アップルはマルチモーダルモデル「Manzano」を発表しました。イノベーションな「二重構造」アーキテクチャにより、AI分野で長年抱いてきた視覚理解と画像生成の両立が難しいという課題を解決しました。
アップルが発表した多モーダルAIモデル「Manzano」は、視覚認識とテキストからの画像生成を統合し、高精度な画像理解と高品質な画像生成を実現。AI技術の重要な進歩を示し、業界の多機能モデル需要に対応可能。....
アップルが新画像モデルManzanoを発表。画像理解と生成の両機能を持ち、オープンソースモデルの技術的課題を解決。効率と性能はOpenAIやGoogleの商業システムに匹敵。現在非公開で、研究論文と低解像度画像例のみ公開。....