GoogleがGemma412Bオープンソースモデルをリリース: エンコーダーなしのマルチモーダル、16GBメモリのノートブックでローカル実行可能
Googleが新たなオープンソース大規模モデル「Gemma412B」を公開。従来のエンコーダーを排除した「Unified」アーキテクチャを採用し、テキスト、画像、音声、動画の4つのモダリティデータを同一Transformerネットワークで直接処理。外部「翻訳」モジュールによるメモリ消費や高遅延問題を解消し、エッジ側での全モーダルAIを実現した。....