従来の枠組みを破る!FUDOKI モデルでマルチモーダル生成と理解がより柔軟で効率的になる
近年、人工知能分野では大きな変革が起こっています。特に大規模言語モデル(LLMs)は、マルチモーダルタスクで顕著な進展を遂げています。これらのモデルは言語の理解と生成の能力において強力な潜在力を示していますが、現時点では大部分のマルチモーダルモデルが依然として自己回帰(AR)アーキテクチャに基づいており、推論プロセスは比較的一辺倒で柔軟性に欠けます。このため、香港大学と華為ノアの箱船研究所の研究チームは、新しいモデルの提案を行いました。それが、この限界を打ち破ることを目指す FUDOKI です。FUDOKI の主な革新点は