豆包:ビデオ生成モデル「VideoWorld」がオープンソース化 純粋なビジュアル学習を実現
豆包大模型チームの公式アカウントによると、北京交通大学と中国科学技術大学の共同研究により、豆包大模型チームが提案したビデオ生成実験モデル「VideoWorld」が近日、正式にオープンソース化されました。このモデルの最大のハイライトは、従来の言語モデルに依存せず、視覚情報のみで世界を認知・理解できる点です。この画期的な研究は、李飛飛教授がTED講演で述べた「幼児は言語に頼らずに現実世界を理解できる」という考えから着想を得ています。「Vide」