最高のMLLM AIツールモデル_厳選MLLM情報

AIニュース

テンセントがOpenSearch-VLをリリース：オープンソースのマルチモーダル深層検索エージェントのフルセットソリューション

テンセントの混元は、UCLAや香港中文大学などと協力し、マルチモーダル大規模言語モデル（MLLMs）の「受動的理解」から「能動的推論」への進化を促進するため、マルチモーダル検索エージェントをオープンソース化しました。これまで、高品質データ、自動軌跡合成パス、訓練レシピの欠如により、トップエージェントの再現が困難でした。今回のオープンソース化は、この停滞を打破し、コミュニティの発展を目指します。....

19.4k 18 時間前

テンセントがOpenSearch-VLをリリース：オープンソースのマルチモーダル深層検索エージェントのフルセットソリューション

6Gはまだ商業化されていない。北京交通大学とイギリス帝国理工学院がまず語義専用回線をエッジクラウドに搭載――隣のビルにVIP帯域を一文で提供

ARグラスがMLLM-SCフレームワークで10ミリ秒以内に意味的注意マップを生成し、重要目標を優先的にマーク。意味エンジンがマルチモーダルデータを選別し、6Gネットワークの30%帯域幅を解放。エッジサーバーと連携して応答効率を向上。....

10.4k 4 日前

昆仑万維がSkyReels-V2をオープンソース化：無限の長さの映画生成モデル

昆侖万維のSkyReelsチームは、世界初の拡散強制（Diffusion-forcing）フレームワークを使用した無限の長さの映画生成モデルであるSkyReels-V2を正式にリリースし、オープンソース化しました。このモデルは、マルチモーダル大規模言語モデル（MLLM）、多段階事前学習、強化学習、拡散強制フレームワークを組み合わせることで協調的な最適化を実現し、ビデオ生成技術が新たな段階に入ったことを示しています。

10k 22 時間前

上海AI研究所がInternVL3シリーズマルチモーダル大規模言語モデルをオープンソース化

OpenGVLabは、InternVL3シリーズモデルのオープンソースリリースを発表しました。これは、マルチモーダル大規模言語モデル（MLLM）分野における新たなマイルストーンとなります。InternVL3シリーズは、1Bから78Bまでの7つのサイズからなるモデル群で、テキスト、画像、ビデオなどの様々な情報を同時に処理でき、優れた総合性能を示しています。

12.5k 3 日前