智元ロボットは精巧なハンド事業を分離し、「臨界点」社を設立。熊坤が率いて初回融資を完了。内部を三大事業ユニットに再編し、コア事業への集中と資源配分の最適化を図る。....
菜鳥集団が九識智能への投資を検討中。両社は無人車事業の統合に向け秘密裏に協議を進めており、資源を再編して共同体制を構築する方針。菜鳥がブランド使用を許可する可能性も。現時点で両社はコメントせず。....
北京智源AI研究院が発表したEmu3.5は、物理的理解と因果推論を強化し、AIが単なる生成から現実世界の理解へ進化する「世界統一モデリング」を実現。....
智源研究院がEmu3.5多モーダル世界モデルを発表。自己回帰型「次状態予測」技術を初導入し、AIが複雑環境での計画・実行を実現、多モーダルAIの質的飛躍を推進。....
最先端の人工知能大規模言語モデルシリーズ
Chatglm
-
入力トークン/百万
出力トークン/百万
128
コンテキスト長
Alibaba
Baichuan
$15
32
Google
$0.49
$2.1
1k
8
$100
BAAI
Emu3.5は北京智源人工知能研究院が開発したオリジナルのマルチモーダルモデルで、視覚と言語をまたいで次の状態を連合予測し、一貫した世界モデリングと生成を実現します。エンドツーエンド事前学習と大規模強化学習による事後学習を行うことで、マルチモーダルタスクで卓越した性能を発揮します。
Emu3.5は北京智源人工知能研究院(BAAI)によって開発されたネイティブマルチモーダルモデルで、視覚と言語をまたいで次の状態を連合予測し、一貫した世界モデリングと生成を実現し、マルチモーダルタスクで卓越した性能を発揮します。
mlx-community
GLM-4.5-Air-mxfp4は、智源研究院のGLM-4.5-AirモデルをMLX形式に変換したバージョンで、Apple Siliconデバイス用に最適化され、効率的なローカル推論をサポートしています。
HyperBlaze
BGE-M3は北京智源人工知能研究院によって開発された多言語テキスト埋め込みモデルで、100種類以上の言語の密集検索、多ベクトル検索、疎検索の3種類の検索方式をサポートしています。このモデルはMTEBベンチマークテストで優れた成績を収め、多言語テキストの類似度計算と検索タスクを効果的に処理することができます。
北京智源研究院が開発した非量子化自己回帰型テキストから動画生成モデルで、テキストプロンプトに基づいて動画を生成・編集可能
Emu3は北京智源研究院によって開発されたマルチモーダルモデルで、次のトークンを予測するだけで訓練され、画像、テキスト、動画処理をサポートします。