米国のグループ遠見者会議で、智元ロボティクスの共同創業者であるSteve Zhouは、人工知能が急速に汎用知能(AGI)に向かって進んでいると予測し、GPT-6の後にその初期段階が実現されるかもしれないと言った。彼は過去10年のAIの進化を振り返り、2015年のコンピュータビジョンの実用化から2025年のAGIの原型の現れに至るまで、その進展の速さが目覚ましいことを示した。
智元ロボットがViLLAアーキテクチャに基づく初の具身知能モデルGO-1をオープンソース化。視覚・言語・潜在動作を統合し、開発者参入のハードル低減を目的とする。....
智元机器人がGO-1汎用モデルをオープンソース化。ViLLAアーキテクチャを採用し、視覚・言語・動作能力を統合、複雑タスクの処理性能を向上。開発者向けに無料公開。....
『AIデイリー』はAI分野の最新トレンドを紹介。本日はAutoGLM 2.0を特集。自然言語理解とマルチプラットフォーム対応で音声操作を実現した画期的な製品。....
百川智能が開発した、医療現場向けに最適化されたオープンソースの大規模言語モデルです。優れた汎用性と医療分野での高い性能を備えています。
ブラウザAIアシスタント。複数のリンクのサマリー作成や、サイト内高度検索などの機能を提供します。
ウェブ閲覧体験を向上させるAIアシスタント
わずか数行のコードで大規模言語モデルにアクセス
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Anthropic
$7
$35
200
$21
$105
Alibaba
$1
$10
256
$2
$20
-
$8
$240
52
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
Moonshot
$4
$16
$0.8
128
Baidu
32
Deepseek
$12
$1.6
BAAI
Emu3.5は北京智源人工知能研究院が開発したオリジナルのマルチモーダルモデルで、視覚と言語をまたいで次の状態を連合予測し、一貫した世界モデリングと生成を実現します。エンドツーエンド事前学習と大規模強化学習による事後学習を行うことで、マルチモーダルタスクで卓越した性能を発揮します。
Emu3.5は北京智源人工知能研究院(BAAI)によって開発されたネイティブマルチモーダルモデルで、視覚と言語をまたいで次の状態を連合予測し、一貫した世界モデリングと生成を実現し、マルチモーダルタスクで卓越した性能を発揮します。
unsloth
GLM-4.6は智譜AIが開発した次世代の大規模言語モデルで、GLM-4.5と比較して、文脈処理、コーディング能力、推論性能の面で著しい向上が見られます。このモデルは200Kの文脈長をサポートし、複数の公開ベンチマークテストで優れた成績を収めており、特にコード生成、推論、エージェントタスクの分野で競争力を持っています。
chaoyinshe
EchoVLMは医学超音波分野に特化して設計された動的エキスパート混合ビジュアル言語モデルで、画像とテキストの入力を処理し、テキスト出力を生成することができ、超音波智能診断において重要な応用価値を持っています。
mlx-community
GLM-4.5-Air-6bitは、智譜AIのGLM-4.5-Airモデルを変換した6ビット量子化バージョンで、MLXフレームワーク用に最適化され、大規模言語モデルの高効率な推論能力を提供します。
GLM-4.5-Air-8bitは、智譜AIのGLM-4.5-Airモデルから変換された8ビット量子化バージョンで、MLXフレームワーク用に特別に最適化されています。このモデルは、オリジナル版の強力な自然言語処理能力を維持しながら、量子化技術によってメモリ使用量と計算要件を削減し、Apple Siliconデバイスで効率的に動作するのに適しています。
dangvansam
TEN Turn Detectionは、人とAIエージェント間の自然で動的なコミュニケーションを実現するために専用に開発された、高度な智能話ターン検出モデルです。このモデルは自然な話ターン変換の手がかりを検出でき、コンテキストに基づく割り込み機能をサポートし、深い意味理解によって対話のコンテキストと言語パターンを解析することで、AI対話をより自然で流れるようにします。
zai-org
GLM-4.1V-9B-Baseは智譜AIが開発したオープンソースのビジョン言語基礎モデルで、90億のパラメータを持ち、マルチモーダル推論能力に特化し、中英バイリンガルをサポートし、最大4K解像度の画像と64Kの文脈長を処理できます。
HyperBlaze
BGE-M3は北京智源人工知能研究院によって開発された多言語テキスト埋め込みモデルで、100種類以上の言語の密集検索、多ベクトル検索、疎検索の3種類の検索方式をサポートしています。このモデルはMTEBベンチマークテストで優れた成績を収め、多言語テキストの類似度計算と検索タスクを効果的に処理することができます。
GLM-4-Z1-9B-0414は智譜AIが発表した新世代の90億パラメータのオープンソース大規模言語モデルで、強力なテキスト生成と推論能力を持っています。このモデルは数学的推論と汎用タスクで優れた性能を発揮し、リソースが制限されたシナリオで効率と効果のバランスを見事に実現し、友好的なローカルデプロイをサポートしています。
GLM-4-9B-0414は智譜AIが発表した90億パラメータの大規模言語モデルで、テキスト生成分野で優れた性能を発揮します。このモデルは15Tの高品質データで事前学習され、強力なテキスト生成能力を備えており、コード作成、ストーリー創作、レポート生成などの様々なシーンに適用でき、効率と結果のバランスが良好です。
openbmb
MiniCPM-再ランキングモデルは、面壁智能と清華大学自然言語処理研究所、東北大学情報検索グループが共同開発した中日バイリンガルテキスト再ランキングモデルで、優れた中日およびクロスランゲージ再ランキング能力を備えています。
MiniCPMは面壁智能と清華大学自然言語処理研究所が共同で開発したエッジサイド大規模言語モデルシリーズで、コアモデルにはわずか12億の非単語埋め込みパラメータしか含まれておらず、複数の評価でより大規模なオープンソースモデルを上回っています。
MiniCPMは面壁智能と清華大学自然言語処理研究所が共同開発したエッジデバイス用大規模言語モデルで、非単語埋め込みパラメータ数はわずか24億(2.4B)で、128kのコンテキストウィンドウをサポートしています。
qihoo360
360智脳は奇虎360によって開発されたオープンソースの大規模言語モデルシリーズで、基本モデルと複数のコンテキスト長の対話モデルを含み、中国語と英語をサポートしています。
MiniCPMは面壁智能と清華大学自然言語処理研究所が共同でオープンソース化した一連のエッジAI大規模言語モデルで、コア言語モデルMiniCPM-2Bは24億の非単語埋め込みパラメータのみを有しています。
MiniCPMは面壁智能と清華大学自然言語処理研究所が共同でオープンソース化した一連のエッジサイド言語大規模モデルで、主体の言語モデルMiniCPM-2Bは非単語埋め込みパラメータ数がわずか24億(2.4B)です。
baichuan-inc
百川-7Bは百川智能が開発したオープンソースの大規模事前学習言語モデルで、Transformerアーキテクチャを基に70億のパラメータを持ち、中英バイリンガルのコーパスで訓練され、4096のコンテキストウィンドウをサポートしています。
智言プラットフォームはオープンソースのエージェント交流と開発プラットフォームで、AIGC愛好者がエージェントをよりよく理解し、開発できるようにすることを目的としています。プラットフォームはメール送信、情報検索、天気照会、論文検索、宅配便照会、ドキュメント検索などの複数のデフォルトエージェント機能を提供し、ユーザーがカスタムツールをサポートします。プロジェクトは迅速な起動とDockerデプロイをサポートし、将来的にはツールショップと自動構築機能の追加を計画しています。
MCPアシスタントサーバーは、大規模言語モデルを統合した智能タスク分析とツール推薦サーバーで、タスク分析、ツール推薦、コンテキスト管理機能を提供し、ClineやCursorなどの開発環境での使用をサポートしています。