2025 FORCE原動力大会で、火山エンジンCEOの譚待氏は、2026年に大規模モデル市場が10倍成長すると予測。企業競争はゼロサムゲームではなく、市場拡大と業界のAI化加速を共に目指すべきと強調。2025年はAIの大規模応用が爆発する前夜であり、競争の核心は市場拡大にある。....
国内初の国家基準テストを通過した具身智能VLA大モデルXR-1がオープンソース化。データ基盤RoboMIND2.0とデータセットArtVIPを同時公開し、人型ロボットの実験段階から実用化へ推進。....
ベイツトゥンはvivo、レノボ、トーンなどハードウェアメーカーとAIスマホに関する協力を模索しており、大規模なモデル実行能力を改善するため、AIGCプラグイン(例:ドウバオスマホアシスタント)を事前インストールすることでAI流量エントリーポイントを獲得しようとしている。vivoの従業員は協力が確認されており、詳細な内容は現在交渉中である。協力のポイントは、ベイツトゥンが魅力的な収益分与計画を提供していることである。
ElevenLabsのAI音声エージェントがWhatsAppに統合され、テキストと音声のデュアルモードで対話可能。ユーザーは文字チャットや音声通話を通じて、リアルなAIアシスタントと会話できます。企業向けに多言語対応、感情認識、リアルタイム翻訳機能を備えたAI音声アシスタントを簡単に導入でき、カスタマーサポート体験を革新します。....
Klariqoは企業向けのAIアシスタントで、24時間体制で電話とウェブサイトのチャットを処理し、自動で予約を行い、潜在顧客を選別します。無料トライアルもあります。
AIストーリーボード生成ツールで、ストーリーをビデオに変換でき、ワンクリックでレンダリングし、さまざまなコンテンツタイプに対応しています。
無料のオンラインサンタクロース音声生成器で、149種類の言語に対応し、リアルな音声を生成します。
AI駆動のオンラインツールで、セルフィーまたはテキストのヒントを使用して専用のアンドロイドロボットをカスタマライズ
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$4
$16
$2
$20
$8
$240
52
Justin331
SAM 3はMetaが発表した第3世代のプロンプト可能な分割基礎モデルで、画像とビデオの分割タスクを統一的にサポートします。前代のSAM 2と比べて、オープンボキャブラリ概念分割能力を導入し、大量のテキストプロンプトを処理でき、SA - COベンチマークテストで人間の性能の75 - 80%に達します。
Intel
DeepMathは40億パラメータの数学推理モデルで、Qwen3 - 4B Thinkingをベースに構築され、微調整された大規模言語モデルとサンドボックス化されたPython実行器を組み合わせています。これは計算ステップに対して簡潔なPythonコード断片を生成し、エラーを大幅に減らし、出力長を短縮します。
XiaomiMiMo
米モデルのエンボディメントモデル(MiMo-Embodied)は、強力なクロスエンボディメント視覚言語モデルであり、自動運転とエンボディメントAIタスクの両方で卓越した性能を発揮します。これは、この2つの重要な分野を結合した最初のオープンソースの視覚言語モデルであり、動的な物理環境における理解と推論能力を大幅に向上させました。
NyxKrage
Moondream 3 Preview HFは、HuggingFace Transformersアーキテクチャの仕様に基づいてMoondream 3 (Preview)モデルを再実装したもので、Hugging Faceのエコシステムと完全に互換性があります。これはマルチモーダルビジュアル言語モデルで、エキスパート混合(MoE)テキストバックボーンを採用し、約90億のパラメータと20億のアクティブパラメータを持ちます。
facebook
SAM 3はMetaが発表した第3世代のプロンプト可能な分割ベースモデルで、テキストまたはビジュアルプロンプト(点、ボックス、マスク)を利用して、画像とビデオ内のオブジェクトを検出、分割、追跡することができます。前代と比較して、SAM 3はオープンボキャブラリ概念のすべてのインスタンスを詳細に分割する機能を導入し、大量のオープンボキャブラリプロンプトをサポートし、SA - COベンチマークで人間の性能の75 - 80%を達成しています。
Clemylia
メルタは、DiscordボットMelta27をベースに開発された独特な小型言語モデルで、可愛く、魅力的で、情熱的な個性を持ち、オリジナルで独特で可愛いテキストコンテンツの生成に特化しています。
LiquidAI
LFM2-VL-3BはLiquid AIが開発したマルチモーダル視覚言語モデルで、LFM2バックボーンアーキテクチャに基づいて構築されており、強力な視覚理解と推論能力を備えており、特に細粒度な感知タスクで優れた性能を発揮します。このモデルは、テキストと画像の入力を効率的に処理することができ、最大512×512解像度の原生画像処理をサポートしています。
Tacoin
これはTacoinがNVIDIA GR00Tモデルをベースに、LIBERO libero longベンチマークテストで微調整したロボット操作モデルです。このモデルはデュアルRGBストリームと8自由度の状態入力を採用し、16ステップの関節空間動作を予測でき、長期的な視野のロボット操作タスクに特化しています。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
jeevanrushi07
OpenLLaMA 3B v2はTransformerアーキテクチャに基づくオープンソースの大規模言語モデルで、30億のパラメータを持っています。このモデルはMITライセンスを採用しており、主に英文テキスト生成タスクに使用され、チャットボットなどのさまざまなアプリケーションシナリオをサポートします。
lerobot
π₀.₅はPhysical Intelligenceによって開発された視覚 - 言語 - 動作モデルで、オープンワールド汎化能力を備えており、訓練時に一度も見たことのない全く新しい環境やシーンでロボットタスクを実行することができます。
merve
これはDETRアーキテクチャとDINOv3ビジュアルバックボーンネットワークをベースに微調整されたナンバープレート検出モデルで、評価セットで2.7008の損失値を達成し、専門的にナンバープレート認識タスクに使用されます。
VLA-Adapter
VLA-Adapterは、Libero-Spatial上で訓練されたマイクロビジョン言語アクションモデルで、Prismatic-VLMアーキテクチャを採用し、大規模言語モデルのバックボーンとしてQwen2.5-0.5Bのみを使用しています。このモデルは、ロボットのベンチマークテストで、パラメータ規模がより大きいオープンソースのVLAモデルを上回り、高性能なビジョン - 言語 - アクションの理解と実行を実現しています。
adityak74
MEDFIT-LLM-3Bは、医療質問応答に特化して最適化された言語モデルで、MetaのLlama-3.2-3B-Instructをベースに微調整されています。このモデルは、LoRA技術を用いて医療データセットで訓練され、医学分野の理解と直接的な回答能力が大幅に向上しており、医療チャットボットや患者教育などのアプリケーションシナリオに適しています。
neuphonic
NeuTTS Airは世界初の即時音声クローニング機能を備えた超リアルなデバイス端テキスト音声変換(TTS)言語モデルです。0.5Bの大規模言語モデルのバックボーンネットワークをベースに構築され、ローカルデバイスに自然な音声、リアルタイム性能、組み込みセキュリティ機能、話者クローニング機能をもたらします。
NiryoTeam
SmolVLAはコンパクトで効率的な視覚言語行動モデルで、計算コストを削減しながら競争力のある性能を実現し、消費者向けハードウェアにデプロイすることができます。このモデルはLeRobotによってトレーニングされ、ロボット技術タスク向けに設計されています。
Vikhrmodels
ボレアリスは、ロシア語向けの最初の自動音声認識(ASR)オーディオ大規模言語モデルで、約7000時間のロシア語オーディオデータで訓練されています。このモデルは、オーディオ内の句読点を認識することができ、アーキテクチャはVoxtralに影響を受けていますが、改良されており、複数のロシア語ASRベンチマークテストで優れた性能を発揮しています。
NVIDIA Qwen3-14B FP4モデルは、アリババのQwen3-14Bモデルの量子化バージョンで、FP4データ型を用いて最適化され、TensorRT-LLMによる効率的な推論が可能です。このモデルはNVIDIA GPU加速システム向けに設計されており、AIエージェントシステム、チャットボット、RAGシステムなどの様々なAIアプリケーションシーンに適しており、世界中での商用および非商用利用がサポートされています。
GeniusJunP
SmolVLAはコンパクトで効率的な視覚-言語-行動モデルで、計算コストを削減しながらも競争力のある性能を維持でき、消費者向けハードウェアに適しています。このモデルはLeRobotフレームワークを使用してトレーニングされ、ロボット技術タスクに特化して最適化されています。
allenai
MolmoActはアレン人工知能研究所によって開発されたオープンソースのロボット操作動作推論モデルで、Qwen2.5 - 7BとSigLip2視覚バックボーンネットワークに基づいて構築され、家庭およびデスクトップ環境における片腕のフランカロボット操作タスクに特化して最適化されています。
データベース用MCPツールボックスは、オープンソースのデータベースMCPサーバーで、企業向けおよび本番環境の品質に特化しており、ツール開発を簡素化し、コネクションプールや認証などの複雑な機能を提供します。
Coco AIは、Google Workspace、Dropbox、GitHubなどの企業アプリとデータを統合した統一検索プラットフォームで、プラットフォームを超えた検索とAI駆動のチームチャット機能を提供し、業務効率とコラボレーション体験の向上を目指しています。
DeepContextは、コードアシスタントに対して、シンボルを意識した意味検索機能を提供するMCPサーバーです。スマートなコード構造解析と意味関係の理解により、大規模なコードベースの中から関連するコード断片を正確に見つけ、開発効率を向上させます。
ClippyはmacOSターミナルのクリップボードツールで、ファイル参照のコピー、GUI貼り付け、最近のダウンロード管理、パイプラインデータ処理、およびMCPサーバーのAI統合をサポートし、作業効率を向上させます。
スリーパーAPI MCPサーバーは、スリーパーのファンタジーフットボールプラットフォームのデータアクセスを提供するモデルコンテキストプロトコルサービスで、ユーザー情報、リーグデータ、ドラフト詳細、選手情報などの機能をサポートし、APIキーなしで読み取り専用データにアクセスできます。
このプロジェクトは、Node.jsベースのMCPサービスアーキテクチャを展示しており、バックエンドAPIサービス、MCPサーバー、およびクライアントAIチャットボットが含まれています。MCPサーバーはAPIアクセス方法を標準化し、クライアントはMCP機能を統合することでカスタムデータストレージ機能を実現しています。
Threat.Zone MCPサーバーは、FastMCPをベースに構築されたマルウェア分析サービスインターフェイスで、LLMに標準化された脅威分析ツールセットを提供し、ファイル/URL検出、サンドボックス分析、ネットワーク行動監視などの機能をサポートします。
Squiggle APIに基づくAFL(オーストラリア・フットボール・リーグ)データのMCPサーバーで、試合結果、チーム情報、シーズン順位などのデータ照会機能を提供します。
Devici MCPサーバーは、Devici APIとのインタラクションに使用されるモデルコンテキストプロトコルサーバーで、ユーザー、コレクション、脅威モデル、コンポーネント、脅威、緩和策、チーム、ダッシュボードデータの管理にLLMツールを提供します。
Qwen MCPツールは、モデルコンテキストプロトコルに基づくサーバーで、Qwen CLIとAIアシスタントを統合し、大規模コンテキストウィンドウ分析、ファイル処理、サンドボックス実行、複数モデルサポートなどの機能を提供します。
このプロジェクトはClaudeとUmami分析プラットフォームをつなぐMCPサーバーで、ウェブサイトのデータ分析ツールを提供します。ユーザー行動の追跡、パフォーマンス指標の監視、可視化ダッシュボードの生成などの機能があります。
macOS用の画面表示と制御MCPサービスで、ウィンドウのスクリーンショット、ウィンドウの検索、キーボード入力機能を提供し、ウィンドウのタイトルまたはIDで操作をサポートしています。
WebAssembly Tree-sitterパーサーを通じてコードコンテキスト分析を提供するサービスで、ディレクトリ構造とコードシンボルの抽出をサポートし、MCPプロトコルとAIアシスタントとの統合に対応しています。
ScreenPilotはMCPサーバーを介してLLMがデバイスを全面的に制御できるツールで、画面自動化ツールキットを提供し、画面キャプチャ、マウスとキーボードの制御などの機能をサポートし、自動化、教育、エンターテインメントに適しています。
Rug-Check-MCPは、ソラナのミームトークンの潜在的なリスクを検出するMCPサーバープロジェクトで、AIエージェントがラグプル詐欺や不安全なプロジェクトを回避するのに役立ちます。Solsniffer APIを通じてトークンデータを取得し、名前、シンボル、リスクスコア、時価総額、価格、供給量、リスク詳細、および監査状態を含む構造化された分析結果を提供します。
RegenNexus UAPは、デバイス、ロボット、アプリケーション、AIエージェントを接続するための汎用アダプタープロトコルで、低遅延、高セキュリティの通信を提供し、さまざまなハードウェアとMCP統合をサポートします。
WebAssemblyに基づくコードコンテキスト分析サービスで、ディレクトリ構造とコードシンボルの抽出機能を提供し、JavaScript/TypeScriptおよびPython言語の分析をサポートし、AIアシスタントとシームレスに統合できます。
サンドボックスフュージョンMCPサーバーは、大規模言語モデルにコードインタープリタ機能を提供する実装であり、複数のプログラミング言語のコード実行とJupyterノートブック操作をサポートし、stdioインタラクションを通じてクライアントと通信します。
Nexus MCPは強力な個人用アシスタントサーバーで、Googleカレンダー、Obsidianノート、Trelloボード、ウェブページ解析機能を統合し、FastMCPを通じて統一されたデジタル生活管理インターフェースを提供します。
SpotDBは軽量級のデータサンドボックスで、AIワークフローとデータ探索に安全な隔離された一時的なデータベース環境を提供し、スナップショット復元とさまざまなAPIアクセスをサポートします。