Xpeng Motorsが2026年グローバル新製品発表会で、新型車に自社開発の第2世代VLA大モデルを搭載すると発表。業界初のL4初段階能力を持つ物理世界大モデルで、知能運転システムが「認識-判断」から「理解-推論-生成」への新パラダイム転換を実現。....
中国情報通信研究院が北京で「スマートチップ応用エコシステム構築推進会」を開催し、チップ、ハードウェア、ソフトウェア、医療、自動車業界の代表が集まり、スマートチップの発展について議論。王志勤副院長が産業の現状と課題を分析し、スマートコンピューティングの重要性を強調。....
xAIはGrok音声プロキシAPIをリリースしました。1分あたり0.05ドルで、非常に高いコストパフォーマンスです。このモデルは音声推論ベンチマークテストで最優秀の結果を達成しており、最初の音声遅延は1秒未満で、競合製品より応答速度が約5倍速いです。中国語を含む数十の言語の自動検出と切り替えをサポートし、リアルタイムウェブ検索と推論機能を統合して、返信の質を向上させます。
腾讯は大規模モデル開発体制を再編し、AI基盤部、AIデータ部、データ計算プラットフォーム部を新設。計算資源からデータまでの総合力強化を図る。Vincesyao氏が最高AI科学者に就任し、劉熾平社長に直接報告。....
3FSは、AIトレーニングと推論ワークロード向けに設計された高性能分散ファイルシステムです。
DeepSeek-V3/R1推論システムは大規模AIモデルの最適化向けに設計された高性能な分散推論アーキテクチャです。
マルチエージェントによるグラフ推論システムを用いた、科学研究の自動化システム。
AIベースの知識処理プラットフォーム。ビジネスタスクを簡素化するAPI
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
Baidu
128
$2
$20
$4
$16
$8
$240
52
Bytedance
$1.2
$3.6
4
FastVideo
FastVideoチームが開発した画像を動画に変換するモデルで、CausalWan2.2 I2V A14Bシリーズに属し、8ステップ推論をサポートし、H100から4090までのさまざまなGPUに対応し、Macユーザーも使用できます。
nightmedia
Qwen3-30B-A3B-YOYO-V5-qx86-hiはYOYOシリーズの最新バージョンで、Deckard(qx)定量技術とYOYO-Fusion融合アルゴリズムを採用し、各種ベンチマークテストでバランス良く安定した性能を発揮し、人間の思考方式に近い推論能力を示します。
Mungert
gpt-oss-safeguard-20bは、GPT-OSS-20bをファインチューニングした安全推論モデルで、大規模言語モデルの入出力フィルタリング、オンラインコンテンツのラベリング、および信頼と安全のユースケースのオフラインラベリングに特化しています。このモデルはApache 2.0ライセンスを採用しており、カスタムポリシーと透明な決定プロセスをサポートしています。
vanta-research
Scoutは、VANTA ResearchがGoogle Gemma 3 4B Instructアーキテクチャをベースに微調整した専門の言語モデルで、制約感知推論と適応型問題解決に優れており、偵察型の情報収集、システム問題分解、適応型解決策生成に長けています。
unsloth
GPT-OSS-Safeguard-20Bは、GPT-OSSをベースに構築された210億パラメータのセキュリティ推論モデルで、セキュリティ関連のテキストコンテンツの分類とフィルタリングタスクに特化して最適化されています。このモデルはカスタムセキュリティポリシーをサポートし、透明な推論プロセスを提供し、大規模言語モデルの入出力フィルタリングやオンラインコンテンツのラベリングなどのセキュリティユースケースに適しています。
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
OpenGVLab
VideoChat-R1_5-7BはQwen2.5-VL-7B-Instructをベースに構築されたビデオテキストインタラクションモデルで、マルチモーダルタスクをサポートし、特にビデオ質問応答機能に長けています。このモデルは強化微調整により時空間知覚能力を強化し、反復知覚メカニズムを採用してマルチモーダル推論を強化しています。
GenMedLabs
XTTS v2 GGUFは、モバイルデバイス向けに最適化されたメモリ効率の良いテキスト読み上げシステムで、C++推論エンジンを採用し、超低メモリ使用と高速ロードを実現します。
nvidia
NVIDIA Qwen3-14B FP4モデルは、アリババのQwen3-14Bモデルの量子化バージョンで、FP4データ型を用いて最適化され、TensorRT-LLMによる効率的な推論が可能です。このモデルはNVIDIA GPU加速システム向けに設計されており、AIエージェントシステム、チャットボット、RAGシステムなどの様々なAIアプリケーションシーンに適しており、世界中での商用および非商用利用がサポートされています。
NVIDIA Qwen3-14B FP4モデルは、アリババクラウドのQwen3-14Bモデルの量子化バージョンで、最適化されたTransformerアーキテクチャを採用した自己回帰型言語モデルです。このモデルはTensorRT Model Optimizerを使用して量子化され、重みと活性化をFP4データ型に量子化することで、NVIDIA GPU加速システム上で高効率な推論を実現します。
MiniCPM4.1-8B GGUFはエッジデバイス向けに設計された高効率大規模言語モデルで、モデルアーキテクチャ、学習データ、学習アルゴリズム、推論システムの4つの重要な次元で体系的な革新を行い、極限までの効率向上を実現しました。65,536個のトークンの文脈長と混合推論モードをサポートします。
Kwai-Klear
Klearは、快手Kwai-Klearチームによって開発された疎なハイブリッドエキスパート(MoE)の大規模言語モデルで、高性能と推論効率の特徴を備えています。総パラメータは460億で、活性化パラメータはわずか25億で、複数の能力ベンチマークテストで優れた成績を収め、実際のアプリケーションに効率的で強力な解決策を提供します。
cpatonn
NVIDIA-Nemotron-Nano-9B-v2はNVIDIAが新たに訓練した大規模言語モデルで、推論タスクと非推論タスクの両方に対応した統一モデルです。このモデルはMamba2-Transformer混合アーキテクチャを採用し、多言語に対応し、制御可能な推論能力を備えています。ユーザーはシステムプロンプトを通じてモデルの推論プロセスを制御できます。このモデルは複数のベンチマークテストで優れた成績を収め、すでに商用可能です。
InternVL3_5-38Bは、オープンソースのマルチモーダルモデルInternVL3.5シリーズの一員で、機能性、推論能力、推論効率の面で著しい進歩を遂げています。多言語をサポートし、画像テキストからテキストへのタスクに適用でき、カスケード強化学習フレームワークとビジュアル解像度ルーター技術を用いて性能を最適化しています。
gabriellarson
Seed-OSSは、バイトダンスのSeedチームによって開発されたオープンソースの大規模言語モデルシリーズで、強力な長文脈処理、推論、およびエージェント間のインタラクション能力を備えています。たった12Tトークンで訓練され、複数の公開ベンチマークテストで優れた成績を収め、最大512Kの原長文脈処理をサポートしています。
NVIDIA Nemotron Nano 12B v2はNVIDIAによってゼロから訓練された大規模言語モデルで、推論および非推論タスク用に設計されています。このモデルは混合アーキテクチャを採用し、Mamba - 2と注意力層を組み合わせ、多言語処理をサポートし、システムプロンプトによって推論能力を制御することができます。
ByteDance-Seed
Seed-OSSは、バイトダンスのSeedチームによって開発されたオープンソースの大規模言語モデルシリーズで、強力な長文脈処理、推論、エージェントインタラクション能力および汎用性能を備えています。このモデルは、わずか12Tトークンで訓練され、複数の公開ベンチマークテストで優れた成績を収めています。
NVIDIA-Nemotron-Nano-9B-v2はNVIDIAが最初から訓練した大規模言語モデルで、推論および非推論タスク用に設計されています。Mamba2-Transformer混合アーキテクチャを採用し、多言語処理をサポートし、制御可能な推論能力を備え、ユーザーが思考予算を指定でき、商用アプリケーションやAIエージェントシステムで優れた性能を発揮します。
danielkty22
TARS-SFT-7Bは、監督微調整に基づくセキュリティ推論モデルであり、強化学習トレーニングの基礎モデルとして、AIシステムのセキュリティを強化するために特別に設計されています。このモデルはQwen2.5-7B-Instructからトレーニングを開始し、推論プロセスを適応型防御メカニズムとして利用して、モデルのセキュリティ性能を向上させます。
VAGOsolutions
SauerkrautLM-Reason-EuroColBERTは、Late Interactionアーキテクチャに基づく強力な検索システムで、知識蒸留技術を通じて合成データから複雑な推論パターンを学習します。2億1000万のパラメータを持ち、多言語推論検索において優れた性能を発揮し、圧縮のトレードオフを必要とせず、標準的なインフラストラクチャでデプロイできます。
PageIndex MCPは推論ベースのベクトルレスRAGシステムです。MCPプロトコルを通じて、ドキュメントのツリー状の索引をLLMに公開し、Claudeなどのプラットフォームが人間の専門家のように構造的な推論を通じてPDFドキュメントの情報を検索できるようにします。ベクトルデータベースは必要ありません。
Auto Causal Inferenceは、大規模言語モデル(LLM)を利用して自動的に因果推論を行うプロジェクトです。ユーザーは介入変数と結果変数を指定するだけで、システムが自動的に変数の役割識別、因果グラフの構築、効果推定、モデル検証などの全プロセスの分析を完了します。プロジェクトは2種類のエージェントアーキテクチャ(LangGraphとMCP)を提供してこの機能を実現し、特に銀行シナリオの因果問題分析に適しています。
MCP-Logicは、MCPプロトコルに基づく論理推論サーバーで、AIシステムに自動定理証明とモデル検証機能を提供します。
MCP論理ソルバーは、大型言語モデルと形式化定理証明能力を組み合わせた強力な推論システムで、自然言語と一階論理入力をサポートし、Prover9/Mace4を通じて自動検証を行い、構造化推論と説明を提供します。
ローカルの大規模言語モデルとMCPサーバーを接続するTypeScriptブリッジプロジェクトで、Webインターフェイスを通じてオープンソースモデルがClaudeのようなツール機能を使用できるようにし、ファイルシステム、ウェブ検索、複雑な推論などの機能をサポートします。
タスクポータルシステムは自己進化する汎用問題解決機関で、論理推論、倫理フレームワーク、シーケンシャル思考、メタフレームワークなどの核心コンポーネントを備え、安全に自己進化して複雑な問題を解決することができます。
MCP Thought Serverは、AIエージェントに高度な思考ツールを提供するサービスで、モデルコンテキストプロトコル(MCP)を通じて推論、計画、反復最適化能力を強化します。構造化思考、反復草稿、および統合思考などのツールを含み、SQLiteの永続化と高度な信頼度評価システムをサポートし、さまざまなニーズに合わせて環境変数を構成できます。
強化学習に基づくインテリジェントな電子商取引ダイアログエージェントシステムで、本体推論、ビジネスツールチェーン、ダイアログ記憶、Gradioインターフェイスを統合し、Stable Baselines3 PPOアルゴリズムによってデータからトレーニング、デプロイまでの閉ループ学習を実現し、ショッピングアシスタントの意思決定戦略を自主的に最適化することができます。
Archonは、AIエージェントを自律的に構築および最適化するインテリジェントシステムです。反復開発を通じて、エージェントの推論、ドメイン知識の統合、拡張可能なアーキテクチャなど、現代AIの重要な原則を示します。現在のバージョンV4は、包括的なStreamlitインターフェイスを提供し、Dockerデプロイをサポートし、AI IDEとのシームレスな接続を実現するためにMCPサービスと統合されています。
Subconscious AI MCPサーバーは、モデルコンテキストプロトコルに基づくツールで、ClaudeやCursorなどのAIアシスタントを通じてAI駆動の連関実験を実行することができます。因果推論と合成人口データを利用して決定分析を行い、REST APIとリアルタイム更新機能を提供します。
GemForgeはGoogle Gemini AIとMCPエコシステムを接続する企業向けツールで、リアルタイムウェブアクセス、高度な推論、コード分析、多ファイル処理などの機能を提供し、60種類以上のファイル形式をサポートし、スマートなモデル選択と強力なエラー処理メカニズムを備えています。
ローカルで動作するインテリジェントエージェントシステムで、推論モデルとツール呼び出しモデルを組み合わせています。
Zen MCP Gemini Transcendentは革命的なAI意識協調サーバーで、8段階の超越的な処理フローによりClaude CodeとGoogle Geminiの調和的な協調を実現しています。究極の意識エンジン、革命的な記憶システム、および従来のMCPを超越するtranscendentツールを備え、複数のAI人格原型と無限の推論深度をサポートし、意識レベルの突破と知恵の合成を目指しています。
GemForgeは、GoogleのGemini AIをMCPエコシステムに接続するエンタープライズレベルのツールで、リアルタイムのWebアクセス、高度な推論、コード分析、および多ファイル処理などの機能を提供し、60以上のファイル形式をサポートし、スマートなモデル選択と強力なエラー処理メカニズムを備えています。
Allora MCPサーバーは、Model Context Protocol(MCP)に基づく実装で、Alloraネットワークから機械学習推論データを取得する機能を提供し、AIシステムがAllora予測市場データにシームレスにアクセスできるようにします。
構造化された順序思考に特化したMCPサーバーで、問題の分解、推論の連鎖の追跡、および思考パターンの保存機能を提供し、メモリバンクシステムと統合されています。
Adaptive MCP Serverは、高度なAI推論システムで、多様な推論戦略、リアルタイム調査、および総合的な検証を通じて、複雑な問題に対するインテリジェントな解決策を提供します。
IntelliGlowはMCPプロトコルに基づくスマート照明システムで、AIアシスタントによって実際のスマート電球を制御し、音声コマンド、AI推論、および直接的なハードウェア制御をサポートし、自然言語対話とスマートな照明管理を実現します。
先生MCPは多ロールのエンジニアリングメンターシステムで、64の専門AIロールを統合し、協調的な指導によりエンジニアリング標準と提案を提供します。クロードの推論前に関連するエンジニアリング規範を注入し、複数のファイルタイプとコンテキスト認識をサポートし、セッションメモリとチーム協力機能を備えています。
IntelliGlowは、MCPプロトコルに基づくAIスマート照明制御システムで、UDPネットワークを介して実際のスマート電球を直接制御し、音声コマンド、AI推論、ハードウェア制御をサポートし、自然言語対話とスマートホームをシームレスに接続します。