NVIDIAのCEOであるHuang Renxun氏はCES 2026で、物理AIの「ChatGPTの時」が来たと発表し、今後10億台の自動車が高度または完全な自律走行を実現し、自律走行タクシーが最初に恩恵を受けると予測した。彼はオープンソースモデルであるAlpamayoを紹介し、それが世界で初めて思考と推論能力を持つ自律走行モデルであると述べた。
アブダビ技術革新研究所がオープンソースモデルFalcon H1R 7Bを公開しました。パラメータ数が70億にもかかわらず、優れた推論性能を発揮し、「挑戦するほど強くなる」という概念に挑戦しています。訓練は2段階で行われました:まずFalcon-H1-7Bに基づいて監督的微調整を行い、数学およびプログラミング能力の向上に注力しました。
NVIDIAがCES 2026で発表したAlpamayo AIモデルは自動運転の安全性向上を目指す。これに対しマスク氏は、テスラが同分野で先行しており、真の安全性には大規模モデルのデータ学習だけでは不十分で人間レベルの推論能力が必要だと指摘した。....
月の裏側が35億ドルのC輪資金調達を完了後、新モデル「Kiwi-do」がLmArenaで公開。2025年1月までの学習データを持ち、特に視覚的物理推論テストで高い能力を示し注目を集めている。....
ナノバナナプロは最先端のAI画像生成エンジンで、4K画質、キャラクターの一貫性、強力な推論生成能力を備えています。
Google DeepMindの旗艦的なマルチモーダルAIで、100万トークンのコンテキストを持ち、博士レベルの推論能力と高度なコーディング能力を備えています。
GoogleがGemini 3 ProをベースにしたAI画像エディター。推論能力が強く、生成と編集能力に優れています。
Grok 4はxAIが開発した画期的なAIモデルで、高度な推論能力、マルチモーダル機能、専門的なコーディング特性を備えています。
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Openai
$7.7
$30.8
200
-
Anthropic
$7
$35
Google
$2.1
$17.5
1k
$21
$105
$0.7
$2.8
Alibaba
$1
$10
256
$6
$24
Baidu
128
$4
$16
$2
$20
Moonshot
Bytedance
$0.8
32
$54
$163
Deepseek
$12
nightmedia
これは実験的な量子化大規模言語モデルで、Deckard(qx)量子化方法を採用し、埋め込み層は3ビット量子化です。このモデルはノルム保持双投影除去(NPBA)技術によって再構築され、セキュリティ制限メカニズムを削除するだけでなく、モデルの認知深度と推論能力を強化しています。
squ11z1
Hypnos i1-8BはNous Hermes 3(Llama 3.1 8B)に基づく専門的な推論モデルで、複雑な論理、思考連鎖推論、数学問題の求解に特化しています。このモデルは、混合量子 - 古典機械学習の分野で独自の探求を行い、量子ノイズ注入を導入することで、モデルの創造力と推論能力を向上させています。
MaziyarPanahi
このプロジェクトでは、Qwen3-4B-Thinking-2507モデルのGGUF形式のファイルを提供しています。これは、思考過程推論能力を持つ4Bパラメータの大規模言語モデルで、複数の量子化バージョンをサポートし、さまざまなハードウェアでのデプロイと実行が容易です。
Nanbeige
楠米色4-3B-思考-2511は楠米色シリーズの最新の強化バージョンで、高度な蒸留技術と強化学習による最適化を通じて、コンパクトな3Bパラメータ規模で強力な推論能力を実現しています。このモデルはArena-Hard-V2やBFCL-V4などのベンチマークテストで、パラメータが32B未満のモデルの中で最先端(SOTA)の成果を達成しています。
allenai
Olmo 3は、Allen Institute for AIによって開発された次世代の言語モデルシリーズで、7Bと32Bの2種類の規模があり、命令型と思考型の2種類のバリエーションがあります。このモデルはDolma 3データセットで事前学習され、Dolciデータセットで事後学習され、長い連鎖的な思考能力を備えており、数学やコーディングなどの推論タスクで優れた性能を発揮します。
kayte0342
ChronoEdit-14BはNVIDIAが開発した、時間推論能力を備えた画像編集と世界シミュレーションモデルで、140億のパラメータを持っています。このモデルは、2段階の推論プロセスにより、物理知覚に基づく画像編集と動作条件に基づく世界シミュレーションを実現し、事前学習されたビデオ生成モデルから事前知識を抽出します。
noctrex
これはMiroThinker-v1.0-30BモデルをMXFP4_MOE imatrix量子化したバージョンで、mradermacherのimatrixをベースに実装されています。この量子化モデルは元のモデルのテキスト生成能力を維持しながら、量子化技術によって推論効率を向上させ、高効率なテキスト生成が必要な様々なアプリケーションシーンに適しています。
OpenMMReasoner
OpenMMReasonerは完全に透明な2段階のマルチモーダル推論アプローチで、教師付き微調整(SFT)と強化学習(RL)を用いてトレーニングされます。SFT段階では874Kのサンプルからなるコールドスタートデータセットを構築し、RL段階では74Kのサンプルを利用して能力をさらに向上させ、マルチモーダル推論のベンチマークテストで優れた結果を示します。
XiaomiMiMo
米モデルのエンボディメントモデル(MiMo-Embodied)は、強力なクロスエンボディメント視覚言語モデルであり、自動運転とエンボディメントAIタスクの両方で卓越した性能を発揮します。これは、この2つの重要な分野を結合した最初のオープンソースの視覚言語モデルであり、動的な物理環境における理解と推論能力を大幅に向上させました。
Mungert
MiroThinker v1.0はオープンソースの研究エージェントで、モデルレベルの対話型拡張により、ツール強化推論と情報検索能力を向上させます。このモデルは複数のベンチマークテストで優れた性能を発揮し、長文脈と深度のある多段階分析をサポートします。
dogeater1612
これはGoogle Gemma 2 9Bモデルを微調整したオランダ語患者シミュレーションモデルで、医療教育シーン向けに特別に設計されています。モデルは常に固定のJSON構造で応答し、手術を終えて回復中の患者「マリア」をシミュレートし、看護専門の学生が安全な環境でコミュニケーションと臨床推論能力を鍛えることをサポートします。
Olmo-3-7B-Think-DPOはAllen Institute for AIが開発した70億パラメータの言語モデルで、長い連鎖的な思考能力を持ち、数学やコーディングなどの推論タスクで優れた性能を発揮します。このモデルは、教師付き微調整、直接的な嗜好最適化、検証可能な報酬に基づく強化学習などの多段階の訓練を経ており、研究や教育目的に特化して設計されています。
Olmo 3はAllen Institute for AI (Ai2)によって開発された一連の言語モデルで、7Bと32Bの2種類の規格があり、InstructとThinkの2種類のバリエーションがあります。このモデルはTransformerアーキテクチャに基づいており、長い思考チェーン能力を持ち、数学やコーディングなどの推論タスクの性能を効果的に向上させることができます。
Olmo 3はAllen Institute for AIによって開発されたオープンソースの言語モデルシリーズで、7Bと32Bの2種類の規格があり、指令(Instruct)と思考(Think)の2種類のバリエーションに分かれています。このモデルは卓越した長鎖思考能力を持ち、数学やコーディングなどの推論タスクのパフォーマンスを大幅に向上させることができます。
Olmo 3 7B RL-Zero Mathは、Allen AIによって開発された、数学的推論タスクに特化して最適化された70億パラメータの言語モデルです。RL-Zero強化学習方法を用いて数学データセットで訓練され、数学的推論能力を効果的に向上させます。
Olmo 3 7B RL-Zero Mixは、Allen AIが開発した7Bパラメータ規模の言語モデルで、Olmo 3シリーズに属します。このモデルはDolma 3データセットで事前学習され、Dolciデータセットで事後学習され、強化学習によって数学、コーディング、推論能力が最適化されています。
Guilherme34
Qwen3-32BはQwenシリーズの最新世代の大規模言語モデルで、強力な推論、命令遵守、エージェント間の相互作用、多言語処理能力を備えています。100種類以上の言語と方言をサポートし、思考モードと非思考モードをシームレスに切り替えることができ、ユーザーに自然でスムーズな対話体験を提供します。
hum-ma
Wan2.2-TI2V-5B-Turbo-GGUFは、quanhaol/Wan2.2-TI2V-5B-Turboベースモデルから変換された画像を動画に変換するモデルで、最適化されて4GB GPUで動作可能で、優れた汎用性と高効率な推論能力を持っています。
TeichAI
これはQwen3 30B A3Bモデルをベースに、Claude Sonnet 4.5の高い推論難易度のデータセットで訓練された蒸留モデルです。このモデルは複雑な推論タスクに特化して最適化されており、コーディングと科学の分野で優れた性能を発揮し、強力な論理推論能力を持っています。
Olmo-3-32B-Think-DPOはAllen AIが開発した32Bパラメータの言語モデルで、直接嗜好最適化(DPO)を用いて訓練され、長鎖的な思考推論能力を備え、数学やコーディングなどの複雑な推論タスクで優れた性能を発揮します。
MCPリーゾナーはClaude Desktop用に設計された推論能力を強化するツールで、ビームサーチとモンテカルロ木探索の2つのアルゴリズムを提供し、複雑な問題の解決を最適化するための実験的な戦略シミュレーション層を新たに追加しています。
MCP ReasonerはClaude Desktop用に設計された推論強化ツールで、Beam SearchとMCTSの2つの検索戦略を提供し、実験的なアルゴリズムを通じて複雑な問題解決能力を向上させます。
DeepSeekの推論能力とClaudeの生成能力を組み合わせたMCPサービス
MCP論理ソルバーは、大型言語モデルと形式化定理証明能力を組み合わせた強力な推論システムで、自然言語と一階論理入力をサポートし、Prover9/Mace4を通じて自動検証を行い、構造化推論と説明を提供します。
Cursor AI内のClaudeに高度な推論能力を提供するMCPサーバーで、複数の推論方法と自動反復機能を備えています。
MCP Thought Serverは、AIエージェントに高度な思考ツールを提供するサービスで、モデルコンテキストプロトコル(MCP)を通じて推論、計画、反復最適化能力を強化します。構造化思考、反復草稿、および統合思考などのツールを含み、SQLiteの永続化と高度な信頼度評価システムをサポートし、さまざまなニーズに合わせて環境変数を構成できます。
DeepSeek R1の推論エンジンを統合することで、Claudeの複雑なタスク処理能力を強化します
このプロジェクトは、DeepSeek R1の推論エンジンを統合することで、Claudeの複雑なタスク処理能力を強化し、多段階の正確な推論サポートを提供します。
MCPエージェントツールアダプタープロジェクトは、MCPプロトコルを通じてモジュール化されたツールの呼び出しを実現し、Google ADKとLangGraphの2種類のエージェントフレームワークをサポートし、動的な推論とツール計画能力を提供します。
MCP推論サーバーはClaude Desktopに体系的な推論能力を提供し、ビームサーチとモンテカルロ木探索の2種類の戦略をサポートし、数学や論理などの複雑な問題の解決に適しています。
Cursor AI内のClaudeに高度な推論能力を提供するMCPサーバーで、モンテカルロ木探索、ビームサーチ、Transformerハイブリッド推論などの複数の推論方法を含みます。
MCP Chain of Draft Prompt Toolは、標準的なプロンプトをChain of DraftまたはChain of Thought形式に変換することで、LLMの推論能力を強化し、推論品質を大幅に向上させ、トークン使用量を削減するツールです。
量子場計算モデルに基づくClaudeマルチインスタンス協調推論サーバー。場の一貫性最適化により、強化されたAI推論能力を実現します。
構造化された検索と動的な思考チェーンにより、AIモデルの推論能力を強化し、問題解決能力を向上させるMCPサーバー。
Perplexity MCPサーバーはGoで書かれたミドルウェアで、AIアシスタントにリアルタイム検索と複雑な推論能力を提供します
公式実装のAnthropicの「思考」ツールMCPサーバー。構造化思考によりClaudeの推論能力を大幅に向上させます。
Thoughtful Claudeは、Claudeの推論能力を強化するMCPサーバーで、DeepSeek R1の高度な推論エンジンを統合することで、Claudeに複雑な多段階推論タスクの処理能力を提供します。
Fluent MCPは、高度な推論能力を備えたモデルコンテキストプロトコル(MCP)サーバーを構築するための最新のフレームワークで、AI統合、ツール分離、および複雑な推論のオフロードをサポートし、2層LLMアーキテクチャを採用して効率的な推論を実現します。
DeepSeek MCPサーバーは、DeepSeek R1の高度な推論エンジンを統合することでClaudeの推論能力を強化し、複雑な多段階推論タスクを処理できるようにします。
DeepSeek-Claude MCPサーバーは、DeepSeek R1の高度な推論エンジンを統合することで、Claudeの複雑な推論タスクの処理能力を強化します。