アリババが推論モデル「Qwen3-Max-Thinking」を発表。パラメータ数は1兆超、学習データは36Tトークン。強化学習により事実知識や数学推論に優れ、PC・Web版千問に搭載。アプリも対応予定で、ワンクリックで高精度推論を体験可能。....
バイチューティアのSeedチームが形式的数学推論モデルであるSeed Prover1.5をリリースし、大規模なAgentic強化学習により推論能力と効率を著しく向上させました。このモデルは2025年の国際数学オリンピック競技会で3日間で6問中4問を解決し、1問については部分的な解答も行い、その優れた性能を示しました。
アリババはアップグレードされたAI推論モデルQwen3-Max-Thinkingを発表しました。このモデルはアメリカンインビテーショナルマスゲームとハーバード・マサチューセッツ工科大学数学トーナメント(HMMT)の両方で満点を達成し、中国のAIモデルとして初めてこの2つの上級数学コンペティションで100%の正確率を達成したことを示しています。これにより、その強力な推論力と問題解決能力が際立っています。
アリババは2種類の30億パラメータを持つマルチモーダルモデル『Qwen3-VL-30B-A3B』を発表し、GPT-5-Miniなどのトップモデルと同等の性能を発揮しており、数学、画像認識、動画処理など多くの分野で優れた性能を示し、強い競争力を備えている。
多機能なAI研究アシスタントで、数学の問題解決とテキストのリライトをカバーし、学習、授業、研究に適しています。
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
$7.7
$30.8
200
-
Anthropic
$105
$525
$7
$35
Google
$2.1
$17.5
$21
$0.7
Alibaba
$1
$10
256
$6
$24
$4
$16
$8
$240
52
$3.9
$15.2
64
$15.8
$12.7
Bytedance
$0.8
$2
Moonshot
mlx-community
VibeThinker-1.5Bの4ビット量子化バージョンで、MLXフレームワークに基づいてAppleチップ向けに最適化されており、15億のパラメータを持つ密集型言語モデルで、数学的推論とアルゴリズムコーディングの問題に特化しています。
allenai
Olmo 3はAllen Institute for AI (Ai2)によって開発された一連の言語モデルで、7Bと32Bの2種類の規格があり、InstructとThinkの2種類のバリエーションがあります。このモデルはTransformerアーキテクチャに基づいており、長い思考チェーン能力を持ち、数学やコーディングなどの推論タスクの性能を効果的に向上させることができます。
nvidia
Nemotron-Flash-3Bは、NVIDIAが開発した新しい混合型小型言語モデルで、実際のアプリケーションにおける低遅延のニーズに特化して設計されています。このモデルは、数学、コーディング、一般知識の推論などのタスクで卓越した性能を発揮し、小バッチでの低遅延と大バッチでの高スループットの特性を兼ね備えています。
cpatonn
Qwen3-30B-A3B-Instruct-2507はアリババクラウドが発表した305億パラメータの混合専門家モデルで、非思考モードを採用し、指示遵守、論理推論、テキスト理解、数学科学、コーディング、ツール使用などの面で優れた性能を発揮し、262Kの長いコンテキストと多言語処理をサポートします。
Sci-fi-vy
DeepSeek-R1-0528はDeepSeek R1シリーズの小バージョンアップグレードモデルで、計算リソースの増加とアルゴリズムの最適化により、推論の深度と能力を大幅に向上させ、数学やプログラミングなどの複数のベンチマークテストで優れた成績を収めています。
cognitivecomputations
DeepSeek-R1-0528はDeepSeek R1モデルの小規模なバージョンアップで、計算リソースの増加とアルゴリズムの最適化により、推論能力を大幅に向上させ、数学、プログラミング、一般的な論理などの複数のベンチマーク評価で優れた成績を収めています。
Nemotron-Flash-3Bは、NVIDIAが開発した新しい混合小型言語モデルで、低遅延アプリケーション向けに設計されており、数学、コーディング、一般常識推論などのタスクで優れた性能を発揮し、性能と効率のバランスに優れています。
OLMo 2 1B RLVR 1 2025年4月は、allenai/OLMo-2-0425-1B-DPOモデルをベースにした事後訓練バリアントで、複数の特定のデータセットで微調整訓練を行っています。このモデルは、数学推論、コード生成、指令追従などの複数のタスクで良好な性能を発揮しており、研究および教育目的で設計された10億パラメータ規模の大規模言語モデルです。
OLMo 2 1B DPO 2025年4月は、allenai/OLMo-2-0425-1B-SFTモデルをベースにした事後訓練バリアントで、Tülu 3データセットで教師付き微調整とDPO訓練を行っています。このモデルは、数学的推論、コード生成、質問応答などの様々なタスクで優れた性能を発揮し、オープンソースの1Bパラメータの言語モデルです。
OldKingMeister
Qwen2.5-1.5B-Instructはアリババクラウドが提供する15億パラメータの大規模言語モデルで、29種類の言語をサポートし、32Kのコンテキスト長と8Kの生成能力を備え、指令の遵守、コード生成、数学的推論などの分野で優れた性能を発揮します。
ThomasBaruzier
Qwen2.5-72B-Instructはアリババの通義千問チームによって開発された大規模言語モデルで、727億のパラメータを持っています。このモデルは知識理解、コーディング能力、数学的推論、多言語対応の面で著しい向上が見られ、最大128Kトークンのコンテキスト長をサポートし、最大8Kトークンの内容を生成することができます。
CalamitousFelicitousness
Qwen2.5-72B-Instructはアリババが開発した720億パラメータの大規模言語モデルで、Qwen2のベースに大きく改良され、豊富な知識を持ち、優れたコーディングと数学能力を備え、長テキスト処理と多言語対話をサポートし、ユーザーに高品質のテキスト生成と対話サービスを提供できます。
SeaLLMs
SeaLLMs-v3は東南アジア言語向けの大規模言語モデルシリーズの最新バージョンで、同規模のモデルの中で最先端の性能を達成し、世界知識、数学的推論、翻訳、指令遵守などのタスクで優れた性能を発揮します。特に信頼性と安全性が最適化され、幻覚現象が減少しています。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実現する方法を示しています。ローカル開発でのデバッグ、MCPインスペクターを通じた接続テスト、ClaudeデスクトップクライアントをMCPサービスに接続して数学ツールを呼び出すことができます。最後に、Cloudflareへのデプロイとリモート接続の完全な手順も提供されています。
ランダムアルゴリズムと確率的決定能力を提供するMCPサーバーです。高度な数学モデルを通じて順序思考を拡張し、AIアシスタントが局所的な思考パターンから脱却し、より良い決定計画を行えるように支援します。
このプロジェクトでは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実装する方法を示しています。ローカル開発のデバッグ、MCPインスペクターを通じた接続テスト、Claudeデスクトップアプリへの統合による数学ツールの呼び出しをサポートしています。最後に、Cloudflareへのデプロイとリモート接続の完全な手順も提供しています。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実現する方法を示しています。ローカル開発のデバッグ、MCPインスペクターを通じた接続テスト、Claudeデスクトップアプリへの統合による数学ツールの呼び出しをサポートしています。最後に、Cloudflareへのデプロイの完全な手順も提供しています。
このプロジェクトでは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実現する方法を示しています。ローカル開発とデバッグ、MCPインスペクターを通じた接続テスト、Claudeデスクトップアプリへの数学ツールの統合をサポートしています。最後に、Cloudflareへのデプロイとリモート接続の完全な手順も提供しています。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実装する方法を示しています。ローカル開発とデバッグをサポートし、MCP InspectorまたはClaudeデスクトップクライアントで接続でき、数学ツールの呼び出しなどの機能を提供します。
MCPプロトコルに基づくManimアニメーション生成サーバーで、スクリプトを受信してレンダリングされた動画を返し、動的な数学アニメーションの生成とClaudeとの統合をサポートします。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実装する方法を示しています。ローカル開発とデバッグをサポートし、MCPインスペクターまたはClaudeデスクトップクライアントで接続でき、数学ツールの呼び出しなどのサービスを提供します。
このプロジェクトは、Cloudflare Workers上でリモートMCPサーバーをデプロイし、OAuthログイン機能を実装する方法を示しています。ローカル開発でのデバッグ、MCPチェッカーを通じた接続テスト、ClaudeデスクトップアプリをMCPサービスに接続して数学計算などのツールを呼び出すことがサポートされています。最後に、Cloudflareへのデプロイとリモートクライアントの接続の完全な手順も提供されています。
このプロジェクトでは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実現する方法を示しています。ローカル開発でのデバッグ、MCPチェッカーを通じた接続テスト、ClaudeデスクトップアプリをMCPサービスに接続して数学計算などのツールを呼び出すことがサポートされています。最後に、Cloudflareにデプロイしてリモートでアクセスする方法を説明します。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実現する方法を示しています。ローカル開発でのデバッグ、MCPインスペクターを通じた接続テスト、およびClaudeデスクトップアプリに数学ツールを統合するなどの機能をサポートしています。
このプロジェクトは、高度なAIプロンプト技術を利用し、モデルコンテキストプロトコル(MCP)を通じてAIエージェント(Google Geminiモデルベース)をWindowsのレガシーアプリケーションであるMSPaintとやり取りさせ、複雑な数学問題を解き、キャンバス上に解を描画します。
MCPプロトコルに基づくモジュール化サーバープロジェクトで、言語モデルがリアルタイムで外部ツール(天気照会、辞書、数学計算など)を呼び出し、AIと現実世界のやり取りを実現します。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーを構築し、OAuthログイン機能を実装する方法を示しています。ユーザーはMCP InspectorまたはClaudeデスクトップアプリを通じてこのサーバーに接続し、定義された数学ツールなどの機能を呼び出すことができます。プロジェクトにはローカル開発、リモートデプロイ、およびClaudeとの統合の完全なフローが含まれています。
このプロジェクトは、TypeScriptに基づくMCPサーバーの実装で、Server-Sent Events (SSE) を使用してリアルタイムメッセージを転送し、Bearer Tokenによる安全な認証を行います。LLMホストなどのクライアントとのリアルタイム通信をサポートし、4つの基本的な数学ツールをサンプルとして提供します。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーを構築し、OAuthログイン機能を実現する方法を示しています。ローカル開発デバッグ、MCPインスペクターを通じた接続テスト、およびClaudeデスクトップアプリに統合して数学ツールを呼び出す機能をサポートし、最後にCloudflareクラウドにデプロイしてリモートクライアントからアクセスできるようにします。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実装する方法を示しています。ローカル開発とデバッグをサポートし、MCP InspectorツールまたはClaudeデスクトップクライアントを通じて接続でき、数学計算などのツール呼び出し機能を提供します。
このプロジェクトは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実装する方法を示しています。ローカル開発でのデバッグ、MCPインスペクターを通じた接続テスト、Claudeデスクトップアプリとの統合による数学ツールの呼び出しなどのシナリオをサポートし、最後にCloudflareのクラウドサービスにデプロイすることができます。
このプロジェクトは、Cloudflare Workers上でリモートMCPサーバーをデプロイし、OAuthログイン機能を実現する方法を示しています。ローカル開発とデバッグをサポートし、MCP InspectorまたはClaudeデスクトップアプリで接続でき、数学計算などのツール呼び出し機能を提供します。
このプロジェクトでは、Cloudflare Workers上にリモートMCPサーバーをデプロイし、OAuthログイン機能を実装する方法を示しています。ローカル開発でのデバッグをサポートし、MCP InspectorツールまたはClaudeデスクトップクライアントを通じて接続でき、数学計算などのツール呼び出し機能を提供し、最終的にCloudflareクラウドにデプロイできます。