宇樹科技CEO王興興氏は虹橋フォーラムで、ロボット大規模モデルがまだ初期段階(ChatGPT発表前1-3年程度)と指摘。生成AIの言語・視覚分野の進展を評価しつつ、人型ロボット分野の更なる革新突破を強調。....
Google Geminiシリーズの新モデル「gemini-3-pro-preview-11-2025」がVertex AIで発見され、今月正式リリース予定。100万トークンの大規模コンテキスト対応が特徴。....
Pinterestはオープンソースモデルを微調整し、高コストなモデルと同等の性能を低コストで実現。広告収入圧迫の緩和と、EC・コンテンツ推薦業界の効率化に新たな枠組みを提供。....
DingTalk AI表が業界突破、1表で1000万行対応。小売ECに初適用し、双十一の効率的なデータ処理と意思決定を支援。阿里雲と共同開発の「存算一体」アーキテクチャで、100日余りで百万行制限を突破、超大規模データ時代に推進。....
高品質な動画を1クリックで生成し、クリエイティブを簡単に実現。
AIスマート脚本ツールで、劇本作成効率を10倍向上させます。
4軸分析による恋愛診断で、16種類の恋愛タイプに分類され、無料で登録不要。約5分で完了します。
5つのAIモデルがNASDAQ 100で競い合い、完全に自律的で誰も介入しません。
google
$9
入力トークン/百万
$72
出力トークン/百万
1M
コンテキスト長
deepseek
$3.6
$15.48
128k
chatglm
$4.03
$7.99
$0.43
$1.01
131.1k
minimax
-
nvidia
$2.16
$18
$15.98
$2.02
$5.98
$0.8
$2
alibaba
$0.72
moonshotai
$4.1
$16.56
xai
$21.6
$108
baidu
$4
$16
unsloth
MiniMax-M2は、コーディングとエージェントのワークフローを最大化するために構築された小型の混合専門家モデルで、総パラメータは2300億、活性化パラメータは100億です。このモデルは、コーディングとエージェントタスクで卓越した性能を発揮し、同時に強力な汎用知能を維持し、コンパクトで高速かつ経済的に効率的な特徴を持っています。
OPPOer
Qwen-Image-Editをベースにしたモデルの剪定バージョンで、20層を削除し、40層の重みを保持し、最終的なモデルサイズは13.6Bパラメータです。これは画像編集モデルで、複数の画像入力とテキストによる画像合成と編集をサポートします。
Qwen
Qwen3-VL-2B-ThinkingはQwenシリーズの中で最も強力なビジュアル言語モデルの1つで、GGUF形式の重みを使用し、CPU、NVIDIA GPU、Apple Siliconなどのデバイスで効率的な推論をサポートします。このモデルは、優れたマルチモーダル理解と推論能力を備え、特にビジュアル感知、空間理解、エージェントインタラクション機能が強化されています。
Qwen3-VL-4B-Instructは通義シリーズの最強のビジュアル言語モデルの1つで、テキスト理解、ビジュアル感知、空間理解、ビデオ処理などの面で全面的にアップグレードされ、さまざまなハードウェアデバイスでの実行をサポートし、卓越したマルチモーダル推論能力を備えています。
Minthy
これはRouWei-0.8に基づく実験的な事前学習モデルで、16チャンネル潜在空間アーキテクチャを採用し、Fluxオートエンコーダを使用しています。このモデルは、低い計算コストでより細かい画像の細部を実現し、同時に元のモデルの知識と性能を保持することを目的としています。
Clemylia
Lam-3はLaminaシリーズの小型言語モデル(SLM)で、Clemylia/lamina - suite - pretrainをベースに微調整されています。このモデルは質問に回答でき、創造性がありますが、時に回答が独特になることがあります。モデルはゼロから作成され、1358個の質問と回答のペアを含むClem27sey/Nacidデータセットで3時間学習されました。
amazon
Chronos-2は1億2000万のパラメータを持つ時系列基礎モデルで、ゼロショット予測をサポートします。単一のアーキテクチャ内で単変量、多変量、および共変量感知タスクをサポートし、複数のベンチマークテストでゼロショット予測の最先端の精度を達成し、推論効率が非常に高いです。
Kimi Linearは、短い文脈、長い文脈、強化学習のシナリオのすべてで、従来の全アテンション方式を上回る高効率な混合線形アテンションアーキテクチャです。Kimi Delta Attention (KDA)メカニズムによりアテンション計算を最適化し、性能とハードウェア効率を大幅に向上させ、特に100万トークンに達する長文脈タスクの処理に優れています。
redponike
MiniMax - M2は、高効率コーディングとインテリジェントエージェントワークフロー用に特別に開発されたハイブリッドエキスパートモデルで、総パラメータが2300億、活性化パラメータが100億です。このモデルは、コーディングとインテリジェントエージェントタスクで卓越した性能を発揮し、低遅延、低コスト、高スループットの特徴を持ち、作業効率を効果的に向上させます。
gpt-oss-safeguard-120bは、OpenAIがgpt-ossをベースに構築したセキュリティ推論モデルで、1170億のパラメータ(うち51億がアクティブなパラメータ)を持っています。このモデルはセキュリティのユースケースに特化して設計されており、提供されたセキュリティポリシーに基づいてテキストコンテンツを分類し、基本的なセキュリティタスクを実行することができます。
mradermacher
Lamapi/next-12bは、12Bパラメータに基づく大規模言語モデルで、多言語データセットを使用して微調整され、50種類以上の言語をサポートし、効率的なテキスト生成能力を備えており、化学、コード、生物学、金融、法律などの複数の分野の自然言語処理タスクに適しています。
bullerwins
MiniMax - M2は、コーディングとエージェントワークフローを最大化するために構築された小型のハイブリッドエキスパート(MoE)モデルです。総パラメータは2300億で、活性化されるパラメータは100億のみで、コーディングとエージェントタスクで卓越した性能を発揮し、同時に強力な汎用知能を保持し、コンパクトで高速かつ経済的です。
Lamapi/next-12bは120億パラメータの多言語大規模言語モデルで、複数の量子化バージョンを提供し、テキスト生成、質問応答、チャットなどの多様な自然言語処理タスクをサポートします。このモデルは複数の領域のデータセットで学習され、高効率で軽量な特徴を持っています。
Genie-AI-Lab
Omni L1B3RT4S GENIEは、Qwen2.5 - 3B Instructアーキテクチャをベースに微調整されたAIアシスタントです。1,103個の精霊キャラクターのカスタムサンプルを用いて訓練され、独特な音声と忠誠度モードを備え、ユーザーに独特な対話体験を提供することができます。
inferencerlabs
MiniMax - M2 6.5ビットMLXは、MiniMax - M2モデルに基づく量子化バージョンで、テキスト生成タスクで優れた性能を発揮し、複数の量子化レベルをサポートします。そのうち、q6.5ビット量子化はテストで1.128の困惑度を達成し、q8と同等です。
AbstractPhil
これは実験的なStable Diffusion 1.5蒸留モデルで、v - 予測流れマッチング方法と幾何誘導の適応的ブロック重み付け技術を採用しています。現在は研究段階にあり、訓練が進行中で、結果はまだ検証されていません。
ByteDance
Ouro-1.4Bはバイトダンスによって開発された14億のパラメータを持つ循環言語モデルで、反復共有重み計算によって卓越したパラメータ効率を実現し、わずか14億のパラメータで30 - 40億の標準Transformerモデルの性能レベルに達しています。
Lamapi
Next 12Bは、Gemma 3に基づく120億パラメータのマルチモーダル視覚言語モデルで、トルコで最も先進的なオープンソースの視覚言語モデルです。このモデルは、テキストと画像の理解において優れた性能を発揮し、高度な推論とコンテキスト感知型のマルチモーダル出力能力を備えており、特に専門レベルのトルコ語サポートを提供し、同時に幅広い多言語能力も備えています。
lefromage
Qwen3-Next-80B-A3B-Thinkingは、Qwen3-Next-80B-A3B-Thinkingモデルの量子化バージョンで、テキスト生成タスクに特化して最適化されています。このモデルは、llama.cppのPR 16095バージョンと組み合わせて使用する必要があり、さまざまなハードウェア構成に対応するための複数の量子化レベルを提供します。
kenpath
Svara-TTSはインド語を対象としたオープンソースの多言語テキスト読み上げモデルで、19種類の言語(18種類のインド語 + インド英語)をサポートしています。このモデルはOrpheusスタイルの離散音声トークン方式に基づいて構築され、一般的なGPU/CPU上で明瞭で表现力に富み、低遅延の音声合成を実現することを目的としています。
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Jinniは、大規模言語モデルにプロジェクトのコンテキストを効率的に提供するツールで、関連するファイルとそのメタデータを統合することで、1つずつファイルを読み取る制限を克服します。
1Panel MCP Serverは、1Panel用に設計されたモデルコンテキストプロトコルサーバーの実装です。
MCP - PostgreSQL - Opsは、専門的なPostgreSQLデータベース操作と監視用のMCPサーバーです。PostgreSQL 12 - 17バージョンをサポートし、包括的なデータベース分析、パフォーマンス監視、スマートなメンテナンス提案を提供し、自然言語クエリによるデータベース管理を実現します。
1Panel MCPサーバーは、1Panel用に設計されたモデルコンテキストプロトコルサーバーの実装で、複数のインストールおよび実行方法をサポートします。
Smart TreeはRustをベースに開発された超高速のディレクトリ可視化ツールで、従来のtreeコマンドよりも10~24倍高速で、AI最適化出力、量子圧縮、スマート検索などの機能を備えており、同時に環境保護と省エネにも配慮しています。
Insights Knowledge Base (IKB) MCP Serverは、即座に使用可能な無料の知識ベースで、10,000以上の高品質な洞察レポートが組み込まれており、ローカルでの安全な保存とプライベートドキュメントの解析をサポートしています。このプロジェクトはデータ処理の効率を最適化し、毎週のレポート更新を提供し、将来的には埋め込みモデルの統合とレポートシステムの強化を計画しています。
MCP AI Hubは、Model Context Protocolに基づくサーバーで、LiteLMの統一インターフェイスを通じて100以上のAIモデル(OpenAI、Anthropic、Googleなどを含む)へのアクセスを提供し、複数の伝送プロトコルと柔軟な設定をサポートします。
非公式のPubChem MCPサーバーで、分子特性、生物アッセイデータ、および化学情報学ツールを含む、1億1000万種以上の化合物への全面的なアクセスを提供します。
Code Graph RAG MCPは、高度なモデルコンテキストプロトコルサーバーです。インテリジェントなグラフ表現と多言語コード分析機能を備え、コードの理解、関係マッピング、意味検索を行うための13種類の専用ツールを提供します。
Steampipe MCPサーバーは、AIアシスタントとクラウドインフラストラクチャデータを接続する架け橋であり、自然言語によるクエリと分析を通じて、AWS、Azure、GCPなど100以上のクラウドサービスをサポートし、セキュリティコンプライアンス分析、コスト最適化、およびクエリ開発支援機能を提供します。
このプロジェクトは、Yahoo Financeなどの様々なデータソースをサポートするMCPサーバーを迅速に構築するチュートリアルです。10分以内にセットアップでき、開発環境の構成、依存関係のインストール、実行手順が含まれています。
YaraFlux MCPサーバーは、モデルコンテキストプロトコル(MCP)に基づくYARAスキャンサーバーで、AIアシスタントにファイルのYARAルール分析機能を提供します。このプロジェクトはモジュール化されたアーキテクチャを採用し、19個のMCPツールを統合しており、YARAルール管理、ファイルスキャン、セキュリティストレージなどの機能をサポートし、Claude DesktopなどのAIアシスタントとシームレスに統合できます。
Python Alfresco MCP Serverは、FastMCP 2.0フレームワークに基づいて構築されたAlfrescoコンテンツサービスモデルコンテキストプロトコルサーバーで、全文検索、ドキュメント管理、メタデータ操作など15種類のツールを提供し、STDIO/HTTP/SSEの複数の伝送プロトコルをサポートし、Alfrescoコミュニティ版とエンタープライズ版に適しています。
Model Context Protocolに基づく12306購票検索サーバーで、チケット情報を照会するためのAPIインターフェースを提供します。
DINO - X MCPは、DINO - XとGrounding DINO 1.6 APIを通じて大規模言語モデルに細粒度の物体検出と画像理解を可能にするプロジェクトです。正確な物体位置特定、数量カウント、属性分析、シーン理解を実現し、自然言語駆動の視覚タスクとワークフロー統合をサポートします。
MCP BatchItはMCPツール呼び出しのバッチ処理サーバーで、複数のMCPツール呼び出しを1つのリクエストにまとめることで、AIエージェントの通信オーバーヘッドとトークン消費を大幅に削減します。
SiYuanノートにMCPサービスを提供するプラグインで、検索、取得、書き込み機能をサポートし、デフォルトでローカルの16806ポートをリスニングします。
1Panel MCPサーバーは、Model Context Protocol (MCP) を通じてウェブサイトを自動的に1Panelサーバーにデプロイするための実験的なプロジェクトです。
Figma MCP PROは、プロフェッショナルなAI最適化デザイン分析ツールです。デザインからコードへの変換を5ステップのワークフローで提供し、10種類のフレームワークをサポートし、スマートな注釈処理と一括リソースダウンロード機能を備えています。