火山引擎が発表した豆包大モデル2.0シリーズは、企業・開発者向けAPIサービスを提供し、個人ユーザーは指定プラットフォームで体験可能。生産環境向けに最適化され、効率的な推論・マルチモーダル理解・複雑な指示実行能力を備え、実世界タスクの処理性能が向上。推論コストは大幅に削減され、日次利用量も急増している。....
MiniMaxがM2.5モデルを発表。108日間で3回目のアップグレードとなるM2シリーズの最新版。プログラミング・検索・オフィス作業など多分野で高性能を発揮し、能力・効率・コストの三要素を革新。オープンソース版をModelScopeで公開、ゼロコード使用からプライベート展開まで対応。低コストAgent時代の実現を目指す。....
DeepSeekは2月11日にWeb版とアプリ版を段階的に更新し、14日に新長文モデル構造のテストを正式発表。最大100万トークンの超長文対応と、2025年5月までのナレッジベース更新を実装。ただしAPIはV3.2版のまま128K対応。業界では次期V4モデル発表前の技術予熱と負荷テストと見られ、V4への期待が高まる。....
アリフーアプリが春節期間中、「健康福」キャンペーンで中国App Store無料ランキング1位を獲得。帰省ラッシュで若者が家族に利用を教え、ダウンロード数が急増。キャンペーンは大晦日まで継続、12月の新バージョンリリース後も成長を維持し、複数地域と連携を拡大中。....
最先端のコミュニティコーヒーチャットソフトで、AIマッチングによる自動化された1対1の紹介を通じて、メンバーの参加度を向上させます。
1クリックでテキストを美しいデザインに変換し、自動でレイアウトし、デザインスキルは不要です。
Seedance 2.0:AIビデオジェネレーター。テキストまたは画像に基づいて15秒の映画レベルのビデオを作成します。
Kling 3.0はアイデアを映画に変え、テキスト画像を1080pのビデオに変換することができ、無料で試用することができます。
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Openai
$7.7
$30.8
200
Alibaba
$2
$20
-
$4
$16
1k
256
Bytedance
$0.8
128
$0.15
$1.5
$10.5
$8
Tencent
$1
32
64
$0.63
$3.15
131
Huawei
Iflytek
drbaph
Z-Image(造相)は60億のパラメータを持つ高効率な画像生成基礎モデルで、画像生成分野の効率と品質の問題を専門的に解決します。その蒸留バージョンであるZ-Image-Turboは、たった8回の関数評価でリーディングな競合モデルに匹敵するか、それを上回る性能を発揮し、企業用のH800 GPUでは亚秒級の推論遅延を実現し、16G VRAMの消費者向けデバイスでも動作します。
PrimeIntellect
INTELLECT-3は1060億のパラメータを持つ混合専門家(MoE)モデルで、大規模な強化学習によって訓練されています。数学、コーディング、推論のベンチマークテストで卓越した性能を発揮し、モデル、訓練フレームワーク、環境はすべて緩やかなライセンス契約でオープンソース化されています。
RinggAI
これは通話記録分析用に特別に開発された混合言語AIモデルで、ヒンディー語、英語、およびヒンディー語と英語の混合通話の文字起こし内容を処理できます。モデルはQwen2.5 - 1.5B - Instructをベースに微調整されており、強力な多言語理解と情報抽出能力を備えています。
Shawon16
これはVideoMAE - baseアーキテクチャに基づいて未知のデータセットで微調整された動画理解モデルで、手話認識タスクに特化しています。モデルは20エポックの訓練後に18.64%の正解率を達成しました。
ExaltedSlayer
Gemma 3はGoogleが開発した軽量オープンソースのマルチモーダルモデルです。このバージョンは12Bパラメータの命令調整量子化感知トレーニングモデルで、MLXフレームワークのMXFP4形式に変換されています。テキストと画像の入力をサポートし、テキスト出力を生成します。128Kのコンテキストウィンドウと140種類以上の言語をサポートしています。
これはMCG - NJU/videomae - baseモデルを未知のデータセットで微調整した動画理解モデルで、20エポックの学習を経て、評価セットで13.31%の正解率を達成しました。このモデルは動画分析タスクに特化して最適化されています。
jayn7
騰訊の混元ビデオ1.5モデルの量子化GGUFバージョンで、テキストから動画生成タスクに特化しており、720P高画質動画生成をサポートし、使用効率を最適化するための複数の量子化精度バージョンを提供します。
このプロジェクトは、テンセントの混元ビデオ1.5のテキストから動画へのモデルの量子化GGUFバージョンを提供し、480P動画生成タスクをサポートします。蒸留モデルと完全モデルの2つのバージョンが含まれており、ComfyUI - GGUFなどのツールと連携して使用できます。
騰訊の混元ビデオ1.5モデルの量子化GGUFバージョンで、画像を動画に変換するタスクや動画生成タスクに特化しています。480P解像度の蒸留モデルと標準モデルを提供し、Q4_K_S、Q8_0、FP16などの複数の量子化精度をサポートします。
DreadPoor
Strawberry_Smoothie-TESTは、mergekitツールを使用して3つの12Bパラメータモデルを統合した混合モデルです。Unity-12B、Chaos-Unknown-12b、Smoothie-12B-Model_Stockの長所を組み合わせ、より良いテキスト生成と対話能力を提供することを目的としています。
evilfreelancer
これはai - sage/GigaChat3-10B-A1.8Bモデルの量子化バージョンで、GGUF形式を採用し、特定のllama.cppブランチのサポートが必要です。モデルは混合専門家アーキテクチャを採用し、総パラメータ数は約118億で、そのうち活性化パラメータ数は約18億です。
prithivMLmods
VibeThinker-1.5Bは微博AIが開発した15億パラメータの密集型言語モデルで、Qwen2.5-Math-1.5Bをベースに微調整され、数学やアルゴリズムコーディングの問題に特化して設計されています。「スペクトルから信号への原理」のフレームワークを用いてトレーニングされ、複数の数学コンテストのテストでより大規模なモデルを上回り、トレーニングコストは約7800ドルで、最大約40kトークンの出力をサポートします。
ai-sage
GigaChat3-10B-A1.8BはGigaChatシリーズの対話モデルで、混合専門家(MoE)アーキテクチャに基づいており、合計100億のパラメータがあり、そのうち18億がアクティブなパラメータです。このモデルは、マルチヘッド潜在注意力と多トークン予測技術を採用しており、25.6万トークンの長文脈をサポートし、多言語対話と推論タスクで優れた性能を発揮します。
kayte0342
ChronoEdit-14BはNVIDIAが開発した、時間推論能力を備えた画像編集と世界シミュレーションモデルで、140億のパラメータを持っています。このモデルは、2段階の推論プロセスにより、物理知覚に基づく画像編集と動作条件に基づく世界シミュレーションを実現し、事前学習されたビデオ生成モデルから事前知識を抽出します。
mlx-community
VibeThinker-1.5Bの4ビット量子化バージョンで、MLXフレームワークに基づいてAppleチップ向けに最適化されており、15億のパラメータを持つ密集型言語モデルで、数学的推論とアルゴリズムコーディングの問題に特化しています。
GigaChat3-10B-A1.8B-baseはGigaChatシリーズの基礎事前学習モデルで、混合エキスパート(MoE)アーキテクチャを採用し、総パラメータは100億、アクティブなパラメータは18億です。モデルはマルチヘッド潜在的注意機構(MLA)と多トークン予測(MTP)技術を統合し、推論時に高いスループットの利点を持ちます。
bartowski
これはREAP方法を用いてMiniMax-M2の専門家を均一に25%裁剪した172Bパラメータの大規模言語モデルで、llama.cppに特化して最適化された量子化処理が施されており、複数の量子化レベルをサポートし、LM Studioやllama.cppベースのプロジェクトで動作します。
これはREAP方法に基づいて、MiniMax-M2の40%の専門家を均等に剪定して得られた139Bパラメータの大規模言語モデルです。GLMアーキテクチャと専門家混合(MoE)技術を採用し、llama.cppを通じて様々な量化処理を行い、テキスト生成タスクに適しています。
DevQuasar
このプロジェクトでは、cerebras/MiniMax-M2-REAP-172B-A10Bモデルの量子化バージョンを提供しており、知識を大衆に利用してもらうことを目指しています。これは1720億パラメータの大規模言語モデルで、最適化と量子化処理が施されており、デプロイコストの削減と推論効率の向上を目的としています。
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Jinniは、大規模言語モデルにプロジェクトのコンテキストを効率的に提供するツールで、関連するファイルとそのメタデータを統合することで、1つずつファイルを読み取る制限を克服します。
PMATはゼロコンフィギュレーションのAIコードコンテキスト生成ツールで、コード品質分析、技術的負債評価、ミューテーションテスト、リポジトリ健全性評価、意味検索などの機能を提供し、17種類以上のプログラミング言語をサポートし、MCPプロトコルを通じてClaude CodeなどのAIアシスタントと統合することができます。
1Panel MCP Serverは、1Panel用に設計されたモデルコンテキストプロトコルサーバーの実装です。
MCP - PostgreSQL - Opsは、専門的なPostgreSQLデータベース操作と監視用のMCPサーバーです。PostgreSQL 12 - 17バージョンをサポートし、包括的なデータベース分析、パフォーマンス監視、スマートなメンテナンス提案を提供し、自然言語クエリによるデータベース管理を実現します。
1Panel MCPサーバーは、1Panel用に設計されたモデルコンテキストプロトコルサーバーの実装で、複数のインストールおよび実行方法をサポートします。
Smart TreeはRustをベースに開発された超高速のディレクトリ可視化ツールで、従来のtreeコマンドよりも10~24倍高速で、AI最適化出力、量子圧縮、スマート検索などの機能を備えており、同時に環境保護と省エネにも配慮しています。
Insights Knowledge Base (IKB) MCP Serverは、即座に使用可能な無料の知識ベースで、10,000以上の高品質な洞察レポートが組み込まれており、ローカルでの安全な保存とプライベートドキュメントの解析をサポートしています。このプロジェクトはデータ処理の効率を最適化し、毎週のレポート更新を提供し、将来的には埋め込みモデルの統合とレポートシステムの強化を計画しています。
RustベースのMCPサーバーで、深いコードインテリジェント分析を提供し、16種類のプログラミング言語のシンボル抽出、セマンティック検索、セキュリティ分析、サプライチェーンセキュリティなどの機能をサポートし、プライバシーとパフォーマンスに重点を置いています。
Model Context Protocolに基づくOpenAPIドキュメント検索サーバーです。API仕様の読み込み、解析、およびクエリ機能を提供し、JSONおよびYAML形式をサポートし、10のクエリツールを備えており、AIアシスタントがAPIドキュメントにアクセスしやすくなります。
Steampipe MCPサーバーは、AIアシスタントとクラウドインフラストラクチャデータを接続する架け橋であり、自然言語によるクエリと分析を通じて、AWS、Azure、GCPなど100以上のクラウドサービスをサポートし、セキュリティコンプライアンス分析、コスト最適化、およびクエリ開発支援機能を提供します。
MCP AI Hubは、Model Context Protocolに基づくサーバーで、LiteLMの統一インターフェイスを通じて100以上のAIモデル(OpenAI、Anthropic、Googleなどを含む)へのアクセスを提供し、複数の伝送プロトコルと柔軟な設定をサポートします。
MCPキャラクターツールは、大規模言語モデルに文字レベルのテキスト分析機能を提供するサーバーです。LLMが形態素解析により個々の文字を処理することが困難な問題を解決し、14種類以上の文字カウント、スペル分析、テキスト比較ツールを提供します。
TurboVaultは、プロダクションレベルのMCPサーバーで、ObsidianナレッジベースをAI駆動のインテリジェントな知識システムに変換し、ノートの読み書き、検索、分析、管理のための44個の専用ツールを提供し、100ミリ秒未満の性能を発揮します。
Code Graph RAG MCPは、高度なモデルコンテキストプロトコルサーバーです。インテリジェントなグラフ表現と多言語コード分析機能を備え、コードの理解、関係マッピング、意味検索を行うための13種類の専用ツールを提供します。
非公式のPubChem MCPサーバーで、分子特性、生物アッセイデータ、および化学情報学ツールを含む、1億1000万種以上の化合物への全面的なアクセスを提供します。
このプロジェクトは、Yahoo Financeなどの様々なデータソースをサポートするMCPサーバーを迅速に構築するチュートリアルです。10分以内にセットアップでき、開発環境の構成、依存関係のインストール、実行手順が含まれています。
DINO - X MCPは、DINO - XとGrounding DINO 1.6 APIを通じて大規模言語モデルに細粒度の物体検出と画像理解を可能にするプロジェクトです。正確な物体位置特定、数量カウント、属性分析、シーン理解を実現し、自然言語駆動の視覚タスクとワークフロー統合をサポートします。
Python Alfresco MCP Serverは、FastMCP 2.0フレームワークに基づいて構築されたAlfrescoコンテンツサービスモデルコンテキストプロトコルサーバーで、全文検索、ドキュメント管理、メタデータ操作など15種類のツールを提供し、STDIO/HTTP/SSEの複数の伝送プロトコルをサポートし、Alfrescoコミュニティ版とエンタープライズ版に適しています。
PrestaShopの開発ドキュメント向けに設計されたローカライズされたMCPサーバーで、1095以上のオフラインドキュメントの高速な全文検索を提供します。フック、コンポーネント、API、および開発ガイドが含まれています。