アリババクラウドはマルチモーダルインタラクション開発キットをリリースしました。この開発キットは通義千問の3つの基本モデルと深く統合されており、さまざまなシナリオ向けのAIエージェントとMCPが事前に設定されており、スマートハードウェアに「開封してすぐに使用できる」AI機能を提供し、スマート化の門檻を下げるものです。AIメガネや学習機器などのエンドデバイスを支援します。
腾讯混元开源文生3D动作大模型HY-Motion1.0は、10億パラメータを持つDiffusion Transformerアーキテクチャを採用し、高品質な標準化されたスケルトンアニメーションを生成します。ゲーム開発者、アニメーター、研究者の効率向上を支援し、3Dアニメーション制作のハードルを下げ、個人クリエイターの創造性実現を促進します。....
リノボグループはモトロラと共同でローカル化されたAIアシスタント「Qira」を発表し、今四半期中にローンチする予定で、リノボのPCやモトロラのスマートフォンなどのデバイスをカバーします。Qiraは「常に存在」を特徴とする設計で、手動で起動する必要なくバックグラウンドで動作し、ユーザーのニーズに応じて知的対応を行い、リノボが独自のAIエコシステム構築を支援します。
リウランテクノロジーはCES2026で新たなスマートエコシステムを発表しました。このエコシステムには、AIプライベートクラウド、スマートセキュリティ、およびデスクトップ充電の3つの製品カテゴリーが含まれており、部品製造からスマートライフソリューションへの戦略的な転換を実現しています。特に、iDXシリーズのAIプライベートクラウドは、Intel® Core Ultraプロセッサを初めて搭載し、家庭データ管理に知能化をもたらします。
Mulanはワンクリックで電商製品の画像や分鏡などを生成でき、デジタルクリエイティブ創作をサポートします。
専門のAIキャラクター生成ツールで、瞬時に一貫したキャラクターを作成でき、20,000人以上のクリエイターが信頼しています。
クリエイティブスタイルの共有プラットフォームで、Nanoなどのモデルに適した高品質のプロンプトを提供し、無料で探索と貢献ができます。
簡単にビデオの素敵な瞬間をキャプチャし、人気のあるクリップをすばやく作成できます。ビデオ愛好家やクリエイターに最適です。
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$4
$16
$2
$20
$8
$240
52
Bytedance
$1.2
$3.6
4
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4bは、高度なColPaliスタイルのマルチモーダル埋め込みモデルで、テキストクエリ、ビジュアルドキュメント(画像やPDFなど)、またはショートビデオをアラインされたマルチベクトル埋め込みにマッピングできます。このモデルは、Qwen3-VL-4B-InstructとQwen3-Embedding-4Bの長所を組み合わせ、ViDoReベンチマークテストで優れた性能を発揮し、同時に埋め込みに必要なスペースを大幅に削減します。
allenai
Olmo 3は、Allen Institute for AIによって開発された次世代の言語モデルファミリーで、7Bと32Bの指令と思考のバリエーションを含んでいます。このモデルは、長鎖思考において優れた性能を発揮し、数学やコーディングなどの推論タスクの性能を大幅に向上させます。すべてのコード、チェックポイント、およびトレーニングの詳細は公開され、言語モデル科学の発展を促進します。
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
混元OCRは、混元の独自のマルチモーダルアーキテクチャによって駆動されるエンドツーエンドOCRの専門的なVLMモデルです。わずか10億パラメータの軽量設計で、複数の業界ベンチマークテストで最先端の成績を収めています。このモデルは、複雑な多言語ドキュメント解析に長けており、テキストの位置特定、オープンドメインの情報抽出、ビデオ字幕の抽出、画像の翻訳などの実際のアプリケーションシーンで優れた性能を発揮します。
pnnbao-ump
VieNeu-TTS-1000hは、約1000時間の高品質ベトナム語音声データを基にトレーニングされた、先進的なベトナム語エッジ側テキスト音声変換モデルです。即時音声クローニング機能を備え、ベトナム語と英語のシームレスな切り替えをサポートし、CPUまたはGPU上で24kHz波形をリアルタイムで合成できます。
Kiy-K
Fyodor-StarCoder2-7B-MoEはStarCoder2-7Bをベースにした強化版で、ハイブリッドエキスパートアーキテクチャを採用し、3つのMoE層、6つのエキスパートネットワーク、top-2ルーティングメカニズムを持ち、コード生成、関数呼び出し、エージェントタスクの分野で優れた性能を発揮します。
DakkaWolf
Trouper-12B GGUFは、DarwinAnim8orによってオリジナルモデルを基に開発されたテキスト生成モデルで、ロールプレイングやクリエイティブライティングのシナリオに特化して最適化されています。このモデルはMistral-Nemo-Base-12Bから微調整され、カスタムの「Actors」データセットを使用して訓練されており、生成されるテキストはより自然で、一般的な「AI言語」の特徴を避けています。
DarwinAnim8or
Prima-24Bは240億パラメータの大規模言語モデルで、GGUF形式を用いて量子化最適化され、ロールプレイングとクリエイティブライティングタスクに特化して最適化されています。このモデルは元のPrima-24Bモデルから変換され、Q4_K_M量子化レベルを採用しており、良好な性能を維持しながらモデルサイズとメモリ要件を大幅に削減しています。
ErenAta00
サイバーブレインは、コンテスト(CTF)の挑戦やネットワークセキュリティタスクに特化して微調整された大規模言語モデルです。Llama - 3.1 - 8B - Instructアーキテクチャに基づいており、CTFの問題解決、セキュリティ脆弱性の分析、リバースエンジニアリングや暗号学的挑戦に対応し、倫理規範に沿った脆弱性利用推論を提供します。
DavidAU
これは、Qwen3-VL-8B-Thinkingモデルをベースにした強化版のマルチモーダルビジュアル言語モデルです。Brainstorm 20x技術を用いて12Bパラメータに拡張され、NEO Imatrixで強化されたGGUF量子化が適用されています。このモデルは、画像理解、テキスト生成、マルチモーダル推論の能力が強く、ビジュアル感知、テキスト品質、クリエイティブなシーンでの性能が著しく向上しています。
unsloth
Qwen3-VLは通義シリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認知と推論、コンテキスト長、空間およびビデオの動的理解、エージェントインタラクション能力などの面で全面的にアップグレードされています。このモデルは密集アーキテクチャとハイブリッドエキスパートアーキテクチャを提供し、エッジデバイスからクラウドまでの柔軟なデプロイをサポートします。
Qwen3-VLはアリババが開発した新世代のビジュアル言語モデルで、テキスト理解、ビジュアル感知、空間理解、長文脈処理、エージェントインタラクションなどの分野で全面的にアップグレードされ、エッジデバイスからクラウドまで柔軟にデプロイできます。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェントインタラクション能力を備えています。このバージョンは2Bパラメータの思考強化版で、推論能力が特別に最適化されています。
Qwen
Qwen3-VL-2B-ThinkingはQwenシリーズの中で最も強力なビジュアル言語モデルの1つで、GGUF形式の重みを使用し、CPU、NVIDIA GPU、Apple Siliconなどのデバイスで効率的な推論をサポートします。このモデルは、優れたマルチモーダル理解と推論能力を備え、特にビジュアル感知、空間理解、エージェントインタラクション機能が強化されています。
Qwen3-VL-8B-Thinkingは通義千問シリーズの中で最も強力なビジュアル言語モデルで、強化された推論能力を備えた8Bパラメータ版です。このモデルは、テキスト理解、ビジュアル認知、空間理解、長文脈処理などの面で全面的にアップグレードされ、マルチモーダル推論とエージェントインタラクションをサポートしています。
Qwen3-VLは通義シリーズで最も強力な視覚言語モデルで、優れたテキスト理解と生成能力、深い視覚感知と推論能力、長文脈サポート、強力な空間およびビデオ動的理解能力、ならびにエージェントインタラクション能力を備えています。このリポジトリはGGUF形式の重みを提供し、CPU、GPUなどのデバイスでの効率的な推論をサポートします。
Qwen3-VLはアリババが開発した最新世代のビジュアル言語モデルで、テキスト理解、ビジュアル認知、空間理解、ビデオ分析、エージェントインタラクションなどの分野で著しい向上が見られます。このモデルはマルチモーダル入力をサポートし、強力な推論能力と長文脈処理能力を備えています。
redponike
MiniMax - M2は、高効率コーディングとインテリジェントエージェントワークフロー用に特別に開発されたハイブリッドエキスパートモデルで、総パラメータが2300億、活性化パラメータが100億です。このモデルは、コーディングとインテリジェントエージェントタスクで卓越した性能を発揮し、低遅延、低コスト、高スループットの特徴を持ち、作業効率を効果的に向上させます。
bullerwins
MiniMax - M2は、コーディングとエージェントワークフローを最大化するために構築された小型のハイブリッドエキスパート(MoE)モデルです。総パラメータは2300億で、活性化されるパラメータは100億のみで、コーディングとエージェントタスクで卓越した性能を発揮し、同時に強力な汎用知能を保持し、コンパクトで高速かつ経済的です。
cturan
MiniMax-M2は、llama.cppの実験的ブランチに基づいて構築された大規模言語モデルで、ハイブリッドエキスパートアーキテクチャを備え、効率的なテキスト生成と推論タスクをサポートします。このモデルは特定の実験的ブランチが必要で正常に動作します。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
PraisonAIは、自動反省機能を備えた本番環境で使用可能な多AIエージェントフレームワークです。簡単なタスクから複雑な課題まで、様々な問題を自動的に解決するAIエージェントを作成することを目的としています。PraisonAIエージェント、AG2、CrewAIを低コードソリューションに統合することで、多エージェントLLMシステムの構築と管理を簡素化し、簡単さ、カスタマイズ性、および効果的な人間との協働を重視しています。
Acemcpは、コードライブラリのインデックス化と意味検索を行うMCPサーバーです。自動増分インデックス、複数エンコーディングファイルの処理、.gitignore統合、およびWeb管理インターフェイスをサポートしており、開発者がコードのコンテキストをすばやく検索し、理解するのに役立ちます。
ソロンは、高効率、オープン、エコシステムにやさしいJavaのエンタープライズアプリケーション開発フレームワークで、全シナリオの開発に対応し、高性能、低メモリ消費、高速起動、小さなパッケージサイズなどの特徴があり、Java8からJava24まで、およびGraalVMネイティブランタイムと互換性があります。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。
Perplexity MCP Serverは、PerplexityのAIモデルを利用して、クエリの複雑度を自動的に分析し、最適なモデルを選択してリクエストを処理するインテリジェントな研究アシスタントです。検索、推論、深掘り研究の3種類のツールをサポートしています。
Redis MCPサーバーは、Redis用に設計された自然言語インターフェースサービスで、AIエージェントが自然言語でRedisデータをクエリし管理でき、MCPプロトコルを統合し、複数のデータ構造と検索機能を提供します。
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
Blender MCP VXAIは強力な統合ツールで、ユーザーが自然言語でBlenderを制御し、3Dモデリング、アニメーション、シーンの作成と修正を実現できます。複雑な操作を簡素化し、リアルタイムでプロジェクトにエクスポートすることをサポートします。
PlaywrightをベースにしたNode.jsツールで、検索エンジンの反クロールメカニズムを回避してGoogle検索を実行し、結果を抽出できます。コマンドラインツールまたはMCPサーバーとしてAIアシスタントにリアルタイム検索機能を提供できます。
これは、MCPコード実行モードを実現するサーバーで、単一ツールブリッジとゼロコンテキスト発見メカニズムを通じて、MCPツールの呼び出しオーバーヘッドを数万トークンから約200トークンに削減し、ルートコンテナ内で安全にPythonコードを実行し、データサイエンスとセキュリティ隔離をサポートします。
Perplexity MCP Serverは、PerplexityのAIモデルを利用して、自動クエリ複雑度検出と最適なモデルルーティング機能を提供するインテリジェントな研究アシスタントで、検索、推論、深度研究の3種類のツールをサポートしています。
Qdrantベクトルデータベースを基にしたドキュメントの意味検索サービスで、URLとローカルファイルのインポートをサポートし、自然言語クエリ機能を提供します。
クライオMCPは、クライオブロックチェーンデータ抽出ツールに基づくモデル完了プロトコルサーバーで、APIを通じてブロックチェーンデータにアクセスする機能を提供し、SQLクエリと複数のデータ形式出力をサポートします。
MCPプロトコルに基づくインテリジェントなタスク管理システムで、AIエージェントによる効率的なプログラミングワークフローフレームワークを提供し、タスクの計画、分解、実行、記憶機能を備えています。
adb - mcpは、MCPプロトコルを通じてLLMにインターフェースを提供し、Adobeツール(PhotoshopやPremiereなど)を制御するAIエージェントを作成する概念実証プロジェクトです。このプロジェクトには、MCPサーバー、Nodeコマンドプロキシサーバー、およびAdobeアプリケーションプラグインが含まれており、自然言語の命令でAdobeソフトウェアを操作でき、画像およびビデオ編集の自動化に適しています。
XiYan MCPサーバーは、XiYan-SQLに基づくモデルコンテキストプロトコルサーバーで、自然言語でデータベースをクエリすることをサポートし、複数のLLMモデルの統合とローカルデプロイオプションを提供します。
XiYan MCPサーバーはXiYan - SQLに基づくモデルコンテキストプロトコルサーバーで、自然言語でデータベースをクエリすることをサポートし、複数のLLMモデルの設定とデータベース接続方法を提供し、ローカルまたはリモートでのデプロイに適しています。
HiMarketは即座に利用可能な企業向けAIオープンプラットフォームソリューションで、管理バックエンド、開発者ポータル、AIゲートウェイの3つの核心コンポーネントを提供し、モデルサービス、MCP ServerなどのAI機能を標準化されたAPI製品にパッケージ化して公開することをサポートします。
このプロジェクトは、コードをGoogle Cloud RunサービスにデプロイするためのMCPサーバーを提供し、AI支援IDE、AIアシスタントアプリ、およびエージェントSDKなどのさまざまな方法でのデプロイをサポートします。