AI専門家のIlya Sutskeverは、モデル規模の拡大だけの時代が終わり、今後の進展はより知的なアーキテクチャ設計に依存すると指摘。中国チームはオープンソースのネイティブマルチモーダルアーキテクチャ「NEO」を発表し、新たな方向性を示した。....
阿里通義千問がQwen Code v0.3.0をリリース。Qwen3-Coderモデル向けに最適化され、開発者効率向上を目指す。コード理解と自動化タスク能力を強化し、新たなスマートアシスト機能を追加。機能拡張、国際化対応、セキュリティ、エコシステム適応を重点的に更新。....
ヌビアの倪飛社長はAIスマホが業界の未来と指摘。最近発表した豆包スマホアシスタント連携プレビュー版で体験向上を図る。2017年からのAI戦略を振り返り、業界のイノベーション課題には開放的な協力が重要と強調。....
OpenAIとドイツテレコムは戦略的提携を結び、2026年からChatGPT Enterpriseを全社約20万人の従業員に導入。カスタマーサービス、IT運用、財務・人事などの業務効率化を推進。ドイツ国内データセンターに専用クラスターを設置し、ネットワーク運用やAIソリューションの共同開発も計画。....
AIによるスマートなウェブ変化サブスクリプションツール。
幻覚を解消し、マルチモーダルRAGは情報を忘れず、最先端モデルをスマートに編成し、タスクの実行に卓越した成果を収めます。
オンラインで無料かつウォーターマークのないAIビデオ生成ツール。テキストまたは画像から素敵なビデオを生成します。
無料で1位のAIビデオ生成ツール。テキストから1080pのビデオを生成でき、ウォーターマークなしで無制限に使用できます。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
Baidu
128
$4
$16
$2
$20
PrimeIntellect
INTELLECT-3は1060億のパラメータを持つ混合専門家(MoE)モデルで、大規模な強化学習によって訓練されています。数学、コーディング、推論のベンチマークテストで卓越した性能を発揮し、モデル、訓練フレームワーク、環境はすべて緩やかなライセンス契約でオープンソース化されています。
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4bは、高度なColPaliスタイルのマルチモーダル埋め込みモデルで、テキストクエリ、ビジュアルドキュメント(画像やPDFなど)、またはショートビデオをアラインされたマルチベクトル埋め込みにマッピングできます。このモデルは、Qwen3-VL-4B-InstructとQwen3-Embedding-4Bの長所を組み合わせ、ViDoReベンチマークテストで優れた性能を発揮し、同時に埋め込みに必要なスペースを大幅に削減します。
bartowski
これはマイクロソフトFara-7Bモデルの量子化バージョンで、llama.cppのimatrix技術を使用して最適化されています。このモデルは、高精度のbf16から超低精度のIQ2_Mまで、さまざまな量子化レベルをサポートし、異なるハードウェア構成とパフォーマンス要件を満たします。
MuXodious
Gemma 3n E4B ITは、Googleが開発した軽量マルチモーダルオープンモデルで、Geminiモデルと同じ研究に基づいて構築されています。このモデルは、テキスト、オーディオ、ビジュアル入力をサポートし、様々なタスクに適用できます。MatFormerアーキテクチャを採用して、効率的なパラメータ利用を実現しています。
pramjana
Qwen3-VL-4B-Instructはアリババが開発した40億パラメータの視覚言語モデルで、Qwen3アーキテクチャに基づいて開発され、マルチモーダル理解と対話タスクをサポートします。このモデルは強力な画像理解とテキスト生成能力を備え、複雑な視覚言語対話シーンを処理することができます。
ExaltedSlayer
Gemma 3はGoogleが開発した軽量オープンソースのマルチモーダルモデルです。このバージョンは12Bパラメータの命令調整量子化感知トレーニングモデルで、MLXフレームワークのMXFP4形式に変換されています。テキストと画像の入力をサポートし、テキスト出力を生成します。128Kのコンテキストウィンドウと140種類以上の言語をサポートしています。
black-forest-labs
FLUX.2 [dev] は320億のパラメータを持つ補正フロートランスフォーマーモデルで、画像生成、編集、および合成タスクに特化しています。このモデルは、テキストから画像への生成、単一参照編集、および多参照編集においてリーディングレベルであり、微調整なしでキャラクター、オブジェクト、およびスタイルの参照を実現し、個人、科学、および商業用途をサポートします。
Kiy-K
Fyodor-Q3-8B-Instructは、スマート推論と堅牢なコード生成のために設計された高忠実度の命令調整モデルです。Qwen3 - 8Bアーキテクチャに基づき、高ランクのLoRA設定で訓練されており、コーディング前の計画立案に長けており、複雑なソフトウェアエンジニアリングタスクに非常に適しています。
mradermacher
これはwexyyyyyy/Ru-Gemma3-1Bモデルの静的量子化バージョンで、ロシア語と英語をサポートし、対話とテキスト生成タスク用に特別に設計されています。このモデルは、さまざまなハードウェア構成とパフォーマンス要件に適した複数の量子化バージョンを提供します。
Justin331
SAM 3はMetaが発表した第3世代のプロンプト可能な分割基礎モデルで、画像とビデオの分割タスクを統一的にサポートします。前代のSAM 2と比べて、オープンボキャブラリ概念分割能力を導入し、大量のテキストプロンプトを処理でき、SA - COベンチマークテストで人間の性能の75 - 80%に達します。
Owen777
UltraFluxは、Fluxベースの拡散トランスフォーマーで、ネイティブ4Kのテキストから画像への生成に特化しています。データ、アーキテクチャ、損失関数の協調設計により、様々なアスペクト比で一貫した画像品質を維持することができます。
Nanbeige
楠米色4-3B-思考-2511は楠米色シリーズの最新の強化バージョンで、高度な蒸留技術と強化学習による最適化を通じて、コンパクトな3Bパラメータ規模で強力な推論能力を実現しています。このモデルはArena-Hard-V2やBFCL-V4などのベンチマークテストで、パラメータが32B未満のモデルの中で最先端(SOTA)の成果を達成しています。
ai-sage
GigaChat3-10B-A1.8BはGigaChatシリーズの対話モデルで、混合専門家(MoE)アーキテクチャに基づいており、合計100億のパラメータがあり、そのうち18億がアクティブなパラメータです。このモデルは、マルチヘッド潜在注意力と多トークン予測技術を採用しており、25.6万トークンの長文脈をサポートし、多言語対話と推論タスクで優れた性能を発揮します。
OpenMMReasoner
OpenMMReasonerは完全に透明な2段階のマルチモーダル推論アプローチで、教師付き微調整(SFT)と強化学習(RL)を用いてトレーニングされます。SFT段階では874Kのサンプルからなるコールドスタートデータセットを構築し、RL段階では74Kのサンプルを利用して能力をさらに向上させ、マルチモーダル推論のベンチマークテストで優れた結果を示します。
GigaChat3-10B-A1.8B-baseはGigaChatシリーズの基礎事前学習モデルで、混合エキスパート(MoE)アーキテクチャを採用し、総パラメータは100億、アクティブなパラメータは18億です。モデルはマルチヘッド潜在的注意機構(MLA)と多トークン予測(MTP)技術を統合し、推論時に高いスループットの利点を持ちます。
OpenMMReasonerは完全に透明な二段階マルチモーダル推論方案で、教師あり微調整(SFT)と強化学習(RL)を含んでいます。この方案は、質の高いデータセットを精心に構築することで、複数のマルチモーダル推論ベンチマークテストで強力なベースラインモデルを上回り、将来の大規模マルチモーダル推論研究に堅実な実証的基礎を築きました。
Mungert
MiroThinker v1.0はオープンソースの研究エージェントで、モデルレベルの対話型拡張により、ツール強化推論と情報検索能力を向上させます。このモデルは複数のベンチマークテストで優れた性能を発揮し、長文脈と深度のある多段階分析をサポートします。
tencent
混元OCRは、混元の独自のマルチモーダルアーキテクチャによって駆動されるエンドツーエンドOCRの専門的なVLMモデルです。わずか10億パラメータの軽量設計で、複数の業界ベンチマークテストで最先端の成績を収めています。このモデルは、複雑な多言語ドキュメント解析に長けており、テキストの位置特定、オープンドメインの情報抽出、ビデオ字幕の抽出、画像の翻訳などの実際のアプリケーションシーンで優れた性能を発揮します。
onnx-community
SAM3は概念ベースの任意分割モデルで、入力された点やボックスなどのプロンプト情報に基づいて、正確な画像分割マスクを生成することができます。このバージョンはONNX形式のSAM3トラッカーモデルで、Transformers.jsライブラリを通じてブラウザ環境で効率的に動作します。
allenai
Olmo 3はAllen Institute for AIによって開発されたオープンソースの言語モデルシリーズで、7Bと32Bの2種類の規格があり、指令(Instruct)と思考(Think)の2種類のバリエーションに分かれています。このモデルは卓越した長鎖思考能力を持ち、数学やコーディングなどの推論タスクのパフォーマンスを大幅に向上させることができます。
sitemcpは、ウェブサイト全体の内容を取得し、それをMCPサーバーとして使用できるツールで、カスタムマッチングページ、コンテンツセレクターなどの機能をサポートし、ドキュメントやブログサイトの迅速な検索に適しています。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
アデリンは、Rustで書かれたオープンソースのSolidityスマートコントラクト静的分析ツールで、開発者やセキュリティ研究者がSolidityコードの脆弱性を発見するのを支援します。FoundryとHardhatプロジェクトをサポートし、複数の形式のレポートを生成でき、VSCode拡張機能も提供します。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
MCPプロトコルに基づくKubernetesクラスター管理サーバーで、コマンドラインまたはチャットインターフェイスを通じてKubernetesクラスターとやり取りでき、リソース管理、Helmチャート操作などの機能を提供します。
Sail は、ストリーム処理、バッチ処理、および計算集約型(AI)ワークロードを統一することを目的としたプロジェクトで、Spark SQL と Spark DataFrame API の代替手段を提供し、シングルマシンと分散環境の両方をサポートします。
OpenDiaはオープンソースのブラウザ拡張ツールで、AIモデルが直接ユーザーのブラウザを制御でき、既存のログイン状態、ブックマークなどのデータを利用して自動化操作を行います。複数のブラウザとAIモデルをサポートし、プライバシー保護に配慮しています。
DeeboはAIデバッグアシスタントで、自動調査とマルチスレッドワークフローにより、コードエラーの解決プロセスを加速し、開発効率を向上させます。
このプロジェクトは、Sonar APIを統合したMCPサーバーの実装で、Claudeにリアルタイムのネットワーク検索機能を提供します。システムアーキテクチャ、ツールの設定、Dockerデプロイ、およびマルチプラットフォーム統合ガイドが含まれています。
DevDocsは、開発者が技術ドキュメントを迅速に理解して実装できるようにする、スマートなドキュメントクローリングと処理ツールです。開発サイクルを大幅に短縮します。
デスクトップコマンダーMCPは、Claudeデスクトップアプリケーションがターミナルコマンドを実行し、ファイルシステムを管理できるAIアシスタントツールです。コードの検索、編集、プロセス管理、リモートファイルの読み取りなどの機能をサポートします。
RedNote MCPは、小红书のコンテンツへのアクセスを提供するツールで、認証管理、キーワードによるノート検索、コマンドラインによる初期化などの機能をサポートし、URLを通じてノートコンテンツにアクセスできます。
RedNote MCPは、小红书のコンテンツへのアクセスを提供するMCPサービスツールで、コマンドラインを通じてログインの初期化、キーワードによるノート検索、URLによるノート内容のアクセスなどの機能をサポートしています。
GitLab MCPサーバーは、Model Context Protocolに基づくプロジェクトで、GitLabアカウントとのやり取りに必要な包括的なツールセットを提供します。コードレビュー、マージリクエスト管理、CI/CD設定などの機能が含まれます。
MCP MongoDBサーバーは、モデルコンテキストプロトコルサービスで、LLMがMongoDBデータベースと相互作用できるようにします。コレクションスキーマチェック、クエリ実行、スマートID処理などの機能を提供し、読み取り専用モードとセキュリティ設定をサポートします。
FastMCPライブラリに基づくPostgreSQLデータベースのMCPサービスで、指定されたテーブルのCRUD操作、スキーマ検査、およびカスタムSQLクエリ機能を提供します。
NodeJSベースのMySQLデータベースのMCPサーバーで、LLMにデータベーススキーマチェックとSQLクエリ実行機能を提供します。
Smithery CLIは、Model Context Protocol (MCP)サーバーを管理するコマンドラインツールで、複数のAIクライアントをサポートし、MCPサーバーのインストール、アンインストール、表示、実行機能を提供します。
ACI.devはオープンソースのAIエージェントツールインフラストラクチャで、600以上の事前統合ツールのマルチテナント認証、権限管理、動的探索機能を提供し、統合MCPサーバーまたは軽量SDKを通じた呼び出しをサポートし、本番レベルのAIエージェント開発を簡素化します。
OpenZeppelin Contracts Wizardはインタラクティブなスマートコントラクト構築ツールで、ユーザーがコントラクトタイプ、パラメータ、機能を選択することで、OpenZeppelinコンポーネントに基づくコントラクトコードを生成できます。複数のプログラミング言語をサポートし、APIと埋め込み機能を提供します。