Googleは2026年2月25日、AIクリエイティブスタジオ「Flow」を大幅アップデートし、画像生成プロジェクト「Whisk」と「ImageFX」を統合。多モーダルAIツールを統一ワークフロー化。新モデル「Nano Banana」で高精度画像生成を実現し、Veo動画モデルへのシームレスな連携も可能に。....
Googleが最新AI音楽生成モデルLyria 3を発表。マルチモーダル入力対応で、30秒の高品質音楽を生成可能。多言語対応し、デスクトップ版で体験提供開始。....
ドゥイナントウグループは、中国テレビ放送協会の春晚が初めて国内AI動画生成モデルSeedance2.0を深く活用することを発表しました。これは中国のAI動画技術における大きな飛躍を示しています。このモデルはドゥーパオチームによって開発され、すでにドゥーパオの多様なプラットフォームに接続されており、ユーザーはプロンプトを使って迅速にショートビデオを作成できます。
ハイルービーAIは馬年の春節向けのシリーズコンテンツを発表しました。ハイルービー2.3および2.3Fastモデルの技術革新により、ダンス動作の性能や作画風の質が向上しています。B站(バクスタ)や芒果TV(マングトゥビ)およびゲームIPと協力して新春向けコンテンツのマトリクスを構築し、面白いインタラクティブ機能を提供するとともに、特別な特典を配布します。多様なAI体験を通じてユーザーを春節を楽しく過ごせるようサポートします。
GLM-5は智譜AIの第5世代の大規模モデルで、7450億のパラメータを持ち、多くの最先端機能を備えており、現在公開されています。
多モデルAIチャットアシスタントで、GPT 5やClaudeなどを統合し、多機能で多言語に対応しています。
GPTunneLは多様なAIモデルを通じたサービスを提供し、文章や画像の生成などが可能で、複数の支払い方法に対応しています。
無料の多モデルAI画像生成とオンライン編集ツールで、使用時に支払い、定期購読不要。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$4
$16
$2
$20
RinggAI
これは通話記録分析用に特別に開発された混合言語AIモデルで、ヒンディー語、英語、およびヒンディー語と英語の混合通話の文字起こし内容を処理できます。モデルはQwen2.5 - 1.5B - Instructをベースに微調整されており、強力な多言語理解と情報抽出能力を備えています。
allenai
Olmo 3はAllen Institute for AIによって開発された一連の言語モデルで、7Bと32Bの2種類の規模があり、命令式と思考式の2種類のバリエーションがあります。このモデルは長鎖思考に優れており、数学やコーディングなどの推論タスクの性能を効果的に向上させることができます。多段階訓練方式を採用しており、教師付き微調整、直接嗜好最適化、検証可能な報酬による強化学習が含まれます。
Olmo-3-7B-Think-DPOはAllen Institute for AIが開発した70億パラメータの言語モデルで、長い連鎖的な思考能力を持ち、数学やコーディングなどの推論タスクで優れた性能を発揮します。このモデルは、教師付き微調整、直接的な嗜好最適化、検証可能な報酬に基づく強化学習などの多段階の訓練を経ており、研究や教育目的に特化して設計されています。
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
TheWhisper-Large-V3はOpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォーム(NVIDIA GPUとApple Silicon)のリアルタイム、低遅延、低消費電力の音声テキスト変換推論用に最適化されています。
Mungert
PokeeResearch-7Bは、Pokee AIによって開発された70億パラメータの深度研究エージェントモデルです。AIフィードバック強化学習(RLAIF)と強力な推論フレームワークを組み合わせ、ツール強化型大規模言語モデルにおいて信頼性が高く、アライメントされ、拡張可能な研究レベルの推論を実現し、複雑な多段階研究ワークフローに適しています。
nineninesix
KaniTTSは、リアルタイム対話型人工知能アプリケーション向けに最適化された高速かつ高忠実度のアラビア語テキスト音声変換モデルです。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度とオーディオ品質を実現し、対話型AI、障害者支援、研究など多くの分野の音声合成ニーズを満たすことができます。
unsloth
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、70億と80億の2種類のパラメータ規模を提供します。このモデルは1000種類以上の言語をサポートし、完全にコンプライアンスでオープンな学習データを使用し、その性能はクローズドソースモデルに匹敵します。Apertusは15Tのトークンで事前学習され、段階的なコース学習方法を採用し、最大65,536トークンのコンテキスト長をサポートします。
redponike
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、パラメータ規模は80億と700億で、1000種以上の言語と長文脈処理をサポートし、完全にコンプライアンスの取れたオープンな学習データのみを使用し、性能はクローズドソースモデルに匹敵します。
Granite-4.0-MicroはIBMが開発した30億パラメータの長文脈指令モデルで、Granite-4.0-Micro-Baseをベースに微調整されています。このモデルはオープンソースの指令データセットと内部合成データセットを使用しており、指令の遵守とツール呼び出し能力が強化されており、多言語タスクをサポートし、各分野のAIアシスタントの基礎モデルとして使用できます。
GLM-4.6は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較して、長いコンテキストウィンドウ、より優れたコーディング性能、より強力な推論能力など、多くの面で顕著な改善が見られます。このモデルは、いくつかの公開ベンチマークテストで優れた結果を収めており、国内外の主要モデルと比較しても競争力があります。
Sunbird
Sunflower-32BはSunbird AIによって開発された多言語大規模言語モデルで、ウガンダ地域の言語に特化して最適化されています。Qwen 3 - 32Bアーキテクチャに基づいて構築され、31種類のウガンダ言語と英語の翻訳およびテキスト生成タスクをサポートし、ウガンダ言語の翻訳精度で優れた結果を示しています。
Sunflower-14Bは、Sunbird AIによって開発された多言語大規模言語モデルで、ウガンダの言語に特化して設計されています。このモデルはQwen 3-14Bアーキテクチャに基づいて構築され、31種類のウガンダ語と英語の翻訳およびテキスト生成タスクをサポートし、複数の評価で優れた成績を収めています。
LFM2はLiquid AIによって開発された次世代のハイブリッドモデルで、エッジAIとデバイス端末のデプロイメントに特化して設計されており、品質、速度、メモリ効率の面で新しい基準を確立しています。このモデルは革新的なハイブリッドLiquidアーキテクチャを採用し、乗算ゲートと短い畳み込みを備えており、多言語処理をサポートしています。
nvidia
NVIDIA-Nemotron-Nano-9B-v2はNVIDIAが最初から訓練した大規模言語モデルで、推論および非推論タスク用に設計されています。Mamba2-Transformer混合アーキテクチャを採用し、多言語処理をサポートし、制御可能な推論能力を備え、ユーザーが思考予算を指定でき、商用アプリケーションやAIエージェントシステムで優れた性能を発揮します。
facebook
DINOv3はMeta AIが開発した多機能ビジュアル基礎モデルで、微調整なしで幅広いビジュアルタスクで専用モデルを上回ります。このモデルは高品質な密集特徴を生成でき、様々なビジュアルタスクで優れた性能を発揮し、これまでの自己監督型および弱監督型の基礎モデルを大幅に上回っています。
Meta Llama-3.3-70B-Instructをベースにした大規模言語モデルで、多段階のトレーニング最適化を経て、推論やチャットなどのタスクで優れた性能を発揮し、複数の言語をサポートし、様々なAIアプリケーションシーンに適しています。ニューラルアーキテクチャサーチ技術を用いて最適化され、単一のH100-80GB GPUで効率的に動作します。
Devstral Small 1.1は、ソフトウェアエンジニアリングタスク用に最適化された大規模言語モデルで、Mistral AIとAll Hands AIが共同開発し、多言語とツール呼び出しをサポートしています。
lmstudio-community
ダニシュタ2.0はHelpingAIによって開発された画期的な推論AIモデルで、多言語テキスト生成をサポートし、中間思考能力と多段階思考プロセスを備えています。
Qwen 30B MoEをベースとしたプロトタイプのロールプレイングモデルで、多様なロールプレイング体験を提供することに特化しています。きめ細かいトレーニングによりAIの決まり文句を排除し、複数のロールプレイング形式とカスタム精度調整をサポートしています。
Zen MCPは多モデルAI協調開発サーバーで、ClaudeやGemini CLIなどのAIコーディングアシスタントに強化されたワークフローツールとモデル間のコンテキスト管理を提供します。これは複数のAIモデルのシームレスな協調をサポートし、コードレビュー、デバッグ、リファクタリングなどの開発タスクを実現し、異なるワークフロー間で会話のコンテキストを維持することができます。
これはDockerコンテナに基づくAI開発ツールプロジェクトで、Markdownファイルを使用して複雑なワークフローを記述し、Docker化されたツールとユーザーが選択したLLMモデルを組み合わせて、多モデルエージェントとプロジェクト優先設計のワークフローを実現します。
K8MはAI駆動の軽量級Kubernetesコンソールツールで、大規模モデルの能力を統合し、多クラスタ管理とMCPサービスをサポートします。
LYRAIOSはモデルコンテキストプロトコル(MCP)に基づく多AIエージェントオペレーティングシステムで、金融ネットワークとブロックチェーンパブリックチェーンを接続することでAIアプリケーションの機能を拡張し、ブロックチェーン操作、金融テクノロジー分析、教育学習などのサービスを提供することを目的としています。
AWS GCRが提供するMCPサーバーのサンプル集合で、リモートデスクトップ、ワークフローサービス、AI計画、時間サービス、HTMLレンダリングなどの多種の機能をカバーしています
MCPゴムダックは、モデルコンテキストプロトコル(MCP)に基づくサーバーで、複数のOpenAI互換のLLMを照会するためのブリッジとして機能します。ゴムダックデバッグ法のように、ユーザーが異なるAI「ダック」に問題を説明し、多様な視点からの回答を得ることができます。さまざまなAIプロバイダーをサポートし、会話管理、多モデル比較、コンセンサス投票、議論、反復最適化などの高度なツールを提供し、MCPブリッジ機能を通じて他のMCPサーバーに接続して機能を拡張することができます。
MindBridgeはAIモデルルーターサーバーで、複数のLLMプロバイダーをサポートし、スマートなモデルスケジューリングと協調を実現し、複雑な推論タスクや多モデルワークフローに適しています。
メタAPI MCPサーバーは、多APIをサポートするゲートウェイサーバーで、Model Context Protocol (MCP)を通じて様々なAPIと大規模言語モデル(Claude、GPTなど)を接続し、AIアシスタントがAPIと直接やり取りし、実データソースにアクセスできるようにします。JSON設定ファイルまたはPostmanコレクションからのAPIの迅速な追加をサポートし、HTTPメソッドの完全なサポートと複数の認証方式を提供します。
AnySite MCPサーバーは、モデルコンテキストプロトコルに基づく多プラットフォームのネットワークデータ収集ツールで、LinkedIn、Instagram、Reddit、Twitterなどのプラットフォームをサポートし、AIエージェントにリアルタイムで構造化されたネットワークデータへのアクセス能力を提供します。
Model Context Protocolに基づくMySQLデータベース操作サーバーで、標準化されたインターフェースを提供してAIモデルがMySQLとやり取りできるようにし、ローカルとリモートのデプロイをサポートし、多ユーザー同時アクセス、コネクションプール管理などの特性を備えています。
飞书MCPサーバーはMCPに基づくサービスで、飞书APIの统合を提供し、AIモデルが飞书サービスと简単にやり取りできるようにします。多次元テーブル操作と复数のモードの通信をサポートしています。
MCPドキュメントインデクサーは、Pythonベースのローカルドキュメントインデックスと検索サーバーです。LanceDBベクトルデータベースとローカルLLM(Ollamaを通じて)を利用して、リアルタイム監視、多フォーマットドキュメント処理、意味検索を実現し、モデルコンテキストプロトコル(MCP)を通じてClaudeなどのAIアシスタントにツールを提供します。
飞书MCPサーバーの実装で、AI大規模モデルと飞书APIのやり取り能力を提供し、主に多维表格の操作をサポートします。
複数のAIエージェントによる相談ができるMCPサーバーで、OpenAI、Anthropic、Google Geminiなどの異なるAIモデルを統合し、コード分析と問題解決に多モデルの視点からのサポートを提供します。
セキュリティを優先したモデルに基づくUbuntu MCPサーバーで、AIアシスタントに制御されたシステム操作へのアクセスを提供し、多層のセキュリティ保護、監査ログ、およびリソース制限を含みます。
OpenSCADに基づくMCPサーバーで、AIを通じて多視点画像を生成し、パラメトリック3Dモデルに再構成し、リモートCUDAアクセラレーション処理をサポートしています。
Claude CodeとGoogle Gemini AIを組み合わせたMCPサーバーで、多モデル協調により深いコード分析を実現します。Claudeはローカルコンテキスト操作とCLIワークフローに優れ、Geminiは超大規模なコンテキストウィンドウを利用して分散システムのデバッグと長いトレース分析を行います。
Image Gen MCP Serverは、Model Context Protocol(MCP)標準プロトコルを通じて、さまざまなLLMチャットボットにクロスプラットフォーム、多モデルの画像生成機能を提供する汎用AI画像生成サービスです。OpenAIとGoogleの複数の画像モデルをサポートし、テキスト対話からビジュアルコンテンツへのシームレスな変換を実現します。
Ultra MCPは多モデルAIプロトコルサーバーで、統一的なMCPインターフェースを通じてOpenAIやGeminiなどのAIモデルを統合し、Claude CodeやCursorをサポートします。ゼロコンフィグインストール、組み込み使用分析ダッシュボード、最新のWebインターフェースなどの特徴があります。
このプロジェクトは、アパッチFineract®にモデルコンテキストプロトコル (MCP) サービスを提供し、Python、Java、Node.jsの実装をサポートし、AIエージェントが金融データと操作にアクセスできるようにします。デバッグツール、多言語実装、標準化されたAPIインターフェースが含まれています。