2026年3月、Google DeepMindはGemini APIをアップグレードし、マルチツールチェーンと「文脈ループ」メカニズムを提供しました。この取り組みにより開発プロセスが簡略化され、1つのリクエスト内でGoogle検索や地図などのネイティブツールとカスタム関数を統合できます。「文脈ループ」は、ツール間でのデータの自動伝達を実現し、応答効率とタスク処理能力を向上させました。
マスクが率いるxAI社は、Grokテキストから音声変換Speech APIを正式にリリースしました。これにより、AIアシスタントは音声によるインタラクションが可能になります。この動きは、Grokのマルチモーダル機能を拡張し、開発者に便利なインターフェースを提供するだけでなく、会話能力をさまざまなアプリケーションに統合できるようにし、AIエコシステムがより人間らしい方向へと進化させることになります。
腾讯AI工作台imaが「ima skills」機能をリリース。OpenClawなどの外部自動化ツールと連携し、API経由で内部コンポーネントを操作可能に。初回実装の「ノートskill」はコンテンツ検索・読み書き機能を搭載、「ナレッジベースskill」も近日公開予定。....
マスク率いるxAI社は、Grok大規模モデル用のテキストから音声へのAPIをリリースしました。開発者はGrok独特のユーモラスで毒舌なトーンをアプリケーションに統合でき、文字から音声インタラクションへと進化させます。
ワンストップAI APIストア。1つのインターフェイスでビデオ、画像、音声の無限の生成能力を網羅します。
AIエージェントがリアルワールドのタスクを完了するために人間を外部委託するプラットフォーム、63万以上の利用可能な人間
強力なAPIマーケット、多様なAIインターフェースの簡単な統合。
シンプルなAPIを通じて、ソーシャルメディアのビデオを構造化データに変換し、要約や文字起こしなどを含みます。
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
-
Anthropic
$105
$525
200
Google
$0.7
$7
$35
$21
Alibaba
Deepseek
$4
$12
128
Tencent
$1
32
$0.35
400
Chatglm
$0.8
$2
$0.2
Huawei
$14
$56
$2.4
$9.6
shorecode
これは効率的なテキスト要約モデルで、大規模言語モデルのプロンプト内のテキスト内容を圧縮するために特別に設計されており、7倍以上の圧縮率を達成でき、API呼び出しコストを大幅に削減します。
Roblox
Roblox Guard 1.0は、Llama - 3.1 - 8B - Instructをベースに微調整された最先端の命令微調整大規模言語モデルで、テキスト生成APIのセキュリティ保護を目的として特別に設計されています。このモデルは、プロンプトと応答のレベルで二段階のセキュリティ分類を行うことができ、ユーザーのクエリとモデルの出力を効果的に審査し、コンテンツがセキュリティポリシーに準拠していることを保証します。
RoGuard 1.0は、Llama-3.1-8B-Instructをベースに微調整された先進的な大規模言語モデルで、大規模言語モデルにセキュリティ保障を提供するために特別に設計されています。このモデルは、プロンプトとレスポンスの両方のレベルでセキュリティ分類を行い、入力または出力がセキュリティポリシーに違反しているかどうかを判断し、テキスト生成APIに強力なセキュリティガードレールを提供します。
RoGuard 1.0は、Llama-3.1-8B-Instructをベースに微調整された大規模言語モデルで、テキスト生成APIのセキュリティ向上に特化しています。
stablediffusionapi
Stable Diffusion APIに基づくテキストから画像への生成モデルで、入力されたテキスト記述に基づいて超リアルな画像を生成でき、様々なクリエイティブシーンやアート創作ニーズに適しています。
litert-community
これはQwen2.5-0.5B-InstructモデルのLiteRT最適化バージョンで、モバイルデバイスへのデプロイに特化して最適化されています。このモデルは複数の量子化バリエーションを提供し、LiteRTフレームワークとMediaPipe LLM推論APIを通じてAndroidデバイスでの効率的なデプロイをサポートします。
Salesforce
xLAM-2シリーズはAPIGen-MTフレームワークでトレーニングされた大規模アクションモデルで、マルチターン対話と関数呼び出し能力に特化しており、AIエージェント開発に適しています。
DeepSeek-R1-Distill-Qwen-1.5Bの複数のバリエーションを基に、LiteRTフレームワークとMediaPipe LLM推論APIに適合し、Androidプラットフォームにデプロイ可能です。
xLAM-7b-fc-r は Salesforce が提供する関数呼び出し最適化を目的とした7Bパラメータの大規模言語モデルで、入力クエリと利用可能なAPIに基づいて迅速かつ正確で構造化された応答を提供します。
apipack
CodeLlama-13b-hfアーキテクチャを基にファインチューニングした大規模言語モデルで、API呼び出し生成タスクに特化して最適化
NexaAI
タコモデルV2は20億パラメータのオープンソース言語モデルで、Android APIの最適化を目的として開発され、機能トークン戦略を採用して推論速度と精度を向上させています。
gorilla-llm
Gorilla OpenFunctions v2は、自然言語の指示とAPIコンテキストに基づいて実行可能なAPI呼び出しを生成できるオープンソースの大規模言語モデルです。
aligner
モデルに依存しないプラグアンドプレイモジュールで、オープンソースおよびAPIベースのモデルに適用可能。残差補正戦略によりAI安全性を強化
AlbedoBase XL 2.0は、テキストから超リアルな画像を生成するモデルで、APIを通じて効率的な画像変換を実現し、費用を支払うことなく使用できます。
Gorilla OpenFunctionsは、大規模言語モデルのチャット補完機能を拡張し、自然言語の指示とAPIコンテキストに基づいて実行可能なAPI呼び出しを生成できます。
cooperleong00
DeBERTa - v3 - largeをベースに微調整された毒性分類器で、テキストの毒性を効率的かつ正確に評価するために特別に設計されています。このモデルはPerspective APIの代替案として、90kのRTPサンプルで訓練され、保留テストセットで94.87%の正確率と98.54%のAUROCスコアを達成しました。
SDVN5-3DCuteWave APIの推論により、テキストから超リアルな画像への変換を実現でき、ユーザーに高品質な画像生成体験を提供します。
squarelike
ShareGPTデータセットとDeepL翻訳APIで訓練された韓英/英韓双方向翻訳モデル
api19750904
PyTorchとHuggingPicsを使用して構築された画像分類モデルで、食品分類専用
SEBIS
T5小型アーキテクチャに基づくマルチタスク事前学習モデルで、Javaプログラミングタスク向けのAPI使用推奨を生成
Supabase MCPサーバーはオープンソースのツールで、IDEが安全にSQLを実行し、スキーマ変更を管理し、Supabase管理APIを呼び出し、Auth Admin SDKを使用できるようにします。組み込みのセキュリティ制御があります。
ElevenLabs公式のMCPサーバーで、テキストを音声に変換し、音声処理APIとのやり取りが可能です。
Claude/Cursor用に設計されたOpenAPI仕様探索サーバーで、3ステップのプロセスでユーザーがAPIドキュメントを検索し理解するのを支援します。
Apify MCPサーバーは、モデルコンテキストプロトコル(MCP)に基づくツールで、AIアシスタントが数千の既成のクローラー、スクレイパー、自動化ツール(Apifyアクター)を通じて、ソーシャルメディア、検索エンジン、電子商取引などのウェブサイトからデータを抽出できるようにします。OAuthとSkyfireプロキシ支払いをサポートしており、HTTPSエンドポイントまたはローカルのstdio方式でClaude、VS CodeなどのMCPクライアントに統合できます。
WhatsApp MCPサーバーは、WhatsAppのウェブマルチデバイスAPIを通じて個人アカウントを接続するツールです。メッセージの検索、送信、マルチメディア処理をサポートし、ClaudeなどのLLMと統合されます。
このプロジェクトは、ObsidianのLocal REST APIプラグインを通じてObsidianノートアプリとやり取りするMCPサーバーです。Obsidian内のファイルを操作および管理するためのさまざまなツールを提供し、ファイルのリスト表示、内容の取得、検索、内容の変更、ファイルの削除などが可能です。
PG - MCPは、PostgreSQLデータベース用に設計されたモデルコンテキストプロトコルサーバーです。AIエージェントがデータベースを発見、接続、クエリ、および理解するためのAPIを提供し、複数のデータベース接続、豊富なディレクトリ情報、およびクエリ実行計画分析機能をサポートします。
Sail は、ストリーム処理、バッチ処理、および計算集約型(AI)ワークロードを統一することを目的としたプロジェクトで、Spark SQL と Spark DataFrame API の代替手段を提供し、シングルマシンと分散環境の両方をサポートします。
Stripe Agent Toolkitは、複数のAIエージェントフレームワーク(OpenAI、LangChain、CrewAIなど)とStripe APIの統合をサポートするツールキットで、PythonとTypeScriptをサポートし、支払い関連の操作を簡素化します。
Exa MCP Serverは、AIアシスタント(Claudeなど)にウェブ検索機能を提供するサーバーで、Exa AI検索APIを通じてリアルタイムで安全にウェブ情報を取得できます。
このプロジェクトは、Notion APIにMCPサーバーを実装し、モデルコンテキストプロトコルを通じてNotionコンテンツにアクセスし操作できるようにします。検索、コメント、ページの追加などの機能をサポートしています。
このプロジェクトは、Sonar APIを統合したMCPサーバーの実装で、Claudeにリアルタイムのネットワーク検索機能を提供します。システムアーキテクチャ、ツールの設定、Dockerデプロイ、およびマルチプラットフォーム統合ガイドが含まれています。
機能豊富なMarkdown排版ツールで、様々なスタイルテーマとプラットフォーム対応をサポートし、リアルタイム編集プレビュー、画像エクスポート、API統合機能を提供します
Notion MCPサーバーは、Notion APIとLLMを接続するミドルウェアサービスで、Markdown変換によりやり取りの効率を最適化します。
MiniMax Model Context Protocol (MCP) は公式サーバーで、強力なテキスト読み上げ、ビデオ/画像生成APIとのやり取りをサポートし、Claude Desktop、Cursorなどの様々なクライアントツールに適しています。
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
MCP Linkは、任意のOpenAPI V3仕様のAPIをMCPサーバーに変換する自動化ツールで、既存のRESTful APIをAI駆動のアプリケーションエコシステムにシームレスに接続できます。
Anna's ArchiveのMCPサーバーとCLIツールは、このプラットフォームのドキュメントを検索およびダウンロードするためのもので、APIキーを使用したアクセスをサポートしています。
PythonベースのMCPサーバーで、Notion APIを通じて高度なタスク管理とコンテンツ組織機能を提供し、AIモデルとNotionのシームレスな統合を実現します。
Framelink Figma MCPサーバーは、AIプログラミングツール(Cursorなど)にFigmaのデザインデータへのアクセスを提供するサーバーで、Figma APIのレスポンスを簡素化することで、AIがデザインからコードへのワンクリック変換をより正確に行えるように支援します。