ElevenLabsのAI音声エージェントがWhatsAppに統合され、テキストと音声のデュアルモードで対話可能。ユーザーは文字チャットや音声通話を通じて、リアルなAIアシスタントと会話できます。企業向けに多言語対応、感情認識、リアルタイム翻訳機能を備えたAI音声アシスタントを簡単に導入でき、カスタマーサポート体験を革新します。....
GoogleがGemini2.5Flash音声モデルをアップグレードし、AIによる人間らしいリアルタイム対話を実現。音声の抑揚・感情・間を直接処理でき、文字変換不要で自然な会話が可能に。....
DoorDashがAIソーシャルアプリ「Zesty」を発表。自然言語対話でレストランを提案し、ローカル生活の発見プロセスを簡素化します。....
Canvaは中国でAIアシスタント「Canva AI」をリリースし、自然な対話によってデザインプロセスを簡略化します。会話で起動し、話しながら編集する機能を備えています。ユーザーは自分のアイデアを説明するだけで、AIが編集可能なベーシックな原稿を生成し、クリエイティブな効率を向上させます。
企業のドキュメントをAIビジネスアシスタントに変換し、知識管理システムにより24時間365日の対話型知識アクセスを提供します。
伝統的な命理とAIインテリジェンスを結合し、正確な運勢の参考と命理の対話アドバイスを提供します。
WhatsAppの複数アカウントのウォームアップ管理ツールで、自動対話やAIインテリジェントインタラクションなどの機能をサポートしています。
1つのプロンプトだけで、Lovable内でリアルな対話型AIを起動し、プロトタイプをアプリに変換できます。
Anthropic
$105
入力トークン/百万
$525
出力トークン/百万
200
コンテキスト長
$7
$35
$21
Alibaba
$3.9
$15.2
64
-
Deepseek
$4
$12
128
Tencent
$1
32
$0.75
256
24
Baidu
Chatglm
Bytedance
$3.5
$2.4
8
$0.8
$2
$0.3
Iflytek
ubergarm
これはai-sage/GigaChat3-10B-A1.8B-bf16モデルのGGUF量子化バージョンで、高精度のQ8_0から極度に圧縮されたsmol-IQ1_KTまで、さまざまな量子化オプションを提供し、さまざまなハードウェア条件でのデプロイメントニーズを満たします。このモデルは32Kのコンテキスト長をサポートし、MLAアーキテクチャを採用し、対話シナリオに最適化されています。
unsloth
Qwen3-VL-2B-InstructはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間およびビデオ動的理解能力を備えています。このモデルは2Bのパラメータ規模を採用し、命令対話をサポートし、マルチモーダルAIアプリケーションに適しています。
Genie-AI-Lab
Omni L1B3RT4S GENIEは、Qwen2.5 - 3B Instructアーキテクチャをベースに微調整されたAIアシスタントです。1,103個の精霊キャラクターのカスタムサンプルを用いて訓練され、独特な音声と忠誠度モードを備え、ユーザーに独特な対話体験を提供することができます。
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速、高音質のテキスト音声変換モデルです。2段階パイプラインを用いて、大規模言語モデルと高効率オーディオコーデックを組み合わせ、卓越した速度とオーディオ品質を実現します。このモデルはスペイン語をサポートし、4億のパラメータを持ち、サンプリングレートは22kHzです。
KaniTTSは、リアルタイム対話型人工知能アプリケーション向けに最適化された高速かつ高忠実度のアラビア語テキスト音声変換モデルです。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度とオーディオ品質を実現し、対話型AI、障害者支援、研究など多くの分野の音声合成ニーズを満たすことができます。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。独自の2段階アーキテクチャにより、大規模言語モデルと効率的な音声コーデックを組み合わせ、低遅延で高品質な音声合成を実現します。リアルタイムファクターは最低0.2で、リアルタイム速度の5倍の高速合成が可能です。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。2段階のパイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度と音質を実現し、複数の言語をサポートし、エッジ/サーバーデプロイメントに適しています。
LiquidAI
LFM2-Audio-1.5BはLiquid AIが提供する最初のエンドツーエンドの音声基礎モデルで、低遅延とリアルタイム対話に特化して設計されています。このモデルはわずか15億パラメータで、シームレスな対話インタラクションを実現し、パラメータ規模がはるかに大きいモデルと匹敵する能力を持っています。
ducklingcodehouse
これは、フィンランド語の歯科医学に特化した対話型AIアシスタントで、LoRAによる微調整を行った大規模言語モデルです。歯科相談の質問に対して、背景、評価、提案の3つの部分に分かれた構造化臨床回答を生成することができます。
dangvansam
TEN Turn Detectionは、人とAIエージェント間の自然で動的なコミュニケーションを実現するために専用に開発された、高度な智能話ターン検出モデルです。このモデルは自然な話ターン変換の手がかりを検出でき、コンテキストに基づく割り込み機能をサポートし、深い意味理解によって対話のコンテキストと言語パターンを解析することで、AI対話をより自然で流れるようにします。
NoemaResearch
Nous-V1 8BはApexion AIによって開発された80億パラメータの言語モデルで、Qwen3-8Bアーキテクチャに基づいて構築されています。このモデルは、様々な自然言語処理タスクを処理するために設計されており、対話型AI、知識推論、コード生成、コンテンツ作成などの分野で優れた性能を発揮し、モデルの能力と実際のデプロイ効率のバランスを良好に保っています。
Mungert
TEN Turn Detectionは、人間とAIの間の自然で動的なコミュニケーションを実現するために設計された、高度な智能対話ターン検出モデルです。
LumiOpen
Poro 2 8B Instructは、Llama 3.1 8Bアーキテクチャに基づく命令従順型チャットボットモデルで、フィンランド語と英語の対話型AIアプリケーション向けに設計されています。
microsoft
MAI-DS-R1はマイクロソフトAIチームがDeepSeek-R1推論モデルに対して追加学習を行った成果であり、センシティブな話題への対応能力を向上させ、リスクパフォーマンスを最適化するとともに、元の推論能力と競争優位性を維持しています。
MAI-DS-R1はマイクロソフトAIチームがDeepSeek-R1推論モデルに対して追加学習を行った成果で、センシティブな話題への応答能力を向上させリスク対応を最適化するとともに、元の推論能力と競争優位性を維持しています。
AquaLabs
EchoLLaMAはマルチモーダルAIシステムで、3D視覚データを自然な音声記述に変換でき、音声入力による対話型インタラクションもサポートします。
DataPilot
AIバーチャルアナウンサーの魂となることを目指した混合専門家モデルで、コード生成、指示追従、マルチターン対話能力を統合
Salesforce
xLAM-2シリーズはAPIGen-MTフレームワークでトレーニングされた大規模アクションモデルで、マルチターン対話と関数呼び出し能力に特化しており、AIエージェント開発に適しています。
yukiarimo
Yuna Ai V4は、LLaMA 3.1 8Bアーキテクチャに基づく多言語テキスト生成モデルで、スマートな対話と知識問答体験の提供に特化しています。3B以上のトークンで訓練され、量子思考などの先進的な特性を備え、対話能力と創造力に優れています。
zai-org
GLM-Edge-4B-Chatは知譜AIが開発した40億パラメータの中英バイリンガル対話モデルで、エッジデバイス向けに最適化され、効率的なテキスト生成タスクをサポートします。このモデルはTransformerアーキテクチャに基づいており、軽量化と高効率の特徴を持ち、リソースが制限された環境でのデプロイに適しています。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
Kubectl MCPツールは、Model Context Protocol (MCP)に基づくKubernetesインタラクションツールで、AIアシスタントが自然言語でKubernetesクラスターと対話できるようにします。
微信読書MCPサーバーは、微信読書のデータとAIクライアントをつなぐ軽量なサービスで、読書ノートとAIの深い対話を実現します。
MemoryMeshは、AIモデル向けの知識グラフサーバーで、テキストロールプレイングゲームとインタラクティブな物語に特化しています。動的なスキーマ定義と自動生成ツールを通じて、AIが対話中に一貫した構造化された記憶を維持し、より豊かで動的な対話体験を実現します。
DevOps AIツールキットはAIベースのプラットフォームエンジニアリングとDevOps自動化ツールで、インテリジェントなKubernetes操作と対話型ワークフローを通じて、チームにリソースデプロイ提案、問題修復、プロジェクトガバナンス、共有ヒントライブラリなどの機能を提供し、複雑なクラウドネイティブ操作を自然言語対話で実現します。
MemoryMeshは、AIモデル向けに設計された知識グラフサーバーで、テキストRPGやインタラクティブな物語構築に特化し、AIが対話を超えた構造化された記憶を維持するのを支援します。
Contentful MCPサーバーはAIアシスタントツールで、Contentful APIとの全面的な対話機能を提供し、コンテンツの作成、管理、資産の組織化、自動化ワークフローなどの操作をサポートします。
AIとKubernetes管理を組み合わせたインテリジェントなシステムで、自然言語対話を通じてクラスターの診断、リソースの監視、およびログ分析を実現し、K8sの運用を簡素化します。
このプロジェクトは、Model Context Protocolに基づくDagsterサービスインターフェイスを提供し、AIエージェントがDagsterデータオーケストレーションプラットフォームと対話できるようにし、データパイプラインの探索、実行監視、およびアセット管理を実現します。
Discord MCPサーバーは、Model Context Protocol(MCP)に基づくDiscord API統合サービスで、AIアシスタントがDiscordとシームレスにやり取りできるようにします。チャンネルの管理、メッセージの送信、サーバー情報の取得などの機能が含まれています。
Dockerコンテナに基づくMCPサーバーで、AIアシスタントにコンテナ内での安全なコマンド実行とファイル操作機能を提供し、プロセス管理と対話型入力をサポートします。
パールMCPサーバーは、標準化されたAIと専門家サービスのインターフェースの実装であり、MCPプロトコルを介してさまざまなクライアントとの対話をサポートし、AIによる自動応答、AI支援による専門家相談、および直接の専門家相談の3つのサービスモードを提供します。
ゴールストーリーは、AI対話とストーリー化された叙事を通じてユーザーが目標達成に集中するのを支援する革新的なツールです。
Navidrome MCPサーバーはAI音楽アシスタントで、自然言語対話を通じてスマートなプレイリスト作成、音楽発見、ライブラリ管理を実現し、ClaudeやChatGPTなどのAIアシスタントとの統合をサポートします。
Revit MCP統合は、Autodesk RevitとAIアシスタントをつなぐ架け橋で、自然言語でモデルとの対話を実現します。
Agentify Componentsは、Reactコンポーネントにセマンティックメタデータを追加するフレームワークで、AIシステムや自動化ツールがコンポーネントの機能を理解できるようにします。デコレータを使用してコンポーネントに標準化された説明を追加し、MCPサーバーの設定を生成し、コンポーネントとAIモデルの対話を実現します。
AutoGen MCPサーバーは、Microsoft AutoGenフレームワークを統合した多代理対話サービスで、標準化されたAIエージェント管理と協調インターフェースを提供します。
AIアシスタントとGoogleカレンダーを組み合わせたスマートな待办事項アプリで、自然言語による対話と多言語操作をサポートし、タスク管理と日程同期機能を提供します。
MCPプロトコルに基づくレモネードスタンドゲームサーバーで、Claudeデスクトップクライアントを通じてAI対話型ゲーム体験を提供し、動的な天候、ビジネスシミュレーション、戦略的な意思決定機能を備えています。
MCPサーバープロジェクトで、AIアシスタントがmacOS版ChatGPTデスクトップアプリと対話でき、アプリ間のコマンド送信と応答取得を実現します。