大規模モデルの競争は実装の厳しい段階に入り、ボルケーノエンジンはAIの進化の新しいパターンを提示しました。スマートエージェントがAIの実装の核心的なプラットフォームとなり、マルチモーダル能力と効率的な開発体系が鍵となります。大規模モデルは対話型のインターフェースから、自動車や製造などの複雑なシーンへの深掘りへと進化し、「会話」から「作業」への飛躍を果たしています。
Canvaは中国でAIアシスタント「Canva AI」をリリースし、自然な対話によってデザインプロセスを簡略化します。会話で起動し、話しながら編集する機能を備えています。ユーザーは自分のアイデアを説明するだけで、AIが編集可能なベーシックな原稿を生成し、クリエイティブな効率を向上させます。
中国移動が初の家庭向けサービス型四足ロボット「霊犀」を発表。AIを活用した対話と多様な家庭ニーズに対応し、子どもの見守りや高齢者ケアなどを目指す。....
2022年11月30日、OpenAIは対話型AI製品ChatGPTをリリースし、短期間でビジネスとテクノロジー業界を沸かせ、ユーザー数が急増し、アップルアプリストアで第1位を維持しました。これは多くの生成型AI製品を生み出し、人々のAIの可能性への期待と懸念を引き起こしました。著者のKaren Haoは、OpenAIの影響力が技術の領域を超え、業界構造を再構築していると指摘しています。
企業のドキュメントをAIビジネスアシスタントに変換し、知識管理システムにより24時間365日の対話型知識アクセスを提供します。
1つのプロンプトだけで、Lovable内でリアルな対話型AIを起動し、プロトタイプをアプリに変換できます。
対話型AI音楽エージェントTuneeとチャットして音楽を創作することは、簡単でインテリジェントで、無料で試用できます!
ElevenLabsの対話型AIによって駆動され、サンタクロースとリアルタイムで対話できるインタラクティブ体験です。
Anthropic
$105
入力トークン/百万
$525
出力トークン/百万
200
コンテキスト長
$7
$35
$21
Alibaba
$3.9
$15.2
64
-
Deepseek
$4
$12
128
Tencent
$1
32
$0.75
256
24
Baidu
Bytedance
$0.8
$8
Chatglm
$3.5
$2.4
8
$2
$0.3
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速、高音質のテキスト音声変換モデルです。2段階パイプラインを用いて、大規模言語モデルと高効率オーディオコーデックを組み合わせ、卓越した速度とオーディオ品質を実現します。このモデルはスペイン語をサポートし、4億のパラメータを持ち、サンプリングレートは22kHzです。
KaniTTSは、リアルタイム対話型人工知能アプリケーション向けに最適化された高速かつ高忠実度のアラビア語テキスト音声変換モデルです。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度とオーディオ品質を実現し、対話型AI、障害者支援、研究など多くの分野の音声合成ニーズを満たすことができます。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。独自の2段階アーキテクチャにより、大規模言語モデルと効率的な音声コーデックを組み合わせ、低遅延で高品質な音声合成を実現します。リアルタイムファクターは最低0.2で、リアルタイム速度の5倍の高速合成が可能です。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。2段階のパイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度と音質を実現し、複数の言語をサポートし、エッジ/サーバーデプロイメントに適しています。
ducklingcodehouse
これは、フィンランド語の歯科医学に特化した対話型AIアシスタントで、LoRAによる微調整を行った大規模言語モデルです。歯科相談の質問に対して、背景、評価、提案の3つの部分に分かれた構造化臨床回答を生成することができます。
NoemaResearch
Nous-V1 8BはApexion AIによって開発された80億パラメータの言語モデルで、Qwen3-8Bアーキテクチャに基づいて構築されています。このモデルは、様々な自然言語処理タスクを処理するために設計されており、対話型AI、知識推論、コード生成、コンテンツ作成などの分野で優れた性能を発揮し、モデルの能力と実際のデプロイ効率のバランスを良好に保っています。
LumiOpen
Poro 2 8B Instructは、Llama 3.1 8Bアーキテクチャに基づく命令従順型チャットボットモデルで、フィンランド語と英語の対話型AIアプリケーション向けに設計されています。
AquaLabs
EchoLLaMAはマルチモーダルAIシステムで、3D視覚データを自然な音声記述に変換でき、音声入力による対話型インタラクションもサポートします。
OEvortex
EMO-2Bは25億パラメータの対話型AIモデルで、感情共鳴対話のために設計され、繊細で文脈に合った感情応答を提供できます。
CreitinGameplays
ConvAI-9bは90億パラメータを持つ対話型AIモデルで、Zephyr-7b-betaとMistral-7B-v0.2を融合して構築されており、チャットボットや仮想アシスタントなどのインタラクティブなシナリオに適しています。
yukiarimo
由奈AIは感情的なコンパニオンとして設計された対話型AIアシスタントで、高度に人間らしいインタラクション能力を備えています
hakurei
MommyGPT-3BはOpenLLaMa 3B V2モデルをファインチューニングした対話型AIで、母親像を模倣してケア的な会話を提供します
Tostino
Inkbotは構造化プロンプトの解析と応答に特化した対話型AIモデルで、コンテキストあり/なしの動的対話をサポートします。
HansAnonymous
GPTアーキテクチャに基づく対話型AIモデルで、自然言語の理解と生成に特化しています。
Ninja5000
ゲーム「ザ・ワールド・エンズ・ウィズ・ユー」(The World Ends With You)のキャラクター、ジョシュアをベースにした対話型AIモデルで、あまり目立たないチャットボットです。
DevOps AIツールキットはAIベースのプラットフォームエンジニアリングとDevOps自動化ツールで、インテリジェントなKubernetes操作と対話型ワークフローを通じて、チームにリソースデプロイ提案、問題修復、プロジェクトガバナンス、共有ヒントライブラリなどの機能を提供し、複雑なクラウドネイティブ操作を自然言語対話で実現します。
Graphiti MCP Serverは、AIエージェントが動的環境で時間感知型の知識グラフを構築およびクエリするための拡張版の知識グラフフレームワークです。MCPプロトコルを通じてコア機能を公開し、ユーザーの対話、企業データ、外部情報の継続的な統合をサポートし、増分更新、効率的な検索、正確な履歴クエリ機能を提供します。
Dockerコンテナに基づくMCPサーバーで、AIアシスタントにコンテナ内での安全なコマンド実行とファイル操作機能を提供し、プロセス管理と対話型入力をサポートします。
Pega DX MCP Serverは、モデルコンテキストプロトコル(MCP)を介してPega Infinity™アプリケーションを直感的な対話型体験に変える実験的なプロジェクトです。Pega DX APIと自然言語インターフェースの橋渡しとして機能し、GenAIエージェント、IDE、その他のMCP対応ツールが簡単な人間が読めるコマンドを使用してPega Infinity™アプリケーションと対話できるようにします。
MCPプロトコルに基づくレモネードスタンドゲームサーバーで、Claudeデスクトップクライアントを通じてAI対話型ゲーム体験を提供し、動的な天候、ビジネスシミュレーション、戦略的な意思決定機能を備えています。
Illumio MCPサーバーは、Illumioポリシー計算エンジン(PCE)との対話インターフェースを提供するサービスで、対話型AIを通じた負荷管理、タグ管理、トラフィック分析をサポートします。
Calva MCP ServerはVS Codeの拡張機能で、Clojure/ClojureScript開発にAIプログラミングアシスタント機能を提供し、REPLを接続することで対話型プログラミングを実現し、AIがコードをリアルタイムで実行およびテストできるようにします。
Codex MCPツールは、IDEまたはAIアシスタントをCodex CLIに接続するオープンソースのMCPサーバーで、非対話型自動化、安全なサンドボックス編集、大規模コード分析をサポートし、進捗のストリーミング更新と構造化変更モードを提供します。
これはCloudflare WorkersとRemix 3に基づくMCPプロトコルのデモプロジェクトで、AIチャット画面に対話型の計算機ウィジェットを埋め込む方法を示しています。プロジェクトには完全なMCPサーバーの実装、状態管理、ウィジェット通信システムが含まれており、トロンスタイルの隠しエasterが特別に設計されています。
Vaali MCPサーバーは、対話型パラメータ収集とワークフロー自動化により、公式MCPによる質問とスマートなパラメータ誘導の2つのモードを実現し、クラウドデプロイとローカル統合をサポートする、高度なAIエージェント機能を展示するオープンソースプロジェクトです。
SketchupMCPは、モデルコンテキストプロトコル(MCP)を通じてSketchupをClaude AIに接続するプロジェクトで、AIによるSketchupの直接制御と対話型3Dモデリングを実現します。
このプロジェクトでは、AWS Bedrockの対話型AI機能をMCPサーバーアーキテクチャを通じてリレーショナルデータベースと統合し、自然言語でデータベースをクエリする機能を実現する方法を示しています。
MCPプロトコルに基づくレモネードスタンドゲームサーバーで、Claudeデスクトップクライアントを通じてAI対話型ゲーム体験を実現し、天候システムやビジネスシミュレーションなどの完全なゲームメカニズムを備えています。
interactive - mcpはNode.js/TypeScriptをベースに実装されたMCPサーバーで、LLMとユーザー間の対話型通信を促進することを目的としています。ユーザー入力要求、システム通知、持続的なチャットセッションなどのさまざまなツールを提供し、ローカルユーザーの対話が必要なAIアシスタントシーンに適しています。
AIによる面接シナリオを専門に設計されたMCPサーバーで、対話型の音声面接練習機能を提供します。
SmartLead MCPサーバーは、AIアシスタント向けのコールドメール自動化ツールで、116以上のAPIインターフェイスを提供し、Claude、Cursorなどの主流のAIツールをサポートし、美しい対話型インストーラーと完全なSmartLead APIカバレッジを備えています。
Cursor用に設計されたMCPサーバーで、AI生成過程でユーザー入力を要求できます
このプロジェクトは、MCPプロトコルを通じてMongoDBデータベース操作をAIツールにカプセル化し、Gemini AIとMongoDBの対話型ターミナル操作を実現します。
対話型AIプロジェクトは、コアのGen AIサービスを提供するフレームワークであり、対話型プラットフォームをサポートすることを目的としています。プロジェクトには、環境設定、依存関係のインストール、設定の変更、実行ガイド、貢献規約、および連絡先情報が含まれています。
Cisco NSO MCPサーバーはPythonベースのモデルコンテキストプロトコル(MCP)の実装で、Ciscoネットワークサービスオーケストレーター(NSO)にAI駆動型のネットワーク自動化機能を提供し、自然言語による対話操作でネットワーク機器を操作できます。