腾讯混元が国内初の対話型AIポッドキャストを発表。音声や文字で司会者やゲストにリアルタイム質問可能。従来の一方向視聴を超え、双方向性と情報取得効率を向上。....
Cartesia社が音声AIエージェントSonic-3を発表しました。世界一速く自然なリアルタイム会話モデルと称しています。新たな状態空間モデルアーキテクチャにより、ほぼゼロに近い遅延のインタラクションを実現し、人の感情やトーン、笑いの変化を模倣できるため、会話の臨場感を大きく向上させます。
MicrosoftのAIアシスタントCopilotの視覚機能「Copilot Appearance」は7月に登場し、リアルタイム表情・音声連動・会話記憶機能でユーザー体験を向上。米英加のテスト市場から全世界展開へ。....
OpenAIがリアルタイムAPIを公開、GPT-Realtimeモデルを発表。音声を直接生成・処理可能で、テキスト変換不要。会話の自然さと応答速度を向上させ、カスタマーサポートや教育分野の音声アシスタント開発向け。....
MCPはクライアント - サーバーアーキテクチャに基づくAIチャットシステムで、複数の専用サーバー(ファイルシステム、Slack、Brave検索)を通じてClaude AIの機能を拡張し、ローカルファイル、Slackの会話、およびリアルタイムのウェブ情報にスマートにアクセスできるようにします。
Claude AIがリアルタイムでインターネットを検索できるようにする軽量なブリッジサービスです。このプロジェクトはFlaskサーバーに基づいており、Claudeの高度な機能とDuckDuckGo検索を統合し、AIが会話中にリアルタイム情報を取得できるようにしています。