サムスンは、Galaxy S26シリーズにPerplexity AI技術を音声アシスタントのBixbyに統合する計画を立てており、アップルがSiriに多モデルAI戦略を導入したように似た戦略を採用しています。リーク情報によると、新しいバージョンのBixbyはまだローカルな単純なタスク(デバイス調整など)を処理しており、サムスンがAI分野での強化を推進していることを示しています。
ユービーアイ、初のプレイ可能生成AIプロジェクト「Teammates」を発表。FPSゲーム体験を向上させるリアルタイム音声コマンドを導入。プレイヤーはディストピア未来でレジスタンスメンバーとして敵基地に潜入し、行方不明の仲間を救出。AIアシスタントJasparが自然音声対話で没入感とインタラクティブ性を強化。....
アリババグループのAIアシスタント「ラス」がリリースされて4日間で、App Store中国地区でのダウンロード数が100万に達し、無料ランキングで第6位に登場しました。その速度はChatGPTやSora2を上回りました。チームは緊急で拡張を行い、コア機能の安定性を確保しました。製品の特徴:ユーザーは自然言語で30秒で編集可能で、インタラクティブな小程序を生成できます。3Dや音声・映像などのマルチモーダル出力にも対応し、操作は超低门槛です。
Perplexity社がAndroid版AIブラウザ「Comet」をリリース。デスクトップ版の核心機能を継承:デフォルト検索エンジン設定、AIアシスタントへのタグメンション質問、新音声モードで開いたページと対話可能。....
音声AIのASR、TTS、LLMモデルを提供し、リアルタイムアプリケーション向けにテスト?デプロイ可能です。
音声AIアシスタントで、受信トレイを整理し、日程を計画し、タスクを簡単に完了できます。
カスタマイズされたAI音声アシスタントソリューションを提供し、あなたの日常的なニーズに対するインテリジェントな解決策を提供します。
DialLinkは使いやすいクラウド電話システムで、中小企業やスタートアップ企業にAI音声エージェント機能を提供し、電話を自動化して顧客満足度を向上させ、成長を促進します。
Genie-AI-Lab
Omni L1B3RT4S GENIEは、Qwen2.5 - 3B Instructアーキテクチャをベースに微調整されたAIアシスタントです。1,103個の精霊キャラクターのカスタムサンプルを用いて訓練され、独特な音声と忠誠度モードを備え、ユーザーに独特な対話体験を提供することができます。
TheStageAI
TheWhisper-Large-V3-Turboは、OpenAI Whisper Large V3モデルの高性能ファインチューニング版で、TheStage AIによって多プラットフォームのリアルタイム、低遅延、低消費電力の音声テキスト変換推論に最適化されています。ストリーミング文字起こし、単語のタイムスタンプ、拡張可能なパフォーマンスをサポートし、リアルタイム字幕、会議、デバイス端末の音声インターフェイスなどのシーンに適しています。
nineninesix
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速、高音質のテキスト音声変換モデルです。2段階パイプラインを用いて、大規模言語モデルと高効率オーディオコーデックを組み合わせ、卓越した速度とオーディオ品質を実現します。このモデルはスペイン語をサポートし、4億のパラメータを持ち、サンプリングレートは22kHzです。
KaniTTSは、リアルタイム対話型人工知能アプリケーション向けに最適化された高速かつ高忠実度のアラビア語テキスト音声変換モデルです。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度とオーディオ品質を実現し、対話型AI、障害者支援、研究など多くの分野の音声合成ニーズを満たすことができます。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。独自の2段階アーキテクチャにより、大規模言語モデルと効率的な音声コーデックを組み合わせ、低遅延で高品質な音声合成を実現します。リアルタイムファクターは最低0.2で、リアルタイム速度の5倍の高速合成が可能です。
KaniTTSは、リアルタイム対話型AIアプリケーション向けに最適化された高速かつ高忠実度のテキスト音声変換モデルです。2段階のパイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度と音質を実現し、複数の言語をサポートし、エッジ/サーバーデプロイメントに適しています。
SystemPrompt Coding Agentは、オープンソースプロジェクトで、ローカルワークステーションをMCPプロトコルでリモート制御可能なAIプログラミングアシスタントに変えます。音声コマンドとモバイル端末での操作をサポートし、異なる場所でのプログラミング管理を実現します。
MCPプロトコルに基づくAI音声通話システムで、VoIP技術を通じてClaudeなどのAIアシスタントが自動的に電話をかけ、スマートな会話を行えます。さまざまなSIPプロトコルとオーディオコーデックをサポートします。
これはNode.jsベースのMCPサーバープロジェクトで、Model Context Protocolを通じてAIアシスタントと棒読みちゃん音声合成ソフトウェアを統合し、テキストを音声に変換する機能を提供します。
AivisSpeechテキスト読み上げエンジン用に設計されたMCPサーバー。日本語音声合成、複数の音声キャラクター選択、パラメータ設定をサポートし、AIアシスタントとのシームレスな統合を実現します。
これは、Model Context Protocol(MCP)エコシステムに関する選りすぐりのリソースリストで、公式リソース、開発ツール、MCPサーバー、Web統合、データベース、ブロックチェーン、AI統合、音声、モバイルアプリ、開発環境、セキュリティテスト、生産性ツール、システムツールなどの複数のカテゴリを網羅しています。
MCPプロトコルに基づく音声通話サーバーで、TwilioとOpenAIの技術を統合し、AIアシスタントがリアルタイム音声通話を開始し管理できるようにします。
Voice Modeは、AIアシスタントに自然な音声対話機能を提供するツールで、MCPプロトコルを介してClaude、ChatGPTなどのLLMとの音声対話をサポートします。
このプロジェクトは、Vapi音声AIとCursorエディタを統合したMCPサーバーを実装し、音声通話、アシスタント管理などの機能を提供します。
Hume MCPサーバーはAI協力ツールで、ユーザーがMCPクライアントアプリケーション(Claude DesktopやCursorなど)を通じてOctaveテキスト読み上げ技術を使用し、スマートな音声合成とインタラクションを実現できます。
FastAPIベースのバックエンドプロジェクトで、ElevenLabs MCPプロトコルを統合し、音声電話で友好的で専門用語のないテクノロジーニュース更新を提供するAIアシスタントを作成します。
AivisSpeechのMCPプロトコルサーバーの実装で、AivisSpeech Engineとのインターフェースを提供し、AIアシスタントの音声合成機能をサポートします。
統一インターフェースを提供してSpotifyの再生を制御するメディア制御プロトコルサーバーで、REST API、AIアシスタント、および音声制御をサポートします。
Transcribe MCPは、AI駆動の自動文字起こしツールで、高速かつ高品質の多言語音声から文字への変換をサポートし、ローカルとクラウドのサービスを提供し、さまざまなAIアシスタントと統合できます。
MCPプロトコルに基づくYouTube動画ダウンロードサービスで、yt-dlpを使用して動画(MP4)と音声(MP3)をダウンロードでき、AIアシスタントと統合できます。
macOSに包括的な音声再生機能を提供するMCPサーバーで、システム音、テキスト読み上げ、カスタム音声ファイルの再生をサポートし、AIアシスタントなどのMCPクライアントに適しています。
Vavicky MCPサーバーは、完全な音声AIエージェントプラットフォームの実装で、ユーザー管理、APIキー構成、アシスタント管理、Twilio統合、および通信機能を提供し、Claudeデスクトップクライアントを通じた対話をサポートします。
IntelliGlowはMCPプロトコルに基づくスマート照明システムで、AIアシスタントによって実際のスマート電球を制御し、音声コマンド、AI推論、および直接的なハードウェア制御をサポートし、自然言語対話とスマートな照明管理を実現します。
これはNode.jsベースのMCPサーバープロジェクトで、Model Context Protocolを通じてAIアシスタントと棒読みちゃん音声合成ソフトウェアの統合を実現し、テキストを音声に変換する機能を提供し、音色、音量、速度などのパラメータの調整をサポートします。
TwilioとOpenAIをベースにした音声通話MCPサーバーで、AIアシスタントによるリアルタイム音声通話の発信と管理を実現します。
大規模モデルに基づくインテリジェントチャットボットプロジェクトで、多プラットフォーム接続と複数のAIモデルをサポートし、テキスト、音声、画像処理およびプラグイン拡張機能を備え、企業用AIアプリケーションをカスタマイズできます。