蘋果在第15個全球無障礙意識日發佈了全新輔助功能,融合Apple Intelligence技術,提升殘障人士在iPhone、Mac和Vision Pro上的體驗。VoiceOver功能升級,新增圖像資源管理器,視障用戶可通過AI識別圖像內容,實現更便捷的視覺輔助。
Claude Code推出語音模式,開發者可通過自然語音下達指令,告別純鍵盤輸入,提升編程效率。該功能已逐步推送,用戶只需輸入/voice命令即可開啓。
聲網聯合美團等發佈AI外呼評測基準VoiceAgentEval,強調實戰性,覆蓋6大領域30個子場景,旨在用真實業務數據推動行業標準化發展。
AI音頻公司ElevenLabs與奧斯卡得主Matthew McConaughey、Michael Caine達成語音克隆合作,將其AI聲線納入新平臺“Iconic Voice Marketplace”。該平臺已收錄超25位名人語音,提供合法授權使用渠道。McConaughey作爲公司投資人,將利用自身聲音參與項目。
VoiceDash是AI語音打字工具,可速將語音轉為結構化文本,提升生產力。
24/7 AI前臺語音代理,即時接聽、篩選來電、預約會議並同步CRM
Voiceslab可免費即時創建AI語音,通過語音克隆保留音色與口音。
Voiceley可免費快速進行AI語音克隆,還能使用語音模型生成語音。
Anthropic
$105
輸入tokens/百萬
$525
輸出tokens/百萬
200
上下文長度
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
-
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
$0.8
$0.15
$1.5
32
Deepseek
$4
$12
Tencent
$1
UsefulSensors
Moonshine Tiny是由Moonshine AI(原有用傳感器公司)開發的輕量級越南語自動語音識別模型,僅有27M參數,專為資源受限平臺設計,在Fleurs和Common Voice 17數據集上表現出色。
webbigdata
VoiceCore是一款可商用的日語語音AI代理模型,專注於讓AI通過語音與人類進行自然交流,具備情感表達和非語言聲音能力,支持多種語音風格選擇。
Voice Mode是一個為AI助手提供自然語音對話功能的工具,支持與Claude、ChatGPT等LLM通過MCP協議進行人機語音交互。
一個Node.js客戶端,用於集成遠程MCP服務器,為Voiceflow代理提供工具支持,支持多種工具發現和Claude AI集成。
Voicevox MCP Server是一個VOICEVOX兼容的語音合成服務器,通過MCP協議實現與AivisSpeech/VOICEVOX/COEIROINK的交互,支持Cursor等編輯器中的Claude 3.7代理模式語音合成。