微軟發佈GPT-realtime語音轉語音模型,整合多項語音技術改進,聚焦自然語言處理、音頻質量和指令跟隨能力。開發者可通過Azure AI Foundry平臺的Real-time API訪問,獲得更自然、富有表現力的語音輸出和高質量音頻體驗。
OpenAI發佈GPT-realtime語音模型,突破AI語音交互天花板。該模型以自然流暢度和情感表達力著稱,能精準模擬人類語調、情感波動和語速變化,徹底改變傳統AI語音生硬僵化的缺陷,實現極致還原人類語音細節。
【AI日報】欄目每日提供AI領域熱點內容,聚焦開發者,幫助瞭解技術趨勢和創新應用。最新動態:MiniMax海螺AI首尾幀功能已在網頁版和APP雙端上線,支持僅尾幀玩法,具備更強的指令理解、更流暢的動態效果。
OpenAI發佈GPT-Realtime多模態語音模型,具備強大推理能力,支持圖像輸入和優化指令遵循。該模型集成遠程MCP和SIP電話呼叫功能,爲開發者提供智能靈活的語音交互解決方案,引發行業廣泛關注。