OpenAI推出兩項API更新,提升AI智能體在語音交互與複雜任務中的性能。全新實時模型gpt-realtime-1.5及配套音頻模型,顯著提高語音命令可靠性。內部測試顯示,新模型在數字字母轉錄準確率上提升約10%,邏輯音頻任務準確率提高5%,指令執行準確率提升7%。
微軟發佈GPT-realtime語音轉語音模型,整合多項語音技術改進,聚焦自然語言處理、音頻質量和指令跟隨能力。開發者可通過Azure AI Foundry平臺的Real-time API訪問,獲得更自然、富有表現力的語音輸出和高質量音頻體驗。
OpenAI發佈GPT-realtime語音模型,突破AI語音交互天花板。該模型以自然流暢度和情感表達力著稱,能精準模擬人類語調、情感波動和語速變化,徹底改變傳統AI語音生硬僵化的缺陷,實現極致還原人類語音細節。
【AI日報】欄目每日提供AI領域熱點內容,聚焦開發者,幫助瞭解技術趨勢和創新應用。最新動態:MiniMax海螺AI首尾幀功能已在網頁版和APP雙端上線,支持僅尾幀玩法,具備更強的指令理解、更流暢的動態效果。