騰訊推出AI音頻生成工具AudioGenie,具備多模態音頻生成能力,採用無訓練框架,可一鍵生成電影級音效,挑戰Claude和Gemini等現有產品,重新定義AI音頻生成標準。
阿里巴巴推出開源多模態智能體WebWatcher,整合網頁瀏覽、圖像搜索、代碼解釋器等工具,突破現有閉源系統侷限。該智能體具備視覺理解、邏輯推理、知識調用等能力,可像人類研究員一樣處理複雜多模態任務。