阿里巴巴推出千問APP公測版,基於Qwen3模型,與ChatGPT展開全面競爭。該應用已在各大商店上線,並計劃推出國際版,旨在爲用戶提供AI服務,助力開發者洞悉技術趨勢。
谷歌Gemini Pro/Ultra訂閱用戶現可體驗Veo3.1視頻模型,新增“Ingredients to Video”功能:支持同時上傳三張參考圖,分別提取人物、場景與風格特徵,融合生成8秒1080p視頻。生成內容自帶SynthID隱形水印,支持網頁/移動端文本輸入一鍵生成。系統確保跨幀角色一致性與光影連貫,演示案例顯示三張自拍+賽博城市背景+油畫風格圖可合成“印象派未來街頭漫步”視頻。
xAI旗下Grok Imagine實現純文本生成短視頻,用戶輸入描述即可在17秒內獲得帶音效、動態鏡頭和專業畫質的6-15秒視頻,無需圖像輸入或編輯基礎。這一升級打通“想法到成片”環節,以高速優勢挑戰OpenAI Sora和Google Veo的市場地位。
谷歌Veo-3模型能生成逼真手術視頻,但醫學操作理解不足。測試中,AI根據手術圖像預測8秒進展,使用SurgVeo標準評估50段真實手術視頻。四位外科醫生參與評測,發現模型在關鍵醫學步驟上存在缺陷。
用WAN 2.5和Veo 3.1無縫AI視頻擴展,時長3 - 10s,畫質專業
谷歌VEO 3.1 AI視頻生成器,可創建8秒高質量帶原生音頻的視頻。
Google的Veo 3.1 AI視頻生成器,可將文本或圖片轉為逼真的1080p視頻
Veo 3.1支持1分鐘視頻生成,角色一致,有電影級預設,免費使用
該項目是一個基於Google Veo2模型的視頻生成MCP服務器,支持通過文本提示或圖像生成視頻,並提供MCP資源訪問功能。