阿里巴巴推出千问APP公测版,基于Qwen3模型,与ChatGPT展开全面竞争。该应用已在各大商店上线,并计划推出国际版,旨在为用户提供AI服务,助力开发者洞悉技术趋势。
谷歌Gemini Pro/Ultra订阅用户现可体验Veo3.1视频模型,新增“Ingredients to Video”功能:支持同时上传三张参考图,分别提取人物、场景与风格特征,融合生成8秒1080p视频。生成内容自带SynthID隐形水印,支持网页/移动端文本输入一键生成。系统确保跨帧角色一致性与光影连贯,演示案例显示三张自拍+赛博城市背景+油画风格图可合成“印象派未来街头漫步”视频。
xAI旗下Grok Imagine实现纯文本生成短视频,用户输入描述即可在17秒内获得带音效、动态镜头和专业画质的6-15秒视频,无需图像输入或编辑基础。这一升级打通“想法到成片”环节,以高速优势挑战OpenAI Sora和Google Veo的市场地位。
谷歌Veo-3模型能生成逼真手术视频,但医学操作理解不足。测试中,AI根据手术图像预测8秒进展,使用SurgVeo标准评估50段真实手术视频。四位外科医生参与评测,发现模型在关键医学步骤上存在缺陷。
用WAN 2.5和Veo 3.1无缝AI视频扩展,时长3 - 10s,画质专业
谷歌VEO 3.1 AI视频生成器,可创建8秒高质量带原生音频的视频。
Google的Veo 3.1 AI视频生成器,可将文本或图片转为逼真的1080p视频
Veo 3.1支持1分钟视频生成,角色一致,有电影级预设,免费使用
该项目是一个基于Google Veo2模型的视频生成MCP服务器,支持通过文本提示或图像生成视频,并提供MCP资源访问功能。