生数科技全球上线 Vidu Q1参考生图：支持同时输入多达7张

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Sep 9, 2025

103

生数科技今日宣布其视频大模型 Vidu 的 Q1参考生图功能正式向公众用户开放，此次功能的推出旨在突破多主体一致性技术的瓶颈，将 AI 图像生成与视频生成的商业生产链闭环，推动 AI 多模态创作进入全新阶段。

Vidu Q1参考生图的推出围绕 “五大亮点” 展开，首先，其支持同时输入多达7张参考图，使得创作过程中可控性显著增强。其次，Vidu Q1在多主体、多场景的生成能力上展现出更强的一致性，无论是在多次生成的情况下，人物和主体的面貌及特征始终保持一致，确保了高还原度和真实感。此外，用户只需提供一张图和一句提示词，即可自由更换服装和背景，实现高自由度的创作。

生数科技表示，Vidu Q1参考生图的多图参考时代标志着一致性技术的重大突破，允许用户在复杂场景下灵活创作，增强了图像生成的真实感和适用性。以往的 AI 创作工具多以激发灵感为主，而 Vidu Q1则将 AI 的角色扩展至内容生产的主导者，用户只需监督，极大降低了内容生产的门槛。

在具体应用方面，Vidu Q1提供了合成、替换和变换三种生成模式。例如，用户可以将不同人物合成在同一场景中，或是将已有照片的背景更换为新的场景，从而轻松生成个性化的内容。此外，该工具在服装设计、广告宣传、创意营销等领域的应用潜力巨大，能够帮助设计师和电商快速产出高质量的素材。

生数科技的此次创新，标志着 AI 生图工具在商业化应用上的新里程碑。公司希望通过这一先进技术，推动行业内更多企业和个人用户开启多模态创作的新纪元，真正实现 AI 技术为生产力赋能的目标。

TRAE 发布 SOLO 正式版：实时感知 + 多智能体开启新一代专业级 AI 编码模式

TRAE发布SOLO正式版，定位“响应式编程助手”，面向专业开发者提供实时可控、多任务并行的AI编程体验。该版本已开放国际版并限时免费。今年7月Beta版推出内置智能体SOLO Builder，支持多模态需求理解与任务分解，助力快速构建端到端应用。

ElevenLabs签下麦康纳与凯恩推出明星语音授权市场

AI音频公司ElevenLabs与奥斯卡得主Matthew McConaughey、Michael Caine达成语音克隆合作，将其AI声线纳入新平台“Iconic Voice Marketplace”。该平台已收录超25位名人语音，提供合法授权使用渠道。McConaughey作为公司投资人，将利用自身声音参与项目。

YC少年放弃向农化巨头出售AI工具转身农药赛道获投600万美元

18岁Tyler Rose与19岁Navvye Anand创立的Bindwell完成600万美元种子轮融资，由General Catalyst与A Capital领投，Paul Graham跟投。公司放弃销售AI工具，转向自研农药分子并授权，将药物发现中的靶点设计引入农药研发。其AI系统可在6小时内扫描全化合物库，利用Foldwell结构预测等技术加速开发。估值未公开。

Google DeepMind发布SIMA 2预览版性能翻倍迈向通用机器人

谷歌DeepMind发布多模态智能体SIMA2，基于Gemini2.5Flash-lite模型，任务成功率较前代提升约一倍。新版本能在陌生环境中执行复杂指令，具备自我改进能力，通过引入自生成数据循环机制：系统调用独立Gemini模型在新场景中批量生成任务。目前以研究预览形式发布，旨在验证实现通用人工智能所需的高阶世界理解与推理能力。