谷歌MobileDiffusion实现手机0.2秒文生成图,创移动端速度新纪录
机器之心
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

Jan团队推出30B参数多模态模型Jan-v2-VL-Max,专注解决AI在复杂自动化任务中易中断的痛点。该模型基于Qwen3-VL-30B-A3B-Thinking,引入LoRA-based RLVR技术,旨在提升多步操作的稳定性,实现更可靠的长周期任务执行。
知名开源项目Lima发布2.0版本,战略重心转向AI领域。新版本为AI开发提供“沙箱”机制,通过在虚拟机内隔离运行AI编码代理,防止其直接访问主机敏感文件或执行危险操作,保障开发安全。

面壁智能获数亿元融资,将用于端侧高效大模型研发与生态建设,巩固其在边缘智能领域的领先地位。作为国内端侧大模型先行者,公司已形成从理论到产品的技术闭环,核心产品MiniCPM“面壁小”系列表现突出。
国产大模型MiniMax开源M2.1,以100亿参数稀疏架构在多语言编程、代码生成与工具调用上实现突破,在权威基准测试中超越谷歌、Anthropic等闭源旗舰模型,标志着开源编码模型性能进入新阶段。
阿里巴巴云发布两款AI语音模型,Qwen3-TTS-VD-Flash支持用户通过文本指令定制声音,可精确描述声音的情感、节奏等特征,实现个性化语音生成。
数字头像生成公司Lemon Slice获1050万美元种子融资,投资方包括Matrix Partners、Y Combinator及The Chainsmokers等。公司致力于为AI聊天机器人添加视频功能,其最新扩散模型Lemon Slice-2仅需一张图片即可生成动态数字头像。该模型拥有200亿参数,可在单个GPU上实现每秒20帧的直播视频,并通过API和可嵌入小工具提供服务。
MiniMax与华中科技大学联合开源VTP技术,仅优化视觉分词器,使图像生成性能提升65.8%,无需修改主模型架构,突破行业依赖大模型的传统思路。
苹果重组AI团队,将AI定位为软件核心而非独立部门,旨在为2026年战略重启做准备。原AI负责人专注开发基础模型,Siri团队并入软件体系,体现整合与聚焦。
豆包视频生成模型Seedance1.5Pro正式上线火山方舟,提升AI视频创作效率与质量。该模型支持音画同步输出、多语言多人对白配音,并具备突出的影视级叙事张力。企业用户可通过火山方舟获取API服务,个人用户也可使用。
科大讯飞星火大模型平台通过国家安全标准试点验证,获首批《人工智能安全国家标准符合性自评估证书》。认证依据我国首个生成式AI专项安全技术标准GB/T45654-2025,涵盖训练数据安全等要求,标志着讯飞在AI安全领域取得重要进展。