Sora模型的出现正在引发文生视频领域的变革,黄礼强表示,Sora模型经过多方探索和突破,使用了DiT的技术框架,突破了扩散模型的局限。七火山通过与知名企业合作推动文生视频内容本地化和国际化发展,而超讯通信则通过战略投资七火山,将AI模型应用落地。
相关AI新闻推荐
阿里通义千问推出Qwen3-VL轻量级模型:4B和8B参数版本性能逼近此前72B旗舰
阿里巴巴通义千问团队推出Qwen3-VL系列两款轻量级模型,参数规模分别为4B和8B。该系列是迄今最强的视觉语言模型家族,新增小参数版本旨在降低部署门槛,同时保持强劲性能。每个规模均提供指令遵循和思维链推理两个版本,为开发者提供更灵活选择。

阿里巴巴推出紧凑型Qwen3-VL模型,提升多模态AI效率,加速边缘设备部署
阿里巴巴发布Qwen3-VL视觉语言模型紧凑版,含4亿和8亿参数变体,推动多模态AI在边缘设备应用。模型优化了STEM推理、视觉问答、OCR、视频理解等核心能力,性能媲美大型模型,实现技术重大突破。

NotebookLM集成Nano Banana,可用于视频生成配图
谷歌NotebookLM集成Nano Banana图像生成模型,实现从文本处理到多模态创作的升级,用户可将笔记转化为视频,提升学习与创作效率。本周起向Pro用户逐步推送,预计数周内全面覆盖。

宾夕法尼亚大学研究发现:对AI越“粗鲁”回答准确率越高
宾夕法尼亚州立大学研究发现:与AI对话时,直白甚至粗鲁的语气可能比礼貌用语获得更准确答案。研究通过50道多领域选择题测试,验证了五种提问语气对模型表现的影响,颠覆了传统交互认知。

国产AI视觉模型"橘洲"V1.5发布:首个基于国产算力的全生态端侧大模型落地长沙
中科曙光与湖南汇视威在长沙联合发布"橘洲"V1.5端侧版,这是国产首个基于国产算力训练的视觉基座大模型重要升级。新版本实现从"单系统"到"全生态"转型,全面适配安卓系统,构建跨平台、多芯片的端侧AI部署能力,标志着国产AI视觉技术在端侧部署领域取得新突破。

亚马逊进军智能体基础设施!AgentCore 全面开放,支持多家主流模型
亚马逊推出AI代理平台AgentCore并集成至Amazon Bedrock,进军智能体基础设施领域。该平台帮助企业快速构建、部署AI代理,支持OpenAI、Gemini等主流模型,开发者无需从零搭建系统,可借助亚马逊环境简化集成流程。

抖音与LV-NUS联合推出SAIL-VL2模型:小巧身材也能大显神威!
抖音SAIL团队与LV-NUS Lab联合推出SAIL-VL2多模态大模型,以2B和8B较小参数规模,在106个数据集上实现性能突破。该模型在MMMU、MathVista等复杂推理任务中超越同类模型,甚至媲美大型闭源模型,显著拓展了小模型的应用潜力。

潞晨科技自研Open-Sora 2.0 被收录进《State of AI Report 2025》
潞晨科技自研开源视频生成模型Open-Sora2.0入选《State of AI Report 2025》,该报告为全球最具影响力AI年度总结之一。此次入选表明潞晨科技在视频生成领域的成果获国际认可,其结合自研训练框架Colossal的技术突破正受到全球AI社区关注。

腾讯发布 Youtu-Embedding:助力企业级智能服务
腾讯优图实验室开源Youtu-Embedding文本表示模型,提升企业智能客服和知识库管理效率。该模型通过精确信息提取,避免大模型在特定领域生成误导性答案,解决通用语料导致的不相关回复问题,有效应对跨领域表现不佳现象。

AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具
微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十名,展现卓越图像生成能力。该模型为微软自主研发,标志着其在AI图像生成领域的重要进展。