通义千问2.0首发!云计算的“第三次浪潮”来了

天下网商
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
上海交大与深势科技团队开发的X-Master智能体系统在超高难度AI测试"HLE"中创下32.1分新纪录,首次突破30分大关。该系统采用工具增强型推理和多智能体协作架构,能模拟人类研究思维,通过代码执行和反馈循环优化决策。其分散-堆叠式工作流让多个智能体并行解题、评估改进,最终整合最优方案,尤其在生物医学领域表现突出。该成果已开源,推动AI领域发展。
【AI日报速览】阿里开源ThinkSound音频生成模型,支持链式推理实现高保真空间音频;谷歌Veo3升级,单图即可生成专业运镜视频;Hugging Face发布30亿参数SmolLM3模型,支持双模式推理;阿里WebSailor智能体展现强大检索能力;Moonvalley推出1080P无版权风险视频模型;Vidu Q1支持7图融合生成一致性视频;苹果研发AI客服助手优化用户体验;飞书发布多款企业AI产品及成熟度模型;微软等科技巨头联合成立AI教育学院,投入2300万美元培训教师。
香港维纳智能科技发布首个免费大模型协同问答系统"QueWi"及两款旗舰应用,突破AI发展瓶颈。公司开发了SYNC、ToM等核心技术,解决行业交互数据短缺问题。测试显示其系统性能超越国际主流AI模型,时事溯源能力达94%,本地名词识别精确度超93%。这一创新将推动香港及全球AI技术应用,助力实现"智能生活"愿景。
法国AI公司Mistral寻求10亿美元股权融资,估值达65.1亿美元。该公司以开源大语言模型和聊天机器人Le Chat闻名,已累计融资11.9亿美元。此次融资将用于研发和市场拓展,同时与MGX基金、英伟达合作建设欧洲最大AI数据中心园区,支持法国AI主权计划。Mistral的发展将提升欧洲在全球AI竞争中的地位。
飞书在7月9日发布会上推出多款AI产品,包括知识问答、AI会议、Aily和飞书妙搭等,助力企业智能化转型。其王牌产品多维表格完成重大更新,可替代小型业务系统处理销售、客服等业务。飞书发布首个AI应用成熟度模型,将AI应用分为四个等级,其中知识问答工具达M3级别,能快速回答员工提问;智能会议纪要达M4级别,可实时总结会议并生成待办事项。多维表格新增应用模式,支持1000万行数据,加载速度显著提升。此外,飞书还推出企业开发套件和Aily开发平台,提升客服效率,飞书妙搭则加速产品原型开发。这些创新产品为企业带来智能化体验,推动行业发展。
Hugging Face推出3B参数开源模型SmolLM3,性能媲美4B参数模型。该模型采用GQA和NoPE技术优化,支持128K长上下文和六种语言处理,在多项基准测试中表现优异。创新性地提供"思考"与"非思考"双推理模式,复杂任务性能提升显著。完全开源训练数据与代码,适合边缘设备部署,为教育、客服等场景提供高性价比解决方案。其开源特性将推动AI生态发展,展现小模型的巨大潜力。
Vidu Q1模型推出"参考转视频"新功能,支持上传7张参考图像生成1080p高质量视频。该功能通过语义融合技术实现多元素视觉一致性,解决传统AI视频生成中的场景断裂问题。用户可组合人物、场景等图像,配合文本提示生成复杂叙事视频。模型还具备多主体一致性技术,确保角色、物体等元素在视频中保持特征稳定,支持多角度镜头切换和动态过渡,显著降低复杂场景制作门槛,为动画、广告等专业创作提供影视级体验。
飞书发布AI产品矩阵及行业首个AI应用成熟度模型,推动企业智能化转型。新产品包括知识问答(M3级)、智能会议纪要(M4级)等,其中多维表格实现千万行数据处理和AI工作流突破。飞书开发套件推出Aily平台和"飞书妙搭"工具,支持企业快速构建AI应用。CEO谢欣强调AI产品应注重实际效果,新模型将AI应用分为四个成熟度等级,帮助企业合理评估技术应用水平。多维表格性能提升10倍,加载速度达行业领先水平,并新增BI分析功能。
苹果正开发AI"支持助手"提升客服体验,用户可通过聊天功能获取问题解决方案。该功能已在Apple Support应用代码中发现,允许用户输入问题获得AI生成答案,减少等待时间。支持助手基于生成模型提供产品相关解答,但苹果提醒可能存在不准确信息。用户可上传图片/文档辅助咨询,并保留转接人工客服选项。该功能可能采用ChatGPT技术,目前正在内部测试中,具体上线时间未定。
Moonvalley发布全新AI视频生成模型Marey Realism v1.5,具备三大核心优势:原生1080P高清画质,基于授权训练数据确保零版权风险,以及精准解读复杂提示的创作能力。该模型支持文本/图像转视频,能生成电影级运动光影效果,未来还将推出姿势传递功能。这一突破性产品为影视制作、广告创意等领域提供了安全高效的AI创作工具,推动行业技术升级。