继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型
此次发布的 Qwen2.5-1M 系列包含两个开源模型:

继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型
此次发布的 Qwen2.5-1M 系列包含两个开源模型:

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
腾讯自研大模型混元2.0(Tencent HY2.0)正式发布,与此同时,DeepSeek V3.2也逐步接入腾讯生态。目前,这两大模型已在元宝、ima等腾讯AI原生应用中率先上线,腾讯云也同步开放了相关模型的API及平台服务。 全新发布的Tencent HY2.0采用混合专家(MoE)架构,总参数量高达4

英伟达与香港大学联合发布Orchestrator模型,拥有8亿参数,能协调多种工具和大型语言模型解决复杂问题。该模型在工具使用基准测试中,以更低成本实现更高准确性,并能根据用户偏好智能选择工具。其训练采用名为ToolOrchestra的新强化学习框架,旨在提升小型模型的协调能力。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、KlingAIAvatar2.0上线即爆火:5分钟唱跳一键生成,数字人正式告别“面瘫”时代KlingAIAvatar2.0通过多模态导演模块实现从音频到情感表演的智能跃迁,显著提升数字人的表情和动作表现力,为短视频、电商广告与教育内容等领域带来革命性影响。8、OpenAI推出GPT-5.1-Codex-MaxOpenAI推出的GPT-5.1-Codex-Max在性能和价格上均表现出色,其强大的编码能力和针对Windows环境的优化,使其在开发者市场中具有重要地位。

OpenAI推出GPT-5.1-Codex-Max编程模型,性能显著提升但价格与GPT-5持平。该模型具备“代理式”编码能力,通过“压缩”技术可在超百万tokens的上下文中持续运行,适合处理复杂编程任务,引发开发者广泛关注。

火山引擎发布豆包语音识别模型2.0,显著提升推理能力,支持多语言和视觉信息识别。模型基于20亿参数音频编码器,优化复杂场景,提升专有名词、人名、地名及多音字的识别准确性。
阿里巴巴在国际志愿者日推出“追星星的AI”绘本智能体,登陆千问APP。该智能体由阿里志愿者与魔搭社区开发者共同开发,专为孤独症儿童设计,提供情感陪伴与个性化阅读体验。2.0版本新增“一句话生成绘本”功能,用户输入故事大意,AI即可自动生成适合孤独症儿童发展特点的绘本内容。
微软开源实时语音模型VibeVoice-Realtime-0.5B,具备极低延迟和接近真人的语音表现。该模型从文本输入到发声平均仅需300毫秒,远低于传统TTS模型的1-3秒,实现近乎零延迟的实时语音合成。

快手可灵AI发布数字人模型Avatar2.0,用户仅需提供一张照片和一段音乐,即可生成长达5分钟的唱歌视频。该模型显著提升了数字人的表现力,使其能够自然展现表情和肢体动作,告别僵硬“对口型”模式。这标志着AI内容创作从静态向动态叙事的重大进步。

AI数据服务商Micro1年收入突破1亿美元,估值达5亿美元,成为增长最快的AI供应链公司。公司从招聘工具转型为“AI专家云”平台,管理数千名跨学科专家,创始人年仅24岁。

阿里云飞天实验室研发的“析言XiYan-SQL”数据分析智能体,在全球权威SQL诊断评测BIRD-CRITIC中登顶所有开放榜单,超越国内外顶尖团队,刷新行业纪录。该基准由学术界与Google Cloud合作推出,旨在测试大语言模型解决真实数据库应用问题的能力,聚焦企业常见数据库报错的诊断与修复。