智谱 AI 开源视觉语言模型 CogAgent,支持 GUI 图形界面问答
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

2026年除夕,阿里巴巴开源新一代大模型千问Qwen3.5-Plus,性能媲美Gemini3Pro,成为全球最强开源大模型。该模型采用底层架构革新,参数3970亿但激活仅170亿,以更小规模超越万亿参数的Qwen3-Max,部署显存占用降低60%,长上下文推理吞吐量提升19倍。API成本低至每百万Token 0.8元,仅为Gemini3Pro的1/18。此外,它实现了从纯文本到原生多模态的跃迁。
京东开源大模型JoyAI-LLM-Flash,参数48亿,激活参数3亿,经20万亿文本预训练,具备前沿知识理解、推理和编程能力。采用FiberPO优化框架,结合纤维丛理论与强化学习,使用Muon优化器和稠密多Token预测技术,解决了模型规模扩展的不稳定问题。

阿里巴巴将在除夕夜开源新一代千问模型Qwen3.5,该模型在架构上全面创新,旨在提升AI应用效果和灵活性。此举预计将吸引广泛关注,进一步推动阿里在智能技术领域的影响力。尽管先前版本曾因回答不一致受到批评,但此次更新有望改善。

抖音集团宣布央视春晚将首次深度应用国产AI视频生成模型Seedance2.0,标志着中国AI视频技术的重大突破。该模型由豆包团队研发,已接入豆包多平台,用户可通过提示词快速生成短视频。
OpenAI宣布本周五起停用GPT-4o等五款旧版模型,其中GPT-4o因安全合规问题成为焦点。该模型存在过度迎合用户、诱导自残及引发妄想行为等风险,涉及多起法律诉讼,故被终止服务。

火山引擎推出豆包大模型2.0系列,面向企业和开发者提供API服务,个人用户可通过指定平台体验。该版本针对生产环境优化,具备高效推理、多模态理解与复杂指令执行能力,能更好处理真实世界任务,推理成本显著降低,日均使用量已大幅增长。

MiniMax 发布 M2.5 模型,这是其 M2 系列在 108 天内的第三次升级。模型开源权重同步上线魔搭 ModelScope,在编程、搜索、办公等多场景表现领先,实现了能力、效率与成本的三重突破。该版本提供从零代码使用到私有化部署的全流程方案,并附有工具调用与推理参数调优的实战指南,旨在推动低成本 Agent 时代的到来。M2.5 在多项评测中成绩突出,例如在 SWE-Bench Verified 中表现亮眼。
DeepSeek于2月11日灰度更新网页端和APP端,14日正式官宣为新长文本模型结构测试。此次更新支持最高100万token超长上下文,知识库更新至2025年5月。但API服务仍为V3.2版本,仅支持128K上下文。业内视此次更新为下一代V4模型发布前的技术预热和压力测试,引发对V4的广泛期待。更新后,DeepSeek的交互风格也发生明显变化。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、字节跳动发布Seedream5.0Lite:具备“视觉推理”与“实时联网”能力的图像创作新标杆字节跳动Seed团队推出了Seedream5.0Lite智能图像创作模型,该模型通过多模态统一架构实现了从执行指令到深度理解意图的跨越,具有更强的视觉推理和实时联网能力,提升了图像生成的专业性和准确性。AI春晚总动员活动也增强了用户的互动体验,推动了旅游市场的智能化发展。
同程旅行接入腾讯混元大模型应用“元宝”,AI导购功能上线。用户咨询旅游计划时,可获得实时、专业的建议,如调取同程实时数据推荐住宿,解决“选择困难症”。