据财联社报道,阿里巴巴新一代基座模型 Qwen3.5 已在 HuggingFace 的 Transformers 项目中出现代码合并申请(PR),预示发布在即。
据悉,Qwen3.5采用了全新的混合注意力机制,并极有可能是一款原生支持视觉理解的 VLM 模型。目前开发者挖掘的信息显示,Qwen3.5预计将开源至少 2B 的密集模型以及 35B-A3B 的 MoE 模型。此前有消息称,该系列模型将在今年春节期间正式开源。

据财联社报道,阿里巴巴新一代基座模型 Qwen3.5 已在 HuggingFace 的 Transformers 项目中出现代码合并申请(PR),预示发布在即。
据悉,Qwen3.5采用了全新的混合注意力机制,并极有可能是一款原生支持视觉理解的 VLM 模型。目前开发者挖掘的信息显示,Qwen3.5预计将开源至少 2B 的密集模型以及 35B-A3B 的 MoE 模型。此前有消息称,该系列模型将在今年春节期间正式开源。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

OpenAI发布Privacy Filter模型,旨在帮助开发者脱敏文本中的个人身份信息(PII)。该模型参数规模1.5亿,采用混合专家(MoE)设计,以Apache 2.0协议在Hugging Face和GitHub开源。其核心优势在于深度语言理解能力,能通过上下文识别非结构化文本中的敏感信息,超越传统基于规则的方法。
2026年北京车展上,芯擎科技发布5纳米车规级AI座舱芯片“龙鹰二号”,AI算力达200TOPS,支持7B以上模型,标志着国产高端车载芯片在先进工艺与跨域融合上取得关键突破。
福客AI获阿里巴巴战略投资,双方将聚焦电商数字生产力提升。合作旨在将AI技术融入商家运营,优化客户接待、服务体验与经营质量。福客AI将借此强化产品体系,覆盖服务、导购、商品、交易及售后等关键环节,加速AI与商家实际需求的结合。
美团近日启动万亿参数级AI大模型测试,该模型完全基于国产算力集群训练,标志着国产技术应用取得重大突破。目前仅对受邀用户开放,尚未全面普及,展现了美团在AI领域的领先布局。

AI独角兽DeepSeek近期启动首次对外融资,目标估值超200亿美元,腾讯与阿里均有意参与。尽管公司此前依赖创始人梁文锋的量化交易资金,并无急迫融资需求,但此举旨在通过股权激励留住核心人才,应对R1论文作者郭达雅、研究员Wang Bingxuan等关键成员近期流失的挑战。
腾讯发布并开源了全新AI大模型“混元Hy3 preview”,这是混元系列中最智能的模型,升级涵盖复杂推理、指令遵循、上下文学习、代码处理和智能体等领域。该模型采用快思考与慢思考结合的混合专家架构,拥有2950亿参数,旨在提升整体性能和智能化水平。

联想近日发布ThinkPad新品及天禧AI生态,推出AI主机系列,包括ThinkCentre Mini、ThinkCentre和ThinkCentre Pro三个版本,覆盖从个人到专业用户的不同算力需求。此举完善了端侧AI硬件布局,为用户提供从云端租用转向本地AI部署的新选择。

腾讯混元于4月23日发布并开源Hy3preview语言模型,这是一个融合快慢思考的混合专家模型,总参数295B,激活参数21B,支持256K上下文。作为重建后训练的首个模型,它在复杂推理、指令遵循、上下文学习、代码和智能体等能力上显著提升,是混元迄今最智能的模型。2026年2月,腾讯混元重建了预训练和强化学习基础设施,注重模型实用性。
谷歌内部编程范式正经历深刻转变。CEO桑达尔·皮查伊透露,公司超75%的新代码已由AI自动生成,标志着“AI优先”战略取得实质性突破。不过,这些AI生成的代码仍需经专业工程师严格审核把关,确保质量与安全性。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、字节跳动发布Seed3D2.0:几何与纹理双SOTA,API同步上线火山引擎字节跳动Seed团队发布新一代3D生成大模型Seed3D2.0,标志着AI3D内容生成向“生产级可用”迈出关键一步。8、大模型购票时代开启:东航首家接入通义千问实现全流程AI服务文章介绍了中国东方航空与阿里通义千问的合作,标志着AI购票服务进入全流程时代,用户可通过自然语言输入行程计划,AI完成查询、比对、购票等操作,并且AI订单由东航官方直接提供退改签支持,规避第三方风险。