大型语言模型 (LLM) 在自然语言处理 (NLP) 领域取得了显著进展,使其在文本生成、摘要和问答等应用中大放异彩。然而,LLM 对令牌级处理(一次预测一个词)的依赖也带来了一些挑战。这种方法与人类的交流方式形成对比,后者通常在更高层次的抽象层面运作,例如句子或想法。


大型语言模型 (LLM) 在自然语言处理 (NLP) 领域取得了显著进展,使其在文本生成、摘要和问答等应用中大放异彩。然而,LLM 对令牌级处理(一次预测一个词)的依赖也带来了一些挑战。这种方法与人类的交流方式形成对比,后者通常在更高层次的抽象层面运作,例如句子或想法。


欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
阿里巴巴推出“AI 店小蜜”,成为电商领域首个兼具售前咨询与售后服务的客服Agent。该产品基于通义千问大模型构建,并利用淘宝海量交易数据微调,通过多模态能力升级,从自动回复工具进化为能主动理解用户需求的智能客服。

火山引擎于5月11日发布业界首个“Agent套餐包”——Agent Plan,推动AI应用从编程辅助向通用智能体跨越。该计划整合字节跳动自研全模态模型(如Doubao-Seed、Doubao-Seedance)及GLM-5.1、Kimi-K2.6等第三方模型,并创新采用“Model与Harness”双驱动技术架构。
国产AI大模型企业MiniMax关联公司上海稀宇极智科技完成注册资本从10亿元增至40亿元的重磅增资,增幅达300%。该公司成立于2021年11月,法定代表人闫俊杰,主营计算机系统服务,由香港稀宇极智有限公司全资控股。
全球AI大模型调用量持续攀升,上周达25.7万亿Token,环比增长7.5%。中国大模型表现突出,周调用量增长显著,展现出强劲的爆发力与应用韧性,在全球算力竞赛中占据重要位置。
2026移动云大会上,AI-eSIM多生态智能服务体系亮相,实现“运营商码号即大模型账号”的突破。该体系将AI-eSIM作为Token经济新入口,融合流量、词元与智能体运营,开启人工智能新形态。核心硬件采用全栈国产芯片,在四维技术上实现突破。
苹果M4芯片普及推动本地AI发展,开发者jola在24GB内存的M4 MacBook Pro上成功部署本地AI工作流。测试显示,优化后的Qwen 3.5-9B模型生成速度达每秒40 tokens,为离线办公和私密开发提供高效方案。选型上,9B模型被认为是本地运行大语言模型的最优解,平衡了性能与资源需求。

2026年5月8日,中国移动在移动云大会上发布模型服务平台MoMA,接入超300款主流AI模型,旨在普及人工智能至各行业。平台提供“一次接入、智能优选、普惠可用、安全可信”的服务体系,用户通过统一API网关即可使用所有模型,大幅降低AI应用门槛。

MiniMax(稀宇科技)启动“10x Team”合作计划,旨在与各行业顶尖人才协作,将大模型从编程、内容创作拓展至工业软件、游戏引擎、芯片设计、金融等垂直领域,实现效率“十倍增长”。已与专家开展实质性合作,验证行业认知对模型进化的驱动作用。
2026移动云大会上,中国移动发布MoMA模型服务平台,推动大模型从实验室走向千行百业,实现AI“随处可用”。平台核心优势是聚合能力,通过统一API网关,用户一次接入即可调用包括自研“九天”基座大模型在内的300余款主流模型,实现“拎包入住”。

Airbnb在2026年第一季度财报中透露,AI已深度融入核心业务,技术端60%的新代码由AI辅助编写。CEO Brian Chesky指出,AI代理使API工具开发效率大幅提升,原本需20人的团队工作缩减至单人监督。这趋势与谷歌、微软、Spotify等公司一致,标志AI正重塑企业研发效能。