大核CNN UniRepLKNet:挑战Transformer多模态霸主地位
量子位
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

百度智能云推出零部署AI服务DuClaw,实现AI智能体“即开即用”,免去镜像选择、服务器部署等复杂流程。作为开源智能体OpenClaw的云端升级版,DuClaw整合百度搜索、百科等核心功能,支持多款主流大模型灵活选配。目前服务已上线网页端,未来将接入企业微信、钉钉等办公平台,构建多端协同生态。

谷歌推出原生多模态嵌入模型Gemini Embedding2,支持文本、图像、视频、音频和文档,统一映射到向量空间,实现跨媒体深度理解。与生成式模型不同,它专注于“理解”,将数据转化为向量,帮助系统识别语义关系。

OpenAI的Atlas浏览器新增多账号登录功能,用户可在同一浏览器中通过独立配置文件分别管理个人、工作及学校等多个ChatGPT账号,解决了以往单一浏览器无法切换身份的痛点。产品负责人称此功能为用户最期待的特性之一,有助于提升Atlas作为主力浏览器的使用体验。
2026年3月10日,AI独角兽MiniMax股价飙升超22%,市值达3826亿港元,超越百度。其营收激增158%,标志着AI商业化取得重大突破。

谷歌推出Gemini Embedding2,这是首款基于Gemini架构的多模态嵌入模型,已在Gemini API和Vertex AI开放预览。该模型将文本、图像、视频、音频和文档等数据类型映射到统一嵌入空间,实现跨模态检索与分类,支持超过100种语言。
杨立昆创立的AMI公司获10.3亿美元融资,投前估值达35亿美元。该公司致力于将具备推理、规划和世界建模能力的AI系统商业化,试图挑战当前以“预测下一个单词”为核心的大语言模型范式。
2026年网文界面临AI冲击,AI写作工具以千倍速度挑战人类作者。传统“爆肝”日更模式在AI“工业化生产”面前显得无力,引发行业生存危机。

蚂蚁集团启动2026年度春季校园招聘,技术类岗位占比达85%,其中超70%与人工智能直接相关,聚焦大模型算法、多模态生成、数据智能及AI安全等核心领域。工作地点覆盖全球多个城市。蚂蚁连续六年春招技术类岗位占比超80%,显示其持续加码AI。
腾讯发布全场景AI智能体WorkBuddy,推动大模型应用进入高集成、低门槛新阶段。产品上线首日因访问量过大,导致关联工具腾讯云代码助手出现服务不稳定。腾讯云紧急扩容10倍后恢复,并向受影响用户补偿5000Credits。
腾讯与清华大学联合推出AI音乐模型SongGeneration2,在技术架构和音乐质量上实现重大突破,显著超越现有开源模型,甚至媲美顶级商业产品,有效解决了AI音乐的“塑料感”问题。