大核CNN UniRepLKNet:挑战Transformer多模态霸主地位
量子位
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
IBM推出开源AI助手CUGA,旨在自动化企业工作流程,可完成超半数任务。该工具通过多代理协作、API集成和代码生成等功能,帮助知识工作者高效处理日常或复杂工作,支持安全、可配置的个性化调整。
中国开源AI大模型实力凸显,DeepSeek、Qwen和Kimi在最新评比中影响力并列第一。榜单由AI研究员发布,涵盖35家机构,超半数为中国团队,展现中国开源领域的快速发展,与美国闭源模式形成对比。
阿里巴巴通义大模型开源“百聆”系列语音模型重大升级。新模型仅需3秒录音即可无缝切换9种语言和18种方言,支持普通话、粤语、日语、英语等,并能模拟开心、愤怒等多种情感。其中Fun-CosyVoice3模型改进显著,首包延迟降低50%,中英混说准确率大幅提升。
商汤科技发布Seko2.0,全球首个专注多集视频生成的AI智能体,实现从单片段到连续叙事的跨越。该系统能保持角色、场景、风格高度一致,在剧情连贯性、人物稳定性和视觉统一性上取得突破,为短剧、广告、教育等领域提供可规模化的AI内容生产方案,基于自研“日日新Seko”多模态大模型。
谷歌等机构研究发现,多智能体系统性能波动显著,任务类型是关键影响因素。在并行任务中,集中式架构表现更优。
国内大模型赛道正从技术竞争转向资本竞速。MiniMax、智谱AI与月之暗面三家头部AI独角兽正密集推进港股上市计划,争夺“中国大模型第一股”头衔。目前三家公司均未公开置评,但多方信源显示上市暗战已打响,其中MiniMax或最早敲钟。

国产大模型Skywork发布移动端APP5.0,支持iOS和安卓。新版核心亮点是实现了“多Agent并行协作”功能,用户通过一句话语音笔记即可快速生成结构化要点、行动清单、脑图,并同步启动多个Agent一键制作PPT、社交媒体文案、播客脚本和宣传海报,显著提升了移动端AI生产力体验。
蚂蚁技术研究院发布LLaDA2.0系列,包含16B和100B版本,其中100B版为业内首个百亿参数离散扩散大语言模型。该模型突破扩散模型规模化瓶颈,显著提升生成质量与推理速度,为领域发展提供新方向。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、MedeoAI新版视频Agent震撼登场:自然语言一键改剧本,内容创作从此零门槛!NotebookLM作为一款智能笔记生成平台,此次升级不仅提升了生成能力优化了用户体验,助力专业人士和创作者高效处理复杂信息。

马斯克旗下xAI计划两年内在萨尔瓦多公立学校部署聊天机器人Grok,覆盖超百万学生。然而,Grok因多次输出极端言论引发全球对AI教育应用的伦理与安全担忧。