南方科技大学联合 IDEA 研究院发布 SUS-Chat-34B 双语模型
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

美团LongCat团队发布新模型LongCat-Flash-Lite,采用“嵌入扩展”新范式,突破传统MoE架构瓶颈。研究表明,扩展嵌入层比单纯增加专家数量能获得更优的帕累托前沿,有效解决了边际收益递减和通信开销高的问题。
ZenMux平台将Claude Opus4.6模型加入免费套餐,并提供两周限免体验,引发AI圈关注。该模型性能显著提升,支持高容量上下文处理,被视为行业重要福利。
苹果团队通过改进开源模型,在UI设计领域超越顶尖大模型。传统AI生成代码在UI设计上表现不佳,因人类反馈强化学习过于粗糙。苹果通过精细调整,使小模型在特定任务上实现逆袭,解决了开发者头疼的界面开发难题。

国家市场监管总局公布五起人工智能领域不正当竞争典型案例,涉及仿冒混淆、虚假宣传、侵犯商业秘密等违法行为。其中,北京奥蓝德和杭州博珩因仿冒DeepSeek被罚,旨在遏制“搭便车”行为,维护市场公平竞争秩序。
AI初创公司Fundamental结束隐身,宣布完成2.55亿美元A轮融资,投后估值达12亿美元。本轮由Oak HC/FT等多家机构领投,Perplexity和Datadog的CEO等也以个人身份参与。公司核心产品为基础模型Nexus,旨在与ChatGPT等主流大语言模型竞争。
中科曙光在郑州核心节点上线全国首个3万卡scaleX超集群,建成国内最大国产AI算力池,从万卡到三万卡仅用不到两个月,标志着国产算力实现重大突破。
OpenAI CEO Sam Altman宣布推出编程大模型GPT-5.3-Codex,该模型在技术指标和应用层面实现突破,推动AI辅助编程进入新阶段。在SWE-Bench Pro评测中达到57%,在TerminalBench2.0和OSWorld评测中表现优异。
OpenAI发布GPT-5.3-Codex编码模型,性能与推理能力显著提升,运行速度加快25%,能高效处理复杂长期任务。

Anthropic 推出新一代旗舰AI模型Claude Opus4.6,更新节奏迅速。新版本聚焦“自主性”与“生产力”,旨在为开发者和企业办公提供深度智能化支持。技术亮点包括首次引入100万token超大上下文窗口,显著提升模型处理长文本能力。
谷歌与苹果达成重要合作,成为其首选云服务提供商,苹果将基于谷歌Gemini技术开发下一代AI模型。同时,谷歌计划在2026年投入1750亿至1850亿美元加强基础设施建设,支持AI发展。