北京大学团队研发出专为“非负矩阵分解”设计的模拟计算芯片,显著提升处理海量数据的能效比,为图像分析、推荐系统等领域提供高效低功耗解决方案。
小米与北京大学联合在arXiv发布学术论文,通讯作者罗福莉曾因雷军千万年薪招募受关注。但论文作者名单未显示她隶属小米大模型团队。罗福莉为1995年出生,本科毕业于北师大计算机专业,现于北大计算语言学研究所。
DeepSeek梁文锋博士团队与北大合作的论文获ACL2025最佳论文奖。该研究提出原生稀疏注意力(NSA)机制,通过压缩、选择性和滑动三条并行注意力分支,实现算法与硬件协同优化,将长文本处理速度提升11倍,性能超越传统全注意力模型。NSA支持100万tokens上下文长度,在64k文本处理中解码速度提升11.6倍,27B参数模型在多项基准测试中表现优异,为AI长文本处理开辟了新方向。
【140字概括】字节跳动视觉AI负责人杨建朝因工作强度及家庭原因暂别岗位,由原阿里M6负责人周畅接任。杨建朝是字节AI核心人物,2018年加入后主导视觉模型研发;继任者周畅为复旦北大背景的AI专家,曾打造阿里M6模型。此次人事变动引发对团队稳定性关注,但字节强调Seed视觉模型团队(专注图像/视频生成)的全球布局及基础研究投入不变。核心团队向谷歌DeepMind前副总裁吴永辉汇报。
Alibaba
$2
Input tokens/M
-
Output tokens/M
256
Context Length
Openai
$1.75
$14
400
Deepseek
$4
$16
32
Baidu
131
Tencent
$1.5
$6
128
$1
8
Bytedance