谷歌DeepMind预测2026年将成为AI发展的关键转折点,届时持续学习技术将全面实现。该技术使AI能自主吸收新知识并不断改进,被视为AI自我提升的核心。谷歌已在NeurIPS2025大会上提出“嵌套化方法”,显著提升了大语言模型的上下文处理能力,为持续学习奠定了基础。
谢赛宁团队因一场持续四个月的推特辩论,意外催生新作“iREPA”。辩论围绕自监督学习模型是否应聚焦于依赖空间局部信息的稠密任务展开,最终以谢赛宁让步告终,却促成了这篇展示创新思路的重要论文。
中国移动推出首款消费级家庭服务型具身智能产品“灵犀”四足机器人,以“拟人化交互”和“场景化服务”为核心,旨在满足儿童陪伴、老人照护和家庭安全等多元化需求。产品深度融合AI大模型技术,具备强大的自然语言理解和持续学习能力,可精准理解用户意图。
谷歌DeepMind推出SIMA2通用智能体,升级采用Gemini模型,能理解目标、解释计划并自我学习,在复杂3D游戏中持续进步。其前身SIMA1于2024年发布,通过图像和虚拟设备控制,掌握600多项语言指令,任务完成率约31%,低于人类玩家水平。
AI助手,提升网站交互体验。
AI驱动的笔记和持续视频,提升学习效率。
深度学习算法与大模型面试指南,持续更新的面试题目集合。
Bytedance
$1.2
Input tokens/M
$3.6
Output tokens/M
4
Context Length
Deepseek
$4
$16
32
Iflytek
$2
-
Openai
$14
$56
200
Alibaba
$1.6
128
$525
$1050
$1
8
Baichuan
Baidu
64
$105
$420
$21
$84
Tencent
QuantFactory
MachineLearningLM-7B-v1是基于Qwen/Qwen2.5-7B-Instruct在数百万合成表格机器学习任务上持续预训练的大语言模型,专门针对表格分类任务优化,支持8到1024个示例的少样本上下文学习。
adaptive-classifier
自适应分类器是一个支持持续学习和动态添加类别的文本分类模型,基于ModernBERT-base架构构建,能够在不重新训练的情况下适应新的类别和示例。
自适应分类器是一个支持持续学习和动态添加类别的文本分类模型,基于ModernBERT-base构建,能够在不重新训练的情况下适应新的类别和数据。
自适应分类器是一个支持持续学习和动态添加类别的文本分类模型,基于ModernBERT-base架构构建,能够不断更新模型以适应新数据,灵活应对不同的分类需求。
WenchuanZhang
Patho-R1-7B是一款专门针对病理学领域设计的多模态推理模型,通过三阶段训练管道(持续预训练、监督微调、强化学习)来增强病理诊断理解能力,能够有效处理高分辨率病理图像和复杂诊断推理任务。
支持持续学习和动态类别扩展的文本分类模型
apple
TiC-CLIP是基于TiC-DataComp-Yearly数据集训练的视觉语言模型,采用持续学习策略保持模型与最新数据同步
TiC-CLIP是基于OpenCLIP改进的视觉语言模型,专注于时间持续学习,训练数据涵盖2014至2022年
ingeol
KoSaul-8B是基于Open-ko-llama3-8B模型通过持续学习训练而成的韩语大语言模型,专注于法律和医疗领域的专业应用。
MTSAIR
一个通过前沿训练方法开发的实验性AI模型,专注于持续学习和知识吸收能力的优化
LR-AI-Labs
基于LLaMA2-7B专为越南语优化的对话模型,通过持续自监督学习和监督微调增强越南语能力
NiiCole
基于TimeSformer架构的视频分类模型,在Kinetics-400数据集上预训练并在UCF101数据集上微调,采用LoRA技术进行持续学习。
Suprit
仲景是首个基于中文医学LLaMA的大语言模型,实现了从持续预训练、监督微调到基于人类反馈的强化学习的全流程训练,专门针对中文医学领域进行优化。
nghuyong
ERNIE 2.0是百度于2019年提出的持续预训练框架,通过持续的多任务学习逐步构建和优化预训练任务。在多项任务中表现优于BERT和XLNet。
ERNIE 2.0是百度提出的持续预训练框架,通过多任务学习优化预训练任务,在多项中英文任务上超越BERT和XLNet。
Brain-MCP是一个为AI提供完整记忆管理系统的MCP服务,模拟人类思维过程,支持短期记忆缓存、长期记忆关联存储和思维链管理,实现AI的持续学习和经验积累。
MCP接口连接Claude的思考循环系统,实现对话间持续后台思考处理,包含模式识别、记忆管理和跨会话学习功能。
结构化思维是一个模块化系统,通过预定义的认知框架帮助用户解决复杂问题,提供模板化思考、验证思维等功能,并支持持续学习和适应。
该项目提供基于ReasoningBank闭环学习的智能规划和目标执行代理系统,支持动态规划、自适应重规划和持续学习改进,适用于复杂多步骤任务部署场景