Reddit CEO表示将大规模招聘应届毕业生,认为他们是“AI原生一代”,具备天然优势,因为他们从大学起就借助AI学习编程和处理任务。
昆仑万维天工AI大模型SkyReels V4在文生视频赛道全球夺冠,性能超越Kling、Google Veo等主流模型。其核心突破在于采用强化学习与逻辑推理技术,有效解决了视频生成的一致性与叙事逻辑难题,成为当前全球视频生成能力最强的AI模型。
MiniMax与腾讯云合作,成功部署了具备百万级吞吐、十万级并发能力的Agent强化学习沙箱,并在测试环境中实现全量平稳运行。这标志着AI智能体底层基建能力取得重要突破,为其大规模应用提供了关键支撑。
清华大学开源OpenMAIC多智能体互动课堂平台,将任意主题或文档转化为沉浸式学习体验,推动在线教育进入“与AI共同上课”新阶段。平台已免费开放,代码开源,引发全球关注。
AI驱动平台,提供个性化学习与备考资源,助你攻克考试。
印度K - 12学生AI教育平台,提供个性化学习与考试准备。
免费AI学习助手,可将文本、图像等转换为流程图、思维导图等
AI驱动的圣经学习伴侣,提供经文解答和个人日记功能。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
allenai
Olmo 3是由Allen Institute for AI开发的一系列语言模型,包含7B和32B两种规模,具有指令式和思考式两种变体。该模型在长链式思维方面表现出色,能有效提升数学和编码等推理任务的性能。采用多阶段训练方式,包括有监督微调、直接偏好优化和可验证奖励的强化学习。
Olmo-3-7B-Think-DPO是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现出色。该模型经过监督微调、直接偏好优化和基于可验证奖励的强化学习等多阶段训练,专为研究和教育用途设计。
Olmo 3 7B RL-Zero Math是Allen AI开发的专为数学推理任务优化的70亿参数语言模型,采用RL-Zero强化学习方法在数学数据集上进行训练,能有效提升数学推理能力。
Olmo 3 7B RL-Zero Mix是Allen AI开发的7B参数规模的语言模型,属于Olmo 3系列。该模型在Dolma 3数据集上进行预训练,在Dolci数据集上进行后训练,并通过强化学习优化数学、编码和推理能力。
DevQuasar
这是NVIDIA基于Qwen3架构开发的32B参数奖励模型,专门用于强化学习中的奖励评分和原则对齐,帮助训练更安全、更符合人类价值观的AI系统。
Smith-3
这是一个专为圣西蒙大学科学与技术学院学生设计的微调AI模型,集成在TecnoTime应用程序中,帮助学生保持学习组织性、提高学术连续性,通过结构化通知和激励信息强化学习习惯。
Mungert
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究代理模型,结合了AI反馈强化学习(RLAIF)和强大的推理框架,能够在工具增强的大语言模型中实现可靠、对齐和可扩展的研究级推理,适用于复杂的多步骤研究工作流程。
PokeeAI
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究智能体,结合基于AI反馈的强化学习(RLAIF)与推理框架,能够执行复杂的多步骤研究工作流程,包括自我修正、验证和综合分析。
facebook
DINOv3是Meta AI开发的一系列通用视觉基础模型,无需微调即可在广泛的视觉任务中超越专门的先进模型。该模型采用自监督学习方式,生成高质量的密集特征,在图像分类、分割、深度估计等多种任务中表现出色。
danielkty22
TARS-SFT-7B是一个基于监督微调的安全推理模型,作为强化学习训练的基础模型,专门设计用于增强AI系统的安全性。该模型从Qwen2.5-7B-Instruct开始训练,通过推理过程作为自适应防御机制来提升模型的安全性能。
lmstudio-community
Kevin 32B是由Cognition AI开发的大语言模型,支持超长上下文(40960 tokens),专注于CUDA内核生成和强化学习任务。
qihoo360
Light-R1-14B-DS是一个14B参数的数学SOTA模型,采用强化学习训练,在AIME24/25和GPQA基准测试中表现优异。
cortexso
Deepscaler是一款基于DeepScaleR-1.5B-Preview开发的高级AI模型,专注于提升机器学习任务的效率与可扩展性。该模型提供高质量的预测分析和数据处理能力,适用于自然语言处理、计算机视觉等复杂场景,在金融、医疗和娱乐等行业有广泛应用。
RUC-AIBOX
STILL-3-1.5B-preview是一款采用强化学习技术增强推理能力的慢思考模型,在AIME基准测试中达到39.33%准确率
MahmoodLab
UNI 2是由哈佛大学/布莱根妇女医院Mahmood Lab开发的病理AI视觉主干网络,基于自监督学习在组织病理学图像上预训练,支持多任务评估。
google
Derm Foundation是一种机器学习模型,旨在加速皮肤病学应用中皮肤图像分析的AI开发。
CXR基础模型是一种专为胸部X光图像分析优化的机器学习模型,通过预训练生成嵌入向量,加速AI开发。
MTSAIR
一个通过前沿训练方法开发的实验性AI模型,专注于持续学习和知识吸收能力的优化
Or4cl3-1
CSUMLM是整合多模态AI引擎和大语言模型优势的前沿人工智能系统,具备多模态处理、复杂语言理解和实时学习能力。
LDCC
LDCC-SOLAR-10.7B是由乐天数据通信AI技术团队研发的大语言模型,基于SOLAR架构构建,具有107亿参数规模,主要针对韩语优化,采用创新的学习方法进行训练。
Scrapling是一个自适应网页抓取库,能自动学习网站变化并重新定位元素,支持多种抓取方式和AI集成,提供高性能解析和开发者友好体验。
Overseer是一个通过MCP为AI代理提供任务编排的系统,采用SQLite存储和原生VCS支持(jj-lib + gix),支持任务层次管理、学习记录传递和可视化界面。
LYRAIOS是一个基于模型上下文协议(MCP)的多AI代理操作系统,旨在通过连接金融网络和区块链公链扩展AI应用功能,提供区块链操作、金融科技分析和教育学习等服务。
Orchestro是一个AI开发协调平台,连接产品经理、开发者和AI,将产品想法转化为生产代码。它通过任务分解、依赖跟踪、模式学习和实时进度可视化,协调整个开发流程,提供项目管理、任务执行、知识库和实时仪表板等功能。
一个专注于探索和应用生成式AI(GenAI)的仓库,旨在通过实际案例和资源分享,帮助用户学习和实验GenAI在日常任务中的应用,包括写作、编程、图像生成等。
MCP-KG-Memory是一个基于知识图谱的长期记忆层MCP服务器,旨在解决AI编程助手的上下文遗忘问题。它通过Neo4j持久化存储项目目标、约束、策略和用户偏好,实现语义检索和主动学习,让AI助手拥有持续的记忆和上下文感知能力。
一个基于MCP协议的IMAP邮件服务器,为AI助手提供邮件检查、处理和用户偏好学习功能。
YouTube MCP是一个基于AI的解决方案,旨在通过机器学习技术提升YouTube内容交互体验,支持视频搜索、字幕获取及语义搜索等功能,无需官方API。
一个基于Fusion-360-MCP-Server的AI增强CAM工作流助手,能够分析几何特征、推荐毛坯设置和刀具路径策略,并学习用户偏好。
一个轻量级服务器,通过简单API暴露Mac系统信息,帮助AI助手获取实时硬件和系统数据,主要用于Mac用户的AI和深度学习实验。
MCP双循环推理器是一个为自主AI代理设计的元认知增强工具,通过双循环框架(哨兵监控和裁决器管理)实现异常检测和经验学习,提升代理的自我意识和可靠性。
本项目指导开发者如何将MCP服务与GitHub Copilot集成,以扩展AI辅助开发工作流的能力。通过不到一小时的学习,用户将搭建GitHub MCP服务器,实现Copilot代理模式集成,并完成从问题研究到代码提交的全流程实践。
Agent Skill Loader是一个MCP服务器,作为静态Claude技能库与动态AI代理之间的桥梁,允许代理按需学习技能而无需手动复制文件到每个项目。
SmartMemory是一个为LLM提供结构化记忆的MCP服务器,通过自然对话将对话内容转化为知识图谱,使AI助手能够学习和应用业务规则。
DadMCP是一个利用AI技术在家激发孩子创造力的教育平台,提供远程MCP服务器支持家庭学习。
Vibe Check MCP是一个为AI代理提供元认知监督的服务器,通过模式中断、计划简化和自我学习反馈循环,防止AI在复杂任务中陷入错误路径或过度设计解决方案。
Tempera是一个为Claude Code提供持久记忆的系统,通过捕获编码会话、语义搜索和强化学习,让AI能从历史经验中学习并持续改进。
一个交互式LeetCode MCP服务器,提供AI引导的认证、学习指导模式、代码提交和详细反馈功能,支持多语言编程练习和用户数据跟踪。
Allora MCP服务器是一个基于Model Context Protocol(MCP)的实现,提供从Allora网络获取机器学习推理数据的功能,使AI系统能够无缝访问Allora预测市场数据。
神经儿童发展系统是一个突破性的人工智能框架,通过模拟人类心理发展阶段(包括认知、情感和社交成长)来重构神经网络的学习方式。该系统整合了发展心理学理论(如皮亚杰认知发展阶段、依恋理论)和神经科学原理,构建了包含感知处理、情感调节、记忆系统和心理组件的复杂架构,旨在创建具有真实情感智能和自然发展能力的AI。