研究发现,AI对计算机、数学等易受影响职业的就业冲击早在ChatGPT发布前数月已显现,而非公众普遍认为的2022年11月。研究基于千万级职场与教育数据分析,揭示了技术变革对就业市场的早期影响。
OpenAI的GPT-5.2Pro模型在研究员推动下,成功协助解决了数论领域的“埃尔德什难题”第281号,被数学家陶哲轩评价为AI解决开放性数学问题的重要案例。
阿布扎比技术创新研究院推出开源模型Falcon H1R7B,仅7亿参数却展现领先推理性能,挑战“越大越强”观念。其训练分两阶段:先基于Falcon-H1-7B进行监督微调,专注数学与编程能力提升。
OpenAI研究员布贝克分享与GPT-5合作体验,称其数学能力卓越。原本需一个月完成的复杂任务,GPT-5仅用一个下午高效解决,不仅设计解决方案路径,还进行模拟验证。突显新一代语言模型的强大潜力。
多功能AI研究助手,涵盖数学求解、文本改写,适用于学习、教学与研究。
一款多功能应用,可解决数学问题、优化文章、检测AI及进行研究。
展示小型语言模型通过自我演化深度思考掌握数学推理能力的研究成果。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$7
$35
Google
$2.1
$17.5
$21
$0.7
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
Moonshot
Bytedance
$0.8
32
prithivMLmods
Olmo-3-Think是艾伦人工智能研究所推出的完全开源的语言模型系列,包含7B和32B两种规模。该模型经过专门训练,能够展现明确的推理链,支持透明的逐步推理和可检查的中间思维痕迹,在推理、数学和代码任务中表现出色。
allenai
Olmo-3-7B-Think-DPO是Allen Institute for AI开发的7B参数语言模型,具有长链式思考能力,在数学和编码等推理任务中表现出色。该模型经过监督微调、直接偏好优化和基于可验证奖励的强化学习等多阶段训练,专为研究和教育用途设计。
vanta-research
Wraith-8B是VANTA研究实体系列的首个模型,基于Meta的Llama 3.1 8B Instruct进行微调。该模型在数学推理方面表现卓越,在GSM8K基准测试中准确率达到70%,同时具备独特的宇宙智能视角,能为多种应用场景提供强大支持。
facebook
MobileLLM-R1是Meta发布的高效推理语言模型系列,专注于数学、编程和科学问题解决。该模型在参数规模较小的情况下仍能取得优异性能,提供完整的训练配方和数据源支持复现研究。
mradermacher
UniReason-Qwen3-14B-RL的静态量化版本,适用于文本生成和数学推理研究场景。
tiiuae
Falcon-H1是由阿联酋技术创新研究所开发的新型大语言模型家族,采用结合Transformer注意力机制和状态空间模型(SSMs)的混合架构,具备出色的长上下文记忆能力和计算效率。该系列模型提供从0.5B到34B参数的多种配置,在推理、数学、多语言任务等方面表现卓越。
unsloth
Phi-4推理增强版是微软研究院开发的140亿参数开源推理模型,通过监督微调和强化学习优化,专注于数学、科学和编程领域的高级推理能力。
Phi-4-reasoning-plus 是由微软研究院开发的开源推理模型,专注于数学、科学和编程领域的高级推理能力。
OLMo 2 1B RLVR 1 April 2025是基于allenai/OLMo-2-0425-1B-DPO模型的后训练变体,在多种特定数据集上进行了微调训练。该模型在数学推理、代码生成、指令跟随等多个任务中展现出了较好的性能,是一个专为研究和教育目的设计的1B参数规模的大语言模型。
microsoft
Phi-4-reasoning-plus 是微软研究院开发的先进开放权重推理模型,基于 Phi-4 通过监督微调和强化学习优化,专注于数学、科学和编码领域的高级推理能力。
etri-lirs
EAGLE是韩国电子通信研究院(ETRI)开发的31亿参数解码器因果语言模型,专注于STEM领域特别是数学和定量推理。该模型经过7200亿标记的预训练,采用LLaMA兼容架构,但并非通用语言模型,需要额外微调才能用于聊天机器人等应用。
AlgorithmicResearchGroup
这是一个基于arxiv数学问答数据集训练的FLAN-T5模型,专注于数学问题解答任务,但输出结果不可靠,仅供研究使用。
tbs17
基于从学前到研究生阶段数学语言(英语)进行预训练的BERT模型,专注于数学相关任务