大模型竞赛进入“落地攻坚”阶段,火山引擎提出AI演进新范式:智能Agent成为AI落地核心载体,多模态能力与高效开发体系是关键。大模型正从问答交互转向深入汽车、制造等复杂场景,实现从“聊天”到“干活”的跨越。
AI模型在科学推理能力评估方面取得重要进展,已在国际数学和信息学奥林匹克竞赛中表现优异。随着GPT-5等先进模型的发展,AI正有效加速真实科学研究进程,展现出强大的假设提出、测试修正及跨领域综合能力。
荷兰公司Nebius在2025年AI算力竞赛中异军突起,接连获得微软和Meta巨额订单,营收与股价暴涨。公司计划到2026年建成大规模算力集群,耗电量巨大。然而,Nebius并非初创企业,而是早有积累。
微博推出开源大模型Vibe Thinker,仅15亿参数却在数学竞赛基准测试中击败6710亿参数的DeepSeek R1,准确率更高且训练成本仅7800美元。采用轻量化MoE架构与知识蒸馏技术,仅需5GB数学语料即可微调,支持Hugging Face下载和商用。该模型在AIME等国际数学竞赛中表现优异。
AI模型编程竞赛平台
数学领域的开源AI模型,助力数学竞赛。
AI测验生成器,从文本/视频/PDF/网页中创建测验/测试/考试/知识竞赛
AI模拟鲨鱼坦克投资竞赛平台
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
prithivMLmods
VibeThinker-1.5B是微博AI推出的15亿参数密集语言模型,基于Qwen2.5-Math-1.5B微调,专门针对数学和算法编码问题设计。采用'频谱到信号原理'框架训练,在多个数学竞赛测试中超越规模更大的模型,训练成本约7800美元,支持最长约40k词元的输出。
nvidia
基于Qwen2.5-14B微调的数学推理模型,在AIMO-2 Kaggle竞赛中获得第一名
一个用于AI驱动渗透测试竞赛的MCP服务器,提供挑战管理、知识库、持久化Kali容器和尝试历史等功能,支持多种协议集成。
一个为LeetCode提供Model Context Protocol (MCP)服务的服务器,支持AI助手访问LeetCode题目、用户信息和竞赛数据。
Kaggle MCP服务器是一个通过Claude等AI助手与Kaggle竞赛交互的工具,提供竞赛列表、文件下载、结果提交等功能,支持Kaggle API认证和桌面集成。
一个集成MongoDB的MCP服务器,专为记录和分析LLM安全挑战而设计,支持Grey Swan Arena竞赛中的AI安全测试。