阶跃星辰开源320亿参数深度研究模型Step-DeepResearch,能在开放环境中自主探索信息并生成专业报告。其研究能力接近OpenAI o3-mini等顶级商业模型,但部署成本仅为传统模型的十分之一,单次调用成本低于0.5元人民币。
美团M17团队推出Meeseeks评测基准,旨在评估大型语言模型如OpenAI、Claude3.5Sonnet等的指令遵循能力,解决模型输出内容虽好但未满足具体格式或内容要求的问题。
OpenAI发布200亿参数开源模型gpt-oss-20b,首次实现骁龙终端本地运行。该模型性能媲美o3-mini,通过高通AI Stack优化后,可在移动设备上提供快速响应和隐私保护。开发者可通过Hugging Face等平台获取,支持Turbo模式体验。这标志着AI推理从云端向终端迁移的重要突破,为智能应用发展开辟新可能。
开源大模型XBai o4发布,创新采用"反思型生成范式",结合Long-CoT强化学习和过程评分学习,显著提升复杂推理能力并降低99%推理耗时。该模型提供三种模式,其中Medium模式全面超越OpenAI o3-mini,部分测试优于Claude Opus。已在GitHub开源训练评估代码,推动开源大模型在复杂推理领域的发展。
OpenAI o3-mini 是 OpenAI 推出的最新高性价比推理模型,专为 STEM 领域优化。
Openai
$7.7
输入tokens/百万
$30.8
输出tokens/百万
200
上下文长度
$0.4
-
128
Alibaba
$2
32
Baichuan
$21
$84
一个通过MCP协议直接查询OpenAI模型的服务器,支持o3-mini和gpt-4o-mini模型,提供简洁和详细的回答。