阿里巴巴否认“千问模型”核心团队集体离职传闻,称团队稳定、产品服务正常运作,并重申将继续坚持开源策略。
阿里巴巴集团辟谣“千问模型核心团队集体离职”及“开源策略调整”传闻,强调大模型研发与服务一切正常,团队架构稳定,AI产品与技术服务运行正常,并重申长期坚持开源策略。
国产大模型在全球开源和消费市场加速发展。阿里云春节期间密集布局,通义千问家族确立全球AI生态领先地位,标志着AI深度融入国民生活。其技术实力突出,Qwen 3.5在Hugging Face榜单表现强势,开源策略持续释放影响力。
Perplexity发布通用AI代理系统Perplexity Computer,能像人类一样操作界面并支持长时间连续任务。其创新在于采用“模型编排”策略,整合了19个顶级实验室的专有及开源模型,而非依赖单一模型。
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
$2
$20
Baidu
128
allura-forge
MiMo是小米专为推理任务从头开始训练的大语言模型系列,通过优化预训练和后训练策略,在数学和代码推理任务上展现出卓越性能。项目开源了7B参数规模的多个版本,包括基础模型、SFT模型和RL模型。
JetLM
SDAR是一种新型大语言模型,集成了自回归和离散扩散建模策略,结合了AR模型高效训练和扩散模型并行推理的优势。在通用任务上与SOTA开源AR模型相当,在科学推理任务上表现出色,成为最强大的扩散语言模型。
leolee99
PIGuard是一种新型的提示防护模型,专门用于检测提示注入攻击。通过创新的训练策略显著减少对触发词的偏差,在多个基准测试中表现出色,超越现有最佳模型30.8%,为LLM安全提供强大的开源防护解决方案。
nvidia
鹰隼2号是一个高性能视觉语言模型家族,专注于数据策略和训练方案的透明性,旨在推动开源社区开发具有竞争力的视觉语言模型。
Eagle2是NVIDIA推出的高性能视觉语言模型家族,专注于通过数据策略和训练方案提升开源视觉语言模型的性能。Eagle2-2B是该系列中的轻量级模型,在保持强劲性能的同时实现卓越效率和速度。
mav23
芦荟(Aloe)是一个全新的医疗大语言模型家族,通过模型融合和先进的提示策略,在同类型开源模型中极具竞争力。
variante
LLaRA是一个开源视觉运动策略模型,通过微调LLaVA-7b-v1.5在指令跟随数据和辅助数据集上训练而成,主要用于机器人技术研究。
HPAI-BSC
Aloe是新一代医疗大语言模型家族,通过模型融合和先进的提示策略,在其规模范围内与所有先前开源模型相比具有高度竞争力,并达到了最先进的成果。
apple
OpenELM是一组开源高效语言模型,采用分层参数分配策略提升模型精度,包含2.7亿至30亿参数的预训练及指令调优版本。
OpenELM是一组开源高效语言模型,采用分层缩放策略在Transformer模型的每一层中高效分配参数,从而提升模型精度。
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,包含2.7亿至30亿参数的预训练及指令调优版本。
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,提升模型准确率。包含270M、450M、1.1B和3B四种参数规模,提供预训练和指令调优版本。
OpenELM是一组开源高效语言模型,采用分层缩放策略在Transformer模型的每一层中高效分配参数,提升准确性。
NexaAI
章鱼模型V2是一款20亿参数的开源语言模型,专为安卓API优化,采用功能令牌策略提升推理速度和准确性。
aligner
一个与模型无关的即插即用模块,适用于开源和基于API的模型,采用残差校正策略增强AI安全性
openchat
OpenChat是一个创新的开源语言模型库,采用C-RLFT策略进行微调,即使仅有70亿参数也能实现与ChatGPT相媲美的性能。
Eunomia MCP Server是一个开源数据治理工具,用于LLM应用的数据策略管理,支持与MCP服务器集成。
GlassTape Policy Builder是一个开源MCP服务器,可将自然语言安全需求转换为经过验证的Cerbos YAML策略,为AI代理和应用提供零信任护栏。
一个基于Claude的代码分析工具,用于分析开源项目并生成智能合并策略