蚂蚁集团百灵大模型团队今日开源万亿级旗舰模型Ling-2.6-1T,该模型不追求参数堆叠,而是优化指令执行、工具适配及长上下文能力。其创新混合架构通过强化奖励策略降低Token开销,实现高效“快思考”机制。
SiFive完成4亿美元融资,估值达36.5亿美元,由Atreides Management领投,英伟达参投。公司基于RISC-V开源指令集,与x86和Arm架构形成差异化竞争,商业模式借鉴Arm早期策略,获资本市场看好其在AI时代的潜力。
阿里巴巴否认“千问模型”核心团队集体离职传闻,称团队稳定、产品服务正常运作,并重申将继续坚持开源策略。
阿里巴巴集团辟谣“千问模型核心团队集体离职”及“开源策略调整”传闻,强调大模型研发与服务一切正常,团队架构稳定,AI产品与技术服务运行正常,并重申长期坚持开源策略。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
allura-forge
MiMo是小米专为推理任务从头开始训练的大语言模型系列,通过优化预训练和后训练策略,在数学和代码推理任务上展现出卓越性能。项目开源了7B参数规模的多个版本,包括基础模型、SFT模型和RL模型。
JetLM
SDAR是一种新型大语言模型,集成了自回归和离散扩散建模策略,结合了AR模型高效训练和扩散模型并行推理的优势。在通用任务上与SOTA开源AR模型相当,在科学推理任务上表现出色,成为最强大的扩散语言模型。
leolee99
PIGuard是一种新型的提示防护模型,专门用于检测提示注入攻击。通过创新的训练策略显著减少对触发词的偏差,在多个基准测试中表现出色,超越现有最佳模型30.8%,为LLM安全提供强大的开源防护解决方案。
nvidia
鹰隼2号是一个高性能视觉语言模型家族,专注于数据策略和训练方案的透明性,旨在推动开源社区开发具有竞争力的视觉语言模型。
Eagle2是NVIDIA推出的高性能视觉语言模型家族,专注于通过数据策略和训练方案提升开源视觉语言模型的性能。Eagle2-2B是该系列中的轻量级模型,在保持强劲性能的同时实现卓越效率和速度。
mav23
芦荟(Aloe)是一个全新的医疗大语言模型家族,通过模型融合和先进的提示策略,在同类型开源模型中极具竞争力。
variante
LLaRA是一个开源视觉运动策略模型,通过微调LLaVA-7b-v1.5在指令跟随数据和辅助数据集上训练而成,主要用于机器人技术研究。
HPAI-BSC
Aloe是新一代医疗大语言模型家族,通过模型融合和先进的提示策略,在其规模范围内与所有先前开源模型相比具有高度竞争力,并达到了最先进的成果。
apple
OpenELM是一组开源高效语言模型,采用分层参数分配策略提升模型精度,包含2.7亿至30亿参数的预训练及指令调优版本。
OpenELM是一组开源高效语言模型,采用分层缩放策略在Transformer模型的每一层中高效分配参数,从而提升模型精度。
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,包含2.7亿至30亿参数的预训练及指令调优版本。
OpenELM是一组开源高效语言模型,采用分层缩放策略优化参数分配,提升模型准确率。包含270M、450M、1.1B和3B四种参数规模,提供预训练和指令调优版本。
OpenELM是一组开源高效语言模型,采用分层缩放策略在Transformer模型的每一层中高效分配参数,提升准确性。
NexaAI
章鱼模型V2是一款20亿参数的开源语言模型,专为安卓API优化,采用功能令牌策略提升推理速度和准确性。
aligner
一个与模型无关的即插即用模块,适用于开源和基于API的模型,采用残差校正策略增强AI安全性
openchat
OpenChat是一个创新的开源语言模型库,采用C-RLFT策略进行微调,即使仅有70亿参数也能实现与ChatGPT相媲美的性能。
Eunomia MCP Server是一个开源数据治理工具,用于LLM应用的数据策略管理,支持与MCP服务器集成。
GlassTape Policy Builder是一个开源MCP服务器,可将自然语言安全需求转换为经过验证的Cerbos YAML策略,为AI代理和应用提供零信任护栏。
一个基于Claude的代码分析工具,用于分析开源项目并生成智能合并策略