国产大模型MiniMax开源M2.1,以100亿参数稀疏架构在多语言编程、代码生成与工具调用上实现突破,在权威基准测试中超越谷歌、Anthropic等闭源旗舰模型,标志着开源编码模型性能进入新阶段。
MiniMax M2.1正式发布,这是一款专为真实编码和AI组织设计的先进开源模型。它拥有100亿激活量,在SWE-multilingual测试中得分72.5%,在VIBE-bench测试中高达88.6%,性能超越Gemini3Pro和Claude4.5Sonnet等闭源模型,标志着代理时代的重要进展。
12月22日,智谱华章发布并开源新一代大模型GLM-4.7。该模型在多项国际基准测试中表现突出,尤其在编码领域表现卓越,综合性能超越GPT-5.2,在权威编码评估平台Code Arena中位列开源与国产模型双榜首,重点面向编程场景。
欧洲AI公司Mistral AI发布新一代开源编码模型家族Devstral2,包括123B参数旗舰版和24B轻量版,并推出配套命令行工具Mistral Vibe CLI,支持自动化编程。该模型在SWE-bench基准测试中获72.2分,接近顶级闭源模型性能,且API目前免费开放,为开发者提供强大助力。
Devstral 2开源编码模型及Mistral Vibe CLI,高效解决软件工程任务
开源编码 LLM,专为软件工程任务设计。
高效编码的开源大型语言模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
PrimeIntellect
INTELLECT-3是一个拥有1060亿参数的混合专家(MoE)模型,通过大规模强化学习训练而成。在数学、编码和推理基准测试中展现出卓越性能,模型、训练框架和环境均以宽松许可协议开源。
allenai
Olmo 3是由Allen Institute for AI开发的开源语言模型系列,包含7B和32B两种规格,分为指令(Instruct)和思考(Think)两种变体。该模型具有出色的长链思维能力,能够显著提升数学和编码等推理任务的表现。
Jackmin108
GLM-4.5-Air是智谱AI推出的适用于智能体的基础模型,采用紧凑设计,统一了推理、编码和智能体能力,能满足智能体应用的复杂需求。该模型参数量适中且效率优越,已开源多种版本,可用于商业和二次开发。
unsloth
GLM-4.5是为智能代理设计的基础模型,统一了推理、编码和智能代理能力,总参数达3550亿,在12个行业标准基准评估中排名第3,得分63.2。采用MIT开源许可,可用于商业和二次开发。
cpatonn
GLM-4.5-Air-AWQ 是基于 zai-org/GLM-4.5-Air 基础模型进行4位AWQ量化的文本生成模型,专为智能代理应用设计,在推理、编码和智能代理能力方面表现优异,采用MIT开源许可证。
moonshotai
Kimi-Dev-72B 是一款用于软件工程任务的开源编码大语言模型,在 SWE-bench Verified 上取得了开源模型中的最优成绩。
deepseek-community
DeepSeek-VL 是一个开源的视觉语言模型,能够同时处理文本和图像,生成上下文相关的响应。该模型采用混合编码架构,结合LLaMA文本编码器和SigLip/SAM视觉编码器,支持高分辨率图像处理,在真实世界应用中表现出色。
DeepSeek-VL是由DeepSeek AI团队开发的开源视觉语言模型,能够同时处理文本和图像信息,生成上下文相关的回复。该模型采用混合视觉编码器,支持高分辨率图像处理,在真实世界的视觉语言理解应用中表现出色。
Mungert
Seed-Coder-8B-Reasoning是基于Transformer架构的代码生成模型,具有强大的推理能力,适用于多种编码任务,在同规模的开源模型中表现出色。
nvidia
一款15亿参数的开源权重模型,专为复杂推理任务设计,在数学、编码、科学及逻辑谜题等领域表现卓越。
Seed-Coder-8B-Instruct 是一款强大的开源代码模型,具有以模型为中心、透明和高性能等特点,在多种编码任务中表现出色。
SpursgoZmy
Table LLaVA 7B是一个开源的多模态聊天机器人,专门设计用于理解表格图像,能够执行表格问答、表格单元格描述和结构理解等多种表格相关任务。该模型基于LLaVA-v1.5架构,使用CLIP-ViT-L-336px作为视觉编码器,Vicuna-v1.5-7B作为基础大语言模型。
OpenHands LM是一款基于Qwen Coder 2.5 Instruct 32B构建的开源编码模型,通过特殊微调在软件工程任务中表现出色。
YOYO-AI
Qwen2.5-7B-YOYO-super 是一个通过合并基础模型和微调模型优化的开源大语言模型,专注于提升指令跟随、数学和编码能力。
Bojun-Feng
Qwen2.5 0.5B Instruct GGUF - llamafile 是一个基于Qwen2.5 0.5B模型的开源大语言模型解决方案,通过llamafile技术实现单文件运行,无需安装即可在本地计算机上部署和使用。该模型在编码、数学、指令遵循和多语言支持方面表现优异。
CISCai
这是Qwen2.5-Coder-32B-Instruct模型的GGUF量化版本,采用先进的重要性矩阵量化方法,在保证模型效果的同时显著减少存储和计算资源需求。该模型是当前最先进的开源代码大语言模型,编码能力与GPT-4o相当。
01-ai
Yi-Coder是一系列开源代码语言模型,在不足100亿参数的情况下实现了最先进的编码性能。
Yi-Coder 是一个开源代码语言模型系列,在参数规模小于100亿的情况下提供最先进的编码性能。
LazarusNLP
NusaBERT基础版是基于BERT架构的多语言编码器语言模型,支持13种印度尼西亚地区语言,在多个开源语料库上进行了预训练。
lmsys
ToxicChat-T5-Large是一个开源的文本审核模型,通过在ToxicChat数据集上微调T5-large得到。该模型基于编码器-解码器的Transformer架构,能够准确识别输入文本是否含有毒性内容,生成'positive'表示有毒,'negative'表示无毒。