英伟达在NeurIPS大会上发布自动驾驶AI模型Alpamayo-R1(AR1),这是全球首个行业级开放推理视觉语言行动模型。它能同时处理文本和图像,将传感器信息转化为自然语言描述,结合推理链AI和路径规划技术,以应对复杂驾驶场景,加速无人驾驶汽车发展。
OpenAI推出“忏悔”框架,训练AI模型主动承认不当行为或问题决策,旨在解决大语言模型因追求“符合预期”而可能产生虚假陈述的问题。该框架引导模型在给出主要答案后进行二次回应,详细说明其推理过程。
亚马逊云科技在2025年re:Invent大会上推出Nova2模型系列,包括四款新模型,在推理、多模态、对话AI、代码生成和Agent任务方面具备领先性价比。其中,Nova2Lite专为日常负载设计,支持文本、图像和视频输入并生成文本输出,是一款快速经济的推理模型。
英伟达在NeurIPS大会上推出新AI基础设施和模型,推动物理AI发展,助力机器人和自动驾驶车辆感知真实世界。重点发布Alpamayo-R1,首个专为自动驾驶设计的开放推理视觉语言模型,能处理文本与图像,提升车辆环境感知能力。
DeepSeek-V3/R1 推理系统是一个高性能的分布式推理架构,专为大规模 AI 模型优化设计。
DeepSeek 是一款先进的 AI 语言模型,擅长逻辑推理、数学和编程任务,提供免费使用。
开源代码生成与推理的大型语言模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
Baidu
128
$2
$20
bartowski
这是由Mistral AI开发的大型语言模型Mistral-Large-3-675B-Instruct-2512的GGUF量化版本。原始模型拥有6750亿参数,专为指令遵循任务设计。本项目使用llama.cpp工具,结合imatrix校准数据集,生成了从Q8_0到IQ1_S共20多种不同精度的量化模型文件,旨在平衡模型性能、推理速度与存储/内存占用,使其能在更广泛的硬件上运行。
Mungert
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究代理模型,结合了AI反馈强化学习(RLAIF)和强大的推理框架,能够在工具增强的大语言模型中实现可靠、对齐和可扩展的研究级推理,适用于复杂的多步骤研究工作流程。
unsloth
GLM-4.6是智谱AI开发的新一代大语言模型,相比GLM-4.5在上下文处理、编码能力和推理性能方面有显著提升。该模型支持200K上下文长度,在多个公开基准测试中表现出色,特别在代码生成、推理和代理任务方面具有竞争优势。
geoffmunn
这是Qwen/Qwen3-0.6B语言模型的GGUF量化版本,一个拥有6亿参数的紧凑大语言模型,专为在低资源设备上进行超快速推理而设计。支持llama.cpp、LM Studio、OpenWebUI和GPT4All等框架,可在任何地方离线使用私有AI。
mlx-community
基于智谱AI GLM-4.5-Air模型转换的3位深度量化权重(Deep Weight Quantization)版本,专为MLX框架优化,在保持较高性能的同时显著减少模型大小和推理资源需求
nvidia
NVIDIA-Nemotron-Nano-9B-v2是NVIDIA从头训练的大语言模型,专为推理和非推理任务设计。采用Mamba2-Transformer混合架构,支持多语言处理,具备可控推理能力,允许用户指定思考预算,在商业应用和AI代理系统中表现出色。
GLM-4.5-Air-6bit是基于智谱AI的GLM-4.5-Air模型转换而来的6位量化版本,专为MLX框架优化,提供高效的大语言模型推理能力。
基于Meta Llama-3.3-70B-Instruct的大语言模型,经过多阶段训练优化,在推理、聊天等任务上表现出色,支持多种语言,适用于多种AI应用场景。采用神经架构搜索技术优化,能够在单个H100-80GB GPU上高效运行。
Intelligent-Internet
II-Medical-8B是智能互联网研发的新一代医疗大语言模型,专为增强AI医疗推理能力而设计,在医疗问答能力上实现重大突破。
NeuraLakeAi
神经湖iSA-03迷你3B是由神经湖科技研发的先进AI模型,融合了传统大语言模型的直接响应能力与自动多步推理功能,支持256K token的超长上下文处理。
zai-org
GLM-4-Z1-9B-0414是智谱AI推出的新一代90亿参数开源大语言模型,具有强大的文本生成和推理能力。该模型在数学推理和通用任务方面表现出色,在资源受限场景下实现了效率与效果的出色平衡,支持友好的本地部署。
ModelCloud
DeepSeek-V3-0324是DeepSeek AI推出的BF16版本大语言模型,适用于不支持FP8的GPU进行量化和推理。
RUC-AIBOX
STILL-3-TOOL-32B是一个通过Python代码辅助推理过程的大语言模型,在AIME 2024评估中达到81.70%准确率。
lucyknada
WizardLM-2 7B是微软AI团队开发的高效大语言模型,基于Mistral-7B架构,在多语言、推理和代理任务上表现优异。
alpindale
WizardLM-2 8x22B 是微软AI开发的下一代最先进大语言模型,采用专家混合(MoE)架构,在复杂对话、多语言、推理和智能体任务上表现优异。
mistral-community
Mixtral-8x22B 是一个预训练的生成式稀疏专家混合大语言模型,由 Mistral AI 团队开发。该模型支持多语言处理,在多个文本生成任务上表现优异,包括推理挑战、常识推理和数学问题求解等。
cloudyu
Mixtral MOE 2x10.7B是一款基于混合专家架构的大语言模型,结合了Sakura-SOLAR-Instruct和CarbonVillain两个基础模型的优势。该模型在文本生成任务上表现出色,在多个公开数据集上进行了评估,包括AI2推理挑战、HellaSwag、MMLU等基准测试。