阿里巴巴发布Qwen3.6-Max-Preview预览版模型,用户可通过QwenStudio对话或阿里云百炼API调用。相比Qwen3.6-Plus,新模型在智能体编程、世界知识和指令遵循等方面显著提升,并在六项主要编程基准测试中表现优异。
谷歌Gemini安卓测试版升级图像编辑功能,引入标记界面与实时文本描述,提升AI图像局部调优能力,解决指令传递不精准问题,重构交互逻辑。
智谱发布GLM-5-Turbo模型,专为复杂Agent场景优化,解决通用大模型在长链路任务中易失速的问题。模型训练时植入“OpenClaw”原生基因,强化了工具调用、指令拆解、定时触发及高吞吐执行等能力。在ZClawBench测试中位居国产模型首位,开发者盲测优胜认可率达90%。
蚂蚁集团开源全模态大模型Ming-Flash-Omni2.0,在视觉语言理解、语音生成、图像处理等多项基准测试中表现优异,部分指标超越Gemini2.5Pro。该模型首创全场景音频统一生成能力,支持在同一条音轨中生成语音、音效和音乐,用户通过自然语言指令即可调整音色、语速等参数。
LG AI Research开发的32B参数双语生成模型
LG AI Research开发的双语文本生成模型
LG AI Research开发的多语言、高性能大型语言模型
大规模多模态推理与指令调优平台
Openai
-
Input tokens/M
Output tokens/M
Context Length
Google
$0.7
$2.8
1k
Alibaba
$6
$24
256
Bytedance
Xai
$1.4
$10.5
$1.6
$4
128
$0.75
$2
64
$0.63
$3.15
131
$15
Iflytek
$0.3
32
$0.5
$140
$280
Tencent
$8
28
$14
$56
$2.4
$9.6
ExaltedSlayer
Gemma 3是谷歌推出的轻量级开源多模态模型,本版本为12B参数的指令调优量化感知训练模型,已转换为MLX框架的MXFP4格式,支持文本和图像输入并生成文本输出,具有128K上下文窗口和140+语言支持。
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUF是基于Allen Institute for AI开发的Olmo-3-7B-Instruct模型的GGUF量化版本。这是一个70亿参数的自回归语言模型,通过监督微调和直接偏好优化在Tulu 2和UltraFeedback等数据集上训练,在问答和指令遵循方面表现出色。
Kiy-K
Fyodor-Q3-8B-Instruct 是一款专为智能推理和稳健代码生成设计的高保真指令调优模型。它基于Qwen3-8B架构,采用高秩LoRA配置训练,擅长在编码前进行规划,非常适合复杂的软件工程任务。
NexaAI
Qwen3-VL-4B-Instruct是阿里云Qwen团队推出的40亿参数指令调优多模态大语言模型,专为高通NPU优化,融合强大的视觉语言理解能力与对话微调功能,适用于聊天推理、文档分析和视觉对话等实际应用场景。
quwsarohi
NanoAgent是一个紧凑的智能大语言模型,拥有1.35亿参数和8k上下文长度。它专门针对工具调用和指令遵循进行了优化,能够在个人设备上高效运行,支持轻量级推理和ReAct风格的交互。
unsloth
Granite-4.0-H-Micro是IBM开发的30亿参数长上下文指令模型,基于Granite-4.0-H-Micro-Base微调而来。该模型结合了开源指令数据集和内部合成数据集,采用监督微调、强化学习对齐和模型合并等技术开发,具备结构化的聊天格式,在指令遵循和工具调用能力方面表现优异。
lapa-llm
Lapa LLM 12B PT是基于Google Gemma 3-12B开发的开源大语言模型,专门针对乌克兰语处理优化。由乌克兰多所高校研究团队开发,在乌克兰语处理方面表现卓越,具备高效的指令微调和多模态能力。
ibm-granite
Granite-4.0-Micro 是 IBM 开发的 30 亿参数长上下文指令模型,具有优秀的指令遵循和工具调用能力,支持多种语言,适用于商业应用和 AI 助手场景。
lmstudio-community
Seed-OSS-36B-Instruct是由字节跳动Seed团队开发的360亿参数指令调优大语言模型,基于Transformer架构构建,经过MLX量化处理,专门针对Apple Silicon芯片进行了优化,可在LM Studio中高效运行。
gaianet
Gemma 3 270M Instruct是Google开发的轻量级指令调优语言模型,基于270M参数规模,专为文本生成任务优化,支持中英文等多种语言。
这是Google开发的Gemma-3-270M指令调优模型的4位量化版本,专为Apple Silicon优化。该模型基于gemma-3-270m-it-qat-q4_0-unquantized基础模型,使用MLX技术进行量化处理,适用于文本生成任务。
Gemma 3是谷歌推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建。该270M版本是经过指令调优的模型,采用量化感知训练(QAT),能够在显著降低内存需求的同时保持与bfloat16相近的质量。
gabriellarson
Foundation-Sec-8B-Instruct是一款专为网络安全应用设计的80亿参数指令调优语言模型。基于Llama-3.1-8B架构,具备出色的指令跟随能力和网络安全专业知识,支持本地部署,可帮助组织构建AI安全工具,减少对云服务的依赖。
arcee-ai
AFM-4.5B是由Arcee.ai开发的45亿参数指令调优模型,专为企业级应用设计,支持多语言处理,在云端到边缘的各种部署环境中展现卓越性能。
deepcogito
Cogito v2是经过指令调优的生成式大语言模型,采用混合专家架构,具有1090亿参数。该模型支持多语言处理、长上下文推理,在编码、STEM等领域表现出色,支持商业用途。
Cogito v2是基于指令调优的生成式大语言模型,具备混合推理能力,支持128k上下文长度和多语言处理。该模型采用迭代蒸馏与放大(IDA)训练策略,在编码、STEM、指令遵循等任务上表现优异。
Cogito v2是基于Llama-3.1-70B的指令调优生成式模型,具备混合推理能力,支持多语言和长上下文,在编码、STEM等领域表现出色。采用迭代蒸馏与放大训练策略,可用于商业用途。
aisingapore
WangchanLION-v3-IT是由VISTEC和新加坡人工智能公司联合开发的多语言大语言模型,专门针对泰语进行指令调优。该模型基于Llama3架构,使用约376万个泰语指令-完成对进行微调,支持英语和泰语处理。
DeSTA-ntu
DeSTA2.5-Audio是一个通用的大型音频语言模型,通过自生成的跨模态对齐技术,在无需特定任务指令调优数据的情况下实现高扩展性和效率,同时保留语言能力并避免灾难性遗忘。
second-state
这是Google Gemma 3 4B指令调优模型的量化版本,提供多种精度级别的GGUF格式文件,适用于不同的硬件和性能需求场景。