阿里巴巴通义千问团队推出Qwen3-VL系列两款轻量级模型,参数规模分别为4B和8B。该系列是迄今最强的视觉语言模型家族,新增小参数版本旨在降低部署门槛,同时保持强劲性能。每个规模均提供指令遵循和思维链推理两个版本,为开发者提供更灵活选择。
快手开源720亿参数代码模型KAT-Dev-72B-Exp,在SWE-Bench基准测试中取得74.6%准确率,登顶开源代码模型排行榜,标志着国产AI在编程助手领域实现里程碑突破。
昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink,同时公布了72B模型权重、技术报告及代码仓库链接,引发行业广泛关注。 该模型通过创新性推理框架实现动态路径选择,可根据任务复杂度灵活结合推理与非推理生成模式,在降低计算成本的同时提升答案透明度与效率。
阿里通义开源WebSailor智能体,32B/72B版本性能超越多款闭源模型,仅次于OpenAI。这是阿里继WebWalker、WebDancer后第三款开源智能体。银河证券认为AI Agent经济已全面开启,建议关注焦点科技、中科金财等布局企业。焦点科技运用AI Agent技术赋能跨境电商,中科金财推进智能体在银行领域应用。阿里开源降低企业接入门槛,或将加速行业技术迭代。
发现由社区开发的令人惊叹的机器学习应用
Alibaba
$1
输入tokens/百万
$10
输出tokens/百万
256
上下文长度
Tencent
-
24
$8
32
$2
Google
Baidu
$3
4
131
$0.35
$0.7
$1.4
Deepseek
8
Chatglm
128
$6
$18
Baichuan
DevQuasar
MiroThinker-v1.0-72B是一个72B参数的大语言模型量化版本,致力于让知识为每个人所用。该项目基于原始模型进行优化,提供更高效的推理性能。
bartowski
这是一个72B参数的大型语言模型量化版本,使用llama.cpp的imatrix技术进行优化量化处理,提供了多种量化级别以适应不同硬件条件,支持在LM Studio和llama.cpp等环境中运行。
Bojun-Feng
Qwen2.5是通义千问大模型的最新系列,包含从0.5B到72B参数规模的基础模型和指令微调模型,在代码、数学、指令遵循、长文本生成等领域有显著提升。
Delta-Vector
Mag-Picaro的升级版本,由PygmalionAI资助,基于Qwen-2-Instruct微调并与Magnum-V2融合的72B参数模型
Mungert
Qwen2.5-VL-72B-Instruct是一个72B参数规模的多模态大模型,支持视觉-语言任务,能够理解和生成与图像相关的文本内容。
字节跳动研究团队发布的72B参数规模的多模态基础模型,专注于图像文本转文本任务
unsloth
Qwen2.5是通义千问大语言模型的最新系列,提供从0.5B到72B多种参数规模的基础语言模型和指令微调模型。该0.5B版本在知识储备、编码和数学能力方面有显著提升,支持长上下文和多语言处理。
基于Qwen2.5-72B-Instruct的量化版本,采用llama.cpp进行多种量化处理,适用于本地推理
backyardai
马格南V4 72B是基于Qwen打造的模型系列中的一员,旨在复刻Claude 3系列模型的散文质量,适用于本地AI聊天应用。
Infermatic
基于Qwen2.5-72B-Instruct微调的72B参数大语言模型,采用动态FP8量化技术优化推理效率,旨在复现Claude 3的散文质量
anthracite-org
该模型是基于Qwen-2 72B Instruct微调的大语言模型,旨在复制Claude 3系列模型的散文质量,是系列模型中的第七个版本。
dphn
DolphinVision 72b是一个多模态模型,能够对其他流行模型会拒绝处理的图像进行推理和评论。
基于Qwen-2 72B Instruct微调的模型,旨在复现Claude 3模型的散文质量
Orion-zhen
通义千问新一代72B参数大语言模型,支持131K长文本处理,在语言理解、文本生成、编程和数学推理等领域表现优异
lightblue
Ao Karasu 72B 是一个72B参数规模的大型语言模型,主要用于日语和英语的文本生成任务。