阿里新开源推理大模型QwQ-32B,性能媲美DeepSeek-R1、显存需求更小
阿里巴巴旗下的Qwen团队近日推出了其最新的开源大型语言模型(LLM)家族成员——QwQ-32B。这款拥有320亿参数的推理模型,旨在通过强化学习(RL)提升在复杂问题解决任务上的性能。据介绍,QwQ-32B已在Hugging Face和ModelScope上以 Apache2.0许可证开源。这意味着该模型可用于商业和研究目的,企业能够直接将其应用于产品和应用,包括那些收费的服务。个人用户也可以通过Qwen Chat访问该模型。QwQ,全称Qwen-with-Questions,是阿里巴巴于2024年11月首次推出的开源推理模型,目标是与OpenAI的o1-preview竞争