DeepSeek-V3:超大开源AI模型发布,性能超越Llama和Qwen
2024年12月26日,中国人工智能初创公司DeepSeek发布了其最新的超大模型DeepSeek-V3,这一模型以其开放源代码技术和创新挑战领先AI供应商而闻名。DeepSeek-V3拥有671B个参数,并采用专家混合架构(mixture-of-experts architecture)来激活特定参数,以准确高效地处理给定任务。根据DeepSeek提供的基准测试,这一新模型已经超越了包括Meta的Llama3.1-405B在内的领先开源模型,并且与Anthropic和OpenAI的封闭模型性能相近。DeepSeek-V3的发布标志着开源AI与封闭源AI之间的差距进一步缩小。DeepSeek,最初是中国量化对冲