DeepSeek-V3:超大開源AI模型發佈,性能超越Llama和Qwen
2024年12月26日,中國人工智能初創公司DeepSeek發佈了其最新的超大模型DeepSeek-V3,這一模型以其開放源代碼技術和創新挑戰領先AI供應商而聞名。DeepSeek-V3擁有671B個參數,並採用專家混合架構(mixture-of-experts architecture)來激活特定參數,以準確高效地處理給定任務。根據DeepSeek提供的基準測試,這一新模型已經超越了包括Meta的Llama3.1-405B在內的領先開源模型,並且與Anthropic和OpenAI的封閉模型性能相近。DeepSeek-V3的發佈標誌着開源AI與封閉源AI之間的差距進一步縮小。DeepSeek,最初是中國量化對衝