Deepseek V3開源!多語言編程能力飆升,力壓Claude 3.5 Sonnet V2
備受期待的Deepseek V3終於開源!這款全新的AI模型在多語言編程能力上取得了重大突破,其在aider多語言編程測評中的表現,甚至超越了Claude3.5Sonnet V2等競爭對手,引發了業界廣泛關注。據瞭解,Deepseek V3相比之前的版本,在性能上實現了質的飛躍。Deepseek V2.5在aider測評中的成功率僅爲17%,而V3則暴增至48%,這充分展現了其強大的進步。Deepseek V3採用了高達6850億參數的混合專家(MoE)架構。該架構包含256個專家,並使用sigmoid路由方式,每次選取前8個專家(topk=8)參與計算,這種設計使得模型能夠