國產大模型突破!DeepSeek V3挑戰Claude 3.5 Sonnet實測全記錄
近期,國產大模型DeepSeek V3在AI競技場的優異表現引發業界關注。作爲唯一闖入前十的開源模型,它不僅超越了o1-mini,在編程、數學等多個領域甚至超過了Claude3.5Sonnet。爲驗證其實際能力,多方展開了一系列實測對比。在基礎理解能力測試中,兩個模型展現出不同特點。面對中文腦筋急轉彎"小明的媽媽有三個孩子"的問題,DeepSeek V3表現出色,不僅答對還進行了自我驗證。但在英文雙關語"April Fools Day"的測試中則略顯不足,未能理解其中的語言巧思,而Claude3.5Sonnet則輕鬆應對。邏輯推理測試