騰訊混元 TurboS 技術報告全面揭祕,560B參數混合Mamba架構
騰訊發佈了混元 TurboS 技術報告,揭示了其旗艦大語言模型 TurboS 的核心創新與強大能力。根據全球權威大模型評測平臺 Chatbot Arena 的最新排名,混元 TurboS 在239個參賽模型中位列第七,成爲國內僅次於 Deepseek 的頂尖模型,並在國際上僅落後於谷歌、OpenAI 及 xAI 等幾家機構。混元 TurboS 模型的架構採用了創新的 Hybrid Transformer-Mamba 結構,這種新穎的設計結合了 Mamba 架構在處理長序列上的高效性與 Transformer 架構在上下文理解上的優勢,從而實現了性能與效率的平衡。該模型總共包含128層,激活