字節跳動發佈豆包大模型1.5Pro,性能超越GPT-4o與Claude3.5Sonnet
字節跳動正式推出其最新的豆包大模型1.5Pro(Doubao-1.5-pro),這一新模型在多個領域的綜合能力上表現出色,成功超越了行業內知名的 GPT-4o 和 Claude3.5Sonnet。該模型的發佈標誌着字節跳動在人工智能領域又向前邁出了重要一步。豆包1.5Pro 採用了新型的稀疏 MoE(混合專家)架構,使用較小的激活參數進行預訓練。這種設計的創新之處在於其可以提供等效於7倍激活參數的 Dense 模型性能,使其在效率上遠超行業常規的 MoE 架構,帶來了約3倍的效率提升。這樣的設計使得豆包大模型在知識、代碼