智譜發佈GLM-5.1高速版API,輸出速度達400tokens/s,刷新全球大模型API速度紀錄。該模型打破“高性能=高延遲”或“高速=輕量”的傳統認知,首次在國產大模型中實現旗艦級能力與極致低延遲的融合,用戶無需在響應速度與模型質量間取捨。
Google
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度