AIBase
首頁
AI資訊
AI產品庫
GEO平台
MCP服务
模型算力廣場
TW

AI資訊

查看更多

號稱全球最快AI推理服務問世!速度提升20倍 成本極低

Cerebras Systems推出Cerebras Inference,宣稱這是全球最快的AI推理服務,性能超越基於GPU的傳統系統20倍,成本效益顯著提高,特別適用於處理大語言模型(LLMs)。其8B版本每秒處理1800個token,70B版本則爲450個token,速度和性價比遠超NVIDIA GPU解決方案。Cerebras Inference在保持行業領先準確度的同時,價格僅爲每百萬個token10美分至60美分,相比GPU產品提升100倍。這項服務特別適合構建需要複雜實時性能的下一代AI應用,如智能代理和智能系統,並提供免費、開發者和企業三個層次的服務,滿足不同需求。Cerebras Inference的核心技術基於Cerebras CS-3系統,搭載業界領先的Wafer Scale Engine3(WSE-3),提供遠超NVIDIA H100的內存帶寬。此服務不僅推動了AI計算領域的革新,還在醫療、能源、政府、科學計算和金融服務等多個行業中發揮關鍵作用,引領AI技術發展。

13.5k 5 天前
號稱全球最快AI推理服務問世!速度提升20倍 成本極低

模型

查看更多

internlm2.5_7b_chat

Shanghai-ai-lab

internlm2.5_7b_chat

$2

輸入tokens/百萬

-

輸出tokens/百萬

8

上下文長度

internlm2.5_1.8b_chat

Shanghai-ai-lab

internlm2.5_1.8b_chat

$2

輸入tokens/百萬

-

輸出tokens/百萬

8

上下文長度

AIBase
智啟未來,您的人工智能解決方案智庫
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2026AIBase
商務合作網站地圖