美團近日啓動萬億參數級AI大模型測試,該模型完全基於國產算力集羣訓練,標誌着國產技術應用取得重大突破。目前僅對受邀用戶開放,尚未全面普及,展現了美團在AI領域的領先佈局。
螢石發佈首款智能大模型主機EZVIZ AI Core X,集存儲、計算與控制於一體,旨在將強大本地算力引入家庭,革新智能設備協同模式。其硬件配置強勁,採用黑色桶狀外觀設計。
螢石發佈AI Core X智能大模型主機,集高性能主機、NAS和智能家居中控於一體,搭載64Tops算力AI單元,旨在成爲家庭數字化大腦。
大語言模型推理效率迎來突破。清華大學與Moonshot AI聯合提出“預填充即服務”新架構,通過將推理過程拆分爲預填充和解碼兩個階段,並優化算力資源分配,有效解決硬件限制問題,顯著提升模型服務性能。
AIGC 應用快速構建平臺
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$6
$24
256
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
Moonshot
$0.8
chavinlo
斯坦福大學tatsu團隊復刻的阿爾帕卡模型,這是一個基於LLaMA-7B進行指令微調的大語言模型。模型在4張A100顯卡上訓練了6小時,由redmond.ai捐贈算力,未使用LoRA技術,採用原生微調方式。