清華大學TSAIL實驗室與生數科技合作推出開源視頻生成加速框架TurboDiffusion,通過集成SageAttention和稀疏線性注意力機制,顯著降低高分辨率視頻處理的計算開銷,在保持生成質量的同時,將端到端擴散推理速度提升100至200倍。
小米創始人雷軍近日表示,未來五年人工智能將深刻影響傳統產業,強調“所有產業都值得用AI再做一遍”。他以小米汽車工廠爲例,指出AI視覺大模型與X光機技術使大壓鑄件檢測效率達人工十倍,僅需兩秒完成一次檢測。
xAI發佈Grok4.1,響應延遲降低42%,意圖識別準確率提升18%,對話連貫性優化。基於Grok-4MoE架構,新增實時反饋層與個性化緩存,實現“秒回”體驗。面向X Premium+用戶無限使用,API定價維持每百萬token 5美元。MT-Bench得分8.97,HumanEval代碼生成通過率87.1%,多輪對話一致性達91.4%,刷新多項基準紀錄。
OpenAI視頻生成平臺Sora2推出新功能:網頁版向專業用戶開放故事板選項,支持直觀規劃視覺故事;同時所有用戶可在應用中享受增強的創作靈活性和便利性。
Alibaba
$8
輸入tokens/百萬
$240
輸出tokens/百萬
52
上下文長度
Bytedance
-
Xai
$1.4
$10.5
256
$0.8
Chatglm
$2
128
Tencent
32
$0.3
$0.5
Anthropic
$21
$105
200
Google
$4
28
131
$2.4
$9.6
Huawei
Stepfun
$1.6
drbaph
Z-Image(造相)是一個擁有60億參數的高效圖像生成基礎模型,專門解決圖像生成領域的效率和質量問題。其蒸餾版本Z-Image-Turbo僅需8次函數評估就能達到或超越領先競品,在企業級H800 GPU上可實現亞秒級推理延遲,並能在16G VRAM的消費級設備上運行。
Runware
HiDream-I1是一款擁有170億參數的開源圖像生成基礎模型,能夠在數秒內生成達到業界頂尖水準的圖像。
azaneko
HiDream-I1是擁有170億參數的開源圖像生成基礎模型,可在數秒內生成達到業界頂尖水平的圖像。
HiDream-I1是擁有170億參數的開源圖像生成基礎模型,能在數秒內生成達到業界頂尖水平的圖像。
kenhktsui
這是一個基於FastText的文本分類器,專門用於區分代碼和自然語言文本。模型基於324萬條混合代碼和自然語言記錄訓練,在測試集上F1分數達到0.97,處理速度極快,CPU吞吐量約2000文檔/秒。
DavidAU
這是一款基於Llama-3.2架構的1B參數模型,專門針對恐怖題材進行了優化訓練。它結合了NEO IMATRIX Tiny 'Wee'恐怖數據集,在創意寫作、恐怖故事生成等方面表現出色,能提供生動且富有沉浸感的文本內容。模型支持128k上下文長度,推理速度可達190+ tokens/秒。