英偉達向雲服務商CoreWeave追加20億美元投資,以每股87.20美元購買其A類股票。雙方將合作建設“AI工廠”,目標到2030年新增超5吉瓦AI算力。新數據中心將全面集成英偉達最新技術棧,包括採用下一代Rubin架構芯片替代現有Blackwell架構。
英偉達承諾優先向韓國供應下一代Vera Rubin GPU,並提前提供Blackwell GB300,以支持韓國科技發展。
Runway發佈最新視頻生成模型Gen-4.5,專爲創作者、影視製作人和企業用戶設計,即將向所有訂閱層級開放。該模型在文本轉視頻基準測試中以1247分領先,超越谷歌Veo3等競品,成爲當前最強文生視頻模型。其卓越性能得益於先進的NVIDIA Hopper與Blackwell GPU平臺支持。
微軟Azure ND GB300v6虛擬機在Llama270B模型上創下每秒110萬token推理速度新紀錄。該成就基於與英偉達的深度合作,採用配備72個Blackwell Ultra GPU和36個Grace CPU的NVIDIA GB300NVL72系統,突顯微軟在規模化AI運算領域的專業實力。
NVIDIA GeForce RTX 5070 Ti顯卡,採用Blackwell架構,支持DLSS 4技術,為遊戲和創作帶來強大性能。
開創計算新時代的NVIDIA Blackwell平臺現已發佈
mratsim
GLM-4.5-Iceblink-v2-106B-A12B-FP8是基於GLM-4.5-Iceblink-v2-106B-A12B模型,採用最先進的混合專家量化方法進行FP8量化的版本。該模型專門針對支持硬件FP8的Ada、Hopper或Blackwell系列GPU優化,在保持高質量輸出的同時顯著提升推理效率。
QuantStack
這是基於Danrisi的Flux架構文本到圖像模型UltraReal Fine-Tune的Nunchaku量化(SVDQ)版本。該模型提供了兩種量化格式:INT4適用於非Blackwell架構GPU(50系列之前),NVFP4適用於Blackwell架構GPU(50系列),旨在降低硬件需求同時保持圖像生成質量。
spooknik
這是UltraReal Fine-Tune模型的SVDQ量化版本,由Danrisi基於Flux開發,是一款文本到圖像生成模型。該版本提供了多種量化方案,適配不同GPU硬件,特別針對非Blackwell系列和Blackwell系列GPU進行了優化。
這是Project0模型的SVDQ量化版本,基於Flux Dev和Flux Krea創建的文本到圖像模型。該模型提供了多種量化格式,針對不同GPU架構進行了優化,包括INT4和FP4量化版本,適用於Blackwell和非Blackwell GPU用戶。