微軟開源圖像轉3D工具TRELLIS.2,僅需一張圖片即可快速生成帶材質的3D模型,輸出.glb格式文件,兼容Blender、Unity等平臺。該工具採用4B模型,支持512³至1536³分辨率圖像處理,在NVIDIA H100顯卡上,生成512³模型僅需約3秒。
Starcloud公司利用搭載NVIDIA H100GPU的衛星,在太空中成功訓練了nano-GPT模型並完成Gemma模型推理,標誌着太空數據中心發展的重要進展。
初創公司Starcloud成功在太空軌道上訓練大語言模型,成爲全球首例。其衛星搭載英偉達H100芯片,並運行基於谷歌開源模型Gemma的應用程序,開啓了太空數據中心的新紀元。公司計劃爲客戶提供商業服務,衛星發回的信號展示了其獨特視角。
Meta CEO扎克伯格親自負責AI商業化,新一代大模型“Avocado”計劃2026年春季發佈,將僅提供API和託管服務,不再開源。該模型整合了谷歌、OpenAI及阿里等第三方開源技術,目標達到前沿性能。Meta已與英偉達簽署50億美元H100訂單,專門用於模型訓練。
提供高性能GPU出租服務,包括B200、H200、RTX4090、H100等型號。即時部署,價格透明。
Google
$0.7
輸入tokens/百萬
$2.8
輸出tokens/百萬
1k
上下文長度
Alibaba
$0.75
-
256
Openai
$0.63
$3.15
131
$1
$4
$8.75
$70
$0.5
32
Tencent
$2.4
$9.6
$1.5
$1.6
Moonshot
$8
$32
262
$0.49
$2.1
Chatglm
FastVideo
FastVideo團隊推出的圖像轉視頻模型,屬於CausalWan2.2 I2V A14B系列,支持8步推理,能適配從H100到4090等多種GPU,也支持Mac用戶使用。
pytorch
這是由PyTorch團隊使用torchao進行量化的Qwen3-8B模型,採用int4僅權重量化和AWQ算法。該模型在H100 GPU上可減少53%顯存使用並實現1.34倍加速,專門針對mmlu_abstract_algebra任務進行了校準優化。
jet-ai
Jet-Nemotron-4B是NVIDIA推出的高效混合架構語言模型,基於後神經架構搜索和JetBlock線性注意力模塊兩大核心創新構建,在性能上超越了Qwen3、Qwen2.5、Gemma3和Llama3.2等開源模型,同時在H100 GPU上實現了最高53.6倍的生成吞吐量加速。
Jet-Nemotron是一個新型混合架構語言模型家族,超越了Qwen3、Qwen2.5、Gemma3和Llama3.2等最先進的開源全注意力語言模型,同時實現了顯著的效率提升——在H100 GPU上生成吞吐量最高可達53.6倍加速。
Mungert
基於Meta Llama-3.3-70B-Instruct的大語言模型,經過多階段訓練優化,在推理、聊天等任務上表現出色,支持多種語言,適用於多種AI應用場景。採用神經架構搜索技術優化,能夠在單個H100-80GB GPU上高效運行。
Phi-4-mini-instruct模型經torchao進行float8動態激活和權重量化,在H100上實現36%顯存降低和15-20%速度提升,幾乎不影響精度。