馬斯克旗下xAI公司啓動全球首個吉瓦級AI訓練集羣“Colossus2”,用於驅動Grok聊天機器人。該超級計算機佔地約13個足球場,配備10萬塊英偉達H100芯片,標誌着AI算力競賽進入新階段。
阿布扎比技術創新研究院推出開源模型Falcon H1R7B,僅7億參數卻展現領先推理性能,挑戰“越大越強”觀念。其訓練分兩階段:先基於Falcon-H1-7B進行監督微調,專注數學與編程能力提升。
SwitchBot在CES 2026推出新款家用機器人Onero H1,定位爲“最具可及性的AI家用機器人”。作爲去年多功能家庭機器人的升級,Onero H1是一款通用類人機器人,旨在減輕家務負擔。它能執行抓取、推送、打開和整理等日常操作,並具備在不同任務和家庭環境中學習適應的能力。
微軟開源圖像轉3D工具TRELLIS.2,僅需一張圖片即可快速生成帶材質的3D模型,輸出.glb格式文件,兼容Blender、Unity等平臺。該工具採用4B模型,支持512³至1536³分辨率圖像處理,在NVIDIA H100顯卡上,生成512³模型僅需約3秒。
提供高性能GPU出租服務,包括B200、H200、RTX4090、H100等型號。即時部署,價格透明。
使用Apple Vision Pro實現人形機器人Unitree H1_2的遙控操作。
FastVideo
FastVideo團隊推出的圖像轉視頻模型,屬於CausalWan2.2 I2V A14B系列,支持8步推理,能適配從H100到4090等多種GPU,也支持Mac用戶使用。
pytorch
這是由PyTorch團隊使用torchao進行量化的Qwen3-8B模型,採用int4僅權重量化和AWQ算法。該模型在H100 GPU上可減少53%顯存使用並實現1.34倍加速,專門針對mmlu_abstract_algebra任務進行了校準優化。
jet-ai
Jet-Nemotron-4B是NVIDIA推出的高效混合架構語言模型,基於後神經架構搜索和JetBlock線性注意力模塊兩大核心創新構建,在性能上超越了Qwen3、Qwen2.5、Gemma3和Llama3.2等開源模型,同時在H100 GPU上實現了最高53.6倍的生成吞吐量加速。
Jet-Nemotron是一個新型混合架構語言模型家族,超越了Qwen3、Qwen2.5、Gemma3和Llama3.2等最先進的開源全注意力語言模型,同時實現了顯著的效率提升——在H100 GPU上生成吞吐量最高可達53.6倍加速。
Mungert
基於Meta Llama-3.3-70B-Instruct的大語言模型,經過多階段訓練優化,在推理、聊天等任務上表現出色,支持多種語言,適用於多種AI應用場景。採用神經架構搜索技術優化,能夠在單個H100-80GB GPU上高效運行。
tiiuae
獵鷹-H1是由TII開發的高性能混合架構語言模型,結合了Transformers和Mamba架構的優勢,支持英語和多語言任務。
獵鷹-H1是由TII開發的混合Transformers+Mamba架構的因果解碼器專用語言模型,支持英語和多語言任務。
獵鷹-H1是由阿聯酋技術創新研究院開發的混合Transformer與曼巴架構的因果解碼器模型,支持英語和多語種任務。
獵鷹-H1是由TII開發的高效混合架構語言模型,結合了Transformers和Mamba架構的優勢,支持英語和多語言任務。
獵鷹-H1是由TII開發的混合Transformers+Mamba架構的因果解碼器專用語言模型,支持英語,性能卓越。
獵鷹H1是由阿聯酋技術創新研究院開發的混合架構語言模型,結合Transformer與Mamba架構,支持多語言處理
Phi-4-mini-instruct模型經torchao進行float8動態激活和權重量化,在H100上實現36%顯存降低和15-20%速度提升,幾乎不影響精度。
h1alexbel
該模型是一個基於Transformers庫的模型,具體用途和功能未明確說明。
h1t
基於Stable Diffusion v1.5的TCD LoRA模型,通過軌跡一致性蒸餾技術優化圖像生成效率。
基於Stable Diffusion XL的軌跡一致性蒸餾模型,通過創新蒸餾技術實現少步高質量圖像生成
transformer3
這是一個使用AutoTrain訓練的文本摘要模型,專門針對金融領域文本進行優化
H1B簽證工作搜索MCP服務器,使用美國勞工部真實LCA數據,提供H1B贊助公司搜索、職位分析和數據導出功能