特斯拉下一代AI5芯片已完成流片,预计2027年量产,将接替AI4成为自动驾驶和人形机器人的核心算力平台。其单芯片性能媲美英伟达Hopper架构,双芯配置表现更优。
OpenAI内部备忘录显示,公司计划在2026年第二季度通过技术升级和生态合作全面反击竞争对手Anthropic。核心举措包括推出代号为Spud的新一代推理模型(可能为GPT-5o或GPT-5.5),直接对标Anthropic的Claude Mythos。该模型将采用英伟达Blackwell架构,旨在提升性能与竞争力。
英伟达在2026年GTC大会上宣布大幅扩展开源模型家族,重点推出Nemotron 3系列多模态模型。其中,Nemotron 3 Ultra基于Blackwell架构优化,吞吐量效率提升5倍,专为复杂代码辅助和企业工作流设计。同时,公司还展示了多模态交互的最新成果,旨在加速智能体、物理AI及医疗领域的创新。
英伟达CEO黄仁勋在GTC大会上预测,到2027年底,其新一代Blackwell和Rubin架构芯片将累计创造至少1万亿美元收入,较此前2026年底5000亿美元的预期大幅提升,凸显了公司在AI算力爆发背景下的强劲增长势头。
NVIDIA GeForce RTX 5070 Ti显卡,采用Blackwell架构,支持DLSS 4技术,为游戏和创作带来强大性能。
开创计算新时代的NVIDIA Blackwell平台现已发布
mratsim
GLM-4.5-Iceblink-v2-106B-A12B-FP8是基于GLM-4.5-Iceblink-v2-106B-A12B模型,采用最先进的混合专家量化方法进行FP8量化的版本。该模型专门针对支持硬件FP8的Ada、Hopper或Blackwell系列GPU优化,在保持高质量输出的同时显著提升推理效率。
QuantStack
这是基于Danrisi的Flux架构文本到图像模型UltraReal Fine-Tune的Nunchaku量化(SVDQ)版本。该模型提供了两种量化格式:INT4适用于非Blackwell架构GPU(50系列之前),NVFP4适用于Blackwell架构GPU(50系列),旨在降低硬件需求同时保持图像生成质量。
spooknik
这是UltraReal Fine-Tune模型的SVDQ量化版本,由Danrisi基于Flux开发,是一款文本到图像生成模型。该版本提供了多种量化方案,适配不同GPU硬件,特别针对非Blackwell系列和Blackwell系列GPU进行了优化。
这是Project0模型的SVDQ量化版本,基于Flux Dev和Flux Krea创建的文本到图像模型。该模型提供了多种量化格式,针对不同GPU架构进行了优化,包括INT4和FP4量化版本,适用于Blackwell和非Blackwell GPU用户。