OpenAI内部备忘录显示,公司计划在2026年第二季度通过技术升级和生态合作全面反击竞争对手Anthropic。核心举措包括推出代号为Spud的新一代推理模型(可能为GPT-5o或GPT-5.5),直接对标Anthropic的Claude Mythos。该模型将采用英伟达Blackwell架构,旨在提升性能与竞争力。
英伟达在2026年GTC大会上宣布大幅扩展开源模型家族,重点推出Nemotron 3系列多模态模型。其中,Nemotron 3 Ultra基于Blackwell架构优化,吞吐量效率提升5倍,专为复杂代码辅助和企业工作流设计。同时,公司还展示了多模态交互的最新成果,旨在加速智能体、物理AI及医疗领域的创新。
英伟达CEO黄仁勋在GTC大会上预测,到2027年底,其新一代Blackwell和Rubin架构芯片将累计创造至少1万亿美元收入,较此前2026年底5000亿美元的预期大幅提升,凸显了公司在AI算力爆发背景下的强劲增长势头。
近日,NVIDIA正式宣布与Meta建立一项为期多年、跨世代的战略合作伙伴关系。根据双方达成的协议内容,Meta计划在其超大规模的AI数据中心内部署数百万颗NVIDIA的Blackwell GPU,以及专为智能体AI推理量身打造的下一代Rubin架构GPU,以强化其AI算力基础。
NVIDIA GeForce RTX 5070 Ti显卡,采用Blackwell架构,支持DLSS 4技术,为游戏和创作带来强大性能。
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Alibaba
$4
$16
1k
$2
$20
-
Bytedance
$1.2
$3.6
4
256
Moonshot
$0.8
128
$10.5
Tencent
$1
32
Deepseek
$12
Openai
$0.4
$0.75
$8.75
$70
400
64
$0.63
$3.15
131
24
Chatglm
$8
QuantStack
这是基于Danrisi的Flux架构文本到图像模型UltraReal Fine-Tune的Nunchaku量化(SVDQ)版本。该模型提供了两种量化格式:INT4适用于非Blackwell架构GPU(50系列之前),NVFP4适用于Blackwell架构GPU(50系列),旨在降低硬件需求同时保持图像生成质量。
spooknik
这是Project0模型的SVDQ量化版本,基于Flux Dev和Flux Krea创建的文本到图像模型。该模型提供了多种量化格式,针对不同GPU架构进行了优化,包括INT4和FP4量化版本,适用于Blackwell和非Blackwell GPU用户。