老黄再度带领 AI 芯片等新品“炸场”。
北京时刻3月19日清晨,“AI超级碗”GTC大会上,英伟达创始人兼CEO黄仁勋向全球推出最强AI芯片GB300,个人AI超级核算机DGX Spark,并预告新一代芯片Vera Rubin等新品。
其间,GB300依据全新Blackwell Ultra架构,和上一年发布的GB200比较,GB300 NVL72 机架级处理方案AI核算FLOPS功用前进了1.5倍(150%),新的注意力机制(New Attention instructions)前进2倍,具有20TB HBM高带宽存储前进1.5倍,估量将在本年下半年出货。
英伟达表明,依据GB300的英伟达GB300 NVL72 机架级处理方案的 AI 功用比 GB200 NVL72 高出 1.5 倍,与运用英伟达Hopper构建的工厂比较使Blackwell的AI工厂收入时机添加50倍。
一起,与Hopper一代比较,NVIDIA HGX B300 NVL16 在大型言语模型上的推理速度前进11倍,核算才能前进7倍,内存添加4倍,然后为 AI 推理等最杂乱的作业负载供给打破功用。第一批傍边,估量思科、戴尔、联想、超微电脑、华硕、富士康等供给依据Blackwell Ultra服务器,AWS、谷歌云、微软云、甲骨文云等云厂商将第一批供给Blackwell Ultra支撑实例。
Vera Rubin方面,与Grace Blackwell(GB)相似,Vera是CPU,Rubin是GPU,而Vera Rubin全体功用是GB300的3.3倍,CPU内存容量是Grace的4.2倍,内存带宽是Grace的2.4倍,估量将于2026年下半年量产出货;此外,黄仁勋还预览了下一代AI超级芯片Rubin Ultra,内存带宽是前代的8倍,功用是GB300的14倍;Rubin下一代GPU架构则是Feynman。
黄仁勋表明:“AI现已获得了巨大的腾跃——推理和Agentic AI需求更高数量的核算功用。咱们为这一刻规划了 Blackwell Ultra——它是一个单一的多功用渠道,能够轻松高效地进行预练习、后练习和推理 AI 才能。”
据黄仁勋泄漏,本年,微软、谷歌、亚马逊和Meta四家大型云服务商现已购入360万颗Blackwell芯片,估量2028年数据中心本钱开销规划打破1万亿美元。