NVIDIA Blackwell GPU在MLPerf训练基准测试中创下新纪录

NVIDIA的Blackwell GPU在最新的MLPerf训练基准测试中碾压竞争对手，在规模和原始性能方面创下纪录性成绩。本周发布的v6.0轮次标志着该公司下一代数据中心加速器首次出现在这一行业标准套件中——它们不仅获胜，还彻底改写了成绩榜。

MLPerf v6.0测评内容

MLPerf是用于训练AI模型最广泛使用的基准测试集。它测试硬件在使用PyTorch和TensorFlow等真实框架时，训练各类神经网络（从图像分类到自然语言处理）的速度和效率。v6.0轮次新增了工作负载，并对功耗报告制定了更严格的规则，使结果对生产数据中心更具参考价值。

NVIDIA提交了Blackwell GPU在多个类别中的结果，包括最大规模的训练运行。该公司报告称，其系统实现了MLPerf有史以来最快的训练时间，通常大幅领先于之前的纪录保持者。基准测试还显示，当增加更多GPU时，Blackwell架构几乎呈线性扩展，这是构建训练前沿AI模型所需的大规模集群的关键要求。

纪录为何重要

对于竞相开发更大、更强AI系统的公司而言，训练速度直接转化为更短的迭代周期和更低的成本。能够在几天而非几周内训练出最先进语言模型的GPU，可节省数百万美元的电力与云计算账单。Blackwell的结果表明，NVIDIA再次提升了AI基础设施的可能性上限。

该公司未披露基准测试所用Blackwell GPU的具体定价或上市时间表。但MLPerf提交确认了这些芯片正从图纸走向实际硅片，并且实现了高管们数月来承诺的性能表现。

NVIDIA的竞争对手（包括AMD和Intel）也在近几轮提交了MLPerf结果，但尚未有任何系统能匹敌Blackwell系统的整体吞吐量与效率。随着竞争架构逐渐成熟，差距可能会缩小，但就目前而言，NVIDIA在超大规模云服务商和研究实验室最看重的AI训练基准测试中保持着绝对领先地位。

v6.0轮次的完整结果（包括各工作负载细分与功耗测量）已于本周早些时候发布在MLPerf网站上。行业分析师与系统构建者将仔细研究这些数据，以了解Blackwell架构究竟如何获得优势——以及其中是否有任何无法转化为实际部署的技巧。

MLPerf v6.0测评内容

纪录为何重要

相关文章