NVIDIAのBlackwell GPUがMLPerfトレーニングで新記録を樹立

NVIDIAのBlackwell GPUは、最新のMLPerfトレーニングベンチマークにおいて、規模と生のパフォーマンスの両面で記録的な結果を叩き出し、競合を圧倒した。今週発表されたv6.0ラウンドでは、同社の次世代データセンター向けアクセラレータが業界標準のベンチマークスイートに初登場したが、単に勝利しただけでなく、スコアボードを塗り替えた。

MLPerf v6.0が測定するもの

MLPerfは、AIモデルのトレーニングに最も広く使われているベンチマーク群である。画像分類から自然言語処理に至るまで、さまざまなニューラルネットワークをPyTorchやTensorFlowなどの実フレームワークを使って、どの程度高速かつ効率的にトレーニングできるかをテストする。v6.0ラウンドでは、新しいワークロードが追加され、電力レポートに関するルールが厳格化され、結果が実運用のデータセンターにより関連性の高いものとなった。

NVIDIAは、最大規模のトレーニング実行を含む複数のカテゴリでBlackwell GPUの結果を提出した。同社によると、そのシステムはMLPerf史上最速のトレーニング時間を達成し、多くの場合、従来の記録保持者に大きな差をつけたという。また、ベンチマークでは、BlackwellアーキテクチャがGPUを追加する際にほぼ線形にスケールすることも示された。これは、フロンティアAIモデルのトレーニングに使用される大規模クラスターを構築するための重要な要件である。

記録が重要な理由

より大規模で高性能なAIシステムの開発を競う企業にとって、トレーニング速度はそのままイテレーションサイクルの短縮とコスト削減につながる。最先端の言語モデルを数週間ではなく数日でトレーニングできるGPUは、電気代やクラウドコンピューティング費用を数百万ドル節約できる。Blackwellの結果は、NVIDIAがAIインフラで可能なことのハードルを再び引き上げたことを示唆している。

同社は、ベンチマークに使用されたBlackwell GPUの具体的な価格や入手時期を明らかにしなかった。しかし、MLPerfへの提出により、これらのチップが紙上の計画から実際のシリコンへと移行しつつあり、幹部が何ヶ月も約束してきたパフォーマンスを実現していることが確認された。

AMDやIntelを含むNVIDIAの競合他社も、最近のラウンドでMLPerfの結果を提出しているが、Blackwellシステムのスループットと効率に匹敵するものはまだない。競合アーキテクチャが成熟するにつれて差は縮まる可能性があるが、現時点では、ハイパースケーラーや研究所にとって最も重要なAIトレーニングベンチマークにおいて、NVIDIAが圧倒的なリードを保っている。

v6.0の全結果（ワークロード別の内訳や電力測定値を含む）は、今週初めにMLPerfのウェブサイトで公開された。業界アナリストやシステム構築業者は、Blackwellアーキテクチャがどのように優位性を達成しているのか、また、その利得の一部が実運用に移行できないトリックによるものではないか、数字を精査することになるだろう。

MLPerf v6.0が測定するもの

記録が重要な理由

関連記事