Le GPU Blackwell di NVIDIA hanno surclassato la concorrenza negli ultimi benchmark MLPerf Training, registrando risultati record in termini di scala e prestazioni grezze. Il round v6.0, pubblicato questa settimana, segna la prima apparizione degli acceleratori di data center di nuova generazione dell'azienda nella suite di riferimento del settore — e non hanno semplicemente vinto, hanno riscritto la classifica.
Cosa misura MLPerf v6.0
MLPerf è la suite di benchmark più utilizzata per l'addestramento di modelli di intelligenza artificiale. Testa la velocità e l'efficienza con cui l'hardware può addestrare una varietà di reti neurali — dalla classificazione delle immagini all'elaborazione del linguaggio naturale — utilizzando framework reali come PyTorch e TensorFlow. Il round v6.0 ha aggiunto nuovi carichi di lavoro e regole più severe per la rendicontazione del consumo energetico, rendendo i risultati più pertinenti per i data center di produzione.
NVIDIA ha presentato i risultati per le GPU Blackwell in diverse categorie, inclusi gli addestramenti su larga scala. L'azienda ha riferito che i suoi sistemi hanno ottenuto i tempi di addestramento più rapidi mai registrati in MLPerf, spesso con margini ampi rispetto ai precedenti detentori del record. I benchmark hanno inoltre dimostrato che l'architettura Blackwell scala quasi linearmente all'aumentare del numero di GPU, un requisito fondamentale per costruire i cluster massicci utilizzati per addestrare modelli di IA all'avanguardia.
Perché il record è importante
Per le aziende in corsa per sviluppare sistemi di IA sempre più grandi e capaci, la velocità di addestramento si traduce direttamente in cicli di iterazione più brevi e costi inferiori. Una GPU in grado di addestrare un modello linguistico all'avanguardia in giorni anziché settimane consente di risparmiare milioni in elettricità e bollette del cloud computing. I risultati di Blackwell suggeriscono che NVIDIA ha nuovamente alzato l'asticella per ciò che è possibile nell'infrastruttura di IA.
L'azienda non ha divulgato prezzi specifici o tempistiche di disponibilità per le GPU Blackwell utilizzate nei benchmark. Ma la presentazione a MLPerf conferma che i chip stanno passando dalla carta al silicio reale — e che mantengono le promesse di prestazioni che i dirigenti hanno fatto per mesi.
I concorrenti di NVIDIA, tra cui AMD e Intel, hanno anch'essi presentato risultati MLPerf nei round recenti, ma nessuno ha ancora eguagliato la produttività e l'efficienza dei sistemi Blackwell. Il divario potrebbe ridursi man mano che le architetture rivali maturano, ma per ora NVIDIA detiene un vantaggio schiacciante nel benchmark di addestramento IA che conta di più per hyperscaler e laboratori di ricerca.
La serie completa di risultati v6.0, inclusi i dettagli per carico di lavoro e le misurazioni del consumo energetico, è stata pubblicata sul sito web di MLPerf all'inizio di questa settimana. Analisti del settore e costruttori di sistemi esamineranno i numeri per capire esattamente come l'architettura Blackwell ottenga il suo vantaggio — e se alcuni dei guadagni provengano da trucchi che non si tradurranno in implementazioni reali.




