Loading market data...

GPU Blackwell của NVIDIA thiết lập kỷ lục mới trong bài kiểm tra huấn luyện MLPerf

GPU Blackwell của NVIDIA thiết lập kỷ lục mới trong bài kiểm tra huấn luyện MLPerf

GPU Blackwell của NVIDIA đã vượt trội so với đối thủ trong các bài kiểm tra huấn luyện MLPerf mới nhất, đạt kết quả kỷ lục về quy mô và hiệu suất thô. Vòng 6.0, được công bố trong tuần này, đánh dấu lần đầu tiên các bộ tăng tốc trung tâm dữ liệu thế hệ mới của công ty xuất hiện trong bộ tiêu chuẩn ngành — và chúng không chỉ chiến thắng, mà còn viết lại bảng điểm.

MLPerf v6.0 đo lường điều gì

MLPerf là bộ điểm chuẩn được sử dụng rộng rãi nhất để huấn luyện các mô hình AI. Nó kiểm tra tốc độ và hiệu quả của phần cứng trong việc huấn luyện nhiều loại mạng nơ-ron — từ phân loại hình ảnh đến xử lý ngôn ngữ tự nhiên — sử dụng các framework thực tế như PyTorch và TensorFlow. Vòng 6.0 đã bổ sung các khối lượng công việc mới và quy tắc chặt chẽ hơn về báo cáo năng lượng, giúp kết quả phù hợp hơn với các trung tâm dữ liệu sản xuất.

NVIDIA đã nộp kết quả cho GPU Blackwell ở nhiều hạng mục, bao gồm các lần chạy huấn luyện quy mô lớn nhất. Công ty báo cáo rằng các hệ thống của họ đạt được thời gian huấn luyện nhanh nhất từng được ghi nhận trong MLPerf, thường với khoảng cách lớn so với các kỷ lục trước đó. Các điểm chuẩn cũng cho thấy kiến trúc Blackwell mở rộng gần như tuyến tính khi thêm nhiều GPU, một yêu cầu quan trọng để xây dựng các cụm máy tính khổng lồ dùng để huấn luyện các mô hình AI tiên tiến.

Tại sao kỷ lục này quan trọng

Đối với các công ty đang chạy đua phát triển các hệ thống AI lớn hơn và mạnh mẽ hơn, tốc độ huấn luyện trực tiếp chuyển thành vòng lặp lặp ngắn hơn và chi phí thấp hơn. Một GPU có thể huấn luyện một mô hình ngôn ngữ hiện đại trong vài ngày thay vì vài tuần sẽ tiết kiệm hàng triệu đô la tiền điện và chi phí điện toán đám mây. Kết quả từ Blackwell cho thấy NVIDIA một lần nữa đã nâng cao tiêu chuẩn cho những gì có thể trong cơ sở hạ tầng AI.

Công ty không tiết lộ giá cụ thể hoặc thời gian có sẵn cho GPU Blackwell được sử dụng trong các điểm chuẩn. Nhưng việc nộp kết quả MLPerf xác nhận rằng các chip đang chuyển từ giấy tờ sang silicon thực tế — và chúng đáp ứng được những lời hứa về hiệu suất mà các giám đốc điều hành đã đưa ra trong nhiều tháng qua.

Các đối thủ của NVIDIA, bao gồm AMD và Intel, cũng đã nộp kết quả MLPerf trong các vòng gần đây, nhưng chưa ai sánh được với thông lượng và hiệu quả tuyệt đối của các hệ thống Blackwell. Khoảng cách có thể thu hẹp khi các kiến trúc đối thủ trưởng thành hơn, nhưng hiện tại, NVIDIA vẫn giữ vị trí dẫn đầu trong điểm chuẩn huấn luyện AI quan trọng nhất đối với các nhà cung cấp dịch vụ siêu quy mô và phòng thí nghiệm nghiên cứu.

Bộ kết quả đầy đủ của vòng 6.0, bao gồm phân tích theo từng khối lượng công việc và đo lường năng lượng, đã được công bố trên trang web MLPerf vào đầu tuần này. Các nhà phân tích ngành và nhà xây dựng hệ thống sẽ xem xét kỹ lưỡng các con số để hiểu chính xác cách kiến trúc Blackwell đạt được lợi thế — và liệu có bất kỳ lợi ích nào đến từ những mẹo không thể áp dụng trong triển khai thực tế hay không.