Hai nền tảng phần cứng mới đang nhắm vào nhu cầu tính toán khổng lồ của các mô hình AI có hàng nghìn tỷ tham số. Theo thông báo từ các công ty, nền tảng Vera Rubin của NVIDIA và kiến trúc Groq 3 LPX hứa hẹn mang lại tổng cộng 35 lần tăng hiệu suất. Thông báo này được đưa ra khi các nhà phát triển đang mở rộng quy mô mô hình vượt xa khả năng xử lý giá rẻ của cơ sở hạ tầng hiện tại.
Vấn đề mở rộng quy mô
Việc huấn luyện một mô hình với hàng nghìn tỷ tham số đòi hỏi băng thông bộ nhớ và tốc độ kết nối cực lớn. Các hệ thống hiện tại thường gặp nghẽn mạch khiến quá trình huấn luyện kéo dài hàng tháng. Nền tảng Vera Rubin và Groq 3 LPX được thiết kế để giải quyết các khía cạnh khác nhau của vấn đề này. Phương pháp của NVIDIA tập trung vào cụm tính toán dày đặc, trong khi dòng LPX của Groq hướng đến thực thi xác định với độ trễ thấp. Kết hợp lại, cả hai tuyên bố có thể giảm 35 lần mức tiêu thụ năng lượng và thời gian huấn luyện.
Ý nghĩa của con số 35x
Con số về hiệu suất này không phải là một điểm chuẩn đơn lẻ, mà là dự báo từ những cải tiến ở cấp hệ thống — từ kiến trúc chip đến việc di chuyển dữ liệu. Đối với mô hình hàng nghìn tỷ tham số, việc tăng 35 lần có thể chuyển một chu kỳ huấn luyện kéo dài cả năm thành vài tuần. Mặc dù chưa có kết quả kiểm tra độc lập được công bố, cả hai công ty đều chỉ ra các lựa chọn kiến trúc giúp giảm chu kỳ lãng phí và lưu lượng bộ nhớ. Nền tảng Vera Rubin sử dụng mạng kết nối mới, còn Groq 3 LPX dựa vào mô hình thực thi xác định tránh được chi phí phát sinh từ bộ đệm truyền thống.
Tại sao thời điểm lại quan trọng
Động thái này diễn ra khi các mô hình ngôn ngữ lớn và hệ thống AI đa phương thức thường xuyên vượt ngưỡng trăm tỷ tham số. Mô hình hàng nghìn tỷ tham số được coi là tiền tuyến tiếp theo, nhưng việc triển khai thực tế đang bị đình trệ do chi phí. Các nhà sản xuất phần cứng đang chạy đua để cung cấp giải pháp giúp các mô hình này trở nên khả thi về kinh tế. NVIDIA và Groq đang tiếp cận cùng một vấn đề từ hai góc độ khác nhau, và con số 35x chính là mốc quan trọng họ đặt ra.
Cả hai công ty chưa công bố ngày ra mắt chính thức cho nền tảng Vera Rubin hoặc Groq 3 LPX. Các hệ thống thử nghiệm được dự kiến sẽ đến tay một số đối tác chọn lọc vào cuối năm nay. Bài kiểm tra thực tế sẽ diễn ra khi các phòng thí nghiệm độc lập và nhà cung cấp đám mây thử nghiệm phần cứng này với khối lượng công việc thực tế của mô hình hàng nghìn tỷ tham số. Cho đến lúc đó, con số 35x vẫn là một lời hứa chờ được chứng minh.



