Chi phí đang hướng tới đâu
Armstrong dự đoán trong vòng 12 đến 18 tháng tới, khoảng 80% khối lượng công việc AI sẽ chuyển sang các mô hình có chi phí thấp hơn tới 99% so với các hệ thống tiên tiến hiện nay. 20% còn lại sẽ vẫn sử dụng các mô hình hàng đầu cho các tác vụ quan trọng như nghiên cứu khoa học. Ông so sánh sự phân chia này với điện tử tiêu dùng: hầu hết mọi người mua MacBook hoặc PC chơi game thường bỏ qua các thông số cao cấp nhất. Theo ông, logic tương tự sẽ áp dụng cho AI — hầu hết các tác vụ sẽ chạy trên các mô hình rẻ hơn, đủ tốt.
Coinbase đã đưa ý tưởng đó vào thực tế. Công ty định tuyến các lời nhắc đến mô hình hiệu quả nhất về chi phí, giúp chi tiêu AI của họ gần như không đổi ngay cả khi lượng token sử dụng tăng theo cấp số nhân. Các giải pháp thay thế mã nguồn mở như DeepSeek V4, có hiệu suất gần bằng các hệ thống độc quyền tốt nhất với chi phí chỉ bằng khoảng một phần ba mươi, đang làm cho chiến lược này khả thi.
Ngân sách doanh nghiệp đã căng thẳng
Nhà đầu tư Tommy Shaughnessy chỉ ra Uber như một ví dụ điển hình về tốc độ chi tiêu AI của doanh nghiệp có thể vượt xa dự đoán nhanh đến mức nào. Theo Shaughnessy, Uber đã đốt hết toàn bộ ngân sách AI năm 2026 vào đầu tháng 4 — chưa đầy bốn tháng của năm. Armstrong lập luận rằng loại chi phí vượt quá dự kiến đó sẽ thúc đẩy các công ty tìm kiếm các lựa chọn thay thế rẻ hơn thay vì theo đuổi mô hình tiên tiến nhất.
Khi chi phí trên mỗi token giảm, nút thắt chuyển lên thượng nguồn. Rào cản thực sự trở thành năng lượng và silicon cần thiết để vận hành bất kỳ mô hình nào ở quy mô lớn. Armstrong mô tả nhu cầu về trí tuệ do AI tạo ra là không có giới hạn thực tế. Nhưng hạ tầng vật lý để cung cấp trí tuệ đó đã bắt đầu đình trệ.
Tại sao Armstrong phản đối quy định AI nặng tay hơn
Armstrong cũng bày tỏ sự phản đối đối với các quy định AI chặt chẽ hơn. Ông cho rằng các ràng buộc chính sách không nên định hình quỹ đạo công nghệ khi thách thức thực tế chính đã là thiếu hụt nhà máy điện và trung tâm dữ liệu


