Các phòng thí nghiệm AI cần dữ liệu mới và sạch hơn so với những gì các bộ dữ liệu công khai cung cấp, và ngày càng nhiều mạng lưới phi tập trung cho biết họ có thể cung cấp dữ liệu đó – với chi phí thấp hơn và nguồn gốc có thể kiểm chứng. Câu hỏi đặt ra là liệu mảng DePIN mới này có thể biến sự cường điệu xoay quanh token thành các hóa đơn định kỳ từ những khách hàng trả tiền hay không.
Cách mô hình hoạt động
GRASS, một dự án nổi bật trong lĩnh vực dữ liệu cho AI, thu thập dữ liệu web công khai bằng cách thuê các điểm cuối phân tán. Các cá nhân chạy các ứng dụng khách nhẹ hoạt động như proxy chia sẻ băng thông, kiếm điểm hoặc token dựa trên thời gian hoạt động, băng thông, độ hiếm về mặt địa lý và bộ lọc chất lượng. Về phía cầu, các phòng thí nghiệm AI và nhà cung cấp dữ liệu trả tiền cho dữ liệu mới, tuân thủ, theo từng lĩnh vực cụ thể có nhật ký kiểm toán. Giá có thể tính theo trang, theo token, theo gigabyte, hoặc theo tác vụ bao gồm thu thập, làm sạch, gắn nhãn và lọc nội dung độc hại.
Lời chào hàng là các nhà cung cấp Web2 tập trung không thể sánh được về độ mới hoặc chi phí của một mạng lưới phi tập trung khai thác hàng nghìn điểm cuối trên toàn thế giới. Người mua cũng coi trọng phạm vi phủ sóng, tuân thủ robots.txt và các quy tắc từ chối, cùng các cam kết về độ tin cậy như SLA và tùy chọn chạy lại.
Cung so với cầu – một thử nghiệm thực tế
GRASS là một phần của phong trào DePIN rộng lớn hơn đã tạo ra đột phá trong lĩnh vực không dây (Helium), bản đồ (Hivemapper), lưu trữ (Filecoin, Arweave) và tính toán (Akash, Render). Mỗi mảng bán một tài nguyên khác nhau: Helium bán kết nối, Hivemapper bán các mảnh bản đồ và bản cập nhật, Filecoin bán lưu trữ bền vững, và Akash bán thời gian GPU và CPU.
Dữ liệu cho AI là làn đường mới nhất. Phía cung của nó phụ thuộc vào các cá nhân đóng góp băng thông và điểm cuối, được khuyến khích bằng phần thưởng token. Nhu cầu đến từ các phòng thí nghiệm AI cần các bộ dữ liệu chuyên biệt – không chỉ nhiều dữ liệu hơn, mà còn là dữ liệu hiện tại, sạch và được thu thập hợp pháp. Nhưng nhu cầu đó vẫn còn non trẻ so với thị trường tính toán hoặc lưu trữ.
Từ cường điệu đến bảng cân đối kế toán
Giá token của một dự án như GRASS phản ánh sự quan tâm đầu cơ, không nhất thiết là sức hút thương mại. Bài kiểm tra then chốt là liệu các DePIN cung cấp dữ liệu cho AI có thể tạo ra các hóa đơn định kỳ từ các doanh nghiệp thực sự hay không. Các phòng thí nghiệm AI có ngân sách cho việc mua sắm dữ liệu, nhưng họ cũng có mối quan hệ đã thiết lập với các nhà cung cấp tập trung như Scale AI, Appen và các dịch vụ thu thập dữ liệu web.
Các mạng lưới phi tập trung cung cấp nhật ký nguồn gốc và dấu vết tuân thủ, điều này có thể là yếu tố khác biệt khi các cơ quan quản lý thắt chặt các quy tắc xung quanh dữ liệu huấn luyện. Nhưng người mua cần tin tưởng rằng mạng lưới có thể liên tục cung cấp dữ liệu chất lượng cao, mới với quy mô lớn – và rằng các token họ trả cho dịch vụ không chỉ là rủi ro biến động.
Câu hỏi chưa có lời giải
GRASS và các dự án cùng loại vẫn còn sớm. Luận điểm dữ liệu cho AI có lý trên lý thuyết: các mô hình được huấn luyện trên dữ liệu cũ hoặc nhiễu cho kết quả kém hơn, và việc thu thập tập trung thì đắt đỏ và rủi ro pháp lý. Nhưng liệu nguồn cung phi tập trung có thực sự cạnh tranh được với các nhà cung cấp hiện tại về giá cả và chất lượng – và làm điều đó một cách đáng tin cậy – vẫn chưa được chứng minh.
Các dự án tồn tại được có lẽ sẽ là những dự án có thể cho thấy các hóa đơn thực tế từ các phòng thí nghiệm AI, chứ không chỉ khối lượng giao dịch token. Hiện tại, sự cường điệu là có thật, nhưng doanh thu thì chưa.




