Comment fonctionne le modèle
GRASS, un projet phare dans le créneau des données pour l'IA, crowdsource des données web publiques en louant des points d'accès distribués. Des particuliers exécutent des clients légers qui agissent comme des proxys de partage de bande passante, gagnant des points ou des tokens liés à la disponibilité, à la bande passante, à la rareté géographique et aux filtres de qualité. Du côté de la demande, les laboratoires d'IA et les fournisseurs de données paient pour des données fraîches, conformes et spécifiques à un domaine, avec des pistes d'audit. La tarification peut être par page, par token, par gigaoctet, ou par tâche incluant l'exploration, le nettoyage, l'étiquetage et le filtrage de toxicité.
L'argument est que les fournisseurs centralisés Web2 ne peuvent pas égaler la fraîcheur ou le coût d'un réseau décentralisé qui exploite des milliers de points d'accès dans le monde entier. Les acheteurs valorisent également la couverture, la conformité avec robots.txt et les règles d'opt-out, ainsi que les garanties de fiabilité comme les SLA et les options de réexécution.
Offre vs demande — une expérience en direct
GRASS fait partie d'un mouvement DePIN plus large qui a déjà percé dans le sans-fil (Helium), la cartographie (Hivemapper), le stockage (Filecoin, Arweave) et le calcul (Akash, Render). Chaque vertical vend une ressource différente : Helium vend de la connectivité, Hivemapper vend des tuiles cartographiques et des mises à jour, Filecoin vend du stockage durable, et Akash vend du temps GPU et CPU.
Les données pour l'IA sont la plus récente voie. Son côté offre dépend de particuliers qui contribuent en bande passante et points d'accès, incités par des récompenses en tokens. La demande provient des laboratoires d'IA qui ont besoin d'ensembles de données spécialisés — pas seulement plus de données, mais des données actuelles, propres et collectées légalement. Mais cette demande est encore naissante comparée aux marchés du calcul ou du stockage.
Du battage médiatique aux bilans
Le prix du token d'un projet comme GRASS reflète un intérêt spéculatif, pas nécessairement une traction commerciale. Le test clé est de savoir si les DePINs de données pour l'IA peuvent générer des factures récurrentes de véritables entreprises. Les laboratoires d'IA ont des budgets pour l'approvisionnement en données, mais ils ont aussi des relations établies avec des fournisseurs centralisés comme Scale AI, Appen et les services de collecte web.
Les réseaux décentralisés offrent des journaux de provenance et des traces de conformité, ce qui pourrait être un différenciateur à mesure que les régulateurs resserrent les règles sur les données d'entraînement. Mais les acheteurs doivent avoir confiance que le réseau peut fournir régulièrement des données de haute qualité et fraîches à grande échelle — et que les tokens qu'ils paient pour les services ne sont pas simplement un risque de volatilité.
La question non résolue
GRASS et ses homologues en sont encore à un stade précoce. La thèse des données pour l'IA tient sur le papier : les modèles entraînés sur des données obsolètes ou bruitées produisent de moins bons résultats, et la collecte centralisée est coûteuse et juridiquement risquée. Mais savoir si l'approvisionnement décentralisé peut réellement sous-coter les vendeurs existants sur le prix et la qualité — et le faire de manière fiable — n'est pas prouvé.
Les projets qui survivront seront probablement ceux qui pourront




