Together AI s'est associé à Pearl Research Labs pour s'attaquer à la hausse des coûts d'inférence de l'IA en liant les charges de travail GPU aux récompenses en crypto. Les deux entreprises prévoient d'utiliser un système appelé Proof of Useful Work — une variante du minage traditionnel qui distribue des jetons pour des calculs qui entraînent ou exécutent réellement des modèles. L'idée est de permettre aux fournisseurs de GPU de gagner de la crypto tout en effectuant de l'inférence, compensant ainsi ce qui est normalement une dépense pure.
Comment fonctionne le Proof of Useful Work
Le Proof of Useful Work est exactement ce à quoi il ressemble : au lieu de hacher des nombres aléatoires pour une récompense de bloc, les mineurs soumettent des calculs utiles — dans ce cas, des travaux d'inférence IA — qui sont vérifiés et récompensés. Pearl Research Labs apporte le protocole sous-jacent, tandis que Together AI contribue avec son infrastructure d'inférence. L'objectif déclaré du partenariat est de réduire les coûts d'inférence de l'IA en permettant aux fournisseurs de récupérer une partie de leurs frais matériels grâce aux récompenses en jetons.
Pourquoi les coûts d'inférence sont la cible
Faire fonctionner de grands modèles de langage et l'IA générative est coûteux, surtout à grande échelle. La plupart du temps GPU est payé à l'avance, sans possibilité de récupérer le coût de calcul. En ajoutant une récompense crypto par-dessus, Together AI et Pearl Research Labs parient que l'incitation en jetons peut rendre l'inférence moins chère — ou du moins plus durable — pour ceux qui font fonctionner les machines. Le modèle transforme effectivement un centre de coûts en une source potentielle de revenus.
Quelle est la prochaine étape
Aucune des deux entreprises n'a publié de calendrier pour la mise en service de l'intégration du Proof of Useful Work. Le partenariat a été annoncé cette semaine et les deux parties en sont aux premiers stades de la collaboration technique. La manière dont le taux de récompense sera fixé — et comment il s'équilibrera par rapport à la valeur du jeton sous-jacent — n'est pas encore publique. Ce calcul déterminera si le système réduit réellement les coûts ou ajoute simplement de la complexité.




