Où vont les coûts
Armstrong prédit que, dans les 12 à 18 mois à venir, environ 80 % des charges de travail de l'IA passeront à des modèles coûtant jusqu'à 99 % de moins que les systèmes de pointe actuels. Les 20 % restants utiliseront encore des modèles de premier plan pour des tâches à enjeux élevés comme la recherche scientifique. Il a comparé cette répartition à l'électronique grand public : la plupart des gens qui achètent un MacBook ou un PC de jeu évitent les spécifications maximales. Selon lui, la même logique s'appliquera à l'IA - la plupart des tâches fonctionneront sur des modèles moins chers et suffisamment bons.
Coinbase met déjà cette idée en pratique. L'entreprise achemine les prompts vers le modèle le plus rentable disponible, ce qui a permis à ses dépenses en IA de rester à peu près stables même si l'utilisation de tokens croît de façon exponentielle. Les alternatives open source comme DeepSeek V4, qui offrent des performances proches des meilleurs systèmes propriétaires pour environ un trentième du coût, rendent cette stratégie réalisable.
Les budgets des entreprises sont déjà sous tension
L'investisseur Tommy Shaughnessy a cité Uber comme exemple de la rapidité avec laquelle les dépenses des entreprises en IA peuvent dépasser les prévisions. Selon Shaughnessy, Uber a épuisé l'intégralité de son budget IA 2026 début avril - moins de quatre mois après le début de l'année. Ce type de dépassement


