Loin de la promesse d'un coût de développement tendant vers zéro, plusieurs entreprises constatent que l'usage intensif d'agents de codage basés sur l'intelligence artificielle génère des dépenses bien réelles. Une illustration frappante est fournie par une start-up nord-américaine, Forest Walk, dont le co-fondateur Allen Pike a détaillé l'expérience dans un billet de blog publié fin juin 2026.
Une escalade des coûts insoupçonnée
Pike raconte qu'au fil des mois, lui et sa co-fondatrice Jenn ont automatisé une grande partie de leurs boucles de développement. Les agents traitaient désormais les corrections de style, les conflits de fusion, les dépendances obsolètes et autres tâches de maintenance. La vélocité a grimpé : Jenn expédiait jusqu'à trente « pull requests » par jour, et l'équipe pouvait répondre aux demandes des utilisateurs le jour même. Cependant, cette cadence s'accompagnait d'une montée en flèche des courriels de dépassement de forfait d'Anthropic, Cursor et OpenAI.
En évaluant les dépenses hebdomadaires, Pike a découvert un chiffre qui l'a lui-même surpris : 10 000 dollars par semaine, soit l'équivalent du salaire d'un ingénieur très compétent. « Nous avons atteint ce seuil. Avons-nous gagné un prix pour notre prodigalité ? », a-t-il ironisé. L'équipe a rapidement réduit cette somme tout en conservant l'essentiel de la vélocité, mais l'épisode illustre un point de bascule que de nombreuses équipes technologiques sont en train de franchir.
Un changement de paradigme dans l'industrie
Ce constat semble rejoindre des préoccupations plus larges. Sam Altman, patron d'OpenAI, a récemment qualifié le coût des tokens de « problème énorme ». Brian Armstrong, PDG de Coinbase, s'interroge sur la manière d'obtenir davantage de codage agentique à moindre coût. Chez Uber, le directeur technologique aurait critiqué certaines solutions d'agents pour leur capacité à faire exploser les budgets dédiés à l'IA, selon des informations de The Information.
La cause principale de cette inflation réside dans le passage au codage « cloud ». Si l'on peut faire fonctionner quelques agents sur un ordinateur portable, la productivité maximale impose de les exécuter dans le cloud. Or, comme le souligne Pike, cette modalité cumule trois inconvénients : elle facilite le lancement simultané de nombreuses tâches, elle est plus coûteuse à l'unité de travail qu'un poste local, et elle rend les gaspillages moins visibles.
Des coûts d'inférence qui restent élevés
Le calcul des dépenses de codage se résume au produit du coût par token et du nombre de tokens consommés. Si les fournisseurs de modèles commencent à proposer des alternatives moins onéreuses — Anthropic a dévoilé Sonnet 5 à 3 dollars par million de tokens, tandis que GPT 5.6 offrira des variantes à 2,50 et 1 dollar —, les modèles les plus performants, comme Claude Fable, restent facturés à 10 dollars par million de tokens. Par ailleurs, des outils comme Cursor appliquent une marge sur les coûts d'API et imposent un mode « MAX » particulièrement gourmand pour le codage cloud.
L'analogie avec le cloud computing classique est frappante : la facilité d'usage et l'élasticité encouragent à consommer beaucoup, mais la facture finit par rattraper les utilisateurs. Alors que les laboratoires de modèles bénéficient de tokens quasi gratuits et peuvent donc vanter des coûts « proches de zéro », les entreprises clientes doivent composer avec des budgets réels.
Vers une optimisation des dépenses
Pour Pike, la question n'est plus « comment utiliser davantage d'agents de codage ? » mais « comment tirer le meilleur parti de notre budget d'agents ? ». L'équipe de Forest Walk a rapidement réduit sa facture de 10 000 dollars par semaine tout en maintenant l'essentiel de sa vélocité, ce qui suggère que des optimisations sont possibles. Le billet de Pike, intitulé « Comment (ne pas) dépenser 10 000 dollars par semaine en agents de codage », explore plusieurs techniques, sans toutefois les détailler de manière exhaustive.
Cette expérience, bien qu'ancrée dans un contexte de start-up, résonne avec des préoccupations plus vastes dans le secteur technologique, où l'enthousiasme pour l'IA agentique se heurte désormais à la réalité des coûts.