L'engouement pour l'intelligence artificielle générative dans les grandes entreprises technologiques a cédé la place à une réalité budgétaire bien plus sobre. Uber a ainsi consommé l'intégralité de son budget annuel dédié à l'IA en seulement quatre mois, un signe parmi d'autres de la dérive des coûts liée à l'usage intensif de ces outils, selon des informations rapportées ces derniers jours.

Une course aux tokens

Au début de l'année, la consigne était claire dans les sièges de la Silicon Valley : les salariés devaient utiliser l'intelligence artificielle autant que possible dans leurs tâches quotidiennes. Ce mouvement, baptisé « tokenmaxxing » par les employés – le « token » étant l'unité de base de consommation des modèles de langage – a rapidement pris une ampleur compétitive. Chez Meta et Amazon, les équipes se disputaient les premières places dans des classements internes mesurant leur volume de tokens utilisés. Ce système de gamification a poussé la consommation à des niveaux records.

Mais cette dynamique s'est heurtée aux factures des fournisseurs de services d'IA (comme Anthropic ou OpenAI, cite-t-on). Meta a observé une « augmentation exponentielle » des coûts d'usage, tandis que chez Uber, les dépenses ont dépassé toutes les prévisions annuelles en l'espace de quatre mois, obligeant la direction à revoir ses arbitrages. L'euphorie a cédé la place à une « sobriété » imposée par les directions financières.

Un frein brutal

Aujourd'hui, l'ère du « tokenmaxxing » semble révolue. Les géants de la tech imposent désormais des limites strictes à leurs employés, estimant que les bénéfices opérationnels de la technologie ne justifient pas les coûts faramineux engagés. Ce retour en arrière, intervenu en l'espace de seulement quelques mois, illustre le défi que représente la maîtrise des dépenses liées à l'IA générative, dont les factures varient considérablement en fonction de l'usage.

Chez Amazon et Meta, des politiques de plafonnement ont été mises en place, et les classements internes de consommation ont été discrètement abandonnés. Les directions financières scrutent désormais chaque token dépensé, tandis que les équipes techniques cherchent à optimiser les requêtes pour réduire la facture. Le signal envoyé aux salariés a changé du tout au tout : il ne s'agit plus d'utiliser l'IA sans modération, mais de le faire de manière ciblée et rentable.

Une tendance plus large

Cette situation ne se limite pas à Uber, Meta ou Amazon. D'autres acteurs technologiques, confrontés à la flambée des coûts, redéfinissent leurs stratégies d'adoption de l'IA. Les entreprises tentent de freiner la dérive budgétaire tout en conservant les gains de productivité promis par ces outils. Mais le choc entre l'enthousiasme initial et la réalité des comptes a été brutal : les modèles d'IA générative, particulièrement coûteux en ressources de calcul, peuvent vite devenir un gouffre financier si leur usage n'est pas strictement encadré.

L'épisode du « tokenmaxxing » illustre les risques d'une adoption non maîtrisée de l'IA dans les organisations, un casse-tête qui s'étend bien au-delà des géants de la tech pour concerner l'ensemble des entreprises engageant des agents d'IA. La leçon pourrait être retenue : avant de déployer ces technologies à grande échelle, encore faut-il savoir en maîtriser le coût.