Infrastructure d’IA : un marché radicalement différent du cloud classique

Alors que les investissements dans l’infrastructure d’intelligence artificielle (IA) atteignent des sommets, un observateur du secteur estime que ce marché en est encore à ses balbutiements et qu’il ne ressemblera pas, une fois mature, au « cloud classique » incarné par AWS, Azure ou Google Cloud.

Dans une analyse publiée récemment, cet expert souligne quatre différences fondamentales entre les deux mondes. La première tient à la nature des charges de travail. Le cloud classique a été conçu pour des applications web : on développe un logiciel, on le déploie. L’infrastructure d’IA, elle, repose sur des charges de travail d’apprentissage automatique, qui exigent une puissance de calcul massive en amont, pour la phase d’entraînement des modèles. L’équivalent le plus proche du « déploiement d’une application web » est l’exécution d’inférences. Mais la grande majorité des développeurs d’applications peuvent intégrer l’IA dans leurs produits sans jamais toucher à des GPU, simplement en utilisant des API (GPT, Claude, Gemini, ou des modèles open-weight hébergés par des tiers).

Concentration inversée

La deuxième divergence concerne la répartition des acteurs. Dans le cloud classique, le côté offre était concentré (quelques grands hyperscalers) tandis que le côté demande était très dispersé (toutes les entreprises ayant besoin de calcul). Pour l’infrastructure d’IA, c’est l’inverse : une multitude de nouveaux fournisseurs spécialisés dans les GPU émergent aux côtés des hyperscalers, mais la demande est très concentrée. L’entraînement des modèles reste l’apanage d’une poignée de laboratoires bien financés, et l’inférence profite à une base de clients à peine plus large, dominée par les mêmes constructeurs de modèles et quelques fournisseurs d’inférence à grande échelle. Selon l’analyste, « tout le monde veut être propriétaire, et il y a environ huit clients ».

Le PaaS l’emporte

Troisièmement, le modèle de consommation dominant devrait être, cette fois-ci, le PaaS (Platform as a Service), et non l’IaaS (Infrastructure as a Service) qui a prévalu dans le cloud classique. Les entreprises, explique-t-il, n’ont jamais eu l’habitude d’exploiter des GPU à grande échelle. Les modèles fermés les plus populaires ne sont accessibles que par API, ce qui les rapproche structurellement de services comme Twilio ou Stripe plutôt que d’EC2 ou EKS. Même les clients plus sophistiqués qui utilisent des modèles open-weight pour obtenir 90 % des performances des modèles de pointe à 10 % du coût confient massivement l’inférence à des fournisseurs tiers plutôt que de l’héberger eux-mêmes, faute de compétences matérielles et logicielles pour faire fonctionner l’inférence à grande échelle.

Des exigences clients encore immatures

Enfin, les exigences des acheteurs d’infrastructure d’IA sont loin d’avoir atteint le niveau de sophistication du cloud classique. Les SLA, les certifications de conformité, la géo-redondance et la gestion du verrouillage fournisseur étaient devenus des critères centraux dans le cloud traditionnel. Aujourd’hui, la pénurie de GPU est si aiguë que les clients les plus exigeants se focalisent avant tout sur l’accès. « La démarche commerciale la plus en vogue dans l’infrastructure d’IA en ce moment est : 'Nous avons des GPU'. C’est tout. C’est l’argumentaire », note l’expert. Lorsque les clients se partagent une ressource rare, ils ne négocient pas les conditions. La sophistication viendra, mais pour l’instant, la disponibilité est le produit.

Un paysage fragmenté

En résumé, alors que le cloud classique a mûri en un marché commoditisé, dominé par l’IaaS, avec une large base de clients et des fournisseurs consolidés, l’infrastructure d’IA semble s’engager sur une voie différente : un paysage de fournisseurs fragmenté, une base de clients concentrée, le PaaS comme mode de consommation par défaut, et une longue période avant que les exigences des acheteurs n’atteignent la maturité du cloud. Cette analyse, bien que prospective, illustre les défis et les opportunités qui attendent les acteurs de ce secteur en pleille expansion.

L’infrastructure d’IA ne ressemble en rien au « cloud classique », selon un expert

À lire ensuite

Nucléaire iranien : l'optimisme américain ravivé à l'approche d'une décision finale

Enquête élargie sur une fraude présumée de 14 milliards d’euros portant sur des actions Hermès

Médicaments anti-obésité : le Wegovy et le Mounjaro remboursés à partir de la mi-juin sous conditions, patient...

Peter Thiel installe sa famille en Argentine, séduit par les réformes libertaires de Milei