Une recomposition des coûts de fabrication

Selon une étude menée par l’institut de recherche Epoch AI, la structure des coûts de production des puces dédiées à l’intelligence artificielle connaît un bouleversement inédit. Entre le début de l’année 2024 et la fin de l’année 2025, la part consacrée à la mémoire à haute bande passante (HBM) est passée de 52 % à 63 % des dépenses totales en composants. Ce constat, issu d’une analyse des chaînes d’approvisionnement et des devis de fabrication, met en lumière la dépendance croissante des accélérateurs d’IA vis-à-vis de la mémoire, devenue le poste budgétaire prédominant.

La mémoire HBM, nerf de la guerre de l’IA

La mémoire HBM se distingue par sa capacité à offrir des débits extrêmement élevés tout en consommant moins d’énergie que les modules classiques. Elle est indispensable pour les réseaux de neurones profonds, qui manipulent des masses de données volumineuses en parallèle. Les principaux fabricants de semi-conducteurs – dont les leaders du marché comme NVIDIA, AMD ou Intel – intègrent de plus en plus de modules HBM dans leurs puces destinées aux centres de données et aux applications d’IA générative. Cette demande explosive, couplée à une offre qui peine à suivre, a provoqué une flambée des prix unitaires de la mémoire. Le rapport d’Epoch AI souligne que le coût moyen par gigaoctet de HBM a augmenté de près de 30 % sur la période considérée, alors même que les volumes de production s’accroissent.

La « bulle IA » alimente l’inflation

Le phénomène s’inscrit dans ce que les observateurs appellent la « bulle IA », c’est-à-dire l’engouement massif des investissements dans l’intelligence artificielle, qui entraîne une course aux capacités de calcul. Les entreprises technologiques multiplient les commandes de puces spécialisées, ce qui exerce une pression continue sur les fournisseurs de mémoire. Les géants coréens Samsung et SK Hynix, principaux producteurs de HBM, ont annoncé des augmentations de prix à plusieurs reprises depuis 2024, justifiées par la hausse des coûts des matières premières et des investissements dans de nouvelles lignes de production. Cette tension sur l’offre se répercute en aval sur les fabricants de systèmes complets.

Microsoft contraint d’augmenter ses tarifs

Parmi les premiers à réagir, Microsoft a annoncé une hausse du prix de certains de ses appareils intégrant des puces d’IA, notamment les gammes Surface et les serveurs destinés à Azure. La société explique dans un communiqué interne que l’augmentation « reflète l’évolution des coûts des composants critiques, en particulier la mémoire à haute bande passante ». Si le montant exact de la hausse n’a pas été divulgué, des analystes estiment qu’elle pourrait se situer entre 5 % et 10 % selon les modèles. D’autres constructeurs, comme Dell et Lenovo, observent la situation avec attention et pourraient emboîter le pas dans les prochains mois. Le cabinet IDC prévoit que le prix moyen des serveurs d’IA augmentera de 8 à 12 % en 2026, en raison principalement du coût de la mémoire.

Conséquences pour les consommateurs et l’industrie

Cette tendance n’est pas sans conséquence pour le grand public. Les ordinateurs portables et les stations de travail équipés de puces d’IA – souvent vendus sous l’appellation « PC Copilot+ » ou « PC IA » – voient leur prix de vente conseillé grimper. Pour les entreprises, l’acquisition de serveurs dédiés à l’IA devient plus coûteuse, ce qui pourrait freiner l’adoption de ces technologies par les PME. Par ailleurs, la dépendance à la mémoire HBM pourrait inciter les industriels à explorer d’autres architectures, comme la mémoire à changement de phase ou les solutions de calcul en mémoire (Processing-in-Memory), afin de diversifier les approvisionnements et de réduire la pression sur un seul type de composant.

Un équilibre fragile

Le rapport d’Epoch AI met en garde contre une possible pénurie de HBM si la demande continue de croître au rythme actuel. Les capacités de production des fabricants de mémoire sont en cours d’expansion, mais les délais de construction des usines – souvent deux à trois ans – limitent la réponse à court terme. En attendant, les fabricants de puces d’IA sont contraints d’intégrer dans leurs devis une part croissante pour la mémoire, ce qui pèse sur leurs marges et, in fine, sur les prix payés par les clients. L’équilibre entre performance, coût et disponibilité de la mémoire HBM s’annonce comme l’un des défis majeurs de l’industrie des semi-conducteurs pour les années à venir.