San Francisco – OpenAI et le fabricant de semi-conducteurs Broadcom ont officialisé, le 24 juin 2026, la mise au point de Jalapeño, le premier processeur conçu en propre par OpenAI. Ce circuit intégré, entièrement architecturé pour l'inférence des grands modèles de langage (LLM), marque une étape décisive dans la stratégie verticale de l'entreprise, qui entend maîtriser l'ensemble de la chaîne, des modèles aux puces.

Jalapeño a été présenté par le directeur général d'OpenAI, Sam Altman, et le président Greg Brockman, en compagnie du PDG de Broadcom, Hock Tan, et du président Charlie Kawwas. La puce a été conçue en partenariat avec Broadcom pour l'intégration du silicium et la mise en réseau, et avec Celestica pour l'intégration des cartes et des systèmes rack.

Performances annoncées et architecture ciblée

Les premiers essais indiquent que Jalapeño offrira un rapport performance par watt « nettement supérieur » à celui des processeurs actuels les plus performants, selon les termes du communiqué officiel. L'architecture vise à réduire les déplacements de données et à équilibrer les ressources de calcul, de mémoire et de réseau afin d'atteindre une utilisation réelle proche du pic théorique. Les échantillons d'ingénierie exécutent déjà des charges de travail de modèles de langage en laboratoire, notamment GPT‑5.3‑Codex‑Spark, aux fréquences et puissances prévues pour la production.

OpenAI souligne que le circuit n'est pas une adaptation d'un accélérateur généraliste, mais une conception « sur une feuille blanche » pour l'inférence moderne des LLM. La firme s'est appuyée sur sa connaissance des noyaux de calcul, des systèmes de mise en mémoire et des schémas de service qui caractérisent ses propres modèles, de ChatGPT à Codex en passant par l'API.

Délai record de développement

De la conception à la production, le cycle n'aura duré que neuf mois. OpenAI explique avoir accéléré le processus en utilisant ses propres modèles pour simuler et optimiser la puce. Ce rythme industriel inédit dans le domaine des semi-conducteurs complexes témoigne d'une intégration poussée entre l'équipe matérielle d'OpenAI, dirigée par Richard Ho, et les ingénieurs de Broadcom.

« Jalapeño a été conçu de A à Z pour l'inférence des LLM, en tirant parti des enseignements détaillés de notre collaboration étroite avec les chercheurs d'OpenAI », a déclaré Richard Ho. Il précise que l'architecture a été optimisée autour des noyaux, des mouvements de mémoire, de la mise en réseau et des schémas de service les plus critiques pour les modèles d'IA de pointe.

Déploiement à grande échelle et partenaires

La feuille de route prévoit un déploiement à l'échelle du gigawatt dans des centres de données, en collaboration avec Microsoft et d'autres partenaires, à partir de 2026. Broadcom apporte notamment sa technologie de mise en réseau Tomahawk pour la production à grande échelle. Plusieurs générations de processeurs sont déjà planifiées dans le cadre d'une plateforme de calcul commune.

« Le monde évolue vers une économie pilotée par le calcul », a commenté Greg Brockman. « Jalapeño s'inscrit dans notre stratégie d'infrastructure full-stack à long terme pour rendre le calcul plus abondant, ce qui se traduira par une IA plus rapide, plus fiable, plus abordable pour les particuliers et les entreprises, et capable de résoudre des problèmes plus importants. »

Implications stratégiques

Avec cette annonce, OpenAI franchit un cap dans sa stratégie d'intégration verticale. Jusqu'ici dépendante des processeurs de Nvidia et d'autres fournisseurs pour l'inférence, l'entreprise dispose désormais d'un circuit taillé sur mesure pour ses besoins. Cette initiative pourrait réduire sa dépendance aux fournisseurs externes et améliorer les marges, tout en offrant un contrôle plus fin sur les performances et la consommation énergétique.

Un rapport technique détaillé sur les performances finales de Jalapeño sera publié dans les mois à venir. La société promet des mesures précises d'efficacité énergétique et de débit sur les charges de travail d'inférence réelles.

Prochaines étapes

Les premiers déploiements commerciaux sont attendus dans la seconde moitié de 2026. OpenAI prévoit d'intégrer progressivement Jalapeño dans ses propres infrastructures, puis de proposer la plateforme à des clients via le cloud. La concurrence avec les puces d'inférence de Nvidia (H100, B200) et les accélérateurs spécialisés de startups comme Cerebras et Groq s'annonce intense, mais l'avantage d'une optimisation verticale pourrait donner à OpenAI un avantage significatif en termes de coût par requête et de latence.