La société DeepSeek a officialisé le caractère définitif de la réduction de 75 % de ses tarifs pour l'accès à son modèle V4 Pro. Cette baisse, qui devait initialement prendre fin le 31 mai 2026, est désormais le prix de référence, et non plus une offre promotionnelle. Les nouvelles grilles s'établissent à 0,435 dollar par million de tokens en entrée et 0,87 dollar par million de tokens en sortie, contre respectivement 1,74 et 3,48 dollars auparavant.
Un avantage compétitif massif
À titre de comparaison, les tarifs estimés du modèle GPT-5.5 d'OpenAI atteindraient environ 30 dollars par million de tokens en sortie. Le V4 Pro de DeepSeek est donc environ 34 fois moins cher. De nombreux observateurs soulignent que cette stratégie modifie profondément le calcul économique pour les entreprises qui déploient des charges de travail importantes en intelligence artificielle, comme les pipelines de RAG (génération augmentée de récupération), les agents de revue de code ou l'analyse de documents longs.
L'architecture du V4 Pro repose sur un mélange d'experts (Mixture-of-Experts) qui n'active que 49 milliards de ses 1 600 milliards de paramètres à chaque passage avant. Cette conception permet de réduire drastiquement la puissance de calcul nécessaire par token traité. Associé à une fenêtre de contexte d'un million de tokens et à un système de cache agressif — le tarif des tokens en cache n'est que de 0,003625 dollar par million — le modèle rend la réduction structurellement viable.
Des performances de premier plan
Le V4 Pro obtient un score de 80,6 % sur le benchmark SWE-bench Verified, un indicateur de performance en résolution de problèmes de programmation. Ce résultat le place à un niveau proche des modèles de pointe, malgré un coût d'exploitation très inférieur. La licence MIT sous laquelle les poids du modèle sont publiés autorise une utilisation commerciale sans restriction, y compris pour un déploiement en local ou dans des environnements isolés, ce qui intéresse particulièrement les secteurs réglementés.
Un utilisateur a rapporté avoir réduit ses coûts d'API de 99 % en basculant de Claude à DeepSeek, illustrant l'impact potentiel pour les PME et les start-ups qui dépendent des API d'IA pour leurs opérations quotidiennes.
Conséquences pour le marché de l'IA
Cette décision intervient dans un contexte où la plupart des fournisseurs d'API d'IA augmentent leurs tarifs ou les maintiennent à un niveau élevé. DeepSeek, à contre-courant, semble miser sur l'effet de volume et la fidélisation des clients grâce à des coûts d'infrastructure optimisés. Pour les entreprises qui traitent des volumes importants de tokens, les économies annuelles peuvent atteindre plusieurs millions de dollars. Par exemple, une charge de travail d'un milliard de tokens en sortie par mois passerait d'environ 30 000 dollars avec GPT-5.5 à moins de 900 dollars avec le V4 Pro.
Les experts recommandent d'ores et déjà aux équipes techniques de tester le V4 Pro pour les tâches de codage et de raisonnement, en particulier dans les architectures à deux étages où un modèle plus léger (comme le V4-Flash, à 0,14 dollar par million de tokens) sert de routeur avant de confier les requêtes complexes au V4 Pro. Cela permettrait de réduire encore le coût moyen par requête.
DeepSeek confirme ainsi sa volonté de se positionner comme un acteur incontournable du marché de l'IA générative, en offrant un rapport qualité-prix inégalé pour les entreprises soucieuses de maîtriser leur budget tout en accédant à des capacités de pointe.