Lors de la conférence Build début juin, Microsoft a levé une restriction qui limitait depuis deux ans l'exécution locale de l'IA sur Windows 11 aux seules machines certifiées Copilot+, équipées d'une unité de traitement neuronal (NPU). Les API Windows AI, qui permettent la réécriture, le résumé et la génération de texte, sont désormais accessibles sur un parc matériel bien plus vaste grâce à la prise en charge des processeurs graphiques Nvidia. Selon la documentation technique mise à jour, les GeForce RTX de la série 30 et les modèles ultérieurs, pour peu qu'ils intègrent au moins 6 Go de mémoire vidéo, figurent parmi les configurations éligibles. Cela inclut notamment la RTX 3060, une carte grand public très répandue.

Phi Silica, le modèle de langage local, s'ouvre aux GPU

Le petit modèle de langage Phi Silica, qui constitue le cœur des fonctions d'écriture et de résumé de Windows 11, pourra donc être exécuté localement sur ces cartes graphiques. Développé par Microsoft, Phi Silica est un modèle de 3,3 milliards de paramètres conçu pour fonctionner en local, sans nécessiter de connexion au cloud. Nvidia a confirmé de son côté qu'elle accélérerait l'exécution de ce modèle sur l'ensemble de ses GeForce compatibles. Cette ouverture marque un tournant stratégique : la distinction entre NPU et GPU est moins technique que philosophique. Le premier, économe en énergie, travaille en continu en arrière-plan sur un PC portable, tandis que le second, plus gourmand, convient davantage à une machine fixe branchée sur secteur.

Un périmètre encore limité

Cette évolution ne concerne pas la totalité des fonctionnalités d'IA de Windows 11. Recall, Click to Do et les effets de studio, plus étroitement couplés à l'intégration matérielle des NPU, ne sont pour l'instant pas inclus dans le périmètre de cette ouverture. La disponibilité de ces API étendues est provisoirement réservée aux développeurs, et leur arrivée dans les applications grand public dépendra du rythme d'adoption de chaque fonctionnalité par les éditeurs de logiciels.

La fin du verrou des 40 TOPS

Cette décision marque l'abandon, au moins partiel, de l'exigence de performance minimale de 40 TOPS (trillions d'opérations par seconde) que Microsoft avait imposée pour les NPU des PC Copilot+ lors de leur lancement en juin 2024. Ce seuil, difficile à atteindre par les NPU embarqués de l'époque, avait suscité des critiques et limité le déploiement de l'IA locale. En ouvrant l'écosystème aux GPU, Microsoft élargit considérablement la base d'utilisateurs potentiels, notamment les possesseurs de PC de bureau équipés de cartes graphiques dédiées. L'entreprise répond ainsi à une demande du marché tout en relançant la compétition avec Apple, dont les puces de la série M intègrent depuis plusieurs années des capacités d'IA locale performantes.