Microsoft a dévoilé, dans le cadre de sa conférence annuelle Build 2026, une série de sept nouveaux modèles d'intelligence artificielle conçus en interne. Regroupés sous la bannière MAI, ces modèles visent à couvrir un large éventail de besoins professionnels, du raisonnement logiciel à la synthèse vocale, en passant par la génération d'images et l'écriture de code. Cette annonce marque une accélération significative de la stratégie de l'entreprise pour développer ses propres technologies et réduire sa dépendance historique aux modèles de partenaires comme OpenAI.

Une famille de modèles couvrant des usages variés

Parmi les modèles présentés, MAI-Thinking-1 se positionne comme un modèle de raisonnement de taille intermédiaire. Selon la firme, ses performances égalent celles des meilleurs modèles de sa catégorie sur des benchmarks d'ingénierie logicielle, ce qui le destine à des tâches de résolution de problèmes complexes.

Pour les développeurs, MAI-Code-1-Flash est un modèle agentic dédié à la génération de code. Avec 5 milliards de paramètres, cette version compacte est optimisée pour l'inférence et profondément intégrée à GitHub Copilot et VS Code. Microsoft indique qu'il offre des performances comparables à celles de Haiku, un modèle concurrent, pour un coût d'utilisation inférieur.

Dans le domaine de la génération visuelle, Microsoft a présenté MAI-Image-2.5 ainsi qu'une variante économique nommée Flash. Ces modèles prennent en charge la création d'images à partir de texte et l'édition d'images. L'entreprise affirme que le modèle Flash dépasse le score de Nano Banana Pro sur la plateforme d'évaluation Arena.

Côté transcription, MAI-Transcribe-1.5 succède à une première version publiée en avril 2026. Microsoft le présente comme « le meilleur modèle de transcription au monde, avec une précision de pointe ». Il serait cinq fois plus rapide que les modèles concurrents et prend en charge 43 langues, avec une capacité native à traiter une terminologie spécialisée.

En matière de synthèse vocale, MAI-Voice-2 permet une génération vocale naturelle dans 15 langues. Il peut adapter une voix à partir d'un court échantillon et intègre des mécanismes de protection contre les usages abusifs. Une version plus légère, MAI-Voice-2-Flash, est également annoncée pour une disponibilité ultérieure.

Un outil de personnalisation pour les entreprises : Frontier Tuning

Au-delà de la simple mise à disposition de modèles, Microsoft a dévoilé un environnement d'apprentissage par renforcement baptisé Frontier Tuning. Cet outil permet aux entreprises clientes d'entraîner les modèles MAI sur leurs propres données et processus métier, dans un espace sécurisé et isolé. « Les développeurs et les entreprises réclament depuis longtemps une IA qui fonctionne selon leurs propres règles et sous leur contrôle. Nous considérons cette avancée comme une étape majeure dans cette direction », a commenté Microsoft.

Cette approche de personnalisation s'inscrit dans la volonté de l'entreprise de proposer des solutions adaptées aux besoins spécifiques des organisations, plutôt que des modèles génériques. Les modèles MAI seront distribués via la plateforme Foundry et intégrés aux produits clés de Microsoft tels que Copilot, Bing, PowerPoint et Azure Speech. Ils seront également accessibles aux développeurs sur d'autres plateformes.

Une stratégie d'indépendance technologique

Avec cette annonce, Microsoft franchit une nouvelle étape dans sa stratégie de développement interne en intelligence artificielle. Jusqu'à présent largement dépendant des modèles d'OpenAI et d'Anthropic, le géant américain affirme désormais sa capacité à produire ses propres modèles couvrant l'image, la voix, la transcription, le code et le raisonnement. Cette diversification vise à offrir aux entreprises des alternatives performantes et personnalisables, tout en réduisant la vulnérabilité liée à une dépendance externe.

Le communiqué de la firme suggère que cette série de modèles ne constitue qu'une première étape. La puissance de calcul et les infrastructures dédiées devraient permettre de nouvelles itérations, renforçant la position de Microsoft dans la course à l'IA générative.