Vue normale

Microsoft a désormais son propre modèle de raisonnement

3 juin 2026 à 13:14
Vieux motard
Microsoft a désormais son propre modèle de raisonnement

Durant sa conférence BUILD, Microsoft a présenté une nouvelle série de modèles MAI. L’entreprise se dote pour la première fois d’un modèle de raisonnement, présenté comme idéal par sa taille moyenne et son coût maitrisé.

Cela peut paraître étonnant, mais Microsoft – qui a investi plusieurs milliards de dollars très tôt dans OpenAI – ne disposait d’aucun modèle de raisonnement. Jusqu’à présent, l’entreprise s’était surtout positionnée comme championne des relais pour d’autres modèles, laissant par exemple un accès à ChatGPT et plus récemment Claude via sa myriade d’assistants Copilot.

La situation a cependant changé : Anthropic a largement grimpé en puissance, tout particulièrement dans le développement, tandis qu’OpenAI suit sa propre trajectoire et se montre beaucoup plus autonome. La firme de Redmond a tout intérêt à manifester sa propre indépendance, avec à la clé une gamme plus complète de modèles.

Place à MAI-Thinking-1

La famille MAI (Microsoft AI) accueille plusieurs nouveaux venus présentés pendant la conférence BUILD, dont MAI-Thinking-1 présenté hier. Comme son nom l’indique, il s’agit d’un modèle de raisonnement de taille intermédiaire, de type MoE (Mixture of Experts), avec 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, soit l’équivalent d’un document de 600 pages selon Microsoft.

L’entreprise met clairement en avant un entrainement du modèle depuis zéro : aucune distillation et à partir de données commercialement licenciées et « propres ». MAI-Thinking-1 n’est donc pas censé s’appuyer sur les traces de raisonnement d’autres modèles, particulièrement concurrents. Il s’agit d’une construction indépendante.

Le modèle atteint 97 % sur AIME 2025 et 94,5 % sur AIME 2026, deux benchmarks évaluant le raisonnement mathématique et scientifique multi-étapes. Sur SWE-Bench Pro, benchmark d’ingénierie logicielle, Microsoft affirme qu’il égale Claude Opus 4.6 sur les tâches de codage. Dans des évaluations indépendantes en aveugle menées par Surge (partenaire indépendant de Microsoft), MAI-Thinking-1 a été préféré à Claude Sonnet 4.6. Ce dernier, le modèle par défaut pour Claude, est largement utilisé comme point de comparaison dans les chiffres donnés par Microsoft.

CNBC rapporte qu’une démonstration a présenté des résultats supérieurs à ceux de GPT-5.5 d’OpenAI avec un modèle ajusté sur les données de McKinsey, avec un coût annoncé comme dix fois inférieur. Il faut pour l’instant croire l’éditeur sur parole, car le modèle n’est disponible qu’en préversion privée via Microsoft Foundry. Sur la partie raisonnement, les tokens seront tarifés à la consommation, là encore sans plus de détails. Le modèle est également inclus dans GitHub Copilot Enterprise et une version pour les enclaves Azure Confidential Computing est prévue.

Six autres « nouveaux » modèles dans la famille MAI

Bien que MAI-Thinking-1 ait eu la part du lion pendant la présentation, la famille MAI a également reçu six autres modèles, en majorité des évolutions de ceux existant déjà.

MAI-Image-2.5 et MAI-Image-2.5 Flash débarquent ainsi pour la génération d’images. Microsoft évoque une hausse significative de la qualité, avec de meilleurs résultats que Nano Banana 2, avec une édition et des contrôles précis. La version classique vise la fidélité maximale et des performances « de qualité professionnelle », tandis que la version Flash – sans surprise – sacrifie une partie de cette qualité pour une plus grande rapidité des résultats. MAI-Image-2.5 est en cours de déploiement dans PowerPoint et OneDrive. Côté tarifs, MAI-Image-2.5 coûte 5 dollars par million de tokens pour les entrées texte, 8 dollars pour les entrées image et 47 dollars pour les sorties image. Pour la version Flash, les tarifs sont de 1,75 dollar pour les entrées texte et image, et de 33 dollars pour les sorties image.

MAI-Transcribe-1.5 est présenté de son côté comme le meilleur modèle de transcription au monde (tout simplement), avec une précision de pointe dans 43 langues, surpassant Gemini et les modèles phares d’OpenAI. Il est censé produire des transcriptions cinq fois plus rapidement que les modèles concurrents, et sera disponible dans GitHub Copilot, Dynamics 365 Contact Center et Foundry, avec un support prochain du streaming. Côté développeurs, il est accessible via Azure Speech au prix de 22 dollars le million de caractères.

Pour les autres modèles, il s’agit surtout de disponibilité. MAI-Voice-2 et sa variante Flash sont ainsi disponibles dans une quinzaine de langues supplémentaires avec de nouvelles options de voix. MAI-Code-1, modèle de codage présenté comme très efficace en inférence et optimisé pour GitHub, est disponible dans Copilot et Visual Studio Code. Son déploiement dans Copilot (tous niveaux) a commencé mardi 2 juin.

Aion, des modèles conçus pour l’exécution locale

Bien que moins mis en avant, deux nouveaux modèles nommés Aion ont aussi été présentés pour l’exécution locale.

Le premier, Aion Instruct, doit prendre le relai de l’actuel Windows OS SLM. Il se veut plus petit (4 milliards de paramètres), plus rapide et surtout plus efficace. Il doit alimenter tout ce qui touche à l’intelligence textuelle quotidienne, c’est-à-dire les résumés, la réécriture, la détection d’intention ou encore l’accessibilité.

Disponible dès maintenant dans le canal Insider d’Edge à des fins de tests pour les développeurs, il sera également accessible depuis les API de Windows. Contrairement aux modèles fournis jusqu’ici par Microsoft dans ce cas de figure, aucun NPU n’est requis : Aion Instruct est fait pour fonctionner partout, sur CPU. Enfin, une version open source doit arriver courant juillet sur Hugging Face.

Aion Plan est à la fois plus ambitieux et plus restreint. Disposant de 14 milliards de paramètres et d’une fenêtre de contexte de 32 000 tokens, de capacités de raisonnement et pouvant appeler des outils (tool-calling), il se veut le champion du flux agentique local. En revanche, il ne sera pas disponible avant plusieurs mois, et la présence d’un NPU semble cette fois requise.

Dans les deux cas, les modèles sont gratuits à l’usage, les opérations étant réalisées par la machine.

Microsoft a désormais son propre modèle de raisonnement

3 juin 2026 à 13:14
Vieux motard
Microsoft a désormais son propre modèle de raisonnement

Durant sa conférence BUILD, Microsoft a présenté une nouvelle série de modèles MAI. L’entreprise se dote pour la première fois d’un modèle de raisonnement, présenté comme idéal par sa taille moyenne et son coût maitrisé.

Cela peut paraître étonnant, mais Microsoft – qui a investi plusieurs milliards de dollars très tôt dans OpenAI – ne disposait d’aucun modèle de raisonnement. Jusqu’à présent, l’entreprise s’était surtout positionnée comme championne des relais pour d’autres modèles, laissant par exemple un accès à ChatGPT et plus récemment Claude via sa myriade d’assistants Copilot.

La situation a cependant changé : Anthropic a largement grimpé en puissance, tout particulièrement dans le développement, tandis qu’OpenAI suit sa propre trajectoire et se montre beaucoup plus autonome. La firme de Redmond a tout intérêt à manifester sa propre indépendance, avec à la clé une gamme plus complète de modèles.

Place à MAI-Thinking-1

La famille MAI (Microsoft AI) accueille plusieurs nouveaux venus présentés pendant la conférence BUILD, dont MAI-Thinking-1 présenté hier. Comme son nom l’indique, il s’agit d’un modèle de raisonnement de taille intermédiaire, de type MoE (Mixture of Experts), avec 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, soit l’équivalent d’un document de 600 pages selon Microsoft.

L’entreprise met clairement en avant un entrainement du modèle depuis zéro : aucune distillation et à partir de données commercialement licenciées et « propres ». MAI-Thinking-1 n’est donc pas censé s’appuyer sur les traces de raisonnement d’autres modèles, particulièrement concurrents. Il s’agit d’une construction indépendante.

Le modèle atteint 97 % sur AIME 2025 et 94,5 % sur AIME 2026, deux benchmarks évaluant le raisonnement mathématique et scientifique multi-étapes. Sur SWE-Bench Pro, benchmark d’ingénierie logicielle, Microsoft affirme qu’il égale Claude Opus 4.6 sur les tâches de codage. Dans des évaluations indépendantes en aveugle menées par Surge (partenaire indépendant de Microsoft), MAI-Thinking-1 a été préféré à Claude Sonnet 4.6. Ce dernier, le modèle par défaut pour Claude, est largement utilisé comme point de comparaison dans les chiffres donnés par Microsoft.

CNBC rapporte qu’une démonstration a présenté des résultats supérieurs à ceux de GPT-5.5 d’OpenAI avec un modèle ajusté sur les données de McKinsey, avec un coût annoncé comme dix fois inférieur. Il faut pour l’instant croire l’éditeur sur parole, car le modèle n’est disponible qu’en préversion privée via Microsoft Foundry. Sur la partie raisonnement, les tokens seront tarifés à la consommation, là encore sans plus de détails. Le modèle est également inclus dans GitHub Copilot Enterprise et une version pour les enclaves Azure Confidential Computing est prévue.

Six autres « nouveaux » modèles dans la famille MAI

Bien que MAI-Thinking-1 ait eu la part du lion pendant la présentation, la famille MAI a également reçu six autres modèles, en majorité des évolutions de ceux existant déjà.

MAI-Image-2.5 et MAI-Image-2.5 Flash débarquent ainsi pour la génération d’images. Microsoft évoque une hausse significative de la qualité, avec de meilleurs résultats que Nano Banana 2, avec une édition et des contrôles précis. La version classique vise la fidélité maximale et des performances « de qualité professionnelle », tandis que la version Flash – sans surprise – sacrifie une partie de cette qualité pour une plus grande rapidité des résultats. MAI-Image-2.5 est en cours de déploiement dans PowerPoint et OneDrive. Côté tarifs, MAI-Image-2.5 coûte 5 dollars par million de tokens pour les entrées texte, 8 dollars pour les entrées image et 47 dollars pour les sorties image. Pour la version Flash, les tarifs sont de 1,75 dollar pour les entrées texte et image, et de 33 dollars pour les sorties image.

MAI-Transcribe-1.5 est présenté de son côté comme le meilleur modèle de transcription au monde (tout simplement), avec une précision de pointe dans 43 langues, surpassant Gemini et les modèles phares d’OpenAI. Il est censé produire des transcriptions cinq fois plus rapidement que les modèles concurrents, et sera disponible dans GitHub Copilot, Dynamics 365 Contact Center et Foundry, avec un support prochain du streaming. Côté développeurs, il est accessible via Azure Speech au prix de 22 dollars le million de caractères.

Pour les autres modèles, il s’agit surtout de disponibilité. MAI-Voice-2 et sa variante Flash sont ainsi disponibles dans une quinzaine de langues supplémentaires avec de nouvelles options de voix. MAI-Code-1, modèle de codage présenté comme très efficace en inférence et optimisé pour GitHub, est disponible dans Copilot et Visual Studio Code. Son déploiement dans Copilot (tous niveaux) a commencé mardi 2 juin.

Aion, des modèles conçus pour l’exécution locale

Bien que moins mis en avant, deux nouveaux modèles nommés Aion ont aussi été présentés pour l’exécution locale.

Le premier, Aion Instruct, doit prendre le relai de l’actuel Windows OS SLM. Il se veut plus petit (4 milliards de paramètres), plus rapide et surtout plus efficace. Il doit alimenter tout ce qui touche à l’intelligence textuelle quotidienne, c’est-à-dire les résumés, la réécriture, la détection d’intention ou encore l’accessibilité.

Disponible dès maintenant dans le canal Insider d’Edge à des fins de tests pour les développeurs, il sera également accessible depuis les API de Windows. Contrairement aux modèles fournis jusqu’ici par Microsoft dans ce cas de figure, aucun NPU n’est requis : Aion Instruct est fait pour fonctionner partout, sur CPU. Enfin, une version open source doit arriver courant juillet sur Hugging Face.

Aion Plan est à la fois plus ambitieux et plus restreint. Disposant de 14 milliards de paramètres et d’une fenêtre de contexte de 32 000 tokens, de capacités de raisonnement et pouvant appeler des outils (tool-calling), il se veut le champion du flux agentique local. En revanche, il ne sera pas disponible avant plusieurs mois, et la présence d’un NPU semble cette fois requise.

Dans les deux cas, les modèles sont gratuits à l’usage, les opérations étant réalisées par la machine.

Windows 11 récupère les coreutils, findutils et grep

3 juin 2026 à 07:45
Grep party
Windows 11 récupère les coreutils, findutils et grep

Mardi soir avait lieu la conférence d’ouverture de la BUILD, la grand-messe annuelle de Microsoft pour les développeurs. Entre autres annonces liées inévitablement à l’IA et aux agents, l’entreprise a mis à disposition des outils que personne n’attendait vraiment : les coreutils pour Windows.

Les coreutils, pour GNU Core Utilities, sont un ensemble logiciel fournissant des commandes standardisées et basées sur Unix pour le shell, autrement dit pour la ligne de commande. Ils contiennent des instructions connues comme chmod pour modifier les permissions d’un fichier, mkdir pour créer un répertoire, rm pour supprimer des fichiers ou encore des outils de manipulation du texte comme printf.

Au cours des derniers mois, les coreutils sont revenus sur le devant de la scène via le projet uutils, une réécriture en Rust des outils. Nous avions d’ailleurs interrogé Sylvestre Ledru, directeur de l’ingénierie chez Mozilla et lead sur le projet, sur lequel les projecteurs s’étaient subitement braqués, Canonical ayant intégré uutils dans Ubuntu 25.10.

Microsoft recompile pour Windows

C’est précisément ce projet que Microsoft a utilisé pour Windows, en compilant uutils pour son propre système. Dans la foulée, Microsoft a d’ailleurs débordé, ajoutant findutils et grep à l’ensemble. Ce dernier est particulièrement connu et utilisé, fournissant un moyen simple et puissant de retrouver du texte. C’est d’ailleurs lui que Microsoft met en avant dans sa courte vidéo de présentation.

Interrogé sur le sujet, Sylvestre Ledru se montre enthousiaste : « Je suis très heureux de voir Microsoft utiliser et mettre en avant uutils, annoncer l’utilisation de nos outils, ainsi que leur contribution de la réécriture de grep en Rust au projet. C’est une belle reconnaissance du travail de la communauté. Leur implication va notamment nous aider à améliorer encore la portabilité sur Windows ».

Les coreutils pour Windows peuvent être récupérés depuis GitHub ou s’installer via la commande WinGet suivante :

winget install Microsoft.Coreutils

Microsoft prévient que certains outils peuvent entrer en conflit avec ceux déjà présentes dans CMD et PowerShell, un tableau est fourni pour lister les problèmes. À noter que PowerShell doit être installé en version 7.4 minimum.

Les conflits potentiels identifiés selon Microsoft – capture d’écran

Windows 11 récupère les coreutils, findutils et grep

3 juin 2026 à 07:45
Grep party
Windows 11 récupère les coreutils, findutils et grep

Mardi soir avait lieu la conférence d’ouverture de la BUILD, la grand-messe annuelle de Microsoft pour les développeurs. Entre autres annonces liées inévitablement à l’IA et aux agents, l’entreprise a mis à disposition des outils que personne n’attendait vraiment : les coreutils pour Windows.

Les coreutils, pour GNU Core Utilities, sont un ensemble logiciel fournissant des commandes standardisées et basées sur Unix pour le shell, autrement dit pour la ligne de commande. Ils contiennent des instructions connues comme chmod pour modifier les permissions d’un fichier, mkdir pour créer un répertoire, rm pour supprimer des fichiers ou encore des outils de manipulation du texte comme printf.

Au cours des derniers mois, les coreutils sont revenus sur le devant de la scène via le projet uutils, une réécriture en Rust des outils. Nous avions d’ailleurs interrogé Sylvestre Ledru, directeur de l’ingénierie chez Mozilla et lead sur le projet, sur lequel les projecteurs s’étaient subitement braqués, Canonical ayant intégré uutils dans Ubuntu 25.10.

Microsoft recompile pour Windows

C’est précisément ce projet que Microsoft a utilisé pour Windows, en compilant uutils pour son propre système. Dans la foulée, Microsoft a d’ailleurs débordé, ajoutant findutils et grep à l’ensemble. Ce dernier est particulièrement connu et utilisé, fournissant un moyen simple et puissant de retrouver du texte. C’est d’ailleurs lui que Microsoft met en avant dans sa courte vidéo de présentation.

Interrogé sur le sujet, Sylvestre Ledru se montre enthousiaste : « Je suis très heureux de voir Microsoft utiliser et mettre en avant uutils, annoncer l’utilisation de nos outils, ainsi que leur contribution de la réécriture de grep en Rust au projet. C’est une belle reconnaissance du travail de la communauté. Leur implication va notamment nous aider à améliorer encore la portabilité sur Windows ».

Les coreutils pour Windows peuvent être récupérés depuis GitHub ou s’installer via la commande WinGet suivante :

winget install Microsoft.Coreutils

Microsoft prévient que certains outils peuvent entrer en conflit avec ceux déjà présentes dans CMD et PowerShell, un tableau est fourni pour lister les problèmes. À noter que PowerShell doit être installé en version 7.4 minimum.

Les conflits potentiels identifiés selon Microsoft – capture d’écran
❌