Vue lecture

Apple veut de nouveau sauver le soldat Siri, cette fois avec l’aide de Google

Siri, take two
Apple veut de nouveau sauver le soldat Siri, cette fois avec l’aide de Google

Pour présenter les nouveautés Apple Intelligence et Siri, Apple a rejoué la partition de la WWDC 2024. Deux ans après des débuts laborieux, le constructeur promet enfin de livrer l’assistant intelligent qu’il avait alors promis.

On efface tout, et on recommence. Il y a deux ans, Apple avait présenté sa « vision » de l’intelligence artificielle « pour le reste du monde ». Comprendre : une IA qui sert au quotidien pour faciliter la vie des utilisateurs, loin des discours exaltés des grands acteurs de l’IA. Malheureusement, les premiers pas d’Apple Intelligence n’ont guère été encourageants, sans compter la crise ouverte autour de Siri.

Siri AI arrive… mais pas pour tout le monde

En dehors des optimisations plutôt bienvenues pour ses systèmes d’exploitation en « 27 », Apple a donc levé le voile sur une batterie de nouveautés liées à sa plateforme d’IA… qui ressemblent furieusement à celles de 2024. Mais cette fois, grâce aux modèles de langage de Google, ça va aller beaucoup mieux… surtout du côté de Siri, où les promesses devraient finalement être tenues, du moins le constructeur l’espère.

Apple n’a cette fois pas joué au plus malin. Les démonstrations vues durant la keynote n’ont pas été coupées au montage : les temps de réflexion de Siri ont semblé bien réels, et plutôt longs. Bien sûr, il faudra voir sur pièce, ce qui ne risque pas d’arriver tout de suite ; les développeurs pourront tester immédiatement « Siri AI » (c’est le nouveau nom de l’assistant) via la première bêta d’iOS 27, iPadOS 27, macOS 27 et visionOS 27. Mais c’est sur liste d’attente.

Les utilisateurs attendront « plus tard dans l’année » de mettre les mains sur Siri AI, qui leur sera proposé en bêta. Est-ce à dire que le nouvel assistant ne sera pas disponible dès l’automne, en même temps que les versions finales des OS ? Par ailleurs, seul l’anglais sera pris en compte. D’autres langues suivront.

Pire encore, les utilisateurs européens d’iOS et d’iPadOS seront privés de Siri AI, le temps que le constructeur accorde ses violons avec l’Union européenne. « Apple œuvre sans relâche pour trouver une voie permettant de préserver la vie privée et la sécurité de ses utilisateurs », précise l’entreprise qui s’est même fendue d’un communiqué contre le DMA fourré à la rage froide. macOS 27 Golden Gate et watchOS 27 ne sont pas concernés par le règlement sur les marchés numériques.

Siri AI nécessite aussi une certaine puissance. Apple annonce une compatibilité à partir de l’iPhone 15 Pro et de l’iPhone 16e ; il faudra au minimum un iPad mini (A17 Pro), un iPad Air ou un iPad Pro M1 ; un Mac avec puce M1 ou plus ; une Apple Watch Series 10, une Ultra 2 ou une Apple Watch SE (3e génération).

Les mêmes promesses qu’en 2024

Ceci étant dit, à quoi ressemble ce nouveau Siri ? Apple le présente comme « plus utile, plus compétent et plus intelligent ». Il gagne en capacités conversationnelles, il peut aussi répondre à des questions relatives au contenu affiché à l’écran et piocher dans les données de l’utilisateur (photos, emails, messages…) pour comprendre le « contexte personnel ». Il sait enfin fureter sur le web pour répondre de la manière la plus pertinente possible.

Les exemples donnés par Apple sont convaincants, sur le papier. On peut ainsi demander à Siri les détails d’un concert à venir, obtenir des informations à son sujet (où acheter des tickets ?), créer un rappel pour l’ouverture de la billetterie, puis finalement écouter la nouvelle chanson du groupe. Tout cela dans une fenêtre qui se déroule depuis la Dynamic Island de l’iPhone. Et il est possible d’en discuter avec l’assistant.

L’« intelligence visuelle » est une des rares fonctions d’Apple Intelligence qui a su trouver son public rapidement : avec un iPhone compatible, des informations peuvent être obtenues à partir d’une photo (ChatGPT peut également être autorisé à scruter l’image). Apple l’étend franchement dans l’app Appareil photo avec un nouveau mode Siri qui sait par exemple afficher des infos nutritionnelles sur un plat ou diviser une addition entre amis avec Apple Cash (toujours pas dispo en France hélas).

Sur iPad et sur Mac, Siri AI vit maintenant dans Spotlight, il fait même partie des menus contextuels des systèmes (control + clic sur un fichier, une photo…). L’assistant est également présent sur Apple Watch, CarPlay et les AirPods. Une application dédiée à Siri complète le dispositif, afin de remettre la main sur une conversation passée, ou pour en entamer une nouvelle. L’intelligence visuelle fait son apparition sur ces deux plateformes : sur Mac, en passant par un raccourci clavier permettant d’entourer un objet ; sur iPad, via une capture d’écran.

Les outils d’aide à l’écriture sont toujours bien en place, ils s’améliorent en intégrant Siri qui peut rédiger un brouillon de texte au complet. Mieux encore (ou peut-être pas ?), l’assistant « comprend » le style d’écriture employé en fonction des correspondants : plus professionnel avec le boss, plus cool avec les amis. Les textes générés par Siri peuvent s’y adapter – ne pas oublier de relire, quand même.

Le constructeur a truffé ses apps de fonctions étiquetées « Apple Intelligence ». Impossible de toutes les énumérer ici, mais relevons :

  • Spatial Reframing, qui va recomposer une photo en exploitant les données de profondeur et en générant les contenus manquants ;
  • l’organisation des onglets par rubriques pertinentes et une fonction de création d’extension web dans Safari ;
  • le changement automatique de mots par passe par lot, en cas de mots de passe faibles ou compromis ;
  • la construction d’une automatisation dans l’app Raccourcis via une requête texte ;
  • la recherche d’un événement dans une vidéo enregistrée par l’app Maison…

Pour bénéficier de ces fonctionnalités Apple Intelligence, les configurations minimales sont l’iPhone 15 Pro et l’iPhone 16, l’iPad mini (A17 Pro), iPad M1, MacBook Neo (A18 Pro), ou une Apple Watch Series 10, Ultra 2 ou SE (3e génération) pour peu que ces modèles de montres soient connectés à un iPhone compatible Apple Intelligence.

Il faudra cependant posséder une configuration musclée pour bénéficier du modèle IA embarqué le plus avancé, autrement dit un appareil équipé de 12 Go de mémoire. Cela comprend les iPhone 17 Pro ou iPhone Air (mais pas l’iPhone 17 qui se contente de 8 Go), un iPad avec puce M4 ou un Mac avec une puce M3 avec au moins cette enveloppe de mémoire, ou un Vision Pro M5. Les bienheureux propriétaires de ces terminaux auront droit à une voix plus expressive de Siri AI, la personnalisation et le débit de cette même voix, ainsi qu’une plus grande précision de la dictée partout dans le système.

Apple précise qu’il faudra posséder un abonnement iCloud+ payant pour obtenir un accès accru à certaines fonctions, comme la génération d’images dans l’app Image Playground.

Gemini sous le capot d’Apple Intelligence

Toutes ces nouveautés (et ces fonctions promises il y a deux ans) sont le résultat d’un travail de fond sur les Foundation Models d’Apple, dont l’architecture repose sur les modèles Gemini. Certaines fonctions tournent en local, d’autres sur des serveurs avec le système Private Cloud Compute. Ce dernier remonte à 2024 et au lancement d’Apple Intelligence (Google s’en est d’ailleurs inspiré pour son propre Private AI Compute).

L’idée générale est de protéger les données des utilisateurs qui transitent par ces serveurs ; elles ne sont « jamais stockées ni communiquées » à Apple ou à quiconque. Durant un « tech talk » inédit après la keynote, Craig Federighi, le grand manitou du logiciel chez le constructeur californien, a affirmé qu’Apple Intelligence n’utilise ni Google Assistant, ni l’app Gemini, ni la recherche Google. La collaboration avec Google porte uniquement sur certains modèles d’IA utilisés par Apple, intégrés dans son propre système et exécutés sur son infrastructure.

Image : Apple

Un composant central, le System Orchestrator, analyse les requêtes et décide quelles ressources utiliser : applications, données personnelles indexées par Spotlight, contexte affiché à l’écran, etc. De nombreuses tâches sont traitées directement sur l’appareil, grâce à des modèles locaux (compréhension vocale, synthèse de la voix, analyse d’images et de texte). Les demandes plus complexes sont envoyées vers le nuage du Private Cloud Compute.

Les nouveaux modèles Apple Foundation Models (AFM) de troisième génération sont le fruit d’un partenariat avec Google. Les modèles AFM Core, Core Advanced, Cloud et Cloud Image sont des modèles Apple entraînés avec des données propriétaires et affinés à partir des modèles Gemini les plus avancés. Le modèle le plus puissant, AFM Cloud Pro, affiche selon Apple un niveau de qualité comparable aux modèles Gemini les plus avancés. Des GPU NVIDIA hébergés dans le cloud de Google sont utilisés pour l’inférence d’AFM Cloud Pro.

Enfin, quand une requête nécessite des informations d’actualité ou des connaissances générales, Apple s’appuie sur son propre service World Knowledge Service, pas sur la recherche Google.

Est-ce que c’est la bonne cette fois pour Siri et Apple Intelligence ? Impossible à dire pour l’instant, et puis les utilisateurs européens vont devoir prendre leur mal en patience. C’est cependant la dernière chance pour Apple de revenir dans le peloton de tête dans la course à l’IA avec son architecture maison.

  •  

Apple veut de nouveau sauver le soldat Siri, cette fois avec l’aide de Google

Siri, take two
Apple veut de nouveau sauver le soldat Siri, cette fois avec l’aide de Google

Pour présenter les nouveautés Apple Intelligence et Siri, Apple a rejoué la partition de la WWDC 2024. Deux ans après des débuts laborieux, le constructeur promet enfin de livrer l’assistant intelligent qu’il avait alors promis.

On efface tout, et on recommence. Il y a deux ans, Apple avait présenté sa « vision » de l’intelligence artificielle « pour le reste du monde ». Comprendre : une IA qui sert au quotidien pour faciliter la vie des utilisateurs, loin des discours exaltés des grands acteurs de l’IA. Malheureusement, les premiers pas d’Apple Intelligence n’ont guère été encourageants, sans compter la crise ouverte autour de Siri.

Siri AI arrive… mais pas pour tout le monde

En dehors des optimisations plutôt bienvenues pour ses systèmes d’exploitation en « 27 », Apple a donc levé le voile sur une batterie de nouveautés liées à sa plateforme d’IA… qui ressemblent furieusement à celles de 2024. Mais cette fois, grâce aux modèles de langage de Google, ça va aller beaucoup mieux… surtout du côté de Siri, où les promesses devraient finalement être tenues, du moins le constructeur l’espère.

Apple n’a cette fois pas joué au plus malin. Les démonstrations vues durant la keynote n’ont pas été coupées au montage : les temps de réflexion de Siri ont semblé bien réels, et plutôt longs. Bien sûr, il faudra voir sur pièce, ce qui ne risque pas d’arriver tout de suite ; les développeurs pourront tester immédiatement « Siri AI » (c’est le nouveau nom de l’assistant) via la première bêta d’iOS 27, iPadOS 27, macOS 27 et visionOS 27. Mais c’est sur liste d’attente.

Les utilisateurs attendront « plus tard dans l’année » de mettre les mains sur Siri AI, qui leur sera proposé en bêta. Est-ce à dire que le nouvel assistant ne sera pas disponible dès l’automne, en même temps que les versions finales des OS ? Par ailleurs, seul l’anglais sera pris en compte. D’autres langues suivront.

Pire encore, les utilisateurs européens d’iOS et d’iPadOS seront privés de Siri AI, le temps que le constructeur accorde ses violons avec l’Union européenne. « Apple œuvre sans relâche pour trouver une voie permettant de préserver la vie privée et la sécurité de ses utilisateurs », précise l’entreprise qui s’est même fendue d’un communiqué contre le DMA fourré à la rage froide. macOS 27 Golden Gate et watchOS 27 ne sont pas concernés par le règlement sur les marchés numériques.

Siri AI nécessite aussi une certaine puissance. Apple annonce une compatibilité à partir de l’iPhone 15 Pro et de l’iPhone 16e ; il faudra au minimum un iPad mini (A17 Pro), un iPad Air ou un iPad Pro M1 ; un Mac avec puce M1 ou plus ; une Apple Watch Series 10, une Ultra 2 ou une Apple Watch SE (3e génération).

Les mêmes promesses qu’en 2024

Ceci étant dit, à quoi ressemble ce nouveau Siri ? Apple le présente comme « plus utile, plus compétent et plus intelligent ». Il gagne en capacités conversationnelles, il peut aussi répondre à des questions relatives au contenu affiché à l’écran et piocher dans les données de l’utilisateur (photos, emails, messages…) pour comprendre le « contexte personnel ». Il sait enfin fureter sur le web pour répondre de la manière la plus pertinente possible.

Les exemples donnés par Apple sont convaincants, sur le papier. On peut ainsi demander à Siri les détails d’un concert à venir, obtenir des informations à son sujet (où acheter des tickets ?), créer un rappel pour l’ouverture de la billetterie, puis finalement écouter la nouvelle chanson du groupe. Tout cela dans une fenêtre qui se déroule depuis la Dynamic Island de l’iPhone. Et il est possible d’en discuter avec l’assistant.

L’« intelligence visuelle » est une des rares fonctions d’Apple Intelligence qui a su trouver son public rapidement : avec un iPhone compatible, des informations peuvent être obtenues à partir d’une photo (ChatGPT peut également être autorisé à scruter l’image). Apple l’étend franchement dans l’app Appareil photo avec un nouveau mode Siri qui sait par exemple afficher des infos nutritionnelles sur un plat ou diviser une addition entre amis avec Apple Cash (toujours pas dispo en France hélas).

Sur iPad et sur Mac, Siri AI vit maintenant dans Spotlight, il fait même partie des menus contextuels des systèmes (control + clic sur un fichier, une photo…). L’assistant est également présent sur Apple Watch, CarPlay et les AirPods. Une application dédiée à Siri complète le dispositif, afin de remettre la main sur une conversation passée, ou pour en entamer une nouvelle. L’intelligence visuelle fait son apparition sur ces deux plateformes : sur Mac, en passant par un raccourci clavier permettant d’entourer un objet ; sur iPad, via une capture d’écran.

Les outils d’aide à l’écriture sont toujours bien en place, ils s’améliorent en intégrant Siri qui peut rédiger un brouillon de texte au complet. Mieux encore (ou peut-être pas ?), l’assistant « comprend » le style d’écriture employé en fonction des correspondants : plus professionnel avec le boss, plus cool avec les amis. Les textes générés par Siri peuvent s’y adapter – ne pas oublier de relire, quand même.

Le constructeur a truffé ses apps de fonctions étiquetées « Apple Intelligence ». Impossible de toutes les énumérer ici, mais relevons :

  • Spatial Reframing, qui va recomposer une photo en exploitant les données de profondeur et en générant les contenus manquants ;
  • l’organisation des onglets par rubriques pertinentes et une fonction de création d’extension web dans Safari ;
  • le changement automatique de mots par passe par lot, en cas de mots de passe faibles ou compromis ;
  • la construction d’une automatisation dans l’app Raccourcis via une requête texte ;
  • la recherche d’un événement dans une vidéo enregistrée par l’app Maison…

Pour bénéficier de ces fonctionnalités Apple Intelligence, les configurations minimales sont l’iPhone 15 Pro et l’iPhone 16, l’iPad mini (A17 Pro), iPad M1, MacBook Neo (A18 Pro), ou une Apple Watch Series 10, Ultra 2 ou SE (3e génération) pour peu que ces modèles de montres soient connectés à un iPhone compatible Apple Intelligence.

Il faudra cependant posséder une configuration musclée pour bénéficier du modèle IA embarqué le plus avancé, autrement dit un appareil équipé de 12 Go de mémoire. Cela comprend les iPhone 17 Pro ou iPhone Air (mais pas l’iPhone 17 qui se contente de 8 Go), un iPad avec puce M4 ou un Mac avec une puce M3 avec au moins cette enveloppe de mémoire, ou un Vision Pro M5. Les bienheureux propriétaires de ces terminaux auront droit à une voix plus expressive de Siri AI, la personnalisation et le débit de cette même voix, ainsi qu’une plus grande précision de la dictée partout dans le système.

Apple précise qu’il faudra posséder un abonnement iCloud+ payant pour obtenir un accès accru à certaines fonctions, comme la génération d’images dans l’app Image Playground.

Gemini sous le capot d’Apple Intelligence

Toutes ces nouveautés (et ces fonctions promises il y a deux ans) sont le résultat d’un travail de fond sur les Foundation Models d’Apple, dont l’architecture repose sur les modèles Gemini. Certaines fonctions tournent en local, d’autres sur des serveurs avec le système Private Cloud Compute. Ce dernier remonte à 2024 et au lancement d’Apple Intelligence (Google s’en est d’ailleurs inspiré pour son propre Private AI Compute).

L’idée générale est de protéger les données des utilisateurs qui transitent par ces serveurs ; elles ne sont « jamais stockées ni communiquées » à Apple ou à quiconque. Durant un « tech talk » inédit après la keynote, Craig Federighi, le grand manitou du logiciel chez le constructeur californien, a affirmé qu’Apple Intelligence n’utilise ni Google Assistant, ni l’app Gemini, ni la recherche Google. La collaboration avec Google porte uniquement sur certains modèles d’IA utilisés par Apple, intégrés dans son propre système et exécutés sur son infrastructure.

Image : Apple

Un composant central, le System Orchestrator, analyse les requêtes et décide quelles ressources utiliser : applications, données personnelles indexées par Spotlight, contexte affiché à l’écran, etc. De nombreuses tâches sont traitées directement sur l’appareil, grâce à des modèles locaux (compréhension vocale, synthèse de la voix, analyse d’images et de texte). Les demandes plus complexes sont envoyées vers le nuage du Private Cloud Compute.

Les nouveaux modèles Apple Foundation Models (AFM) de troisième génération sont le fruit d’un partenariat avec Google. Les modèles AFM Core, Core Advanced, Cloud et Cloud Image sont des modèles Apple entraînés avec des données propriétaires et affinés à partir des modèles Gemini les plus avancés. Le modèle le plus puissant, AFM Cloud Pro, affiche selon Apple un niveau de qualité comparable aux modèles Gemini les plus avancés. Des GPU NVIDIA hébergés dans le cloud de Google sont utilisés pour l’inférence d’AFM Cloud Pro.

Enfin, quand une requête nécessite des informations d’actualité ou des connaissances générales, Apple s’appuie sur son propre service World Knowledge Service, pas sur la recherche Google.

Est-ce que c’est la bonne cette fois pour Siri et Apple Intelligence ? Impossible à dire pour l’instant, et puis les utilisateurs européens vont devoir prendre leur mal en patience. C’est cependant la dernière chance pour Apple de revenir dans le peloton de tête dans la course à l’IA avec son architecture maison.

  •  

☕️ Ubuntu : vers de la reconnaissance vocale pour tous les champs texte



En avril dernier, Canonical a fait part de ses ambitions concernant l’intelligence artificielle dans Ubuntu. Comme signalé notamment par XDA Developers, cette annonce a provoqué des inquiétudes. Jon Seager, vice-président de l’ingénierie chez Canonical, a détaillé la position de l’entreprise fin mai lors du dernier Ubuntu Summit.

La thématique centrale est la compatibilité de l’open source en général avec l’intelligence artificielle, en particulier les modèles. Pour Seager, connaitre les poids est une chose, mais c’est peu en comparaison du niveau de transparence auquel le monde du libre est habitué. L’accent de Canonical est donc mis à la fois sur le type de fonctions que l’IA pourrait amener ou faciliter dans le système, autant que sur la licence qui accompagne le modèle retenu.

Mais quelles fonctions ? Bien que Canonical emploie les éléments de langage courants du secteur, évoquant par exemple l’idée de faire d’Ubuntu un « système agentique », les prétentions de l’éditeur semblent pour l’instant modestes et axées sur l’accessibilité.

Jon Seager a expliqué en effet que le premier cas identifié d’utilisation concrète était la reconnaissance vocale pour interagir avec les champs texte, rapporte OMGUbuntu. Cet apport est prévu pour Ubuntu 26.10, comme toujours si les tests donnent satisfaction dans les temps. L’ingénieur doute que cette méthode puisse être appliquée à l’intégralité des champs, mais la fonction devrait pouvoir s’appliquer à une majorité d’entre eux, avec les bénéfices qu’on imagine en matière d’accessibilité.

La volonté de Canonical semble être de poser les bases pour faciliter l’utilisation des agents dans son système, tout en ajoutant des cas d’usage au compte-gouttes. Cette reconnaissance vocale sera assurée par un LLM local, selon l’éditeur, mais aucune précision n’a été donnée. Le responsable a donné deux autres exemples de fonctions « implicites » : l’amélioration de l’autofocus pour la webcam et de la qualité du son pour le microphone, là encore en local.

Autre point important, ces fonctions seront basées sur un paquet Snap qu’il suffira de supprimer si on ne souhaite pas cette fonction. Canonical n’aborde pas ce point, mais il serait intéressant que l’installeur d’Ubuntu pose la question, car un modèle local consomme souvent plusieurs Go et peut donc alourdir l’empreinte de stockage. Un panneau avec des cases à cocher pour chaque service de type IA serait bienvenu.

  •  

☕️ Ubuntu : vers de la reconnaissance vocale pour tous les champs texte



En avril dernier, Canonical a fait part de ses ambitions concernant l’intelligence artificielle dans Ubuntu. Comme signalé notamment par XDA Developers, cette annonce a provoqué des inquiétudes. Jon Seager, vice-président de l’ingénierie chez Canonical, a détaillé la position de l’entreprise fin mai lors du dernier Ubuntu Summit.

La thématique centrale est la compatibilité de l’open source en général avec l’intelligence artificielle, en particulier les modèles. Pour Seager, connaitre les poids est une chose, mais c’est peu en comparaison du niveau de transparence auquel le monde du libre est habitué. L’accent de Canonical est donc mis à la fois sur le type de fonctions que l’IA pourrait amener ou faciliter dans le système, autant que sur la licence qui accompagne le modèle retenu.

Mais quelles fonctions ? Bien que Canonical emploie les éléments de langage courants du secteur, évoquant par exemple l’idée de faire d’Ubuntu un « système agentique », les prétentions de l’éditeur semblent pour l’instant modestes et axées sur l’accessibilité.

Jon Seager a expliqué en effet que le premier cas identifié d’utilisation concrète était la reconnaissance vocale pour interagir avec les champs texte, rapporte OMGUbuntu. Cet apport est prévu pour Ubuntu 26.10, comme toujours si les tests donnent satisfaction dans les temps. L’ingénieur doute que cette méthode puisse être appliquée à l’intégralité des champs, mais la fonction devrait pouvoir s’appliquer à une majorité d’entre eux, avec les bénéfices qu’on imagine en matière d’accessibilité.

La volonté de Canonical semble être de poser les bases pour faciliter l’utilisation des agents dans son système, tout en ajoutant des cas d’usage au compte-gouttes. Cette reconnaissance vocale sera assurée par un LLM local, selon l’éditeur, mais aucune précision n’a été donnée. Le responsable a donné deux autres exemples de fonctions « implicites » : l’amélioration de l’autofocus pour la webcam et de la qualité du son pour le microphone, là encore en local.

Autre point important, ces fonctions seront basées sur un paquet Snap qu’il suffira de supprimer si on ne souhaite pas cette fonction. Canonical n’aborde pas ce point, mais il serait intéressant que l’installeur d’Ubuntu pose la question, car un modèle local consomme souvent plusieurs Go et peut donc alourdir l’empreinte de stockage. Un panneau avec des cases à cocher pour chaque service de type IA serait bienvenu.

  •  

☕️ L’administration Trump envisage d’entrer au capital des géants de l’IA



Le gouvernement américain voudrait sa part du gâteau du boom de l’IA générative. L’administration Trump envisagerait d’investir au capital des principales entreprises du secteur. Sam Altman milite depuis longtemps pour une telle initiative.

L’administration Trump n’hésite pas à investir directement dans les entreprises américaines. On l’a ainsi vu acquérir 9,9 % du capital d’Intel. Et demain, elle pourrait s’octroyer une part au capital des principaux labos IA. C’est du moins l’idée qui flotte à Washington, selon le Wall Street Journal.

Donald Trump, interrogé à bord d’Air Force One sur le sujet, n’a pas caché son intérêt sur le sujet. « Il existe des idées selon lesquelles des parts pourraient être attribuées au public américain, de sorte que les Américains deviennent en quelque sorte partenaires de ces entreprises (…) C’est quelque chose de très intéressant, car cela reviendrait presque à créer un partenariat avec le public américain. Nous allons examiner cette possibilité. »

Trump a ajouté : « L’idée est que le peuple américain puisse bénéficier du succès de l’IA (…) C’est quelque chose qui le rendrait riche », promet-il. En échange de ce soutien public, le gouvernement américain profiterait de la valorisation future de ces entreprises. Anthropic et OpenAI sont dans les starting-blocks, avec des IPO record en vue. Les dividendes pourraient ensuite être redistribués à la population, via un fonds souverain ou tout autre mécanisme.

Sam Altman pousse cette idée depuis des années, avant même le lancement de ChatGPT. Le fondateur et patron d’OpenAI cherche manifestement à obtenir le soutien le plus large possible pour ces investissements : il a rencontré le sénateur Bernie Sanders ce mercredi, qui sur l’échiquier politique américain se trouve à l’exact opposé de l’administration actuelle. Mais sur cette question, les extrêmes pourraient se retrouver. Bernie Sanders travaille ainsi sur une mesure radicale : transférer 50 % du capital des principales entreprises d’IA vers un fonds public.

En avril, OpenAI avait effectivement proposé la création d’un fonds public qui investirait dans les entreprises d’IA et surtout, qui distribuerait les gains directement aux citoyens américains. Un dispositif parmi d’autres, dans un catalogue de mesures très politiques visant à faire accepter l’IA par le grand public.

Au vu de l’opposition actuelle de nombreux Américains — 71 % d’entre eux sont opposés à l’installation de datacenters IA — et aux menaces réelles ou supposées que cette technologie fait peser sur l’emploi, la création d’un mécanisme compensatoire n’est pas une idée complètement farfelue. Officiellement, rien n’a encore été décidé. Il faut aussi prendre en compte l’hypothèse impossible à écarter d’un éclatement de la bulle IA : ces investissements publics pourraient dès lors perdre énormément de leur valeur.

Mais sans parler de prise de participation, le gouvernement fédéral actuel a fait du soutien à l’IA un pilier de sa politique industrielle et économique, en dérégulant à tout va et en favorisant la construction de centres de données.

Donald Trump a signé ce mercredi 2 juin un décret présidentiel, certes édulcoré, pour contrôler d’un peu plus près les modèles IA avancés, via un processus d’évaluation volontaire. OpenAI a d’ailleurs confirmé sa participation.

  •  

☕️ L’administration Trump envisage d’entrer au capital des géants de l’IA



Le gouvernement américain voudrait sa part du gâteau du boom de l’IA générative. L’administration Trump envisagerait d’investir au capital des principales entreprises du secteur. Sam Altman milite depuis longtemps pour une telle initiative.

L’administration Trump n’hésite pas à investir directement dans les entreprises américaines. On l’a ainsi vu acquérir 9,9 % du capital d’Intel. Et demain, elle pourrait s’octroyer une part au capital des principaux labos IA. C’est du moins l’idée qui flotte à Washington, selon le Wall Street Journal.

Donald Trump, interrogé à bord d’Air Force One sur le sujet, n’a pas caché son intérêt sur le sujet. « Il existe des idées selon lesquelles des parts pourraient être attribuées au public américain, de sorte que les Américains deviennent en quelque sorte partenaires de ces entreprises (…) C’est quelque chose de très intéressant, car cela reviendrait presque à créer un partenariat avec le public américain. Nous allons examiner cette possibilité. »

Trump a ajouté : « L’idée est que le peuple américain puisse bénéficier du succès de l’IA (…) C’est quelque chose qui le rendrait riche », promet-il. En échange de ce soutien public, le gouvernement américain profiterait de la valorisation future de ces entreprises. Anthropic et OpenAI sont dans les starting-blocks, avec des IPO record en vue. Les dividendes pourraient ensuite être redistribués à la population, via un fonds souverain ou tout autre mécanisme.

Sam Altman pousse cette idée depuis des années, avant même le lancement de ChatGPT. Le fondateur et patron d’OpenAI cherche manifestement à obtenir le soutien le plus large possible pour ces investissements : il a rencontré le sénateur Bernie Sanders ce mercredi, qui sur l’échiquier politique américain se trouve à l’exact opposé de l’administration actuelle. Mais sur cette question, les extrêmes pourraient se retrouver. Bernie Sanders travaille ainsi sur une mesure radicale : transférer 50 % du capital des principales entreprises d’IA vers un fonds public.

En avril, OpenAI avait effectivement proposé la création d’un fonds public qui investirait dans les entreprises d’IA et surtout, qui distribuerait les gains directement aux citoyens américains. Un dispositif parmi d’autres, dans un catalogue de mesures très politiques visant à faire accepter l’IA par le grand public.

Au vu de l’opposition actuelle de nombreux Américains — 71 % d’entre eux sont opposés à l’installation de datacenters IA — et aux menaces réelles ou supposées que cette technologie fait peser sur l’emploi, la création d’un mécanisme compensatoire n’est pas une idée complètement farfelue. Officiellement, rien n’a encore été décidé. Il faut aussi prendre en compte l’hypothèse impossible à écarter d’un éclatement de la bulle IA : ces investissements publics pourraient dès lors perdre énormément de leur valeur.

Mais sans parler de prise de participation, le gouvernement fédéral actuel a fait du soutien à l’IA un pilier de sa politique industrielle et économique, en dérégulant à tout va et en favorisant la construction de centres de données.

Donald Trump a signé ce mercredi 2 juin un décret présidentiel, certes édulcoré, pour contrôler d’un peu plus près les modèles IA avancés, via un processus d’évaluation volontaire. OpenAI a d’ailleurs confirmé sa participation.

  •  

☕️ Google teste le remplacement des résultats de recherche classiques par le mode IA dans Chrome



La liste des résultats d’une recherche en ligne sur Google a-t-elle vécu ? Le moteur de recherche teste actuellement un réglage pour afficher ses résultats directement dans le mode IA de Chrome. Il s’agit uniquement d’une expérimentation pour le moment, mais… qui sait ?

Depuis 28 ans maintenant, les résultats de recherche Google accompagnent des milliards d’internautes dans la jungle du web. L’IA pourrait-elle bouleverser ces habitudes ? C’est déjà un peu le cas, pour ceux qui ont troqué Google pour un moteur de recherche IA comme Perplexity ou ChatGPT. Le géant du web n’a pas l’intention de regarder passer les trains, en fourrant de l’IA absolument dans tous les coins de son principal service (au point de favoriser les moteurs alternatifs qui revendiquent leur absence d’IA).

L’AI Mode de Google dans Chrome.

Bien sûr, on connait les AI Overviews — enfin, à part en France où ces résumés ne sont pas disponibles —, qui s’affichent en haut des résultats d’une recherche. Et qui souvent privent les sites web de précieux clics. Depuis l’an dernier, un AI Mode a rejoint les fonctions d’intelligence artificielle accessibles directement depuis la recherche Google. Il s’agit ni plus ni moins qu’un bot conversationnel propulsé par les mêmes modèles que Gemini.

À l’heure actuelle, saisir une requête dans la barre de recherche lance par défaut le moteur traditionnel, celui qui liste les résultats sous forme de liens web, éventuellement avec un descriptif. Le site Windows Report est tombé sur un nouveau flag dans la dernière version Canary (alpha) de Chrome, qui permet de changer ce comportement : on peut décider d’activer par défaut l’affichage des résultats dans le mode IA de Google. Il est toujours possible d’obtenir les résultats « classiques », mais il faut cliquer sur le bouton « All ».

Ce réglage, que l’on peut trouver en naviguant dans chrome://flags (recherchez ensuite « Fulfill Searchbox Queries in AI Mode »), n’est là qu’à des fins d’« exploration » pour le moment. « Il n’est actuellement pas prévu de déployer cela en production », explique le développeur Google qui a implémenté le flag. Néanmoins, le travail est abouti : les raccourcis clavier ctrl-clic, MAJ-clic et clic molette sont pris en charge, ils ouvrent de nouveaux onglets ou en arrière-plan comme actuellement dans la recherche classique.

Un tel niveau de finition laisse penser que Google ne se contente pas de tester une simple idée. Quant à la note laissée par l’auteur du flag, elle indique seulement qu’aucun déploiement n’est prévu à ce stade, ce qui n’exclut pas une arrivée ultérieure auprès du grand public.

  •  

☕️ Google teste le remplacement des résultats de recherche classiques par le mode IA dans Chrome



La liste des résultats d’une recherche en ligne sur Google a-t-elle vécu ? Le moteur de recherche teste actuellement un réglage pour afficher ses résultats directement dans le mode IA de Chrome. Il s’agit uniquement d’une expérimentation pour le moment, mais… qui sait ?

Depuis 28 ans maintenant, les résultats de recherche Google accompagnent des milliards d’internautes dans la jungle du web. L’IA pourrait-elle bouleverser ces habitudes ? C’est déjà un peu le cas, pour ceux qui ont troqué Google pour un moteur de recherche IA comme Perplexity ou ChatGPT. Le géant du web n’a pas l’intention de regarder passer les trains, en fourrant de l’IA absolument dans tous les coins de son principal service (au point de favoriser les moteurs alternatifs qui revendiquent leur absence d’IA).

L’AI Mode de Google dans Chrome.

Bien sûr, on connait les AI Overviews — enfin, à part en France où ces résumés ne sont pas disponibles —, qui s’affichent en haut des résultats d’une recherche. Et qui souvent privent les sites web de précieux clics. Depuis l’an dernier, un AI Mode a rejoint les fonctions d’intelligence artificielle accessibles directement depuis la recherche Google. Il s’agit ni plus ni moins qu’un bot conversationnel propulsé par les mêmes modèles que Gemini.

À l’heure actuelle, saisir une requête dans la barre de recherche lance par défaut le moteur traditionnel, celui qui liste les résultats sous forme de liens web, éventuellement avec un descriptif. Le site Windows Report est tombé sur un nouveau flag dans la dernière version Canary (alpha) de Chrome, qui permet de changer ce comportement : on peut décider d’activer par défaut l’affichage des résultats dans le mode IA de Google. Il est toujours possible d’obtenir les résultats « classiques », mais il faut cliquer sur le bouton « All ».

Ce réglage, que l’on peut trouver en naviguant dans chrome://flags (recherchez ensuite « Fulfill Searchbox Queries in AI Mode »), n’est là qu’à des fins d’« exploration » pour le moment. « Il n’est actuellement pas prévu de déployer cela en production », explique le développeur Google qui a implémenté le flag. Néanmoins, le travail est abouti : les raccourcis clavier ctrl-clic, MAJ-clic et clic molette sont pris en charge, ils ouvrent de nouveaux onglets ou en arrière-plan comme actuellement dans la recherche classique.

Un tel niveau de finition laisse penser que Google ne se contente pas de tester une simple idée. Quant à la note laissée par l’auteur du flag, elle indique seulement qu’aucun déploiement n’est prévu à ce stade, ce qui n’exclut pas une arrivée ultérieure auprès du grand public.

  •  

Anthropic joue encore sur les peurs de l’IA toute-puissante pour se mettre en valeur

👻
Anthropic joue encore sur les peurs de l’IA toute-puissante pour se mettre en valeur

Alors qu’elle prépare une entrée en bourse, l’entreprise de Dario Amodei regonfle les discours catastrophistes sur l’IA générative pour sa communication juste après avoir gonflé ses muscles grâce à Mythos.

« Perte de contrôle », évocation du traité sur les armes nucléaires et proposition d’un moratoire sur le développement de l’IA générative, Anthropic y va fort dans sa communication. Celle-ci porte un discours ambivalent et survient alors que l’entreprise prépare une entrée en bourse.

Dans un texte publié sur son site web et signé notamment par Marina Favaro, responsable du pôle R&D, l’entreprise met en avant les avancées de ses outils de génération de code pour soutenir la peur d’une IA générative qui pourrait bientôt être autonome dans la gestion de son amélioration.

L’affichage du danger de l’ « auto-amélioration récursive »

L’entreprise appuie sa communication sur son utilisation de plus en plus importante du code généré par son propre outil pour l’améliorer. « En mai 2026, Claude est l’auteur de plus de 80 % du code que nous intégrons dans la base de code d’Anthropic », argumente ainsi l’entreprise, utilisant au passage l’anthropomorphisme pour attribuer à son outil le statut d’auteur. Elle oublie aussi que, même si Lawrence Lessig affirmait que « le code fait loi » et que son code est grandement généré par Claude, le choix de mettre telle ou telle fonction en place reste bien actuellement dans les mains de ses dirigeants.

Mais qu’importe, selon l’entreprise qui a récemment lancé son projet d’entrée en Bourse de façon officielle : cela pourrait amener d’ici peu, « si l’on pousse le raisonnement assez loin et si l’on dispose de ressources informatiques suffisantes », à l’auto-amélioration récursive de ce genre de système.

Un discours catastrophiste toujours présent

Et, tout en brossant deux autres scénarios possibles, l’entreprise met en avant celui où « les systèmes d’IA deviennent eux-mêmes capables de s’améliorer de manière entièrement récursive et commencent à créer leurs propres successeurs », quitte à retrouver les accents catastrophistes des myriades d’appels à stopper la course à l’IA qui existent depuis 2015. Pour l’éviter, elle évoque un moratoire sur la R&D de ce genre de système.

Ainsi, pour insister sur l’importance de sa proposition, Anthropic n’hésite pas à évoquer le traité sur les forces nucléaires à portée intermédiaire signé par Mikhaïl Gorbatchev et Ronald Reagan en 1987. Elle dramatise encore plus en affirmant que « ces régimes ont mis des décennies à mettre en place à la fois les infrastructures et la confiance » et que « nous n’avons pas autant de temps devant nous ».

L’utilisation de cette rhétorique catastrophiste par les entreprises de la tech n’est pas nouvelle. Comme nous le relations au sujet de l’agitation des peurs sur les problèmes d’alignement, Emile Torres et Timnit Gebru expliquaient déjà en 2024 que les discours sur la sécurité de l’IA permettent aux entreprises d’attirer des ressources vers la construction de leurs systèmes et de détourner l’attention. Anthropic n’est pas en reste sur le sujet et s’affiche depuis longtemps comme l’entreprise qui parie sur la sécurité de l’IA comme « stratégie gagnante ».

« Dindons de la farce »

Le chercheur Irénée Régnauld souligne l’utilisation de cette rhétorique alors que l’entreprise prépare son entrée en bourse : « Anthropic agite le drapeau des risques avec la « Pause » comme horizon moral juste avant la plus vaste IPO du monde ». Et il ajoute : « les « Pausistes » vont-ils se rendre compte qu’ils sont les dindons de la farce ? ».

Il remarque au passage le paradoxe entre ce nouvel affichage de l’entreprise et son abandon en interne en février dernier d’un pan important de sa politique de sécurité. En effet, le Time expliquait que l’entreprise avait décidé de la revoir en profondeur, renonçant aux limites qui lui interdisaient catégoriquement d’entrainer des modèles au-delà d’un certain niveau si les mesures de sécurité appropriées n’étaient pas déjà en place.

Cette annonce intervient aussi alors qu’Anthropic a utilisé cette stratégie marketing de la peur pour promouvoir Mythos, son IA dédiée à la cybersécurité.

  •  

Anthropic joue encore sur les peurs de l’IA toute-puissante pour se mettre en valeur

👻
Anthropic joue encore sur les peurs de l’IA toute-puissante pour se mettre en valeur

Alors qu’elle prépare une entrée en bourse, l’entreprise de Dario Amodei regonfle les discours catastrophistes sur l’IA générative pour sa communication juste après avoir gonflé ses muscles grâce à Mythos.

« Perte de contrôle », évocation du traité sur les armes nucléaires et proposition d’un moratoire sur le développement de l’IA générative, Anthropic y va fort dans sa communication. Celle-ci porte un discours ambivalent et survient alors que l’entreprise prépare une entrée en bourse.

Dans un texte publié sur son site web et signé notamment par Marina Favaro, responsable du pôle R&D, l’entreprise met en avant les avancées de ses outils de génération de code pour soutenir la peur d’une IA générative qui pourrait bientôt être autonome dans la gestion de son amélioration.

L’affichage du danger de l’ « auto-amélioration récursive »

L’entreprise appuie sa communication sur son utilisation de plus en plus importante du code généré par son propre outil pour l’améliorer. « En mai 2026, Claude est l’auteur de plus de 80 % du code que nous intégrons dans la base de code d’Anthropic », argumente ainsi l’entreprise, utilisant au passage l’anthropomorphisme pour attribuer à son outil le statut d’auteur. Elle oublie aussi que, même si Lawrence Lessig affirmait que « le code fait loi » et que son code est grandement généré par Claude, le choix de mettre telle ou telle fonction en place reste bien actuellement dans les mains de ses dirigeants.

Mais qu’importe, selon l’entreprise qui a récemment lancé son projet d’entrée en Bourse de façon officielle : cela pourrait amener d’ici peu, « si l’on pousse le raisonnement assez loin et si l’on dispose de ressources informatiques suffisantes », à l’auto-amélioration récursive de ce genre de système.

Un discours catastrophiste toujours présent

Et, tout en brossant deux autres scénarios possibles, l’entreprise met en avant celui où « les systèmes d’IA deviennent eux-mêmes capables de s’améliorer de manière entièrement récursive et commencent à créer leurs propres successeurs », quitte à retrouver les accents catastrophistes des myriades d’appels à stopper la course à l’IA qui existent depuis 2015. Pour l’éviter, elle évoque un moratoire sur la R&D de ce genre de système.

Ainsi, pour insister sur l’importance de sa proposition, Anthropic n’hésite pas à évoquer le traité sur les forces nucléaires à portée intermédiaire signé par Mikhaïl Gorbatchev et Ronald Reagan en 1987. Elle dramatise encore plus en affirmant que « ces régimes ont mis des décennies à mettre en place à la fois les infrastructures et la confiance » et que « nous n’avons pas autant de temps devant nous ».

L’utilisation de cette rhétorique catastrophiste par les entreprises de la tech n’est pas nouvelle. Comme nous le relations au sujet de l’agitation des peurs sur les problèmes d’alignement, Emile Torres et Timnit Gebru expliquaient déjà en 2024 que les discours sur la sécurité de l’IA permettent aux entreprises d’attirer des ressources vers la construction de leurs systèmes et de détourner l’attention. Anthropic n’est pas en reste sur le sujet et s’affiche depuis longtemps comme l’entreprise qui parie sur la sécurité de l’IA comme « stratégie gagnante ».

« Dindons de la farce »

Le chercheur Irénée Régnauld souligne l’utilisation de cette rhétorique alors que l’entreprise prépare son entrée en bourse : « Anthropic agite le drapeau des risques avec la « Pause » comme horizon moral juste avant la plus vaste IPO du monde ». Et il ajoute : « les « Pausistes » vont-ils se rendre compte qu’ils sont les dindons de la farce ? ».

Il remarque au passage le paradoxe entre ce nouvel affichage de l’entreprise et son abandon en interne en février dernier d’un pan important de sa politique de sécurité. En effet, le Time expliquait que l’entreprise avait décidé de la revoir en profondeur, renonçant aux limites qui lui interdisaient catégoriquement d’entrainer des modèles au-delà d’un certain niveau si les mesures de sécurité appropriées n’étaient pas déjà en place.

Cette annonce intervient aussi alors qu’Anthropic a utilisé cette stratégie marketing de la peur pour promouvoir Mythos, son IA dédiée à la cybersécurité.

  •  

Projet Solara : Microsoft veut remplacer la bonne vieille informatique par des agents IA

Les apps, c'est ringard
Projet Solara : Microsoft veut remplacer la bonne vieille informatique par des agents IA

Cette fois c’est 100 % sûr, plus aucun doute à avoir, non vraiment juré-craché : l’avenir est aux agents IA. C’est du moins ce que l’industrie de la tech veut nous faire entrer dans le ciboulot, en nous faisant miroiter un futur riant où les paradigmes actuels sont complètement dépassés : les PC et les smartphones évidemment, mais aussi les systèmes d’exploitation et les logiciels.

Qui a besoin d’apps quand les agents IA répondent aux besoins spécifiques de l’utilisateur ? « La prochaine grande évolution de l’informatique ne concernera plus les applications, mais les agents », assène Steven Bathiche, le patron de l’Applied Sciences Group (ASG) de Microsoft. Plus besoin d’interfaces graphiques, de menus, de boutons, place à « l’expression directe de nos intentions auprès d’agents (…) capables d’agir à travers nos logiciels, nos flux de travail et nos appareils ».

La folie des agents

Dans un discours qui rappelle les grandes envolées de Microsoft autour du métavers, le dirigeant livre une vision de l’avenir où l’agent IA devient la nouvelle interface entre l’utilisateur et l’informatique. L’utilisateur formule une intention, tandis que l’agent se charge de coordonner les logiciels et les services nécessaires en arrière-plan.

C’est une informatique moins dépendante des écrans, des claviers et même des logiciels traditionnels que dessine Microsoft ici… Autrement dit, un monde dans lequel les produits qui ont fait le succès de Microsoft deviennent peu à peu obsolètes. Afin de garder la main, l’entreprise développe ses propres agents, et a levé le voile sur le projet Solara à l’occasion de la conférence BUILD.

Derrière ce nom de code se cache une plateforme censée servir de fondation à cette informatique centrée sur les agents. Steven Bathiche la présente comme un système « de la puce au cloud », capable de faire fonctionner plusieurs agents spécialisés sur de nouveaux types d’appareils.

Un badge et un radio-réveil

Histoire d’aiguiller l’industrie, Microsoft a planché sur deux designs de référence avec ses partenaires, Qualcomm et MediaTek. Le premier a donné un coup de main pour la conception d’un badge connecté, mais pas comme le défunt Ai Pin de Humane, plutôt un badge d’accès doté d’un écran tactile.

L’appareil embarque un micro, un haut-parleur, une caméra sur le côté, une connexion 5G et un lecteur d’empreintes digitales. L’idée est de permettre à l’utilisateur d’accéder rapidement à ses agents IA, de consulter des informations ou encore d’enregistrer une conversation à la volée.

Le second prototype, développé avec MediaTek, est sédentaire. C’est un petit terminal qui n’est pas sans évoquer un radio-réveil ou un écran connecté de cuisine. Posé sur le bureau, cet appareil doit permettre de discuter avec des agents, de jeter un œil à son agenda ou ses tâches en souffrance, en permanence disponible à côté d’un PC (qui remplit à peu de choses près les mêmes fonctions). Microsoft envisage même qu’il puisse se transformer en poste Windows 365 une fois branché à un moniteur externe.

« Ensemble, ces deux concepts illustrent l’ambition de Microsoft : permettre aux agents IA de suivre l’utilisateur partout, sans être limités à une application ou à un appareil particulier », explique Steven Bathiche. « Qu’il s’agisse d’un terminal de bureau ou d’un badge connecté porté autour du cou, l’expérience doit s’adapter au contexte et aux besoins du moment. »

Et à la fin, c’est le smartphone qui gagne

Difficile pourtant de ne pas penser que ces appareils tentent de réinventer des catégories de produits qui existent déjà : un badge qui ressemble à un smartphone miniature, un terminal de bureau qui évoque un écran connecté, des assistants qui nous suivent partout… Une problématique autour de laquelle doivent aussi tourner OpenAI et Jony Ive, qui préparent un appareil basé sur l’IA. Il pourrait s’agir d’un bête smartphone, selon les sources de Ming-Chi Kuo.

L’idée du projet Solara n’est pour autant pas dénuée d’intérêt. Si les agents IA tiennent leur promesse, ils pourraient effectivement aider à créer à la volée des interfaces et des outils bien plus adaptés aux besoins spécifiques de chaque utilisateur. Alors que les logiciels traditionnels (et même les OS) imposent un fonctionnement identique pour tous, un agent pourrait en théorie composer une expérience sur mesure et selon le contexte.

Plutôt que Windows, l’entreprise a choisi MDEP (Microsoft Device Ecosystem Platform) pour propulser les terminaux Solara ; c’est une plateforme reposant sur Android open source (AOSP). Elle est déjà utilisée sur certains appareils Teams. GeekWire, qui a eu droit à un briefing exclusif, explique que les produits Solara peuvent exécuter plusieurs agents simultanément, tandis qu’une couche de coordination choisit automatiquement l’agent adapté à chaque tâche. Ils pourront utiliser des agents de Microsoft, mais aussi des agents tiers développés par les entreprises.

Auprès de nos confrères, Steven Bathiche a défendu la vision de Microsoft pour les appareils Solara. Pourquoi ne pas simplement utiliser un smartphone ? Plusieurs entreprises ont essayé, explique-t-il, notamment dans le secteur de la santé, mais ça n’a rien donné de probant. Un appareil conçu pour un usage particulier est plus sécurisant, affirme le dirigeant, et une bonne optimisation permet de l’utiliser pendant plus longtemps qu’un smartphone plus polyvalent sur une seule charge.

Quant à la comparaison inévitable entre le radio-réveil/écran connecté Solara et un Echo Show, il indique que l’appareil d’Amazon se contente d’un « agent unique », en l’occurrence Alexa. Solara est conçu pour accueillir les agents propres à une organisation.

Le projet n’en est qu’à ses débuts. Microsoft compte travailler avec les fabricants de puces, les constructeurs et les développeurs pour créer des appareils spécialisés pour différents secteurs, de la santé au commerce, en passant par la finance.

  •  

Projet Solara : Microsoft veut remplacer la bonne vieille informatique par des agents IA

Les apps, c'est ringard
Projet Solara : Microsoft veut remplacer la bonne vieille informatique par des agents IA

Cette fois c’est 100 % sûr, plus aucun doute à avoir, non vraiment juré-craché : l’avenir est aux agents IA. C’est du moins ce que l’industrie de la tech veut nous faire entrer dans le ciboulot, en nous faisant miroiter un futur riant où les paradigmes actuels sont complètement dépassés : les PC et les smartphones évidemment, mais aussi les systèmes d’exploitation et les logiciels.

Qui a besoin d’apps quand les agents IA répondent aux besoins spécifiques de l’utilisateur ? « La prochaine grande évolution de l’informatique ne concernera plus les applications, mais les agents », assène Steven Bathiche, le patron de l’Applied Sciences Group (ASG) de Microsoft. Plus besoin d’interfaces graphiques, de menus, de boutons, place à « l’expression directe de nos intentions auprès d’agents (…) capables d’agir à travers nos logiciels, nos flux de travail et nos appareils ».

La folie des agents

Dans un discours qui rappelle les grandes envolées de Microsoft autour du métavers, le dirigeant livre une vision de l’avenir où l’agent IA devient la nouvelle interface entre l’utilisateur et l’informatique. L’utilisateur formule une intention, tandis que l’agent se charge de coordonner les logiciels et les services nécessaires en arrière-plan.

C’est une informatique moins dépendante des écrans, des claviers et même des logiciels traditionnels que dessine Microsoft ici… Autrement dit, un monde dans lequel les produits qui ont fait le succès de Microsoft deviennent peu à peu obsolètes. Afin de garder la main, l’entreprise développe ses propres agents, et a levé le voile sur le projet Solara à l’occasion de la conférence BUILD.

Derrière ce nom de code se cache une plateforme censée servir de fondation à cette informatique centrée sur les agents. Steven Bathiche la présente comme un système « de la puce au cloud », capable de faire fonctionner plusieurs agents spécialisés sur de nouveaux types d’appareils.

Un badge et un radio-réveil

Histoire d’aiguiller l’industrie, Microsoft a planché sur deux designs de référence avec ses partenaires, Qualcomm et MediaTek. Le premier a donné un coup de main pour la conception d’un badge connecté, mais pas comme le défunt Ai Pin de Humane, plutôt un badge d’accès doté d’un écran tactile.

L’appareil embarque un micro, un haut-parleur, une caméra sur le côté, une connexion 5G et un lecteur d’empreintes digitales. L’idée est de permettre à l’utilisateur d’accéder rapidement à ses agents IA, de consulter des informations ou encore d’enregistrer une conversation à la volée.

Le second prototype, développé avec MediaTek, est sédentaire. C’est un petit terminal qui n’est pas sans évoquer un radio-réveil ou un écran connecté de cuisine. Posé sur le bureau, cet appareil doit permettre de discuter avec des agents, de jeter un œil à son agenda ou ses tâches en souffrance, en permanence disponible à côté d’un PC (qui remplit à peu de choses près les mêmes fonctions). Microsoft envisage même qu’il puisse se transformer en poste Windows 365 une fois branché à un moniteur externe.

« Ensemble, ces deux concepts illustrent l’ambition de Microsoft : permettre aux agents IA de suivre l’utilisateur partout, sans être limités à une application ou à un appareil particulier », explique Steven Bathiche. « Qu’il s’agisse d’un terminal de bureau ou d’un badge connecté porté autour du cou, l’expérience doit s’adapter au contexte et aux besoins du moment. »

Et à la fin, c’est le smartphone qui gagne

Difficile pourtant de ne pas penser que ces appareils tentent de réinventer des catégories de produits qui existent déjà : un badge qui ressemble à un smartphone miniature, un terminal de bureau qui évoque un écran connecté, des assistants qui nous suivent partout… Une problématique autour de laquelle doivent aussi tourner OpenAI et Jony Ive, qui préparent un appareil basé sur l’IA. Il pourrait s’agir d’un bête smartphone, selon les sources de Ming-Chi Kuo.

L’idée du projet Solara n’est pour autant pas dénuée d’intérêt. Si les agents IA tiennent leur promesse, ils pourraient effectivement aider à créer à la volée des interfaces et des outils bien plus adaptés aux besoins spécifiques de chaque utilisateur. Alors que les logiciels traditionnels (et même les OS) imposent un fonctionnement identique pour tous, un agent pourrait en théorie composer une expérience sur mesure et selon le contexte.

Plutôt que Windows, l’entreprise a choisi MDEP (Microsoft Device Ecosystem Platform) pour propulser les terminaux Solara ; c’est une plateforme reposant sur Android open source (AOSP). Elle est déjà utilisée sur certains appareils Teams. GeekWire, qui a eu droit à un briefing exclusif, explique que les produits Solara peuvent exécuter plusieurs agents simultanément, tandis qu’une couche de coordination choisit automatiquement l’agent adapté à chaque tâche. Ils pourront utiliser des agents de Microsoft, mais aussi des agents tiers développés par les entreprises.

Auprès de nos confrères, Steven Bathiche a défendu la vision de Microsoft pour les appareils Solara. Pourquoi ne pas simplement utiliser un smartphone ? Plusieurs entreprises ont essayé, explique-t-il, notamment dans le secteur de la santé, mais ça n’a rien donné de probant. Un appareil conçu pour un usage particulier est plus sécurisant, affirme le dirigeant, et une bonne optimisation permet de l’utiliser pendant plus longtemps qu’un smartphone plus polyvalent sur une seule charge.

Quant à la comparaison inévitable entre le radio-réveil/écran connecté Solara et un Echo Show, il indique que l’appareil d’Amazon se contente d’un « agent unique », en l’occurrence Alexa. Solara est conçu pour accueillir les agents propres à une organisation.

Le projet n’en est qu’à ses débuts. Microsoft compte travailler avec les fabricants de puces, les constructeurs et les développeurs pour créer des appareils spécialisés pour différents secteurs, de la santé au commerce, en passant par la finance.

  •  

Microsoft veut rendre les utilisateurs accros à son agent IA Scout

Pas de pause café pour l'IA
Microsoft veut rendre les utilisateurs accros à son agent IA Scout

Avec Scout, son nouvel agent autonome connecté à Microsoft 365, l’éditeur de Windows poursuit son pari sur l’IA. Quitte à s’appuyer sur une technologie qu’il critiquait encore il y a quelques mois.

En novembre dernier, Microsoft faisait miroiter un Windows « agentique », capable de travailler pour le compte de l’utilisateur sur toutes les tâches possibles et imaginables. L’annonce a été très froidement accueillie par des utilisateurs, d’abord désireux de travailler avec un système d’exploitation stable et fiable.

C’est pas si mal finalement OpenClaw

L’éditeur a compris le message, en annonçant un retour aux fondamentaux pour Windows. Et miracle, les promesses ont l’air d’être tenues, du moins jusqu’à présent. Mais cela n’empêche pas Microsoft de tracer sa route sur le chemin de l’IA – pas question de lâcher la bride au vu des milliards de dollars investis dans les infrastructures et le développement de ses propres modèles.

La conférence BUILD a été l’occasion de présenter de nouveaux modèles, mais aussi des fonctions IA pour Windows. Parmi elles, des agents permanents baptisés Autopilot. Ils surveillent l’environnement de travail et agissent par eux-mêmes, dans les limites qu’on leur aura fixées évidemment.

Le premier produit basé sur Autopilot est Scout, qui se connecte aux différentes composantes de Microsoft 365 : Teams, Outlook, OneDrive, SharePoint, mais aussi les contacts, le calendrier, les e-mails… Scout peut par exemple repérer des réunions importantes, organiser des rendez-vous automatiquement, bloquer du temps dans l’agenda pour boucler un projet, préparer des documents avant une réunion ou encore détecter qu’une prise de décision traîne un peu trop et risque de retarder un projet.

Cette approche, bien plus proactive que celle de Copilot, permet aussi à Scout d’avoir sa propre identité : l’agent est en effet identifié et ses actions peuvent être retracées. Par ailleurs, l’agent peut « apprendre » la manière dont l’utilisateur travaille, les projets importants et les tâches qui reviennent régulièrement.

Un des aspects les plus étonnants de Scout est que le projet est propulsé par la technologie open source OpenClaw. Cette dernière s’est hissée comme une référence dans le petit monde remuant des agents autonomes capables d’utiliser des applications, de manipuler des fichiers et d’accéder à des services en continu. Microsoft ne cherche donc pas à la remplacer et mieux encore, l’entreprise s’engage à contribuer directement au projet.

Voilà qui contraste avec la position de Meta qui développe sa propre alternative Hatch, après qu’OpenAI lui a chipé Peter Steinberger, créateur d’OpenClaw.

Microsoft se montrait pourtant bien moins enthousiaste mi-février, en prévenant des risques de sécurité qui pesaient sur OpenClaw. La société expliquait à l’époque que la technologie d’agents était trop risquée pour être exécutée directement dans un environnement d’entreprise classique à cause de ses privilèges étendus et de sa capacité à agir de manière autonome. « OpenClaw a démontré que les agents permanents fonctionnent. Nous allons leur ajouter la sécurité, la gouvernance et l’intégration Microsoft 365 », affirme désormais l’éditeur.

La drogue

Scout combine donc plusieurs fonctions de sécurité visant justement à répondre à ces craintes, avec un système d’identité contrôlée, une validation humaine pour les actions critiques, une journalisation des actions et des permissions limitées. Des employés Microsoft utilisent déjà Scout, qui s’ouvre à davantage de testeurs via un aperçu privé.

Dans des documents internes publiés par 404media, on apprend que Microsoft mise beaucoup sur Scout. Plus de 1 000 employés l’utiliseraient déjà, dont le directeur général Satya Nadella. « ClawPilot [l’ancien nom de Scout] est devenu de manière organique l’un des outils internes les plus demandés chez Microsoft. Sans annonce officielle, sans marketing, sans campagne de déploiement à l’échelle de l’entreprise », affirme un d’entre eux.

Ces documents décrivent le plan de déploiement de ClawPilot, dont la première des phases est de rendre les utilisateurs accros à l’outil. Ils se réjouissent des retours des tests internes, qui montrent une « utilisation quotidienne, avec un fort taux de rétention et une forte intensité d’usage (conversations, requêtes, flux de travail, compétences) ».

L’addiction tant voulue par Microsoft n’est pas surprenante : tous les acteurs de l’IA rêvent de transformer leurs services en compagnons du quotidien. Mais le fait de voir cet objectif formulé aussi explicitement rappelle que la question de la dépendance aux assistants IA fait désormais partie intégrante des stratégies de développement de l’industrie.

  •  

Microsoft veut rendre les utilisateurs accros à son agent IA Scout

Pas de pause café pour l'IA
Microsoft veut rendre les utilisateurs accros à son agent IA Scout

Avec Scout, son nouvel agent autonome connecté à Microsoft 365, l’éditeur de Windows poursuit son pari sur l’IA. Quitte à s’appuyer sur une technologie qu’il critiquait encore il y a quelques mois.

En novembre dernier, Microsoft faisait miroiter un Windows « agentique », capable de travailler pour le compte de l’utilisateur sur toutes les tâches possibles et imaginables. L’annonce a été très froidement accueillie par des utilisateurs, d’abord désireux de travailler avec un système d’exploitation stable et fiable.

C’est pas si mal finalement OpenClaw

L’éditeur a compris le message, en annonçant un retour aux fondamentaux pour Windows. Et miracle, les promesses ont l’air d’être tenues, du moins jusqu’à présent. Mais cela n’empêche pas Microsoft de tracer sa route sur le chemin de l’IA – pas question de lâcher la bride au vu des milliards de dollars investis dans les infrastructures et le développement de ses propres modèles.

La conférence BUILD a été l’occasion de présenter de nouveaux modèles, mais aussi des fonctions IA pour Windows. Parmi elles, des agents permanents baptisés Autopilot. Ils surveillent l’environnement de travail et agissent par eux-mêmes, dans les limites qu’on leur aura fixées évidemment.

Le premier produit basé sur Autopilot est Scout, qui se connecte aux différentes composantes de Microsoft 365 : Teams, Outlook, OneDrive, SharePoint, mais aussi les contacts, le calendrier, les e-mails… Scout peut par exemple repérer des réunions importantes, organiser des rendez-vous automatiquement, bloquer du temps dans l’agenda pour boucler un projet, préparer des documents avant une réunion ou encore détecter qu’une prise de décision traîne un peu trop et risque de retarder un projet.

Cette approche, bien plus proactive que celle de Copilot, permet aussi à Scout d’avoir sa propre identité : l’agent est en effet identifié et ses actions peuvent être retracées. Par ailleurs, l’agent peut « apprendre » la manière dont l’utilisateur travaille, les projets importants et les tâches qui reviennent régulièrement.

Un des aspects les plus étonnants de Scout est que le projet est propulsé par la technologie open source OpenClaw. Cette dernière s’est hissée comme une référence dans le petit monde remuant des agents autonomes capables d’utiliser des applications, de manipuler des fichiers et d’accéder à des services en continu. Microsoft ne cherche donc pas à la remplacer et mieux encore, l’entreprise s’engage à contribuer directement au projet.

Voilà qui contraste avec la position de Meta qui développe sa propre alternative Hatch, après qu’OpenAI lui a chipé Peter Steinberger, créateur d’OpenClaw.

Microsoft se montrait pourtant bien moins enthousiaste mi-février, en prévenant des risques de sécurité qui pesaient sur OpenClaw. La société expliquait à l’époque que la technologie d’agents était trop risquée pour être exécutée directement dans un environnement d’entreprise classique à cause de ses privilèges étendus et de sa capacité à agir de manière autonome. « OpenClaw a démontré que les agents permanents fonctionnent. Nous allons leur ajouter la sécurité, la gouvernance et l’intégration Microsoft 365 », affirme désormais l’éditeur.

La drogue

Scout combine donc plusieurs fonctions de sécurité visant justement à répondre à ces craintes, avec un système d’identité contrôlée, une validation humaine pour les actions critiques, une journalisation des actions et des permissions limitées. Des employés Microsoft utilisent déjà Scout, qui s’ouvre à davantage de testeurs via un aperçu privé.

Dans des documents internes publiés par 404media, on apprend que Microsoft mise beaucoup sur Scout. Plus de 1 000 employés l’utiliseraient déjà, dont le directeur général Satya Nadella. « ClawPilot [l’ancien nom de Scout] est devenu de manière organique l’un des outils internes les plus demandés chez Microsoft. Sans annonce officielle, sans marketing, sans campagne de déploiement à l’échelle de l’entreprise », affirme un d’entre eux.

Ces documents décrivent le plan de déploiement de ClawPilot, dont la première des phases est de rendre les utilisateurs accros à l’outil. Ils se réjouissent des retours des tests internes, qui montrent une « utilisation quotidienne, avec un fort taux de rétention et une forte intensité d’usage (conversations, requêtes, flux de travail, compétences) ».

L’addiction tant voulue par Microsoft n’est pas surprenante : tous les acteurs de l’IA rêvent de transformer leurs services en compagnons du quotidien. Mais le fait de voir cet objectif formulé aussi explicitement rappelle que la question de la dépendance aux assistants IA fait désormais partie intégrante des stratégies de développement de l’industrie.

  •  

Google autorise les sites web à refuser explicitement les résumés IA

Merci, mais non merci
Google autorise les sites web à refuser explicitement les résumés IA

Depuis un peu plus de deux ans, Google affiche ses AI Overviews tout en haut d’une recherche web, autrement dit un résumé des résultats généré par IA. Ils ne tombent pas du ciel : les informations qu’ils contiennent proviennent de sites web qui vont finalement avoir la possibilité explicite d’exclure leurs contenus du moissonnage effectué par le moteur de recherche. Trop peu, trop tard ?

Les AI Overviews, visibles aux États-Unis depuis leur lancement en mai 2024, sont maintenant présents dans une centaine de pays (la France est toujours exclue). Ces résumés ont été complétés un an plus tard par l’AI Mode, qui tente de concurrencer directement les moteurs de recherche IA comme Perplexity ou ChatGPT.

Google demande enfin la permission d’aspirer le web

Durant la dernière édition de la Google I/O, le géant américain en a remis une couche avec une avalanche de nouveautés IA pour son moteur de recherche – offrant au passage au mode « No AI » de DuckDuckGo un joli coup de pouce. Aussi incroyable que cela puisse paraitre, il existe des internautes qui apprécient peu le forcing IA de Google. C’est le cas aussi pour plusieurs éditeurs de sites web, qui refusent obstinément que leurs contenus soient collectés sans autorisation ni rémunération pour se transformer en données d’entraînement.

Exemple d’AI Overview.

Il existe des mécanismes qui empêchent les robots de scraping de moissonner les contenus du web ouvert. Le fichier robots.txt est le plus commun, il permet à un site de refuser l’accès à certaines de ses pages pour l’indexation web et la collecte IA. Voilà pour la théorie, mais en pratique rien n’empêche un bot mal élevé d’ignorer ces consignes et de parcourir l’intégralité d’un site. Perplexity est régulièrement pointé du doigt à ce sujet.

Google a commencé à déployer un nouvel outil qui va permettre aux éditeurs web de décider, depuis la Search Console, si leurs sites peuvent apparaitre dans les résumés générés par IA. C’est un changement de taille, le groupe ayant plutôt cherché à flouter la frontière entre l’indexation et le scraping. Il promet la main sur le cœur que cela n’aura aucun impact sur l’indexation traditionnelle. En activant ce bouton depuis la console de recherche, un site ne recevra « ni trafic ni impressions provenant de nos fonctionnalités d’IA générative », martèle Google. Est-ce pour autant un drame ?

Google affirme régulièrement que les résumés IA dans les résultats de recherche ne font pas diminuer le trafic des sites d’où les informations sont extraites. Une étude du Pew Research Center, publiée en juillet dernier, affirmait le contraire. L’entreprise s’était d’ailleurs pris les pieds dans le tapis en évoquant un web ouvert en « déclin rapide » en raison du marché publicitaire chamboulé par l’IA.

La mise en place de ce bouton n’a rien d’un geste désintéressé ou d’une branche d’olivier lancé aux éditeurs, car sinon pourquoi avoir attendu deux ans ? C’est simplement le résultat d’une obligation réglementaire imposée par la CMA, l’autorité de la concurrence britannique. « Pour la première fois au monde, les éditeurs disposeront d’outils leur permettant d’empêcher l’utilisation de leurs contenus par les fonctionnalités d’IA de la recherche Google », se réjouit le régulateur.

Ce dernier ajoute que les éditeurs seront ainsi « mieux armés pour négocier des accords de licence avec Google, notamment dans le secteur de la presse ». L’intention est louable, mais rien n’empêchera Google d’utiliser les contenus provenant d’autres sites web plus conciliants pour générer ses résumés IA.

  •  

Google autorise les sites web à refuser explicitement les résumés IA

Merci, mais non merci
Google autorise les sites web à refuser explicitement les résumés IA

Depuis un peu plus de deux ans, Google affiche ses AI Overviews tout en haut d’une recherche web, autrement dit un résumé des résultats généré par IA. Ils ne tombent pas du ciel : les informations qu’ils contiennent proviennent de sites web qui vont finalement avoir la possibilité explicite d’exclure leurs contenus du moissonnage effectué par le moteur de recherche. Trop peu, trop tard ?

Les AI Overviews, visibles aux États-Unis depuis leur lancement en mai 2024, sont maintenant présents dans une centaine de pays (la France est toujours exclue). Ces résumés ont été complétés un an plus tard par l’AI Mode, qui tente de concurrencer directement les moteurs de recherche IA comme Perplexity ou ChatGPT.

Google demande enfin la permission d’aspirer le web

Durant la dernière édition de la Google I/O, le géant américain en a remis une couche avec une avalanche de nouveautés IA pour son moteur de recherche – offrant au passage au mode « No AI » de DuckDuckGo un joli coup de pouce. Aussi incroyable que cela puisse paraitre, il existe des internautes qui apprécient peu le forcing IA de Google. C’est le cas aussi pour plusieurs éditeurs de sites web, qui refusent obstinément que leurs contenus soient collectés sans autorisation ni rémunération pour se transformer en données d’entraînement.

Exemple d’AI Overview.

Il existe des mécanismes qui empêchent les robots de scraping de moissonner les contenus du web ouvert. Le fichier robots.txt est le plus commun, il permet à un site de refuser l’accès à certaines de ses pages pour l’indexation web et la collecte IA. Voilà pour la théorie, mais en pratique rien n’empêche un bot mal élevé d’ignorer ces consignes et de parcourir l’intégralité d’un site. Perplexity est régulièrement pointé du doigt à ce sujet.

Google a commencé à déployer un nouvel outil qui va permettre aux éditeurs web de décider, depuis la Search Console, si leurs sites peuvent apparaitre dans les résumés générés par IA. C’est un changement de taille, le groupe ayant plutôt cherché à flouter la frontière entre l’indexation et le scraping. Il promet la main sur le cœur que cela n’aura aucun impact sur l’indexation traditionnelle. En activant ce bouton depuis la console de recherche, un site ne recevra « ni trafic ni impressions provenant de nos fonctionnalités d’IA générative », martèle Google. Est-ce pour autant un drame ?

Google affirme régulièrement que les résumés IA dans les résultats de recherche ne font pas diminuer le trafic des sites d’où les informations sont extraites. Une étude du Pew Research Center, publiée en juillet dernier, affirmait le contraire. L’entreprise s’était d’ailleurs pris les pieds dans le tapis en évoquant un web ouvert en « déclin rapide » en raison du marché publicitaire chamboulé par l’IA.

La mise en place de ce bouton n’a rien d’un geste désintéressé ou d’une branche d’olivier lancé aux éditeurs, car sinon pourquoi avoir attendu deux ans ? C’est simplement le résultat d’une obligation réglementaire imposée par la CMA, l’autorité de la concurrence britannique. « Pour la première fois au monde, les éditeurs disposeront d’outils leur permettant d’empêcher l’utilisation de leurs contenus par les fonctionnalités d’IA de la recherche Google », se réjouit le régulateur.

Ce dernier ajoute que les éditeurs seront ainsi « mieux armés pour négocier des accords de licence avec Google, notamment dans le secteur de la presse ». L’intention est louable, mais rien n’empêchera Google d’utiliser les contenus provenant d’autres sites web plus conciliants pour générer ses résumés IA.

  •  

Microsoft a désormais son propre modèle de raisonnement

Vieux motard
Microsoft a désormais son propre modèle de raisonnement

Durant sa conférence BUILD, Microsoft a présenté une nouvelle série de modèles MAI. L’entreprise se dote pour la première fois d’un modèle de raisonnement, présenté comme idéal par sa taille moyenne et son coût maitrisé.

Cela peut paraître étonnant, mais Microsoft – qui a investi plusieurs milliards de dollars très tôt dans OpenAI – ne disposait d’aucun modèle de raisonnement. Jusqu’à présent, l’entreprise s’était surtout positionnée comme championne des relais pour d’autres modèles, laissant par exemple un accès à ChatGPT et plus récemment Claude via sa myriade d’assistants Copilot.

La situation a cependant changé : Anthropic a largement grimpé en puissance, tout particulièrement dans le développement, tandis qu’OpenAI suit sa propre trajectoire et se montre beaucoup plus autonome. La firme de Redmond a tout intérêt à manifester sa propre indépendance, avec à la clé une gamme plus complète de modèles.

Place à MAI-Thinking-1

La famille MAI (Microsoft AI) accueille plusieurs nouveaux venus présentés pendant la conférence BUILD, dont MAI-Thinking-1 présenté hier. Comme son nom l’indique, il s’agit d’un modèle de raisonnement de taille intermédiaire, de type MoE (Mixture of Experts), avec 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, soit l’équivalent d’un document de 600 pages selon Microsoft.

L’entreprise met clairement en avant un entrainement du modèle depuis zéro : aucune distillation et à partir de données commercialement licenciées et « propres ». MAI-Thinking-1 n’est donc pas censé s’appuyer sur les traces de raisonnement d’autres modèles, particulièrement concurrents. Il s’agit d’une construction indépendante.

Le modèle atteint 97 % sur AIME 2025 et 94,5 % sur AIME 2026, deux benchmarks évaluant le raisonnement mathématique et scientifique multi-étapes. Sur SWE-Bench Pro, benchmark d’ingénierie logicielle, Microsoft affirme qu’il égale Claude Opus 4.6 sur les tâches de codage. Dans des évaluations indépendantes en aveugle menées par Surge (partenaire indépendant de Microsoft), MAI-Thinking-1 a été préféré à Claude Sonnet 4.6. Ce dernier, le modèle par défaut pour Claude, est largement utilisé comme point de comparaison dans les chiffres donnés par Microsoft.

CNBC rapporte qu’une démonstration a présenté des résultats supérieurs à ceux de GPT-5.5 d’OpenAI avec un modèle ajusté sur les données de McKinsey, avec un coût annoncé comme dix fois inférieur. Il faut pour l’instant croire l’éditeur sur parole, car le modèle n’est disponible qu’en préversion privée via Microsoft Foundry. Sur la partie raisonnement, les tokens seront tarifés à la consommation, là encore sans plus de détails. Le modèle est également inclus dans GitHub Copilot Enterprise et une version pour les enclaves Azure Confidential Computing est prévue.

Six autres « nouveaux » modèles dans la famille MAI

Bien que MAI-Thinking-1 ait eu la part du lion pendant la présentation, la famille MAI a également reçu six autres modèles, en majorité des évolutions de ceux existant déjà.

MAI-Image-2.5 et MAI-Image-2.5 Flash débarquent ainsi pour la génération d’images. Microsoft évoque une hausse significative de la qualité, avec de meilleurs résultats que Nano Banana 2, avec une édition et des contrôles précis. La version classique vise la fidélité maximale et des performances « de qualité professionnelle », tandis que la version Flash – sans surprise – sacrifie une partie de cette qualité pour une plus grande rapidité des résultats. MAI-Image-2.5 est en cours de déploiement dans PowerPoint et OneDrive. Côté tarifs, MAI-Image-2.5 coûte 5 dollars par million de tokens pour les entrées texte, 8 dollars pour les entrées image et 47 dollars pour les sorties image. Pour la version Flash, les tarifs sont de 1,75 dollar pour les entrées texte et image, et de 33 dollars pour les sorties image.

MAI-Transcribe-1.5 est présenté de son côté comme le meilleur modèle de transcription au monde (tout simplement), avec une précision de pointe dans 43 langues, surpassant Gemini et les modèles phares d’OpenAI. Il est censé produire des transcriptions cinq fois plus rapidement que les modèles concurrents, et sera disponible dans GitHub Copilot, Dynamics 365 Contact Center et Foundry, avec un support prochain du streaming. Côté développeurs, il est accessible via Azure Speech au prix de 22 dollars le million de caractères.

Pour les autres modèles, il s’agit surtout de disponibilité. MAI-Voice-2 et sa variante Flash sont ainsi disponibles dans une quinzaine de langues supplémentaires avec de nouvelles options de voix. MAI-Code-1, modèle de codage présenté comme très efficace en inférence et optimisé pour GitHub, est disponible dans Copilot et Visual Studio Code. Son déploiement dans Copilot (tous niveaux) a commencé mardi 2 juin.

Aion, des modèles conçus pour l’exécution locale

Bien que moins mis en avant, deux nouveaux modèles nommés Aion ont aussi été présentés pour l’exécution locale.

Le premier, Aion Instruct, doit prendre le relai de l’actuel Windows OS SLM. Il se veut plus petit (4 milliards de paramètres), plus rapide et surtout plus efficace. Il doit alimenter tout ce qui touche à l’intelligence textuelle quotidienne, c’est-à-dire les résumés, la réécriture, la détection d’intention ou encore l’accessibilité.

Disponible dès maintenant dans le canal Insider d’Edge à des fins de tests pour les développeurs, il sera également accessible depuis les API de Windows. Contrairement aux modèles fournis jusqu’ici par Microsoft dans ce cas de figure, aucun NPU n’est requis : Aion Instruct est fait pour fonctionner partout, sur CPU. Enfin, une version open source doit arriver courant juillet sur Hugging Face.

Aion Plan est à la fois plus ambitieux et plus restreint. Disposant de 14 milliards de paramètres et d’une fenêtre de contexte de 32 000 tokens, de capacités de raisonnement et pouvant appeler des outils (tool-calling), il se veut le champion du flux agentique local. En revanche, il ne sera pas disponible avant plusieurs mois, et la présence d’un NPU semble cette fois requise.

Dans les deux cas, les modèles sont gratuits à l’usage, les opérations étant réalisées par la machine.

  •  

Microsoft a désormais son propre modèle de raisonnement

Vieux motard
Microsoft a désormais son propre modèle de raisonnement

Durant sa conférence BUILD, Microsoft a présenté une nouvelle série de modèles MAI. L’entreprise se dote pour la première fois d’un modèle de raisonnement, présenté comme idéal par sa taille moyenne et son coût maitrisé.

Cela peut paraître étonnant, mais Microsoft – qui a investi plusieurs milliards de dollars très tôt dans OpenAI – ne disposait d’aucun modèle de raisonnement. Jusqu’à présent, l’entreprise s’était surtout positionnée comme championne des relais pour d’autres modèles, laissant par exemple un accès à ChatGPT et plus récemment Claude via sa myriade d’assistants Copilot.

La situation a cependant changé : Anthropic a largement grimpé en puissance, tout particulièrement dans le développement, tandis qu’OpenAI suit sa propre trajectoire et se montre beaucoup plus autonome. La firme de Redmond a tout intérêt à manifester sa propre indépendance, avec à la clé une gamme plus complète de modèles.

Place à MAI-Thinking-1

La famille MAI (Microsoft AI) accueille plusieurs nouveaux venus présentés pendant la conférence BUILD, dont MAI-Thinking-1 présenté hier. Comme son nom l’indique, il s’agit d’un modèle de raisonnement de taille intermédiaire, de type MoE (Mixture of Experts), avec 35 milliards de paramètres actifs et une fenêtre de contexte de 256 000 tokens, soit l’équivalent d’un document de 600 pages selon Microsoft.

L’entreprise met clairement en avant un entrainement du modèle depuis zéro : aucune distillation et à partir de données commercialement licenciées et « propres ». MAI-Thinking-1 n’est donc pas censé s’appuyer sur les traces de raisonnement d’autres modèles, particulièrement concurrents. Il s’agit d’une construction indépendante.

Le modèle atteint 97 % sur AIME 2025 et 94,5 % sur AIME 2026, deux benchmarks évaluant le raisonnement mathématique et scientifique multi-étapes. Sur SWE-Bench Pro, benchmark d’ingénierie logicielle, Microsoft affirme qu’il égale Claude Opus 4.6 sur les tâches de codage. Dans des évaluations indépendantes en aveugle menées par Surge (partenaire indépendant de Microsoft), MAI-Thinking-1 a été préféré à Claude Sonnet 4.6. Ce dernier, le modèle par défaut pour Claude, est largement utilisé comme point de comparaison dans les chiffres donnés par Microsoft.

CNBC rapporte qu’une démonstration a présenté des résultats supérieurs à ceux de GPT-5.5 d’OpenAI avec un modèle ajusté sur les données de McKinsey, avec un coût annoncé comme dix fois inférieur. Il faut pour l’instant croire l’éditeur sur parole, car le modèle n’est disponible qu’en préversion privée via Microsoft Foundry. Sur la partie raisonnement, les tokens seront tarifés à la consommation, là encore sans plus de détails. Le modèle est également inclus dans GitHub Copilot Enterprise et une version pour les enclaves Azure Confidential Computing est prévue.

Six autres « nouveaux » modèles dans la famille MAI

Bien que MAI-Thinking-1 ait eu la part du lion pendant la présentation, la famille MAI a également reçu six autres modèles, en majorité des évolutions de ceux existant déjà.

MAI-Image-2.5 et MAI-Image-2.5 Flash débarquent ainsi pour la génération d’images. Microsoft évoque une hausse significative de la qualité, avec de meilleurs résultats que Nano Banana 2, avec une édition et des contrôles précis. La version classique vise la fidélité maximale et des performances « de qualité professionnelle », tandis que la version Flash – sans surprise – sacrifie une partie de cette qualité pour une plus grande rapidité des résultats. MAI-Image-2.5 est en cours de déploiement dans PowerPoint et OneDrive. Côté tarifs, MAI-Image-2.5 coûte 5 dollars par million de tokens pour les entrées texte, 8 dollars pour les entrées image et 47 dollars pour les sorties image. Pour la version Flash, les tarifs sont de 1,75 dollar pour les entrées texte et image, et de 33 dollars pour les sorties image.

MAI-Transcribe-1.5 est présenté de son côté comme le meilleur modèle de transcription au monde (tout simplement), avec une précision de pointe dans 43 langues, surpassant Gemini et les modèles phares d’OpenAI. Il est censé produire des transcriptions cinq fois plus rapidement que les modèles concurrents, et sera disponible dans GitHub Copilot, Dynamics 365 Contact Center et Foundry, avec un support prochain du streaming. Côté développeurs, il est accessible via Azure Speech au prix de 22 dollars le million de caractères.

Pour les autres modèles, il s’agit surtout de disponibilité. MAI-Voice-2 et sa variante Flash sont ainsi disponibles dans une quinzaine de langues supplémentaires avec de nouvelles options de voix. MAI-Code-1, modèle de codage présenté comme très efficace en inférence et optimisé pour GitHub, est disponible dans Copilot et Visual Studio Code. Son déploiement dans Copilot (tous niveaux) a commencé mardi 2 juin.

Aion, des modèles conçus pour l’exécution locale

Bien que moins mis en avant, deux nouveaux modèles nommés Aion ont aussi été présentés pour l’exécution locale.

Le premier, Aion Instruct, doit prendre le relai de l’actuel Windows OS SLM. Il se veut plus petit (4 milliards de paramètres), plus rapide et surtout plus efficace. Il doit alimenter tout ce qui touche à l’intelligence textuelle quotidienne, c’est-à-dire les résumés, la réécriture, la détection d’intention ou encore l’accessibilité.

Disponible dès maintenant dans le canal Insider d’Edge à des fins de tests pour les développeurs, il sera également accessible depuis les API de Windows. Contrairement aux modèles fournis jusqu’ici par Microsoft dans ce cas de figure, aucun NPU n’est requis : Aion Instruct est fait pour fonctionner partout, sur CPU. Enfin, une version open source doit arriver courant juillet sur Hugging Face.

Aion Plan est à la fois plus ambitieux et plus restreint. Disposant de 14 milliards de paramètres et d’une fenêtre de contexte de 32 000 tokens, de capacités de raisonnement et pouvant appeler des outils (tool-calling), il se veut le champion du flux agentique local. En revanche, il ne sera pas disponible avant plusieurs mois, et la présence d’un NPU semble cette fois requise.

Dans les deux cas, les modèles sont gratuits à l’usage, les opérations étant réalisées par la machine.

  •  

Le décret présidentiel sur l’IA de Donald Trump a été édulcoré

L'industrie IA garde les clés
Le décret présidentiel sur l’IA de Donald Trump a été édulcoré

Donald Trump a finalement signé l’executive order sur l’intelligence artificielle. Le président américain devait apposer son paraphe sur une précédente version du texte, plus contraignante, il y a deux semaines. Mais au dernier moment, l’industrie a réclamé et obtenu des changements importants dans la mouture finale.

Ce n’est pas une bulle du pape, mais pas loin. Dans l’executive order (EO) signé ce mardi 2 juin, Donald Trump rappelle les mesures déjà mises en œuvre depuis le début de son second mandat, dont « [la suppression des] contraintes bureaucratiques que l’administration précédente avait imposées aux développeurs et aux chercheurs américains ». Surtout, l’EO liste une série de mécanismes visant à amplifier le mouvement pour « promouvoir l’innovation et la sécurité de l’IA ».

Report de dernière minute

Mais voilà, ce décret présidentiel aurait déjà dû être paraphé le 21 mai, et tout semblait prêt pour que ce soit le cas. Mais David Sacks, l’ancien « tsar » de l’IA nommé par Donald Trump, a arraché un délai de dernière minute, comme l’explique Politico.

L’ancien EO mettait en place un mécanisme volontaire de supervision pour les entreprises IA : certains modèles avancés auraient pu être soumis à un examen par plusieurs agences fédérales jusqu’à 90 jours avant leur publication. L’administration Trump avait un temps imaginé d’imposer ce dispositif aux entreprises, avant de revenir à une position moins tranchée. La perspective n’en inquiétait pas moins une partie de l’industrie, qui voyait dans ce mécanisme les prémices d’un contrôle gouvernemental plus poussé sur les modèles les plus puissants.

La mesure a notamment été imaginée suite aux craintes d’un modèle comme Mythos sur ses capacités d’attaque envers les infrastructures critiques. David Sacks, porte-voix de l’industrie en sa qualité d’associé fondateur du fonds de capital-risque Craft Ventures, aurait expliqué à Trump que les entreprises n’avaient pas besoin d’une mesure coercitive : elles coopèrent déjà volontairement. Autre argument : un examen des modèles par le gouvernement ralentirait la marche de l’IA, ce qui nuirait aux États-Unis dans sa course contre la Chine.

La signature a donc été reportée et avec elle, une bonne partie du (faible) mordant initial du décret présidentiel. La mouture finale renforce l’idée que le gouvernement fédéral n’impose pas de licence obligatoire, pas d’autorisation avant lancement, pas de « permis » pour publier un modèle. Un cadre est mis en place pour les développeurs volontaires, dans lequel ils peuvent fournir un accès anticipé à leurs modèles 30 jours maximum avant leur mise à disposition.

Le texte ordonne la création, sous les 30 jours, d’un centre de coordination de la cybersécurité liée à l’IA, en collaboration — là aussi volontaire — avec des entreprises du secteur et les opérateurs des infrastructures critiques. Il regroupera plusieurs activités aujourd’hui dispersées entre plusieurs agences du gouvernement pour détecter des vulnérabilités logicielles, mesurer les niveaux de risque de ces failles, coordonner la réponse et la diffusion des correctifs. Il s’agit d’éviter que chacun, dans le privé comme dans le public, fasse sa tambouille dans son coin. C’est louable, mais le caractère non contraignant de ce centre risque d’en diluer la force de frappe.

Un coup pour rien ?

Le décret demande également à plusieurs agences, dont la NSA et le Trésor, de mettre au point dans les 60 jours un processus d’évaluation pour déterminer les modèles IA considérés comme suffisamment puissants pour présenter un risque particulier. Les critères de ce processus resteront secrets, pour éviter que des acteurs malveillants ne connaissent les capacités qui intéressent les autorités.

L’EO ne le précise pas, mais les agences pourraient par exemple mesurer la capacité d’un modèle à découvrir des vulnérabilités zero-day, à écrire du code malveillant, à automatiser des campagnes de piratage, ou à contourner des systèmes de sécurité. Le dernier mot reviendra à la NSA, l’agence du renseignement états-unien. Le NIST, souvent considéré comme plus neutre et technique, est écarté de la décision finale.

L’EO exige aussi du ministère de la Justice de poursuivre les personnes utilisant l’IA pour pirater des systèmes, voler des données ou commettre des infractions informatiques. Si l’architecture générale entre les deux versions du texte est similaire, la version finale adoucit fortement les aspects les plus contraignants pour l’industrie, en insistant notamment sur le caractère volontaire de certaines mesures. Et surtout, elle exclut tout système de licence ou d’autorisation préalable.

  •  

Le décret présidentiel sur l’IA de Donald Trump a été édulcoré

L'industrie IA garde les clés
Le décret présidentiel sur l’IA de Donald Trump a été édulcoré

Donald Trump a finalement signé l’executive order sur l’intelligence artificielle. Le président américain devait apposer son paraphe sur une précédente version du texte, plus contraignante, il y a deux semaines. Mais au dernier moment, l’industrie a réclamé et obtenu des changements importants dans la mouture finale.

Ce n’est pas une bulle du pape, mais pas loin. Dans l’executive order (EO) signé ce mardi 2 juin, Donald Trump rappelle les mesures déjà mises en œuvre depuis le début de son second mandat, dont « [la suppression des] contraintes bureaucratiques que l’administration précédente avait imposées aux développeurs et aux chercheurs américains ». Surtout, l’EO liste une série de mécanismes visant à amplifier le mouvement pour « promouvoir l’innovation et la sécurité de l’IA ».

Report de dernière minute

Mais voilà, ce décret présidentiel aurait déjà dû être paraphé le 21 mai, et tout semblait prêt pour que ce soit le cas. Mais David Sacks, l’ancien « tsar » de l’IA nommé par Donald Trump, a arraché un délai de dernière minute, comme l’explique Politico.

L’ancien EO mettait en place un mécanisme volontaire de supervision pour les entreprises IA : certains modèles avancés auraient pu être soumis à un examen par plusieurs agences fédérales jusqu’à 90 jours avant leur publication. L’administration Trump avait un temps imaginé d’imposer ce dispositif aux entreprises, avant de revenir à une position moins tranchée. La perspective n’en inquiétait pas moins une partie de l’industrie, qui voyait dans ce mécanisme les prémices d’un contrôle gouvernemental plus poussé sur les modèles les plus puissants.

La mesure a notamment été imaginée suite aux craintes d’un modèle comme Mythos sur ses capacités d’attaque envers les infrastructures critiques. David Sacks, porte-voix de l’industrie en sa qualité d’associé fondateur du fonds de capital-risque Craft Ventures, aurait expliqué à Trump que les entreprises n’avaient pas besoin d’une mesure coercitive : elles coopèrent déjà volontairement. Autre argument : un examen des modèles par le gouvernement ralentirait la marche de l’IA, ce qui nuirait aux États-Unis dans sa course contre la Chine.

La signature a donc été reportée et avec elle, une bonne partie du (faible) mordant initial du décret présidentiel. La mouture finale renforce l’idée que le gouvernement fédéral n’impose pas de licence obligatoire, pas d’autorisation avant lancement, pas de « permis » pour publier un modèle. Un cadre est mis en place pour les développeurs volontaires, dans lequel ils peuvent fournir un accès anticipé à leurs modèles 30 jours maximum avant leur mise à disposition.

Le texte ordonne la création, sous les 30 jours, d’un centre de coordination de la cybersécurité liée à l’IA, en collaboration — là aussi volontaire — avec des entreprises du secteur et les opérateurs des infrastructures critiques. Il regroupera plusieurs activités aujourd’hui dispersées entre plusieurs agences du gouvernement pour détecter des vulnérabilités logicielles, mesurer les niveaux de risque de ces failles, coordonner la réponse et la diffusion des correctifs. Il s’agit d’éviter que chacun, dans le privé comme dans le public, fasse sa tambouille dans son coin. C’est louable, mais le caractère non contraignant de ce centre risque d’en diluer la force de frappe.

Un coup pour rien ?

Le décret demande également à plusieurs agences, dont la NSA et le Trésor, de mettre au point dans les 60 jours un processus d’évaluation pour déterminer les modèles IA considérés comme suffisamment puissants pour présenter un risque particulier. Les critères de ce processus resteront secrets, pour éviter que des acteurs malveillants ne connaissent les capacités qui intéressent les autorités.

L’EO ne le précise pas, mais les agences pourraient par exemple mesurer la capacité d’un modèle à découvrir des vulnérabilités zero-day, à écrire du code malveillant, à automatiser des campagnes de piratage, ou à contourner des systèmes de sécurité. Le dernier mot reviendra à la NSA, l’agence du renseignement états-unien. Le NIST, souvent considéré comme plus neutre et technique, est écarté de la décision finale.

L’EO exige aussi du ministère de la Justice de poursuivre les personnes utilisant l’IA pour pirater des systèmes, voler des données ou commettre des infractions informatiques. Si l’architecture générale entre les deux versions du texte est similaire, la version finale adoucit fortement les aspects les plus contraignants pour l’industrie, en insistant notamment sur le caractère volontaire de certaines mesures. Et surtout, elle exclut tout système de licence ou d’autorisation préalable.

  •  
❌