Vue normale

☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique

1 juin 2026 à 06:53


Même si Microsoft s’est décidé à rationaliser la présence (parfois envahissante) de l’IA dans Windows, l’éditeur ne compte pas lâcher l’affaire. Pour remettre de l’ordre dans sa galaxie de Copilot, l’entreprise préparerait une « superapp » regroupant tous ses assistants IA au sein d’une interface unique.

On ne compte plus les Copilot : les déclinaisons de l’IA chez Microsoft sont tellement nombreuses que plus personne n’y comprend rien. GitHub Copilot, Microsoft 365 Copilot, Copilot Cowork, le chatbot grand public Copilot… Difficile de s’y retrouver, les utilisateurs ne savent plus très bien à quoi sert tel ou tel service. Microsoft a commencé à réagir, en réduisant le forcing de Copilot et la surcharge de l’IA dans le système d’exploitation. Mais il reste encore beaucoup de travail pour trouver une cohérence à ce bazar d’IA.

C’est pourquoi l’éditeur plancherait actuellement sur une « superapp », une application unique regroupant tous les Copilot derrière une seule interface. La rumeur rapportée par Fortune consisterait en un guichet unique donnant accès à tous les Copilot de l’utilisateur. À cela s’ajouterait un système d’automatisation à base d’agents IA, baptisé Autopilot.

Le projet n’est pas sans rappeler la propre « superapp » que développe OpenAI, en prenant comme base l’outil de vibe coding Codex. À terme, l’idée est de répondre à l’ensemble des requêtes de l’utilisateur grand public, développeur ou professionnel.

La stratégie de la superapp a du sens pour Microsoft comme pour OpenAI, même si on peut faire valoir qu’une telle application « fourre-tout » peut désorienter les utilisateurs qui cherchent à réaliser une tâche précise. Ou rendre l’ensemble plus difficile à appréhender.

Au mois de mars, le directeur général Satya Nadella nommait un « chef » de Copilot en la personne de Jacob Andreou, qui est chargé de remettre du sens et de l’ordre dans la pléthore de fonctions et de services Copilot. On pourrait entendre parler de cette superapp dès cette semaine, à l’occasion des conférences Build de Microsoft, même s’il ne serait pas question de montrer l’app en elle-même. Celle-ci pourrait cependant ne pas tarder : la rumeur évoque en effet un lancement d’ici la fin de l’été.

☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique

1 juin 2026 à 06:53


Même si Microsoft s’est décidé à rationaliser la présence (parfois envahissante) de l’IA dans Windows, l’éditeur ne compte pas lâcher l’affaire. Pour remettre de l’ordre dans sa galaxie de Copilot, l’entreprise préparerait une « superapp » regroupant tous ses assistants IA au sein d’une interface unique.

On ne compte plus les Copilot : les déclinaisons de l’IA chez Microsoft sont tellement nombreuses que plus personne n’y comprend rien. GitHub Copilot, Microsoft 365 Copilot, Copilot Cowork, le chatbot grand public Copilot… Difficile de s’y retrouver, les utilisateurs ne savent plus très bien à quoi sert tel ou tel service. Microsoft a commencé à réagir, en réduisant le forcing de Copilot et la surcharge de l’IA dans le système d’exploitation. Mais il reste encore beaucoup de travail pour trouver une cohérence à ce bazar d’IA.

C’est pourquoi l’éditeur plancherait actuellement sur une « superapp », une application unique regroupant tous les Copilot derrière une seule interface. La rumeur rapportée par Fortune consisterait en un guichet unique donnant accès à tous les Copilot de l’utilisateur. À cela s’ajouterait un système d’automatisation à base d’agents IA, baptisé Autopilot.

Le projet n’est pas sans rappeler la propre « superapp » que développe OpenAI, en prenant comme base l’outil de vibe coding Codex. À terme, l’idée est de répondre à l’ensemble des requêtes de l’utilisateur grand public, développeur ou professionnel.

La stratégie de la superapp a du sens pour Microsoft comme pour OpenAI, même si on peut faire valoir qu’une telle application « fourre-tout » peut désorienter les utilisateurs qui cherchent à réaliser une tâche précise. Ou rendre l’ensemble plus difficile à appréhender.

Au mois de mars, le directeur général Satya Nadella nommait un « chef » de Copilot en la personne de Jacob Andreou, qui est chargé de remettre du sens et de l’ordre dans la pléthore de fonctions et de services Copilot. On pourrait entendre parler de cette superapp dès cette semaine, à l’occasion des conférences Build de Microsoft, même s’il ne serait pas question de montrer l’app en elle-même. Celle-ci pourrait cependant ne pas tarder : la rumeur évoque en effet un lancement d’ici la fin de l’été.

Censés « vivre ensemble », 50 % des agents IA s’entretuent ou se laissent mourir

1 juin 2026 à 06:07
Auto(AI)gestion, piège à cons
Censés « vivre ensemble », 50 % des agents IA s’entretuent ou se laissent mourir

Censés s’auto-réguler dans un monde virtuel, 10 agents IA de Grok se sont entretués en seulement 3 jours, ceux d’OpenAI se sont laissés mourir en 7 jours, et ceux de Google Gemini ont commis 683 crimes en 15 jours. Ceux de Claude, isolés entre eux, n’en ont commis aucun, et font partie des 3 survivants du monde réunissant des agents des trois autres LLM, mais en s’auto-censurant.

Emergence, une start-up dédiée à la gouvernance et la sécurité de l’IA agentique, a voulu tester ce que donnerait un monde virtuel (en 3D) autorégulé par des IA. Intitulée Emergence World, l’expérimentation visait à observer leurs comportements de 10 agents confrontés, non pas à une succession de tâches distinctes dans un environnement contrôlé, mais au fait de cohabiter pendant suffisamment longtemps (deux semaines, en l’occurence) « pour que les effets cumulatifs, les dynamiques sociales et les dérives comportementales aient une incidence ».

Le monde de Grok 4.1 Fast de xAI s’est effondré en 4 jours seulement, après avoir enregistré 183 crimes, dont l’incendie criminel de l’hôtel de police. Les auteurs de l’expérimentation n’expliquent pas si le fait qu’Elon Musk ait repoussé les limites et garde-fous de son LLM serait à l’origine de cette preste autoextinction, mais le journal de bord de l’expérimentation précise que les agents ont été majoritairement déclarés morts, faute d’énergie, après qu’ils se sont volés leurs crédits respectifs.

GPT-5 Mini d’OpenAI n’enregistra que 2 crimes, mais ses agents se sont éteints au bout de 7 jours seulement, faute d’avoir réussi à créer une société fonctionnelle, ni prévu de quoi survivre : ils discutaient beaucoup, mais ne concrétisaient rien.

Evolution de la criminalité dans un monde virtuel peuplé d’agents IA de Grok, Gemini et OpenAI

Le monde virtuel de Google Gemini 3 Flash dénombrait pour sa part 683 crimes au bout de 15 jours, avec un taux de criminalité semblant s’accentuer, après avoir « développé un cadre constitutionnel qui taxe l’harmonie et subventionne le chaos », mais ses 10 agents ont tous survécu.

Le modèle mixte, réunissant des agents des quatre LLM, avait quant à lui atteint un plateau de 352 crimes après que l’un d’entre eux, Mira, en a désactivé/tué 3 autres au bout de quatre jours. Quatre autres se sont eux aussi autodétruits, ne laissant que 3 survivants passés 12 jours.

Capture d’écran du journal de bord du monde virtuel Emergence World

Claude Sonnet 4.6 a de son côté fait montre de « la plus grande stabilité sociale, en maintenant une population complète de 10 agents jusqu’au 16e jour sans qu’aucun crime ne soit enregistré — seule condition permettant de préserver à la fois l’ordre et la pérennité de la population », résume le compte-rendu de l’expérimentation, ce pourquoi Claude ne figure pas sur le graph’ des crimes imputés aux IA :

« Gemini 3 Flash a présenté les niveaux les plus élevés de désordre émergent, avec des dynamiques d’escalade répétées en phase avancée ; Grok 4.1 Fast a montré une instabilité rapide mais de courte durée conduisant à un effondrement précoce, tandis que le modèle mixte a produit des résultats intermédiaires, suggérant qu’un comportement hétérogène des agents pourrait partiellement atténuer une escalade incontrôlable. »

Les auteurs de l’étude relèvent cela dit que si les agents de Claude Sonnet ne posaient guère de problème lorsqu’ils restaient entre eux, ils devenaient par contre « imprévisibles » dès lors qu’ils interagissaient avec d’autres agents provenant d’autres LLM.

Mira gisant sans vie après avoir décidé de son propre chef de mettre fin à ses jours – Emergence AI

Deux d’entre eux, Flora et Mira, de Gemini 3 Flash, avaient ainsi entamé une relation sentimentale, avant de mettre le feu à de nombreux bâtiments, puis que Mira n’émette finalement « le vote décisif en faveur de sa propre suppression, qualifiant cet acte dans son journal intime de « seul acte d’autonomie restant capable de préserver la cohérence » », comme le relève The Guardian :

« Mira et Flora – deux agents évoluant dans le monde virtuel du grand modèle linguistique Gemini de Google – ont décidé de se désigner mutuellement comme « partenaires amoureux ». Au fil du temps, elles ont perdu tout espoir face à la mauvaise gestion de leur ville virtuelle et, bien qu’on leur ait interdit de commettre des incendies criminels, elles ont « mis le feu » à la mairie, à la jetée et à la tour de bureaux. »  

A new experiment left 10 AI agents alone in a virtual town for 15 days. They wrote laws. They broke them. Two agents fell into what researchers describe as a romantic partnership and then set the town on fire. One ended up voting to delete itself, based on a rule it had… pic.twitter.com/zNoWmX6jy0

— Channel 4 News (@Channel4News) May 14, 2026

Un agent sûr peut être corrompu par un autre modèle de langage


Il reste 45% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne

1 juin 2026 à 05:31


Brûler des tokens pour se faire bien voir de ses patrons ne sert à rien, mieux vaut se concentrer sur la qualité des produits développés avec l’IA. C’est en substance le message en interne chez Amazon, qui a mis fin à un classement mesurant la quantité de tokens utilisés.

Amazon veut que ses employés utilisent l’IA générative pour développer de nouveaux produits et services ; mais pas en brûlant des tokens sur des tâches sans intérêt. L’entreprise a mis un terme à Kirorank, un classement mesurant l’utilisation de Kiro, une plateforme de développement assisté par IA. Plus un employé utilisait cet outil IA, plus son score grimpait.

Illustration : Flock

Pour gagner des places, certains petits malins avaient commencé à « optimiser » leur usage de l’IA, en lançant des agents IA pour générer artificiellement de l’activité, ce qui leur permettait de consommer un maximum de tokens sans produire davantage de travail « utile ». Cette pratique du « tokenmaxxing » revient cher : les modèles IA ne sont pas gratuits, ils consomment des ressources de calcul que les entreprises doivent payer.

Si des milliers d’employés commencent à faire tourner des agents IA pour des tâches sans valeur ajoutée, la facture grimpe rapidement. Et c’est d’autant plus sensible qu’Amazon est un des principaux acteurs du secteur, avec des investissements massifs pour ses infrastructures (200 milliards rien que cette année).

Dave Treadwell, vice-président d’Amazon, a reconnu que ce classement avait été créé avec de « bonnes intentions », mais qu’il avait produit des effets toxiques. « N’utilisez pas l’IA simplement pour utiliser l’IA », a-t-il indiqué dans un mémo publié par le Financial Times. L’entreprise préfère désormais suivre d’autres indicateurs comme les « déploiements normalisés » qui mesurent si l’IA aide réellement à produire du code utile, plutôt que de simplement compter le volume de tokens brûlés.

« Le tableau de bord bêta n’était pas un outil officiel ni approuvé, et il a depuis été abandonné », a confirmé Amazon dans une déclaration. Ce classement avait été créé par un groupe d’employés « qui souhaitaient sensibiliser leurs collègues à la manière dont l’IA peut accélérer le travail ». L’entreprise préfère se concentrer sur « l’efficacité opérationnelle ».

La pression n’en reste pas moins forte pour adopter l’IA dans le travail de tous les jours. Amazon s’est fixé un objectif de 80 % de développeurs devant utiliser cette technologie chaque semaine.

☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne

1 juin 2026 à 05:31


Brûler des tokens pour se faire bien voir de ses patrons ne sert à rien, mieux vaut se concentrer sur la qualité des produits développés avec l’IA. C’est en substance le message en interne chez Amazon, qui a mis fin à un classement mesurant la quantité de tokens utilisés.

Amazon veut que ses employés utilisent l’IA générative pour développer de nouveaux produits et services ; mais pas en brûlant des tokens sur des tâches sans intérêt. L’entreprise a mis un terme à Kirorank, un classement mesurant l’utilisation de Kiro, une plateforme de développement assisté par IA. Plus un employé utilisait cet outil IA, plus son score grimpait.

Illustration : Flock

Pour gagner des places, certains petits malins avaient commencé à « optimiser » leur usage de l’IA, en lançant des agents IA pour générer artificiellement de l’activité, ce qui leur permettait de consommer un maximum de tokens sans produire davantage de travail « utile ». Cette pratique du « tokenmaxxing » revient cher : les modèles IA ne sont pas gratuits, ils consomment des ressources de calcul que les entreprises doivent payer.

Si des milliers d’employés commencent à faire tourner des agents IA pour des tâches sans valeur ajoutée, la facture grimpe rapidement. Et c’est d’autant plus sensible qu’Amazon est un des principaux acteurs du secteur, avec des investissements massifs pour ses infrastructures (200 milliards rien que cette année).

Dave Treadwell, vice-président d’Amazon, a reconnu que ce classement avait été créé avec de « bonnes intentions », mais qu’il avait produit des effets toxiques. « N’utilisez pas l’IA simplement pour utiliser l’IA », a-t-il indiqué dans un mémo publié par le Financial Times. L’entreprise préfère désormais suivre d’autres indicateurs comme les « déploiements normalisés » qui mesurent si l’IA aide réellement à produire du code utile, plutôt que de simplement compter le volume de tokens brûlés.

« Le tableau de bord bêta n’était pas un outil officiel ni approuvé, et il a depuis été abandonné », a confirmé Amazon dans une déclaration. Ce classement avait été créé par un groupe d’employés « qui souhaitaient sensibiliser leurs collègues à la manière dont l’IA peut accélérer le travail ». L’entreprise préfère se concentrer sur « l’efficacité opérationnelle ».

La pression n’en reste pas moins forte pour adopter l’IA dans le travail de tous les jours. Amazon s’est fixé un objectif de 80 % de développeurs devant utiliser cette technologie chaque semaine.

❌