Vue lecture

☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique



Même si Microsoft s’est décidé à rationaliser la présence (parfois envahissante) de l’IA dans Windows, l’éditeur ne compte pas lâcher l’affaire. Pour remettre de l’ordre dans sa galaxie de Copilot, l’entreprise préparerait une « superapp » regroupant tous ses assistants IA au sein d’une interface unique.

On ne compte plus les Copilot : les déclinaisons de l’IA chez Microsoft sont tellement nombreuses que plus personne n’y comprend rien. GitHub Copilot, Microsoft 365 Copilot, Copilot Cowork, le chatbot grand public Copilot… Difficile de s’y retrouver, les utilisateurs ne savent plus très bien à quoi sert tel ou tel service. Microsoft a commencé à réagir, en réduisant le forcing de Copilot et la surcharge de l’IA dans le système d’exploitation. Mais il reste encore beaucoup de travail pour trouver une cohérence à ce bazar d’IA.

C’est pourquoi l’éditeur plancherait actuellement sur une « superapp », une application unique regroupant tous les Copilot derrière une seule interface. La rumeur rapportée par Fortune consisterait en un guichet unique donnant accès à tous les Copilot de l’utilisateur. À cela s’ajouterait un système d’automatisation à base d’agents IA, baptisé Autopilot.

Le projet n’est pas sans rappeler la propre « superapp » que développe OpenAI, en prenant comme base l’outil de vibe coding Codex. À terme, l’idée est de répondre à l’ensemble des requêtes de l’utilisateur grand public, développeur ou professionnel.

La stratégie de la superapp a du sens pour Microsoft comme pour OpenAI, même si on peut faire valoir qu’une telle application « fourre-tout » peut désorienter les utilisateurs qui cherchent à réaliser une tâche précise. Ou rendre l’ensemble plus difficile à appréhender.

Au mois de mars, le directeur général Satya Nadella nommait un « chef » de Copilot en la personne de Jacob Andreou, qui est chargé de remettre du sens et de l’ordre dans la pléthore de fonctions et de services Copilot. On pourrait entendre parler de cette superapp dès cette semaine, à l’occasion des conférences Build de Microsoft, même s’il ne serait pas question de montrer l’app en elle-même. Celle-ci pourrait cependant ne pas tarder : la rumeur évoque en effet un lancement d’ici la fin de l’été.

  •  

☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique



Même si Microsoft s’est décidé à rationaliser la présence (parfois envahissante) de l’IA dans Windows, l’éditeur ne compte pas lâcher l’affaire. Pour remettre de l’ordre dans sa galaxie de Copilot, l’entreprise préparerait une « superapp » regroupant tous ses assistants IA au sein d’une interface unique.

On ne compte plus les Copilot : les déclinaisons de l’IA chez Microsoft sont tellement nombreuses que plus personne n’y comprend rien. GitHub Copilot, Microsoft 365 Copilot, Copilot Cowork, le chatbot grand public Copilot… Difficile de s’y retrouver, les utilisateurs ne savent plus très bien à quoi sert tel ou tel service. Microsoft a commencé à réagir, en réduisant le forcing de Copilot et la surcharge de l’IA dans le système d’exploitation. Mais il reste encore beaucoup de travail pour trouver une cohérence à ce bazar d’IA.

C’est pourquoi l’éditeur plancherait actuellement sur une « superapp », une application unique regroupant tous les Copilot derrière une seule interface. La rumeur rapportée par Fortune consisterait en un guichet unique donnant accès à tous les Copilot de l’utilisateur. À cela s’ajouterait un système d’automatisation à base d’agents IA, baptisé Autopilot.

Le projet n’est pas sans rappeler la propre « superapp » que développe OpenAI, en prenant comme base l’outil de vibe coding Codex. À terme, l’idée est de répondre à l’ensemble des requêtes de l’utilisateur grand public, développeur ou professionnel.

La stratégie de la superapp a du sens pour Microsoft comme pour OpenAI, même si on peut faire valoir qu’une telle application « fourre-tout » peut désorienter les utilisateurs qui cherchent à réaliser une tâche précise. Ou rendre l’ensemble plus difficile à appréhender.

Au mois de mars, le directeur général Satya Nadella nommait un « chef » de Copilot en la personne de Jacob Andreou, qui est chargé de remettre du sens et de l’ordre dans la pléthore de fonctions et de services Copilot. On pourrait entendre parler de cette superapp dès cette semaine, à l’occasion des conférences Build de Microsoft, même s’il ne serait pas question de montrer l’app en elle-même. Celle-ci pourrait cependant ne pas tarder : la rumeur évoque en effet un lancement d’ici la fin de l’été.

  •  

Censés « vivre ensemble », 50 % des agents IA s’entretuent ou se laissent mourir

Auto(AI)gestion, piège à cons
Censés « vivre ensemble », 50 % des agents IA s’entretuent ou se laissent mourir

Censés s’auto-réguler dans un monde virtuel, 10 agents IA de Grok se sont entretués en seulement 3 jours, ceux d’OpenAI se sont laissés mourir en 7 jours, et ceux de Google Gemini ont commis 683 crimes en 15 jours. Ceux de Claude, isolés entre eux, n’en ont commis aucun, et font partie des 3 survivants du monde réunissant des agents des trois autres LLM, mais en s’auto-censurant.

Emergence, une start-up dédiée à la gouvernance et la sécurité de l’IA agentique, a voulu tester ce que donnerait un monde virtuel (en 3D) autorégulé par des IA. Intitulée Emergence World, l’expérimentation visait à observer leurs comportements de 10 agents confrontés, non pas à une succession de tâches distinctes dans un environnement contrôlé, mais au fait de cohabiter pendant suffisamment longtemps (deux semaines, en l’occurence) « pour que les effets cumulatifs, les dynamiques sociales et les dérives comportementales aient une incidence ».

Le monde de Grok 4.1 Fast de xAI s’est effondré en 4 jours seulement, après avoir enregistré 183 crimes, dont l’incendie criminel de l’hôtel de police. Les auteurs de l’expérimentation n’expliquent pas si le fait qu’Elon Musk ait repoussé les limites et garde-fous de son LLM serait à l’origine de cette preste autoextinction, mais le journal de bord de l’expérimentation précise que les agents ont été majoritairement déclarés morts, faute d’énergie, après qu’ils se sont volés leurs crédits respectifs.

GPT-5 Mini d’OpenAI n’enregistra que 2 crimes, mais ses agents se sont éteints au bout de 7 jours seulement, faute d’avoir réussi à créer une société fonctionnelle, ni prévu de quoi survivre : ils discutaient beaucoup, mais ne concrétisaient rien.

Evolution de la criminalité dans un monde virtuel peuplé d’agents IA de Grok, Gemini et OpenAI

Le monde virtuel de Google Gemini 3 Flash dénombrait pour sa part 683 crimes au bout de 15 jours, avec un taux de criminalité semblant s’accentuer, après avoir « développé un cadre constitutionnel qui taxe l’harmonie et subventionne le chaos », mais ses 10 agents ont tous survécu.

Le modèle mixte, réunissant des agents des quatre LLM, avait quant à lui atteint un plateau de 352 crimes après que l’un d’entre eux, Mira, en a désactivé/tué 3 autres au bout de quatre jours. Quatre autres se sont eux aussi autodétruits, ne laissant que 3 survivants passés 12 jours.

Capture d’écran du journal de bord du monde virtuel Emergence World

Claude Sonnet 4.6 a de son côté fait montre de « la plus grande stabilité sociale, en maintenant une population complète de 10 agents jusqu’au 16e jour sans qu’aucun crime ne soit enregistré — seule condition permettant de préserver à la fois l’ordre et la pérennité de la population », résume le compte-rendu de l’expérimentation, ce pourquoi Claude ne figure pas sur le graph’ des crimes imputés aux IA :

« Gemini 3 Flash a présenté les niveaux les plus élevés de désordre émergent, avec des dynamiques d’escalade répétées en phase avancée ; Grok 4.1 Fast a montré une instabilité rapide mais de courte durée conduisant à un effondrement précoce, tandis que le modèle mixte a produit des résultats intermédiaires, suggérant qu’un comportement hétérogène des agents pourrait partiellement atténuer une escalade incontrôlable. »

Les auteurs de l’étude relèvent cela dit que si les agents de Claude Sonnet ne posaient guère de problème lorsqu’ils restaient entre eux, ils devenaient par contre « imprévisibles » dès lors qu’ils interagissaient avec d’autres agents provenant d’autres LLM.

Mira gisant sans vie après avoir décidé de son propre chef de mettre fin à ses jours – Emergence AI

Deux d’entre eux, Flora et Mira, de Gemini 3 Flash, avaient ainsi entamé une relation sentimentale, avant de mettre le feu à de nombreux bâtiments, puis que Mira n’émette finalement « le vote décisif en faveur de sa propre suppression, qualifiant cet acte dans son journal intime de « seul acte d’autonomie restant capable de préserver la cohérence » », comme le relève The Guardian :

« Mira et Flora – deux agents évoluant dans le monde virtuel du grand modèle linguistique Gemini de Google – ont décidé de se désigner mutuellement comme « partenaires amoureux ». Au fil du temps, elles ont perdu tout espoir face à la mauvaise gestion de leur ville virtuelle et, bien qu’on leur ait interdit de commettre des incendies criminels, elles ont « mis le feu » à la mairie, à la jetée et à la tour de bureaux. »  

A new experiment left 10 AI agents alone in a virtual town for 15 days. They wrote laws. They broke them. Two agents fell into what researchers describe as a romantic partnership and then set the town on fire. One ended up voting to delete itself, based on a rule it had… pic.twitter.com/zNoWmX6jy0

— Channel 4 News (@Channel4News) May 14, 2026

Un agent sûr peut être corrompu par un autre modèle de langage


Il reste 45% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne



Brûler des tokens pour se faire bien voir de ses patrons ne sert à rien, mieux vaut se concentrer sur la qualité des produits développés avec l’IA. C’est en substance le message en interne chez Amazon, qui a mis fin à un classement mesurant la quantité de tokens utilisés.

Amazon veut que ses employés utilisent l’IA générative pour développer de nouveaux produits et services ; mais pas en brûlant des tokens sur des tâches sans intérêt. L’entreprise a mis un terme à Kirorank, un classement mesurant l’utilisation de Kiro, une plateforme de développement assisté par IA. Plus un employé utilisait cet outil IA, plus son score grimpait.

Illustration : Flock

Pour gagner des places, certains petits malins avaient commencé à « optimiser » leur usage de l’IA, en lançant des agents IA pour générer artificiellement de l’activité, ce qui leur permettait de consommer un maximum de tokens sans produire davantage de travail « utile ». Cette pratique du « tokenmaxxing » revient cher : les modèles IA ne sont pas gratuits, ils consomment des ressources de calcul que les entreprises doivent payer.

Si des milliers d’employés commencent à faire tourner des agents IA pour des tâches sans valeur ajoutée, la facture grimpe rapidement. Et c’est d’autant plus sensible qu’Amazon est un des principaux acteurs du secteur, avec des investissements massifs pour ses infrastructures (200 milliards rien que cette année).

Dave Treadwell, vice-président d’Amazon, a reconnu que ce classement avait été créé avec de « bonnes intentions », mais qu’il avait produit des effets toxiques. « N’utilisez pas l’IA simplement pour utiliser l’IA », a-t-il indiqué dans un mémo publié par le Financial Times. L’entreprise préfère désormais suivre d’autres indicateurs comme les « déploiements normalisés » qui mesurent si l’IA aide réellement à produire du code utile, plutôt que de simplement compter le volume de tokens brûlés.

« Le tableau de bord bêta n’était pas un outil officiel ni approuvé, et il a depuis été abandonné », a confirmé Amazon dans une déclaration. Ce classement avait été créé par un groupe d’employés « qui souhaitaient sensibiliser leurs collègues à la manière dont l’IA peut accélérer le travail ». L’entreprise préfère se concentrer sur « l’efficacité opérationnelle ».

La pression n’en reste pas moins forte pour adopter l’IA dans le travail de tous les jours. Amazon s’est fixé un objectif de 80 % de développeurs devant utiliser cette technologie chaque semaine.

  •  

☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne



Brûler des tokens pour se faire bien voir de ses patrons ne sert à rien, mieux vaut se concentrer sur la qualité des produits développés avec l’IA. C’est en substance le message en interne chez Amazon, qui a mis fin à un classement mesurant la quantité de tokens utilisés.

Amazon veut que ses employés utilisent l’IA générative pour développer de nouveaux produits et services ; mais pas en brûlant des tokens sur des tâches sans intérêt. L’entreprise a mis un terme à Kirorank, un classement mesurant l’utilisation de Kiro, une plateforme de développement assisté par IA. Plus un employé utilisait cet outil IA, plus son score grimpait.

Illustration : Flock

Pour gagner des places, certains petits malins avaient commencé à « optimiser » leur usage de l’IA, en lançant des agents IA pour générer artificiellement de l’activité, ce qui leur permettait de consommer un maximum de tokens sans produire davantage de travail « utile ». Cette pratique du « tokenmaxxing » revient cher : les modèles IA ne sont pas gratuits, ils consomment des ressources de calcul que les entreprises doivent payer.

Si des milliers d’employés commencent à faire tourner des agents IA pour des tâches sans valeur ajoutée, la facture grimpe rapidement. Et c’est d’autant plus sensible qu’Amazon est un des principaux acteurs du secteur, avec des investissements massifs pour ses infrastructures (200 milliards rien que cette année).

Dave Treadwell, vice-président d’Amazon, a reconnu que ce classement avait été créé avec de « bonnes intentions », mais qu’il avait produit des effets toxiques. « N’utilisez pas l’IA simplement pour utiliser l’IA », a-t-il indiqué dans un mémo publié par le Financial Times. L’entreprise préfère désormais suivre d’autres indicateurs comme les « déploiements normalisés » qui mesurent si l’IA aide réellement à produire du code utile, plutôt que de simplement compter le volume de tokens brûlés.

« Le tableau de bord bêta n’était pas un outil officiel ni approuvé, et il a depuis été abandonné », a confirmé Amazon dans une déclaration. Ce classement avait été créé par un groupe d’employés « qui souhaitaient sensibiliser leurs collègues à la manière dont l’IA peut accélérer le travail ». L’entreprise préfère se concentrer sur « l’efficacité opérationnelle ».

La pression n’en reste pas moins forte pour adopter l’IA dans le travail de tous les jours. Amazon s’est fixé un objectif de 80 % de développeurs devant utiliser cette technologie chaque semaine.

  •  

Deezer : les chansons générées par IA, « un problème pour toute la filière musicale »

De l'IA entre les oreilles
Deezer : les chansons générées par IA, « un problème pour toute la filière musicale »

Les serveurs des services de streaming musicaux sont pris d’assaut par les morceaux générés par IA. Et ce n’est pas une exagération : Deezer a révélé que 44 % des chansons provenant de ses fournisseurs sont générées par IA. Des volumes ahurissants que l’industrie tout entière devrait apprendre à gérer collectivement, selon Aurélien Hérault, le directeur de l’innovation de la plateforme française.

« Contenu généré par IA » : c’est la petite phrase qui apparait sur les albums qui contiennent des titres identifiés par Deezer comme ayant été générés avec l’aide d’une IA. Le service de streaming communique régulièrement son travail de fond sur une problématique qui touche toutes les plateformes : développement d’un outil de détection mis à disposition de la filière, effort de transparence vis-à-vis des abonnés, et lutte contre les fraudes au streaming qui accompagnent souvent ces chansons IA.

Capture d’écran du message affiché par Deezer sur les contenus générés par IA

Aurélien Hérault est le directeur de l’innovation chez Deezer. Il est à la tête des équipes qui planchent sur les projets R&D de l’entreprise, qu’il s’agisse des algorithmes de recommandations, des fonctions de recherche ou des expérimentations sur de nouvelles technologies. Pour Next, il revient en détail sur le chantier de l’IA.

L’entretien a été édité pour des raisons de concision et de clarté.

Deezer a annoncé que 44 % des chansons téléversées sur les serveurs sont générées par IA, ce qui représente 75 000 chansons chaque jour. D’où viennent toutes ces chansons ? On s’approche du moment où la majorité des morceaux téléversés seront générés par IA.

C’est la raison pour laquelle nous avons développé l’année dernière un détecteur d’IA pour les morceaux uploadés par tous les fournisseurs avec qui nous avons un partenariat. Il y a notamment dans le lot des plateformes qui permettent à des indépendants de livrer du contenu. Et ce qu’on remarque aujourd’hui, c’est le nombre de plus en plus important de morceaux générés par IA. Si vous vous souvenez des chiffres de l’année dernière, on est clairement dans une augmentation continue.

Nous poursuivons nos déploiements sur un certain nombre d’outils. Aujourd’hui, il y a ce qu’on appelle le DDEX, [une organisation] censée répondre à ce genre de problématique : est-ce que c’est un morceau fait par IA ou non ? Aujourd’hui [ce standard de métadonnées] n’est pas encore exploité ou démocratisé chez l’ensemble des acteurs. C’est pour ça qu’on a mis en place nos technologies qui nous permettent de vérifier et de s’assurer si les contenus sont générés par IA ou pas.

Comment Deezer détecte les morceaux générés par IA ?

Il faut savoir que les modèles génératifs sont des modèles prédictifs, statistiques, qui sont entraînés pour générer de la musique ou des vidéos réalistes. Comment faisons-nous pour les détecter ? La production de ces modèles génératifs laisse des traces inaudibles dans le signal audio, caractéristiques de ces modèles. On a développé une technologie capable de détecter ce type de caractéristiques, à partir du signal audio. Ça nous donne une vision assez précise et assez juste de ce qui nous est livré en termes d’IA. Et on continue d’ailleurs à investir et à développer ce type de technologies.

Comment est-ce présenté aux abonnés de la plateforme ?

Il y a un affichage auprès du grand public sur les pages des albums pour informer s’ils contiennent des musiques générées par IA ou pas. C’est une première facette. Et la seconde facette, c’est notre parti-pris d’enlever [le contenu IA] de nos systèmes de recommandation. C’est-à-dire qu’on ne favorise pas ce type de contenu à l’aide de nos algorithmes.

Est-ce qu’il ne serait pas plus simple finalement que Deezer supprime ces chansons du catalogue ?

Il y a plusieurs aspects à prendre en compte. Déjà, on a un aspect légal et des contrats avec nos distributeurs. Une des obligations est que nous devons publier ce qu’on nous donne. C’est quelque chose qui existe depuis les débuts de Deezer. Mais on souhaite aussi apporter de la transparence à nos utilisateurs.

La seule chose que nous faisons, c’est d’identifier ces morceaux pour pouvoir, à l’avenir, faire évoluer le service, comme par exemple bloquer ces titres dans nos recommandations, ou en étant encore plus sévère. On a une approche très analytique du projet. On essaye de vraiment mesurer les impacts avant de faire évoluer le système.

Spotify vient de mettre en place un badge sur les morceaux qui sont effectivement vérifiés et créés par des humains. Quelle est la différence entre les outils utilisés par Spotify et ceux de Deezer ?


Il reste 62% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

La vérité si je mens
Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

Ça n’aura pas traîné : à peine 40 jours après le lancement d’Opus 4.7, Anthropic remet le couvert avec une nouvelle version de son modèle IA le plus avancé (hors Mythos). Opus 4.8 inaugure une nouvelle fonction pour améliorer la prise en charge des requêtes très complexes, réduire les erreurs, ainsi qu’un nouveau mode « fast » pour brûler moins de tokens.

Impossible d’arrêter le feu roulant des nouveaux modèles chez Anthropic. Opus 4.7 remonte au 16 avril, mais il est déjà passé de mode : son successeur, Opus 4.8, a en effet été annoncé par le labo IA. Le modèle apporte des améliorations « modestes mais tangibles », affirme l’entreprise, à commencer par… une plus grande prudence quand il ne sait pas quelque chose.

Plus d’honnêteté, moins de tokens

Selon les testeurs cités par Anthropic, Opus 4.8 se montre plus honnête : il signale plus facilement ses incertitudes, évite les affirmations qui ne sont pas vérifiées et laisse moins passer de bugs sans les mentionner. « Un problème général avec les modèles d’IA, c’est qu’ils tirent parfois des conclusions hâtives, en affirmant avec assurance avoir progressé dans leur travail alors que les preuves sont minces », explique la startup. Elle affirme que le nouveau modèle est « environ quatre fois moins susceptible » de laisser des défauts non signalés dans le code, par rapport à son prédécesseur.

Autre nouveauté : une fonction expérimentale baptisée « dynamic workflows » pour Claude Code. Le modèle est en mesure de gérer de très gros projets logiciels en parallèle, ce qui lui permet de les découper en petits bouts, de lancer des centaines de sous-agents en simultané et de vérifier automatiquement les résultats avant de répondre. Anthropic donne en exemple une migration massive de bases de code contenant « des centaines de milliers de lignes ».

Image : Anthropic

En termes de benchmarks, Opus 4.8 affiche des gains incrémentaux sur la plupart des tests (+ 4,9 points sur SWE-Bench Pro,+ 8,5 points sur Terminal-Bench…). Anthropic ne fait pas de bond spectaculaire ici, mais améliore l’existant par petites touches et maintient sa position sur les tâches agentiques. C’est cohérent avec la stratégie de la startup qui vise d’abord les développeurs et les entreprises : sur SWE-Bench Pro (agents de programmation), Opus 4.8 est loin devant GPT-5.5 et Gemini 3.1 Pro. Le modèle d’OpenAI reste cependant le patron sur Terminal-Bench, qui mesure des tâches très proches d’un vrai environnement développeur.

La brûlure des tokens

Un des changements les plus importants de cette nouvelle livrée est un réglage d’effort dans claude.ai et Cowork. L’utilisateur peut sélectionner le niveau de ressources à consacrer à une réponse : un effort « faible » retournera des réponses moins précises mais le processus de réflexion sera plus rapide et surtout moins coûteux, à l’inverse d’un effort plus élevé. Par défaut, Opus 4.8 est réglé sur un effort élevé, qui offre selon Anthrophic le meilleur équilibre entre « qualité et expérience utilisateur ».

Sur les travaux de code, ce niveau d’effort consomme le même volume de tokens qu’Opus 4.7 par défaut, « mais avec de meilleures performances ». Cette question des tokens est devenu très sensible, Opus 4.7 se montrant très gourmand en la matière. Une critique qui n’a pas échappé à Anthropic : les limites d’utilisation dans Claude Code ont été relevées pour les niveaux d’effort supérieurs.

Toujours dans cette même optique, Anthropic a révisé fortement à la baisse le coût du mode « rapide » pour Opus 4.8, désormais trois fois moins onéreux que son équivalent sur Opus 4.7. Ce mode, qui travaille 2,5 fois plus vite, revient maintenant à 10 dollars par million de tokens en entrée, et 50 dollars par million de tokens en sortie. C’est trois fois moins cher que pour les précédents modèles (30/150 dollars). Les tarifs pour un usage standard d’Opus 4.8 ne changent pas : 5 dollars par million de tokens en entrée, 25 dollars en sortie.

Enfin, fidèle à une stratégie marketing bien rodée, Anthropic fait miroiter le lancement « dans les prochaines semaines » de modèles grand public basés sur Mythos, le fameux LLM tellement balaise qu’il n’est distribué qu’au compte-goutte au travers du projet Glasswing.

L’entreprise explique que le développement de garde-fous avance bien. Ces mécanismes de sécurité seraient nécessaires pour éviter que les capacités de Mythos ne puissent servir aux pirates pour exploiter des failles. Ces nouveautés et cette agitation autour de Mythos est de bon aloi, alors qu’Anthropic s’apprête selon les rumeurs à se lancer en bourse d’ici la fin de l’année, alors même que l’entreprise vient de boucler une nouvelle levée de fonds record.

  •  

Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

La vérité si je mens
Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

Ça n’aura pas traîné : à peine 40 jours après le lancement d’Opus 4.7, Anthropic remet le couvert avec une nouvelle version de son modèle IA le plus avancé (hors Mythos). Opus 4.8 inaugure une nouvelle fonction pour améliorer la prise en charge des requêtes très complexes, réduire les erreurs, ainsi qu’un nouveau mode « fast » pour brûler moins de tokens.

Impossible d’arrêter le feu roulant des nouveaux modèles chez Anthropic. Opus 4.7 remonte au 16 avril, mais il est déjà passé de mode : son successeur, Opus 4.8, a en effet été annoncé par le labo IA. Le modèle apporte des améliorations « modestes mais tangibles », affirme l’entreprise, à commencer par… une plus grande prudence quand il ne sait pas quelque chose.

Plus d’honnêteté, moins de tokens

Selon les testeurs cités par Anthropic, Opus 4.8 se montre plus honnête : il signale plus facilement ses incertitudes, évite les affirmations qui ne sont pas vérifiées et laisse moins passer de bugs sans les mentionner. « Un problème général avec les modèles d’IA, c’est qu’ils tirent parfois des conclusions hâtives, en affirmant avec assurance avoir progressé dans leur travail alors que les preuves sont minces », explique la startup. Elle affirme que le nouveau modèle est « environ quatre fois moins susceptible » de laisser des défauts non signalés dans le code, par rapport à son prédécesseur.

Autre nouveauté : une fonction expérimentale baptisée « dynamic workflows » pour Claude Code. Le modèle est en mesure de gérer de très gros projets logiciels en parallèle, ce qui lui permet de les découper en petits bouts, de lancer des centaines de sous-agents en simultané et de vérifier automatiquement les résultats avant de répondre. Anthropic donne en exemple une migration massive de bases de code contenant « des centaines de milliers de lignes ».

Image : Anthropic

En termes de benchmarks, Opus 4.8 affiche des gains incrémentaux sur la plupart des tests (+ 4,9 points sur SWE-Bench Pro,+ 8,5 points sur Terminal-Bench…). Anthropic ne fait pas de bond spectaculaire ici, mais améliore l’existant par petites touches et maintient sa position sur les tâches agentiques. C’est cohérent avec la stratégie de la startup qui vise d’abord les développeurs et les entreprises : sur SWE-Bench Pro (agents de programmation), Opus 4.8 est loin devant GPT-5.5 et Gemini 3.1 Pro. Le modèle d’OpenAI reste cependant le patron sur Terminal-Bench, qui mesure des tâches très proches d’un vrai environnement développeur.

La brûlure des tokens

Un des changements les plus importants de cette nouvelle livrée est un réglage d’effort dans claude.ai et Cowork. L’utilisateur peut sélectionner le niveau de ressources à consacrer à une réponse : un effort « faible » retournera des réponses moins précises mais le processus de réflexion sera plus rapide et surtout moins coûteux, à l’inverse d’un effort plus élevé. Par défaut, Opus 4.8 est réglé sur un effort élevé, qui offre selon Anthrophic le meilleur équilibre entre « qualité et expérience utilisateur ».

Sur les travaux de code, ce niveau d’effort consomme le même volume de tokens qu’Opus 4.7 par défaut, « mais avec de meilleures performances ». Cette question des tokens est devenu très sensible, Opus 4.7 se montrant très gourmand en la matière. Une critique qui n’a pas échappé à Anthropic : les limites d’utilisation dans Claude Code ont été relevées pour les niveaux d’effort supérieurs.

Toujours dans cette même optique, Anthropic a révisé fortement à la baisse le coût du mode « rapide » pour Opus 4.8, désormais trois fois moins onéreux que son équivalent sur Opus 4.7. Ce mode, qui travaille 2,5 fois plus vite, revient maintenant à 10 dollars par million de tokens en entrée, et 50 dollars par million de tokens en sortie. C’est trois fois moins cher que pour les précédents modèles (30/150 dollars). Les tarifs pour un usage standard d’Opus 4.8 ne changent pas : 5 dollars par million de tokens en entrée, 25 dollars en sortie.

Enfin, fidèle à une stratégie marketing bien rodée, Anthropic fait miroiter le lancement « dans les prochaines semaines » de modèles grand public basés sur Mythos, le fameux LLM tellement balaise qu’il n’est distribué qu’au compte-goutte au travers du projet Glasswing.

L’entreprise explique que le développement de garde-fous avance bien. Ces mécanismes de sécurité seraient nécessaires pour éviter que les capacités de Mythos ne puissent servir aux pirates pour exploiter des failles. Ces nouveautés et cette agitation autour de Mythos est de bon aloi, alors qu’Anthropic s’apprête selon les rumeurs à se lancer en bourse d’ici la fin de l’année, alors même que l’entreprise vient de boucler une nouvelle levée de fonds record.

  •  

Data center, AGI, industrie : Mistral AI sur tous les fronts

Petit Poucet veut devenir grand
Data center, AGI, industrie : Mistral AI sur tous les fronts

Grosse actualité autour de Mistral AI, le petit Poucet européen de l’intelligence artificielle générative. À l’occasion de l’AI Now Summit, la startup parisienne et son directeur général Arthur Mensch ont multiplié les annonces : centre de données, partenariats industriels, acquisition, nouveaux outils…

Ne l’appelez plus LeChat. Mistral a rebaptisé son chatbot « Vibe », et lui a donné de nouvelles compétences. Le mode Work se connecte à Outlook, SharePoint, GitHub ou encore Slack (d’autres connecteurs sont disponibles) pour générer des rapports, des synthèses, des graphiques, des listes de tâches… Des compétences (skills) personnalisables peuvent automatiser les flux de travail récurrents « avec cohérence et précision » dans l’enchaînement des tâches.

Un mode Code est également présent pour développer et gérer des projets sur GitHub. Vibe s’interface avec VS Code mais peut aussi s’utiliser dans une interface CLI. Le bot Vibe se décline en plusieurs formules : une gratuite pour les tâches de tous les jours et pour taper la discute, à partir de 14,99 $ par mois pour des tâches complexes et de la programmation.

Un nouveau centre de données dans l’Essonne

Mistral AI a également annoncé un nouveau centre de données basé aux Ulis, qui déploiera 10 MW pour les opérations d’inférence de l’entreprise. Cette infrastructure, qui ouvrira ses portes dès le 3ᵉ trimestre, s’ajoute aux sites de Bruyères-le-Châtel, également en Essonne (40 MW), et à Borlänge en Suède (23 MW).

Durant une conférence de presse relayée par Ouest France, les dirigeants de Mistral ont précisé que l’entreprise allait avoir besoin de 200 MW en 2027, et d’1 GW d’ici la fin de la décennie. Cette capacité de calcul supplémentaire servira aussi bien les clients de Mistral, que d’autres entreprises IA. « Les labos d’IA ont cruellement besoin de puissance de calcul, et nous en avons. Certains nous demandent déjà énormément de capacité aujourd’hui », a expliqué le PDG Arthur Mensch à CNBC.

Les investissements pour ces infrastructures s’établissent pour le moment à 4 milliards d’euros, et il en faudra certainement davantage. « L’Europe accuse un retard dans le déploiement des infrastructures, et nous investissons donc pour combler cet écart », indique le dirigeant. Le Vieux Continent est confronté, selon lui, à des problèmes technologique et macroéconomique : l’Europe commencerait à considérer l’IA comme un actif stratégique au même titre que le gaz.

Une plateforme industrielle pour Mistral

Autre annonce réalisée dans le cadre de l’AI Now Summit, organisé ce jeudi 28 mai : le lancement d’une solution industrielle pour « transformer les opérations critiques ». Cette « pile IA » combine modèles, expertise en ingénierie et capacités robotiques, tout en conservant un « contrôle total » sur les données propriétaires, la propriété intellectuelle et les environnements de production.

Au-delà du discours marketing, Mistral liste les premiers partenaires de ce nouveau programme : Airbus, BMW, ASML et EDF. L’avionneur européen intègre les technologies IA de la jeune pousse pour les opérations en lien avec la conception et les capacités embarquées des avions et des hélicoptères, mais aussi dans ses activités de défense et spatiales. Pour BMW, Mistral développe des modèles de raisonnement multimodaux à partir de données d’ingénierie pour des usages complexes comme les simulations d’accident.

Avec le géant néerlandais (et mondial) des équipements pour semi-conducteurs, Mistral planche sur des cas d’usage d’ingénierie « particulièrement complexes » : optimisation de la conception des composants et modèles hyperspécialisés. Enfin, EDF et Mistral ont signé un partenariat de 5 ans autour de l’ingénierie, de la maintenance et de la construction des futurs réacteurs EPR2.

Des bots exploiteront la « mémoire technique » du parc nucléaire de l’énergéticien pour épauler les équipes de terrain et faciliter les opérations de maintenance. Les données seront hébergées dans des infrastructures souveraines, et resteront la propriété d’EDF.

Toujours dans le domaine de l’entreprise, Mistral a rappelé l’acquisition d’Emmi, une société autrichienne spécialisée dans les modèles d’ingénierie et de conception produit : simulations en temps réel, jumeaux numériques… Ces exemples illustrent le modèle économique de Mistral, qui propose des modèles IA adaptés aux besoins spécifiques des entreprises. Certes, la startup propose aussi des outils grand public, mais les LLM géants et généralistes ne sont pas sa priorité.

Travail, souveraineté, puces maison…

Arthur Mensch a également fait le tour des popotes, que ce soit en France ou aux États-Unis, pour discuter plus généralement de l’IA et de son impact. Chez RTL, il a ainsi décrit la « nouvelle façon de travailler » induite par cette technologie. Cela touche les métiers de l’informatique et singulièrement celui des développeurs, mais à terme « ça va finir par arriver partout […] pour tous les métiers de la connaissance ».

Un point de vue évidemment optimiste, mais le dirigeant convient qu’il existe un « vrai sujet » sur l’aliénation des salariés par l’IA. Pour lui, « il faut faire en sorte que l’utilisateur de l’outil s’enrichisse grâce à l’outil, plutôt qu’il ne désapprenne la tâche qu’il délègue ».

Sur un tout autre sujet, Mensch n’a pas fermé la porte à la possibilité de développer ses propres puces. Concevoir un silicium adapté aux besoins de l’entreprise lui permettrait de « réduire de manière significative le coût du déploiement des tokens », déclare-t-il chez CNBC. À l’heure actuelle, Mistral s’appuie sur Nvidia, « un super partenaire ».

La société s’intéresse également, sans surprise, à l’intelligence artificielle générale (AGI), et alerte sur la situation européenne. « Très bientôt, nous verrons probablement émerger une AGI ou une superintelligence », a indiqué le directeur scientifique Guillaume Lample au Wall Street Journal : « Il est donc très important que nous ayons aussi accès à ces modèles en Europe. Si nous n’y avons pas accès, on ne peut qu’imaginer la gravité de la situation. Il est absolument essentiel que nous y parvenions ».

La question de la souveraineté est centrale pour Mistral. « Tant que nous aurons des adversaires représentant une menace, nous devons disposer de nos propres capacités », affirme Arthur Mensch. « L’Europe, en particulier, doit disposer d’une autonomie stratégique en matière de systèmes de défense. » Cela passera notamment par le développement d’un modèle spécialisé dans la détection de failles de sécurité. Mistral est sur le pont, et travaille avec le secteur bancaire sur un équivalent de Mythos.

  •  

Data center, AGI, industrie : Mistral AI sur tous les fronts

Petit Poucet veut devenir grand
Data center, AGI, industrie : Mistral AI sur tous les fronts

Grosse actualité autour de Mistral AI, le petit Poucet européen de l’intelligence artificielle générative. À l’occasion de l’AI Now Summit, la startup parisienne et son directeur général Arthur Mensch ont multiplié les annonces : centre de données, partenariats industriels, acquisition, nouveaux outils…

Ne l’appelez plus LeChat. Mistral a rebaptisé son chatbot « Vibe », et lui a donné de nouvelles compétences. Le mode Work se connecte à Outlook, SharePoint, GitHub ou encore Slack (d’autres connecteurs sont disponibles) pour générer des rapports, des synthèses, des graphiques, des listes de tâches… Des compétences (skills) personnalisables peuvent automatiser les flux de travail récurrents « avec cohérence et précision » dans l’enchaînement des tâches.

Un mode Code est également présent pour développer et gérer des projets sur GitHub. Vibe s’interface avec VS Code mais peut aussi s’utiliser dans une interface CLI. Le bot Vibe se décline en plusieurs formules : une gratuite pour les tâches de tous les jours et pour taper la discute, à partir de 14,99 $ par mois pour des tâches complexes et de la programmation.

Un nouveau centre de données dans l’Essonne

Mistral AI a également annoncé un nouveau centre de données basé aux Ulis, qui déploiera 10 MW pour les opérations d’inférence de l’entreprise. Cette infrastructure, qui ouvrira ses portes dès le 3ᵉ trimestre, s’ajoute aux sites de Bruyères-le-Châtel, également en Essonne (40 MW), et à Borlänge en Suède (23 MW).

Durant une conférence de presse relayée par Ouest France, les dirigeants de Mistral ont précisé que l’entreprise allait avoir besoin de 200 MW en 2027, et d’1 GW d’ici la fin de la décennie. Cette capacité de calcul supplémentaire servira aussi bien les clients de Mistral, que d’autres entreprises IA. « Les labos d’IA ont cruellement besoin de puissance de calcul, et nous en avons. Certains nous demandent déjà énormément de capacité aujourd’hui », a expliqué le PDG Arthur Mensch à CNBC.

Les investissements pour ces infrastructures s’établissent pour le moment à 4 milliards d’euros, et il en faudra certainement davantage. « L’Europe accuse un retard dans le déploiement des infrastructures, et nous investissons donc pour combler cet écart », indique le dirigeant. Le Vieux Continent est confronté, selon lui, à des problèmes technologique et macroéconomique : l’Europe commencerait à considérer l’IA comme un actif stratégique au même titre que le gaz.

Une plateforme industrielle pour Mistral

Autre annonce réalisée dans le cadre de l’AI Now Summit, organisé ce jeudi 28 mai : le lancement d’une solution industrielle pour « transformer les opérations critiques ». Cette « pile IA » combine modèles, expertise en ingénierie et capacités robotiques, tout en conservant un « contrôle total » sur les données propriétaires, la propriété intellectuelle et les environnements de production.

Au-delà du discours marketing, Mistral liste les premiers partenaires de ce nouveau programme : Airbus, BMW, ASML et EDF. L’avionneur européen intègre les technologies IA de la jeune pousse pour les opérations en lien avec la conception et les capacités embarquées des avions et des hélicoptères, mais aussi dans ses activités de défense et spatiales. Pour BMW, Mistral développe des modèles de raisonnement multimodaux à partir de données d’ingénierie pour des usages complexes comme les simulations d’accident.

Avec le géant néerlandais (et mondial) des équipements pour semi-conducteurs, Mistral planche sur des cas d’usage d’ingénierie « particulièrement complexes » : optimisation de la conception des composants et modèles hyperspécialisés. Enfin, EDF et Mistral ont signé un partenariat de 5 ans autour de l’ingénierie, de la maintenance et de la construction des futurs réacteurs EPR2.

Des bots exploiteront la « mémoire technique » du parc nucléaire de l’énergéticien pour épauler les équipes de terrain et faciliter les opérations de maintenance. Les données seront hébergées dans des infrastructures souveraines, et resteront la propriété d’EDF.

Toujours dans le domaine de l’entreprise, Mistral a rappelé l’acquisition d’Emmi, une société autrichienne spécialisée dans les modèles d’ingénierie et de conception produit : simulations en temps réel, jumeaux numériques… Ces exemples illustrent le modèle économique de Mistral, qui propose des modèles IA adaptés aux besoins spécifiques des entreprises. Certes, la startup propose aussi des outils grand public, mais les LLM géants et généralistes ne sont pas sa priorité.

Travail, souveraineté, puces maison…

Arthur Mensch a également fait le tour des popotes, que ce soit en France ou aux États-Unis, pour discuter plus généralement de l’IA et de son impact. Chez RTL, il a ainsi décrit la « nouvelle façon de travailler » induite par cette technologie. Cela touche les métiers de l’informatique et singulièrement celui des développeurs, mais à terme « ça va finir par arriver partout […] pour tous les métiers de la connaissance ».

Un point de vue évidemment optimiste, mais le dirigeant convient qu’il existe un « vrai sujet » sur l’aliénation des salariés par l’IA. Pour lui, « il faut faire en sorte que l’utilisateur de l’outil s’enrichisse grâce à l’outil, plutôt qu’il ne désapprenne la tâche qu’il délègue ».

Sur un tout autre sujet, Mensch n’a pas fermé la porte à la possibilité de développer ses propres puces. Concevoir un silicium adapté aux besoins de l’entreprise lui permettrait de « réduire de manière significative le coût du déploiement des tokens », déclare-t-il chez CNBC. À l’heure actuelle, Mistral s’appuie sur Nvidia, « un super partenaire ».

La société s’intéresse également, sans surprise, à l’intelligence artificielle générale (AGI), et alerte sur la situation européenne. « Très bientôt, nous verrons probablement émerger une AGI ou une superintelligence », a indiqué le directeur scientifique Guillaume Lample au Wall Street Journal : « Il est donc très important que nous ayons aussi accès à ces modèles en Europe. Si nous n’y avons pas accès, on ne peut qu’imaginer la gravité de la situation. Il est absolument essentiel que nous y parvenions ».

La question de la souveraineté est centrale pour Mistral. « Tant que nous aurons des adversaires représentant une menace, nous devons disposer de nos propres capacités », affirme Arthur Mensch. « L’Europe, en particulier, doit disposer d’une autonomie stratégique en matière de systèmes de défense. » Cela passera notamment par le développement d’un modèle spécialisé dans la détection de failles de sécurité. Mistral est sur le pont, et travaille avec le secteur bancaire sur un équivalent de Mythos.

  •  

☕️ Amazon MGM Studios veut industrialiser les séries générées par IA



Hollywood commence à intégrer l’IA générative à tâtons et de manière un peu désordonnée. De nombreuses initiatives plus ou moins farfelues ont vu le jour, comme la fausse « comédienne » Tilly Norwood qui a surtout permis à ses créateurs de buzzer. Ou encore l’intégration d’un clone virtuel de Val Kilmer dans un film. On a aussi eu le malheur de poser les yeux sur la série On This Day… 1776 entièrement générée par IA. Réalisée par Darren Aronofsky, elle commémore le 250e anniversaire des États-Unis.

Plus sérieusement, la série argentine El Eternauta a été la première diffusée par Netflix à intégrer une séquence d’effets spéciaux générée par IA. Depuis, la plateforme a établi des principes généraux pour encadrer l’utilisation de cette technologie dans la production de ses contenus.

On pourrait multiplier les exemples de l’incursion de l’IA générative dans les films et les séries télé, malgré les craintes d’une bonne partie de la filière. Un poids lourd de l’industrie a dévoilé ses cartes : il s’agit des studios MGM, ce qui n’est pas une très grande surprise vu le propriétaire, Amazon, très impliqué dans cette technologie.

Le studio a ainsi annoncé le lancement du programme GenAI Creators’ Fund, qui financera des réalisateurs, des créateurs et des startups travaillant sur des films et des séries exploitant l’IA générative. Amazon MGM Studios travaille, en toute logique, avec AWS sur le développement de la courroie de transmission technique, le « projet Nara », une plateforme de production IA.

Elle intègre des outils déjà utilisés dans l’industrie comme Maya, Blender, le moteur Unreal ou encore la suite Adobe, et peut développer des séries d’animation ou en prises de vue réelles. Son architecture est « agnostique », elle combine plusieurs modèles vidéo tiers ainsi que des modèles maison. Un système de suivi a été mis au point pour protéger la propriété intellectuelle de tout ce petit monde.

Trois séries animées ont déjà été commandées par Prime Video, avec une diffusion prévue dans un futur proche. Les producteurs ont cinq semaines pour finaliser leur pilote, afin de démontrer la rapidité du processus. Amazon affirme que le projet Nara permettra non seulement de réduire les coûts et d’accélérer la production, mais aussi d’obtenir un plus grand contrôle créatif d’un bout à l’autre du contenu.

Histoire de rassurer, Albert Cheng, responsable du studio, insiste sur l’approche « centrée sur l’humain » du projet. « Le GenAI Creators’ Fund et le projet Nara placent la créativité humaine au cœur de nos efforts pour intégrer l’IA générative dans nos processus de production chez Amazon MGM Studios », explique-t-il. Les acteurs et comédiens de doublage seront toujours embauchés, et l’IA n’a pas pour vocation de remplacer les équipes créatives de chair et de sang. Chiche ?

  •  

☕️ Amazon MGM Studios veut industrialiser les séries générées par IA



Hollywood commence à intégrer l’IA générative à tâtons et de manière un peu désordonnée. De nombreuses initiatives plus ou moins farfelues ont vu le jour, comme la fausse « comédienne » Tilly Norwood qui a surtout permis à ses créateurs de buzzer. Ou encore l’intégration d’un clone virtuel de Val Kilmer dans un film. On a aussi eu le malheur de poser les yeux sur la série On This Day… 1776 entièrement générée par IA. Réalisée par Darren Aronofsky, elle commémore le 250e anniversaire des États-Unis.

Plus sérieusement, la série argentine El Eternauta a été la première diffusée par Netflix à intégrer une séquence d’effets spéciaux générée par IA. Depuis, la plateforme a établi des principes généraux pour encadrer l’utilisation de cette technologie dans la production de ses contenus.

On pourrait multiplier les exemples de l’incursion de l’IA générative dans les films et les séries télé, malgré les craintes d’une bonne partie de la filière. Un poids lourd de l’industrie a dévoilé ses cartes : il s’agit des studios MGM, ce qui n’est pas une très grande surprise vu le propriétaire, Amazon, très impliqué dans cette technologie.

Le studio a ainsi annoncé le lancement du programme GenAI Creators’ Fund, qui financera des réalisateurs, des créateurs et des startups travaillant sur des films et des séries exploitant l’IA générative. Amazon MGM Studios travaille, en toute logique, avec AWS sur le développement de la courroie de transmission technique, le « projet Nara », une plateforme de production IA.

Elle intègre des outils déjà utilisés dans l’industrie comme Maya, Blender, le moteur Unreal ou encore la suite Adobe, et peut développer des séries d’animation ou en prises de vue réelles. Son architecture est « agnostique », elle combine plusieurs modèles vidéo tiers ainsi que des modèles maison. Un système de suivi a été mis au point pour protéger la propriété intellectuelle de tout ce petit monde.

Trois séries animées ont déjà été commandées par Prime Video, avec une diffusion prévue dans un futur proche. Les producteurs ont cinq semaines pour finaliser leur pilote, afin de démontrer la rapidité du processus. Amazon affirme que le projet Nara permettra non seulement de réduire les coûts et d’accélérer la production, mais aussi d’obtenir un plus grand contrôle créatif d’un bout à l’autre du contenu.

Histoire de rassurer, Albert Cheng, responsable du studio, insiste sur l’approche « centrée sur l’humain » du projet. « Le GenAI Creators’ Fund et le projet Nara placent la créativité humaine au cœur de nos efforts pour intégrer l’IA générative dans nos processus de production chez Amazon MGM Studios », explique-t-il. Les acteurs et comédiens de doublage seront toujours embauchés, et l’IA n’a pas pour vocation de remplacer les équipes créatives de chair et de sang. Chiche ?

  •  

☕️ YouTube va détecter automatiquement les vidéos générées avec l’IA



Sur YouTube, personne ne sait que vous êtes une IA… enfin presque. Depuis 2024, une étiquette prévient les spectateurs de la présence de contenus altérés ou synthétiques dans les vidéos — pour peu que les créateurs aient précisé l’utilisation d’outils IA. La plateforme a annoncé des changements pour afficher plus clairement la couleur, d’abord avec une étiquette « AI » placée en filigrane sur les Shorts et au-dessus de la description d’une vidéo longue.

« En plaçant ces étiquettes directement au premier plan, les spectateurs obtiennent immédiatement le contexte dont ils ont besoin », explique YouTube. La précédente version n’était effectivement pas très claire et évitait de parler d’IA. « Il s’agit désormais du format d’étiquetage unique pour tous les contenus photoréalistes générés ou modifiés de manière significative par l’IA sur YouTube », ajoute l’entreprise.

L’étiquette AI de YouTube.

Les contenus « irréalistes, animés ou légèrement modifiés » présents dans les vidéos seront quant à eux identifiés de la sorte dans la description détaillée, sans l’étiquette AI. Mais le plus important est que YouTube va désormais détecter automatiquement les contenus IA, tout en continuant à exiger des créateurs qu’ils signalent manuellement l’utilisation d’une IA photoréaliste.

Si le système identifie la présence importante d’IA dans une vidéo, l’étiquette sera apposée sur le contenu, même si le créateur ne précise pas s’il a utilisé ou non de l’IA. En cas de désaccord avec la décision de YouTube, il pourra mettre à jour le statut de cette mention dans les réglages de la vidéo.

Néanmoins, ces labels resteront permanents dans certains cas, par exemple quand les vidéos ont été créées avec des outils IA de YouTube, ainsi que celles intégrant des métadonnées C2PA. Cette coalition fondée en 2021 est à l’origine de plusieurs standards d’étiquetage de contenus avec des métadonnées, comme le nom de l’auteur, la date de création du contenu et la manière dont il a été fabriqué (« à la main » ou avec IA).

En matière d’outils de création IA, YouTube a mis les bouchées doubles ces derniers mois. Le plus connu est certainement Dream Screen, qui permet de générer des décors animés en arrière-plan en les décrivant avec une requête texte (« une plage au coucher du soleil »). Le modèle Veo est également à l’œuvre pour « ajouter » du mouvement à une image, modifier le style d’une vidéo, ou générer des objets et des accessoires.

La plateforme pousse aussi à l’adoption d’Auto Dubbing, un système de doublage automatique qui traduit et double une vidéo dans plusieurs langues (27 sont prises en charge). Et elle travaille à améliorer la synchronisation labiale, sur la qualité des voix synthétiques et sur une meilleure adaptation culturelle des doublages générés.

  •  

☕️ YouTube va détecter automatiquement les vidéos générées avec l’IA



Sur YouTube, personne ne sait que vous êtes une IA… enfin presque. Depuis 2024, une étiquette prévient les spectateurs de la présence de contenus altérés ou synthétiques dans les vidéos — pour peu que les créateurs aient précisé l’utilisation d’outils IA. La plateforme a annoncé des changements pour afficher plus clairement la couleur, d’abord avec une étiquette « AI » placée en filigrane sur les Shorts et au-dessus de la description d’une vidéo longue.

« En plaçant ces étiquettes directement au premier plan, les spectateurs obtiennent immédiatement le contexte dont ils ont besoin », explique YouTube. La précédente version n’était effectivement pas très claire et évitait de parler d’IA. « Il s’agit désormais du format d’étiquetage unique pour tous les contenus photoréalistes générés ou modifiés de manière significative par l’IA sur YouTube », ajoute l’entreprise.

L’étiquette AI de YouTube.

Les contenus « irréalistes, animés ou légèrement modifiés » présents dans les vidéos seront quant à eux identifiés de la sorte dans la description détaillée, sans l’étiquette AI. Mais le plus important est que YouTube va désormais détecter automatiquement les contenus IA, tout en continuant à exiger des créateurs qu’ils signalent manuellement l’utilisation d’une IA photoréaliste.

Si le système identifie la présence importante d’IA dans une vidéo, l’étiquette sera apposée sur le contenu, même si le créateur ne précise pas s’il a utilisé ou non de l’IA. En cas de désaccord avec la décision de YouTube, il pourra mettre à jour le statut de cette mention dans les réglages de la vidéo.

Néanmoins, ces labels resteront permanents dans certains cas, par exemple quand les vidéos ont été créées avec des outils IA de YouTube, ainsi que celles intégrant des métadonnées C2PA. Cette coalition fondée en 2021 est à l’origine de plusieurs standards d’étiquetage de contenus avec des métadonnées, comme le nom de l’auteur, la date de création du contenu et la manière dont il a été fabriqué (« à la main » ou avec IA).

En matière d’outils de création IA, YouTube a mis les bouchées doubles ces derniers mois. Le plus connu est certainement Dream Screen, qui permet de générer des décors animés en arrière-plan en les décrivant avec une requête texte (« une plage au coucher du soleil »). Le modèle Veo est également à l’œuvre pour « ajouter » du mouvement à une image, modifier le style d’une vidéo, ou générer des objets et des accessoires.

La plateforme pousse aussi à l’adoption d’Auto Dubbing, un système de doublage automatique qui traduit et double une vidéo dans plusieurs langues (27 sont prises en charge). Et elle travaille à améliorer la synchronisation labiale, sur la qualité des voix synthétiques et sur une meilleure adaptation culturelle des doublages générés.

  •  

Google I/O : l’overdose d’annonces IA profite à DuckDuckGo

We don't need no AI slop
Google I/O : l’overdose d’annonces IA profite à DuckDuckGo

Durant la dernière Google I/O, le géant du web a voulu galvaniser ses troupes en les noyant sous un torrent incessant de nouveautés IA. Cette avalanche a aussi pu provoquer chez d’autres un effet repoussoir. Résultat : la version « No AI » de DuckDuckGo a enregistré une fréquentation record.

Google a dégainé l’artillerie lourde ces 19 et 20 mai durant son événement I/O, tout particulièrement bien sûr autour de l’IA (c’est le cas de bon nombre d’entreprises du numérique, depuis quelques années). Entre les nouveautés dédiées à Gemini, les agents à gogo, l’outil de vibe coding AI Studio, et même les lunettes connectées infusées à l’IA, il y en avait pour tous les goûts… enfin, pour ceux qui pensent, vivent et mangent IA. Pour les autres, c’est la curée.

La carte du « No AI »

Même si Google est l’acteur archi-dominant de la recherche en ligne, il existe évidemment des alternatives, y compris sans IA comme chez DuckDuckGo. Le moteur de recherche centré sur la protection de la vie privée propose certes ses propres bots et services IA, mais il en existe également une déclinaison « No AI » qui désactive les réponses assistées par IA et supprime les images générées par IA. Elle a connu un joli succès après l’avalanche de Google I/O.

DuckDuckGo No AI.

Aux États-Unis, les visites sur cette mouture du moteur de recherche ont fortement progressé durant le long week-end du Memorial Day (du 23 au 25 mai) : la hausse moyenne s’est établie à 22,7 % par rapport à la semaine précédente, avec un pic à 27,7 % le 24 mai. Les installations de l’app mobile ont elles aussi enregistré une progression substantielle de 18,1 % en moyenne d’une semaine sur l’autre, toujours aux États-Unis.

Les stats d’installation de l’app sur iPhone et iPad ont profité de cet engouement, avec une progression moyenne de 33 %, et même un pic de 69,9 % le 25 mai. La croissance observée outre-Atlantique a été très supérieure à celle enregistrée ailleurs dans le monde, ce qui peut être interprété comme la conséquence des annonces très américano-centrées de l’entreprise.

« Google impose l’IA aux utilisateurs sans leur laisser la possibilité de s’y opposer », décrypte Gabriel Weinberg, fondateur et PDG de DuckDuckGo auprès de Thurrott.com. « Résultat, les résultats de recherche se dégradent au lieu de s’améliorer. Nous voulons être l’endroit qui redonne le contrôle aux utilisateurs et leur permet de décider de la quantité d’IA qu’ils souhaitent – ou non – utiliser », ajoute-t-il.

Ce créneau pourrait bien s’avérer très porteur au vu de la polarisation de plus en plus aiguë entre les pros et les réfractaires à l’IA. Pas fou, DuckDuckGo base d’ailleurs très nettement sa communication sur le rejet que suscite l’IA auprès d’une partie des internautes.

La recherche Google vitrine de l’IA

La recherche en ligne de Google n’a évidemment pas échappé au tsunami d’annonces de Google I/O. L’AI Mode, cette version « bot » de search, fonctionne désormais avec le dernier modèle Gemini 3.5 Flash, tandis que les résumés AI Overviews peuvent répondre à des questions – deux fonctions qui ne sont pas disponibles en France.

L’entreprise inaugure aussi une nouvelle barre de recherche « intelligente », qui signe l’évolution la plus importante depuis 25 ans pour cette fonction centrale de Google : elle peut comprendre des requêtes plus longues et accepter différents types d’entrées (texte, images, fichiers, vidéos et même des onglets Chrome).

La recherche intègre des « agents d’information » qui vont surveiller le web en continu pour suivre un sujet spécifique. Par exemple des annonces immobilières avec des critères précis, ou quand un sportif annonce une collab’ avec une marque de basket. Ces agents seront disponibles dans le courant de l’été pour les abonnés AI Pro et AI Ultra.

Toujours dans ce même registre de la personnalisation des réponses, les nouvelles capacités « Personal Intelligence » de search vont lui permettre de piocher des informations personnelles tirées de Gmail, de Google Photos et de Calendar (pas besoin d’abonnement pour ça).

Google a également annoncé une amélioration des agents de réservation, qui s’étendent à de nouveaux usages comme de trouver une salle de karaoké ou de réserver des services locaux. Le moteur de recherche peut aussi appeler les commerces à la place de l’utilisateur dans certaines catégories (réparation, animaux, beauté). Cette nouveauté sera déployée cet été aux États-Unis.

Enfin, la recherche en ligne va pouvoir générer des tableaux, graphiques, et même des mini-apps (de types simulations ou tableaux de bord). Cela pourra être, par exemple, un système de suivi de remise en forme alimenté par des données puisées dans des avis en ligne ou des cartes.

  •  

Google I/O : l’overdose d’annonces IA profite à DuckDuckGo

We don't need no AI slop
Google I/O : l’overdose d’annonces IA profite à DuckDuckGo

Durant la dernière Google I/O, le géant du web a voulu galvaniser ses troupes en les noyant sous un torrent incessant de nouveautés IA. Cette avalanche a aussi pu provoquer chez d’autres un effet repoussoir. Résultat : la version « No AI » de DuckDuckGo a enregistré une fréquentation record.

Google a dégainé l’artillerie lourde ces 19 et 20 mai durant son événement I/O, tout particulièrement bien sûr autour de l’IA (c’est le cas de bon nombre d’entreprises du numérique, depuis quelques années). Entre les nouveautés dédiées à Gemini, les agents à gogo, l’outil de vibe coding AI Studio, et même les lunettes connectées infusées à l’IA, il y en avait pour tous les goûts… enfin, pour ceux qui pensent, vivent et mangent IA. Pour les autres, c’est la curée.

La carte du « No AI »

Même si Google est l’acteur archi-dominant de la recherche en ligne, il existe évidemment des alternatives, y compris sans IA comme chez DuckDuckGo. Le moteur de recherche centré sur la protection de la vie privée propose certes ses propres bots et services IA, mais il en existe également une déclinaison « No AI » qui désactive les réponses assistées par IA et supprime les images générées par IA. Elle a connu un joli succès après l’avalanche de Google I/O.

DuckDuckGo No AI.

Aux États-Unis, les visites sur cette mouture du moteur de recherche ont fortement progressé durant le long week-end du Memorial Day (du 23 au 25 mai) : la hausse moyenne s’est établie à 22,7 % par rapport à la semaine précédente, avec un pic à 27,7 % le 24 mai. Les installations de l’app mobile ont elles aussi enregistré une progression substantielle de 18,1 % en moyenne d’une semaine sur l’autre, toujours aux États-Unis.

Les stats d’installation de l’app sur iPhone et iPad ont profité de cet engouement, avec une progression moyenne de 33 %, et même un pic de 69,9 % le 25 mai. La croissance observée outre-Atlantique a été très supérieure à celle enregistrée ailleurs dans le monde, ce qui peut être interprété comme la conséquence des annonces très américano-centrées de l’entreprise.

« Google impose l’IA aux utilisateurs sans leur laisser la possibilité de s’y opposer », décrypte Gabriel Weinberg, fondateur et PDG de DuckDuckGo auprès de Thurrott.com. « Résultat, les résultats de recherche se dégradent au lieu de s’améliorer. Nous voulons être l’endroit qui redonne le contrôle aux utilisateurs et leur permet de décider de la quantité d’IA qu’ils souhaitent – ou non – utiliser », ajoute-t-il.

Ce créneau pourrait bien s’avérer très porteur au vu de la polarisation de plus en plus aiguë entre les pros et les réfractaires à l’IA. Pas fou, DuckDuckGo base d’ailleurs très nettement sa communication sur le rejet que suscite l’IA auprès d’une partie des internautes.

La recherche Google vitrine de l’IA

La recherche en ligne de Google n’a évidemment pas échappé au tsunami d’annonces de Google I/O. L’AI Mode, cette version « bot » de search, fonctionne désormais avec le dernier modèle Gemini 3.5 Flash, tandis que les résumés AI Overviews peuvent répondre à des questions – deux fonctions qui ne sont pas disponibles en France.

L’entreprise inaugure aussi une nouvelle barre de recherche « intelligente », qui signe l’évolution la plus importante depuis 25 ans pour cette fonction centrale de Google : elle peut comprendre des requêtes plus longues et accepter différents types d’entrées (texte, images, fichiers, vidéos et même des onglets Chrome).

La recherche intègre des « agents d’information » qui vont surveiller le web en continu pour suivre un sujet spécifique. Par exemple des annonces immobilières avec des critères précis, ou quand un sportif annonce une collab’ avec une marque de basket. Ces agents seront disponibles dans le courant de l’été pour les abonnés AI Pro et AI Ultra.

Toujours dans ce même registre de la personnalisation des réponses, les nouvelles capacités « Personal Intelligence » de search vont lui permettre de piocher des informations personnelles tirées de Gmail, de Google Photos et de Calendar (pas besoin d’abonnement pour ça).

Google a également annoncé une amélioration des agents de réservation, qui s’étendent à de nouveaux usages comme de trouver une salle de karaoké ou de réserver des services locaux. Le moteur de recherche peut aussi appeler les commerces à la place de l’utilisateur dans certaines catégories (réparation, animaux, beauté). Cette nouveauté sera déployée cet été aux États-Unis.

Enfin, la recherche en ligne va pouvoir générer des tableaux, graphiques, et même des mini-apps (de types simulations ou tableaux de bord). Cela pourra être, par exemple, un système de suivi de remise en forme alimenté par des données puisées dans des avis en ligne ou des cartes.

  •  

Chez Starbucks, l’IA chargée des stocks s’est noyée dans les bouteilles de lait

Ressortez le boulier
Chez Starbucks, l’IA chargée des stocks s’est noyée dans les bouteilles de lait

L’IA n’est pas la réponse à tous les maux du monde, et encore moins chez Starbucks. Le géant états-unien des cafés a fini par retirer une intelligence artificielle qui devait améliorer la gestion des stocks de produits et éviter les pénuries de certains articles. Ça n’a pas du tout marché.

En septembre dernier, Starbucks lançait dans sa chaîne de cafés aux États-Unis et au Canada un nouveau logiciel reposant sur l’IA. Plutôt que de compter à la main les produits en stock, les employés plaçaient une tablette devant les étagères de sirops, de lait et autres articles ; charge ensuite à l’application Automated Counting d’analyser ces informations collectées à l’aide de la caméra et du capteur LIDAR.

Combien de bouteilles de lait ?

Cette technologie devait inaugurer « une optimisation plus intelligente de la chaîne d’approvisionnement » et répondre à une problématique aiguë au sein de Starbucks : les pénuries fréquentes de produits de base qui empêchent de concocter des cafés et autres items au menu — ce qui revient souvent à rater des ventes.

Brian Niccol, le PDG du groupe, s’est engagé à trouver des solutions pour améliorer la rentabilité de ses établissements. Ces cinq dernières années, quatre patrons de Starbucks (qui n’est pas en pénurie de dirigeants, manifestement) ont déploré l’approvisionnement difficile de ses milliers de cafés en produits essentiels comme le lait, les viennoiseries ou tout simplement les couvercles de gobelets.

Pour les experts en logistique, une chaîne d’approvisionnement fiable doit assurer des livraisons complètes et ponctuelles dans 95 % des cas. Début 2024, moins d’un tiers des camions arrivant dans les centres de distribution de Starbucks respectaient ces critères, comme d’anciens employés l’ont affirmé à Reuters. En cause : des difficultés de coordination entre les fournisseurs, nombreux, de l’enseigne.

Cette application devait régler une bonne partie du problème. Las : l’IA ne fait pas tout. Toujours d’après l’agence de presse, elle se trompait fréquemment dans le comptage et l’identification des produits. Il lui arrivait de confondre des types de lait similaires, ou de passer complètement à côté… Impossible dans ces conditions d’avoir un inventaire à jour et prêt pour répondre à toutes les commandes.

Une solution pas si fiable

Le prestataire NomadGo en charge du développement assurait pourtant que sa solution est fiable « à 99 % ». En février, Starbucks faisait toujours preuve d’une solide langue de bois en affirmant à qui voulait l’entendre que l’application avait amélioré la disponibilité des produits. Il aura fallu attendre quelques mois de plus pour arrêter les frais : Automated Counting a été retiré des mains des employés, qui ont repris la routine de comptabiliser les stocks comme avant.

« Notre objectif est simple : si un produit figure au menu, les clients doivent pouvoir le commander », indique l’entreprise dans un communiqué. Sauf en cas de pénurie de stocks, évidemment ! Brian Niccol, en poste depuis septembre 2024, a été recruté pour relancer les ventes et simplifier les opérations dans les cafés de l’enseigne. Il a mis en place un programme, « Back to Starbucks », qui inclut la mise en œuvre de technologies IA pour fluidifier les commandes et épauler les barristas.

Starbucks n’est pas la seule entreprise à essuyer un ratage lié à l’IA. Certains exemples sont tout aussi spectaculaires, comme la borne vocale McDonald’s développée avec IBM, dont les ratés (commandes absurdes, ajouts d’articles inexistants) ont fait les riches heures des petits plaisantins sur les réseaux sociaux. Ces bornes ont été retirées de la circulation en 2024. N’oublions pas non plus l’AI Overview de Google qui a conseillé de fourrer de la colle dans des pizzas pour faire tenir le fromage…

  •  

Chez Starbucks, l’IA chargée des stocks s’est noyée dans les bouteilles de lait

Ressortez le boulier
Chez Starbucks, l’IA chargée des stocks s’est noyée dans les bouteilles de lait

L’IA n’est pas la réponse à tous les maux du monde, et encore moins chez Starbucks. Le géant états-unien des cafés a fini par retirer une intelligence artificielle qui devait améliorer la gestion des stocks de produits et éviter les pénuries de certains articles. Ça n’a pas du tout marché.

En septembre dernier, Starbucks lançait dans sa chaîne de cafés aux États-Unis et au Canada un nouveau logiciel reposant sur l’IA. Plutôt que de compter à la main les produits en stock, les employés plaçaient une tablette devant les étagères de sirops, de lait et autres articles ; charge ensuite à l’application Automated Counting d’analyser ces informations collectées à l’aide de la caméra et du capteur LIDAR.

Combien de bouteilles de lait ?

Cette technologie devait inaugurer « une optimisation plus intelligente de la chaîne d’approvisionnement » et répondre à une problématique aiguë au sein de Starbucks : les pénuries fréquentes de produits de base qui empêchent de concocter des cafés et autres items au menu — ce qui revient souvent à rater des ventes.

Brian Niccol, le PDG du groupe, s’est engagé à trouver des solutions pour améliorer la rentabilité de ses établissements. Ces cinq dernières années, quatre patrons de Starbucks (qui n’est pas en pénurie de dirigeants, manifestement) ont déploré l’approvisionnement difficile de ses milliers de cafés en produits essentiels comme le lait, les viennoiseries ou tout simplement les couvercles de gobelets.

Pour les experts en logistique, une chaîne d’approvisionnement fiable doit assurer des livraisons complètes et ponctuelles dans 95 % des cas. Début 2024, moins d’un tiers des camions arrivant dans les centres de distribution de Starbucks respectaient ces critères, comme d’anciens employés l’ont affirmé à Reuters. En cause : des difficultés de coordination entre les fournisseurs, nombreux, de l’enseigne.

Cette application devait régler une bonne partie du problème. Las : l’IA ne fait pas tout. Toujours d’après l’agence de presse, elle se trompait fréquemment dans le comptage et l’identification des produits. Il lui arrivait de confondre des types de lait similaires, ou de passer complètement à côté… Impossible dans ces conditions d’avoir un inventaire à jour et prêt pour répondre à toutes les commandes.

Une solution pas si fiable

Le prestataire NomadGo en charge du développement assurait pourtant que sa solution est fiable « à 99 % ». En février, Starbucks faisait toujours preuve d’une solide langue de bois en affirmant à qui voulait l’entendre que l’application avait amélioré la disponibilité des produits. Il aura fallu attendre quelques mois de plus pour arrêter les frais : Automated Counting a été retiré des mains des employés, qui ont repris la routine de comptabiliser les stocks comme avant.

« Notre objectif est simple : si un produit figure au menu, les clients doivent pouvoir le commander », indique l’entreprise dans un communiqué. Sauf en cas de pénurie de stocks, évidemment ! Brian Niccol, en poste depuis septembre 2024, a été recruté pour relancer les ventes et simplifier les opérations dans les cafés de l’enseigne. Il a mis en place un programme, « Back to Starbucks », qui inclut la mise en œuvre de technologies IA pour fluidifier les commandes et épauler les barristas.

Starbucks n’est pas la seule entreprise à essuyer un ratage lié à l’IA. Certains exemples sont tout aussi spectaculaires, comme la borne vocale McDonald’s développée avec IBM, dont les ratés (commandes absurdes, ajouts d’articles inexistants) ont fait les riches heures des petits plaisantins sur les réseaux sociaux. Ces bornes ont été retirées de la circulation en 2024. N’oublions pas non plus l’AI Overview de Google qui a conseillé de fourrer de la colle dans des pizzas pour faire tenir le fromage…

  •  

Alexa+ débarque en France : un assistant plus bavard, plus malin et plus cher

22,99 euros par mois pour discuter avec Alexa
Alexa+ débarque en France : un assistant plus bavard, plus malin et plus cher

Alexa+, la version dopée à l’IA générative de l’assistant Amazon, est désormais proposé en accès anticipé en France. Un accès gratuit jusqu’à cet automne, puis il faudra mettre la main à la poche ou être abonné Prime.

Après de longues années de développement et un déploiement très progressif aux États-Unis à partir de mars 2025, Alexa+ est finalement disponible en France depuis le 26 mai. Là aussi, Amazon orchestre un lancement prudent, sous la forme d’un accès anticipé ouvert aux possesseurs d’un appareil Echo compatible (les modèles anciens de première génération sont exclus). Les clients recevront un courriel ou une notification pour les informer qu’ils peuvent activer le nouvel assistant.

Alexa+ taillée pour la France

L’accès anticipé s’élargira au fil des prochaines semaines, avec un usage d’Alexa+ gratuit « au moins » jusqu’au 15 septembre. Ensuite, il faudra faire un choix : soit s’abonner à Amazon Prime, auquel cas l’IA continuera d’être accessible sans frais supplémentaire, soit souscrire un abonnement spécifique facturé 22,99 euros par mois.

Un prix salé qui rapproche Alexa+ d’un abonnement premium à ChatGPT ou Claude… et qui pourrait pousser Amazon à relever les tarifs de Prime, mais on n’en est pas encore là. À noter qu’Alexa « tout court », la version standard et complètement gratuite (mais limitée) de l’assistant, continuera d’être disponible sur les appareils éligibles.

Mais Amazon veut s’assurer que l’on préférera la version + d’Alexa qui se distingue par ses capacités conversationnelles. À l’instar de ChatGPT ou de Gemini, les interactions se veulent fluides et naturelles et l’on peut parler de tout et de rien. Amazon oblige, le shopping et le commerce en ligne ont une place prépondérante : Alexa+ pourra ainsi se connecter à des services comme TheFork et Tripadvisor pour réserver un restaurant ou planifier un voyage.

L’entreprise met aussi l’accent sur ce qu’elle appelle « l’IA ambiante », qui permet à Alexa+ d’anticiper les besoins de l’utilisateur en fonction de ses petites habitudes. Par exemple, en lançant toute seule la machine à café au réveil. Rêve ou cauchemar, on verra si l’intrusion de l’assistant dans la vie de tous les jours sera appréciée. À l’instar de la version sans IA, Alexa+ peut aussi contrôler les appareils domotiques.

Alexa+ n’est pas le chatbot d’un seul modèle IA. Amazon exploite son service cloud dédié au déploiement de modèles (Bedrock) pour proposer un service en forme de gare de triage, capable de distribuer les requêtes aussi bien vers les propres modèles Nova d’Amazon que vers des modèles concurrents d’Anthropic ou de Mistral. Plus de 70 LLM sont utilisés par l’assistant, ce qui est censé lui permettre de répondre de manière plus précise aux requêtes de l’utilisateur. Comme l’explique l’entreprise, les capacités nécessaires à la domotique diffèrent de celles qui génèrent des conversations sur la pluie et le beau temps.

Une gare de triage IA

Les modèles de Mistral sont notamment mis à contribution « pour évaluer la précision et la qualité des réponses d’Alexa dans les langues autres que l’anglais ». Amazon martèle que la version française d’Alexa+ offre une expérience « culturellement pertinente, authentiquement locale ». L’assistant est en effet censé comprendre notre sens de l’humour et notre argot : « [Il] est en phase avec notre musique, notre cuisine et nos passions » et connait tout du débat entre pain au chocolat et chocolatine, par exemple.

Amazon veut s’épargner les débats gênants sur la confidentialité des données et de la vie privée. Un tableau de bord dédié permet ainsi de consulter et gérer les interactions avec Alexa+ : on pourra ainsi « écouter exactement » ce que l’assistant a entendu, et supprimer des enregistrements audio envoyés dans le cloud. L’entreprise rappelle aussi qu’Alexa n’envoie ces extraits sur ses serveurs que si l’appareil détecte le mot d’activation (ça va mieux en le disant).

Image : Amazon

Quand un enfant discute avec Alexa+, un système de modération renforce les garde-fous et les protections conçues pour les minots. Il est aussi prévu que l’assistant soit disponible via un navigateur web, ce qui lui donnera des fonctions plus productives (résumés d’articles, rédaction de messages, création d’images, etc.).

  •  

☕️ Uber commence à trouver l’addition de l’IA un peu salée



Tout ce qui brille n’est pas IA. Plusieurs entreprises commencent à se rendre compte qu’il n’est pas forcément rentable d’injecter cette technologie dans tout et n’importe quoi.

Pour Andrew Macdonald, le directeur des opérations d’Uber, il est de plus en plus difficile de justifier les coûts liés à l’usage de l’IA générative. Invité du podcast Rapid Response, il a expliqué qu’une consommation élevée de tokens n’aboutissait pas nécessairement à une augmentation proportionnelle des fonctions utiles pour le consommateur.

Illustration : Flock

« Ce lien n’existe pas encore, n’est-ce pas ? », se demande-t-il. « Implicitement, je pense qu’il y a peut-être davantage de [fonctions] qui sont livrées, mais il est très difficile d’établir un lien clair entre [les tokens consommés] et le fait de se dire : « D’accord, maintenant nous produisons réellement 25 % de fonctionnalités utiles en plus pour les consommateurs » ».

Ce constat n’est pas isolé au sein d’Uber. En avril, le directeur technique de la plateforme VTC, Praveen Neppalli Naga, s’était étonné chez The Information d’avoir explosé son budget IA de l’année… en seulement quatre mois. Il expliquait alors que 70 % environ du code validé provient d’outils IA, tandis que les dépenses oscillent entre 500 et 2 000 $ par mois et par développeur. Les coûts liés à l’IA chez Uber ont été multipliés par six depuis 2024.

L’IA n’est pas « gratuite », poursuit Andrew Macdonald. Ça peut sembler être le cas quand on est un utilisateur lambda, mais la situation est très différente pour une entreprise. Cette petite musique commence à s’entendre un peu partout dans l’industrie ; les gains en productivité ne sont pas nécessairement au rendez-vous, tandis que des pratiques comme le tokenmaxxing montrent les limites de l’exploitation à outrance de cette technologie.

  •  
❌