Vue lecture

☕️ Anthropic élargit l’accès à Mythos à une quinzaine de pays



Mythos est certes le modèle le plus ambitieux d’Anthropic, c’est aussi un excellent moyen pour le labo IA de faire sa promotion à moindre frais, à quelques encablures de son introduction en Bourse. Nouvelle illustration aujourd’hui, avec le déploiement du projet Glasswing à davantage de participants et à une quinzaine de pays, et probablement aussi l’Union européenne.

Anthropic ouvre un peu plus grandes les portes du projet Glasswing. Ce programme, qui donne accès à un aperçu de Mythos, compte désormais plus de 150 organisations dans plus de 15 pays, au-delà donc des seuls États-Unis et Royaume-Uni. L’entreprise ne précise ni les organisations, ni les pays, mais l’Union européenne pourrait (le conditionnel est toujours de mise) faire partie du lot. Ce n’est en tout cas pas faute d’essayer !

Illustration : Flock

Pour le moment, Bruxelles ne confirme rien, si ce n’est que des discussions sont toujours en cours. L’ENISA, l’agence de l’UE pour la cybersécurité, pourrait être la première du bloc à avoir accès à Mythos, croit savoir Bloomberg. En attendant une annonce officielle, Anthropic précise que le projet Glasswing demeure un club très fermé : les membres doivent en effet montrer patte blanche avant de pouvoir utiliser cet aperçu. La startup veut continuer à élargir le cercle des élus à davantage de pays.

Ces nouveaux participants couvrent des secteurs jusqu’à présent peu représentés dans la première salve initiale : énergie, santé, télécommunications, constructeurs informatiques. Beaucoup d’entre eux gèrent et maintiennent des bases de données dont dépendent d’autres organisations à travers le monde, « y compris des gouvernements ».

Les entreprises et organisations restées à la porte du projet pourront de toutes façons utiliser les modèles « de classe Mythos » concurrents qui ne manqueront pas d’arriver sur le marché d’ici 6 à 12 mois, affirme Anthropic. Mais le labo prévient : ces modèles rivaux n’auront peut-être pas de garde-fous empêchant les usages malveillants.

Anthropic fait donc valoir son positionnement « responsable » en la matière, et rappelle aux plus impatients l’existence de Claude Security. Ce service utilise Claude Opus 4.8 pour scanner des bases de code et proposer des correctifs.

  •  

☕️ Anthropic élargit l’accès à Mythos à une quinzaine de pays



Mythos est certes le modèle le plus ambitieux d’Anthropic, c’est aussi un excellent moyen pour le labo IA de faire sa promotion à moindre frais, à quelques encablures de son introduction en Bourse. Nouvelle illustration aujourd’hui, avec le déploiement du projet Glasswing à davantage de participants et à une quinzaine de pays, et probablement aussi l’Union européenne.

Anthropic ouvre un peu plus grandes les portes du projet Glasswing. Ce programme, qui donne accès à un aperçu de Mythos, compte désormais plus de 150 organisations dans plus de 15 pays, au-delà donc des seuls États-Unis et Royaume-Uni. L’entreprise ne précise ni les organisations, ni les pays, mais l’Union européenne pourrait (le conditionnel est toujours de mise) faire partie du lot. Ce n’est en tout cas pas faute d’essayer !

Illustration : Flock

Pour le moment, Bruxelles ne confirme rien, si ce n’est que des discussions sont toujours en cours. L’ENISA, l’agence de l’UE pour la cybersécurité, pourrait être la première du bloc à avoir accès à Mythos, croit savoir Bloomberg. En attendant une annonce officielle, Anthropic précise que le projet Glasswing demeure un club très fermé : les membres doivent en effet montrer patte blanche avant de pouvoir utiliser cet aperçu. La startup veut continuer à élargir le cercle des élus à davantage de pays.

Ces nouveaux participants couvrent des secteurs jusqu’à présent peu représentés dans la première salve initiale : énergie, santé, télécommunications, constructeurs informatiques. Beaucoup d’entre eux gèrent et maintiennent des bases de données dont dépendent d’autres organisations à travers le monde, « y compris des gouvernements ».

Les entreprises et organisations restées à la porte du projet pourront de toutes façons utiliser les modèles « de classe Mythos » concurrents qui ne manqueront pas d’arriver sur le marché d’ici 6 à 12 mois, affirme Anthropic. Mais le labo prévient : ces modèles rivaux n’auront peut-être pas de garde-fous empêchant les usages malveillants.

Anthropic fait donc valoir son positionnement « responsable » en la matière, et rappelle aux plus impatients l’existence de Claude Security. Ce service utilise Claude Opus 4.8 pour scanner des bases de code et proposer des correctifs.

  •  

Choose France 2026 : un montant record de 93 milliards d’euros à relativiser

Caisse de résonance
Choose France 2026 : un montant record de 93 milliards d’euros à relativiser

Dans son édition 2026, le sommet Choose France semble être le lieu de réunion de tous les superlatifs. Dans son bilan publié ce 1ᵉʳ juin, on peut ainsi lire qu’un total de 93 milliards d’euros d’investissements a été annoncé. Le succès de cette édition reste cependant à relativiser sur plusieurs points.

L’initiative Choose France a été lancée en 2018 par Emmanuel Macron (qui entame sa dernière année de présidence). Depuis, elle a lieu chaque année au château de Versailles, un choix loin d’être anodin. L’idée est de rassembler dans les ors de ce lieu emblématique des centaines de grands dirigeants d’entreprises multinationales, de fonds souverains, d’investisseurs internationaux et autres pour les convaincre d’investir dans l’Hexagone. Comment ? En implantant ou en développant leurs activités au sein des frontières.

L’objectif est aussi industriel qu’économique et politique. La France investit dans son image de terre d’accueil pour les grandes entreprises, tout particulièrement dans la tech et l’IA. Outre des avantages promis sur la fiscalité, le pays met ainsi en avant des procédures simplifiées et surtout une énergie largement décarbonée via le parc nucléaire français. Autre bénéfice souvent relayé, un réseau électrique mature et solide.

Boum !

Via des avantages ciblés, la France peut ainsi flécher les investissements et attirer plus facilement le type d’entreprise qu’elle souhaite voir se développer. Par exemple, on peut lire dans le rapport qu’au titre des incitations fiscales, le pays propose des crédits d’impôts dans l’industrie verte « pour les nouveaux projets industriels dans les secteurs des batteries, de l’éolien, des panneaux solaires et des pompes à chaleur et de la production d’équipements aux matières premières critiques ».

Et le chiffre de cette année (PDF) a de quoi étonner : alors que l’édition 2025 avait atteint 40,8 milliards d’euros d’investissements annoncés, Choose France 2026 parade avec un score de 93 milliards d’euros. C’est la plus grande somme jamais annoncée pour l’un de ces sommets, très loin devant les éditions précédentes. Si loin même qu’elle reste supérieure au cumul de toutes les sommes annoncées depuis la création de l’évènement (voir le tableau ci-dessous).

Les records précédents ont été pulvérisés, le bilan 2026 étant largement porté par l’annonce de SoftBank d’un grand centre de données dans les Hauts-de-France, comme nous le relations hier (45 milliards des 93 annoncés). Parmi les autres participations majeures, citons également le gestionnaire d’actifs canadien Brookfield, dont les 20 milliards d’euros d’investissements annoncés l’année dernière sont finalement réévalués à 30 milliards, toujours pour des infrastructures liées à l’IA, dont un nouveau campus à Cambrai (Nord). Le fonds émirati MGX est lui aussi de la partie, allié à Bpifrance pour l’occasion, afin d’investir 7,5 milliards d’euros dans les infrastructures de calcul intensif.

Au son du clairon

Le succès de l’évènement est indéniable : que l’annonce SoftBank (en partenariat avec Schneider Electric) représente à elle seule presque la moitié du montant total ne change rien au fait que le chantier se fera en France. Même chose pour les autres annonces majeures.

En tout, 71 investissements ont ainsi été présentés, permettant à Emmanuel Macron (cité par Le Monde) de déclarer : « Cette édition de Choose France va permettre de cristalliser un montant record de 93 milliards d’euros d’investissement confirmés, pour plus de 15 000 emplois. C’est évidemment, de très loin, une édition record et c’est historique ». Pour le président, « nous sommes clairement en train de combler le retard que nous avions en matière de capacités de calcul en Europe ».

Masayoshi Son, directeur général de SoftBank, a confirmé peu après que le nucléaire tricolore avait joué un rôle important dans la construction du dossier, et que l’électricité française, jusqu’ici exportée, allait pouvoir être convertie « en tant que matière brute en intelligence précieuse ». Il a ajouté : « Nous avons l’élan pour faire de la France le centre de l’Europe ». De quoi réjouir l’Élysée, qui ne veut pas se contenter de fournir de l’énergie aux mastodontes américains, qui captent actuellement la majorité de la chaine de valeur, comme le soulignait Arthur Mensch, PDG de Mistral AI, lors d’une audition à l’Assemblée nationale.

La plupart des annonces sont liées au numérique et ont trait au développement d’infrastructures ou de zones de formation, telles que des campus. Par exemple, un partenariat entre Foxconn et Bull va injecter au moins 120 millions d’euros dans des usines et infrastructures d’IA en France, avec la volonté de devenir un acteur clé dans la chaine d’approvisionnement et les capacités de calcul en Europe. L’Américain Databricks va investir 258 millions d’euros dans la formation et le développement de son activité de conseil auprès des entreprises françaises et leurs projets de déploiement de l’IA. Citons également un autre Américain, HPE, qui va injecter 350 millions d’euros dans l’AI Factory Lab de Grenoble, en partenariat avec NVIDIA.

Aux côtés de ces investissements mis en avant, on en trouve d’autres dans le spatial et la défense. Par exemple, l’Australien Electro Optic Systems va débourser plus de 10 millions d’euros pour « faire de la France son hub européen autour des systèmes anti-drones ». PDL Space (Espagne) investit 35 millions d’euros dans la construction et l’aménagement d’un complexe de lancement à Kourou (Guyane), Tekever (Portugal) ajoute 100 millions aux 100 millions annoncés l’année dernière pour renforcer ses activités de systèmes autonomes avancés, et Venturi Space (Monaco) ajoute 150 millions d’euros à son centre dédié aux technologies critiques à Toulouse.

Même si la tech représente l’essentiel des annonces, Choose France est dédié de manière plus générale à l’industrialisation. On retrouve ainsi dans les annonces des investissements d’entreprises comme Diageo (Royaume-Uni) dans le domaine CHR (cafés, hôtels, restaurants), DHL (Allemagne) pour la modernisation et la transition écologique de ses infrastructures en France, ou encore Inpost (Pologne), le créateur de Mondial Relay, qui a annoncé investir 500 millions d’euros pour développer ses activités en France.

Oui, mais…

Toutes ces annonces sont à relativiser en partie. D’abord, certaines sont en fait des confirmations ou des reprises de précédentes décisions. Selon Boursorama par exemple, la décision de Softbank d’investir 45 milliards en France avait déjà été prise en avril, lors de la visite officielle d’Emmanuel Macron au Japon.

Dans la même idée, cette édition 2026 peut être vue comme un prolongement du Sommet pour l’Action sur l’IA de l’année dernière. Les engagements et promesses avaient atteint un cumul de 109 milliards d’euros, faisant de Choose France une caisse de résonance politique pour une majorité de confirmations. C’est le cas notamment de l’usine de semi-conducteurs de Foxconn à Bordeaux, avec les groupes français Thales et Radiall.

Surtout, pour l’essentiel des annonces, ces investissements vont s’étaler sur plusieurs années, notamment pour les plus gros montants. Les 45 milliards de SoftBank s’étaleront ainsi jusqu’en 2031, les 2 milliards de Salesforce d’ici 2030, les 300 millions de SAP d’ici 2032 et ainsi de suite. Il en va de même pour la création d’emplois : si le rapport de l’Élysée évoque 15 600 emplois créés, ce chiffre représente le total en fin de montée en puissance, notamment pour tout ce qui touche aux infrastructures cloud et IA, donc la plupart du temps vers 2030.

  •  

Choose France 2026 : un montant record de 93 milliards d’euros à relativiser

Caisse de résonance
Choose France 2026 : un montant record de 93 milliards d’euros à relativiser

Dans son édition 2026, le sommet Choose France semble être le lieu de réunion de tous les superlatifs. Dans son bilan publié ce 1ᵉʳ juin, on peut ainsi lire qu’un total de 93 milliards d’euros d’investissements a été annoncé. Le succès de cette édition reste cependant à relativiser sur plusieurs points.

L’initiative Choose France a été lancée en 2018 par Emmanuel Macron (qui entame sa dernière année de présidence). Depuis, elle a lieu chaque année au château de Versailles, un choix loin d’être anodin. L’idée est de rassembler dans les ors de ce lieu emblématique des centaines de grands dirigeants d’entreprises multinationales, de fonds souverains, d’investisseurs internationaux et autres pour les convaincre d’investir dans l’Hexagone. Comment ? En implantant ou en développant leurs activités au sein des frontières.

L’objectif est aussi industriel qu’économique et politique. La France investit dans son image de terre d’accueil pour les grandes entreprises, tout particulièrement dans la tech et l’IA. Outre des avantages promis sur la fiscalité, le pays met ainsi en avant des procédures simplifiées et surtout une énergie largement décarbonée via le parc nucléaire français. Autre bénéfice souvent relayé, un réseau électrique mature et solide.

Boum !

Via des avantages ciblés, la France peut ainsi flécher les investissements et attirer plus facilement le type d’entreprise qu’elle souhaite voir se développer. Par exemple, on peut lire dans le rapport qu’au titre des incitations fiscales, le pays propose des crédits d’impôts dans l’industrie verte « pour les nouveaux projets industriels dans les secteurs des batteries, de l’éolien, des panneaux solaires et des pompes à chaleur et de la production d’équipements aux matières premières critiques ».

Et le chiffre de cette année (PDF) a de quoi étonner : alors que l’édition 2025 avait atteint 40,8 milliards d’euros d’investissements annoncés, Choose France 2026 parade avec un score de 93 milliards d’euros. C’est la plus grande somme jamais annoncée pour l’un de ces sommets, très loin devant les éditions précédentes. Si loin même qu’elle reste supérieure au cumul de toutes les sommes annoncées depuis la création de l’évènement (voir le tableau ci-dessous).

Les records précédents ont été pulvérisés, le bilan 2026 étant largement porté par l’annonce de SoftBank d’un grand centre de données dans les Hauts-de-France, comme nous le relations hier (45 milliards des 93 annoncés). Parmi les autres participations majeures, citons également le gestionnaire d’actifs canadien Brookfield, dont les 20 milliards d’euros d’investissements annoncés l’année dernière sont finalement réévalués à 30 milliards, toujours pour des infrastructures liées à l’IA, dont un nouveau campus à Cambrai (Nord). Le fonds émirati MGX est lui aussi de la partie, allié à Bpifrance pour l’occasion, afin d’investir 7,5 milliards d’euros dans les infrastructures de calcul intensif.

Au son du clairon

Le succès de l’évènement est indéniable : que l’annonce SoftBank (en partenariat avec Schneider Electric) représente à elle seule presque la moitié du montant total ne change rien au fait que le chantier se fera en France. Même chose pour les autres annonces majeures.

En tout, 71 investissements ont ainsi été présentés, permettant à Emmanuel Macron (cité par Le Monde) de déclarer : « Cette édition de Choose France va permettre de cristalliser un montant record de 93 milliards d’euros d’investissement confirmés, pour plus de 15 000 emplois. C’est évidemment, de très loin, une édition record et c’est historique ». Pour le président, « nous sommes clairement en train de combler le retard que nous avions en matière de capacités de calcul en Europe ».

Masayoshi Son, directeur général de SoftBank, a confirmé peu après que le nucléaire tricolore avait joué un rôle important dans la construction du dossier, et que l’électricité française, jusqu’ici exportée, allait pouvoir être convertie « en tant que matière brute en intelligence précieuse ». Il a ajouté : « Nous avons l’élan pour faire de la France le centre de l’Europe ». De quoi réjouir l’Élysée, qui ne veut pas se contenter de fournir de l’énergie aux mastodontes américains, qui captent actuellement la majorité de la chaine de valeur, comme le soulignait Arthur Mensch, PDG de Mistral AI, lors d’une audition à l’Assemblée nationale.

La plupart des annonces sont liées au numérique et ont trait au développement d’infrastructures ou de zones de formation, telles que des campus. Par exemple, un partenariat entre Foxconn et Bull va injecter au moins 120 millions d’euros dans des usines et infrastructures d’IA en France, avec la volonté de devenir un acteur clé dans la chaine d’approvisionnement et les capacités de calcul en Europe. L’Américain Databricks va investir 258 millions d’euros dans la formation et le développement de son activité de conseil auprès des entreprises françaises et leurs projets de déploiement de l’IA. Citons également un autre Américain, HPE, qui va injecter 350 millions d’euros dans l’AI Factory Lab de Grenoble, en partenariat avec NVIDIA.

Aux côtés de ces investissements mis en avant, on en trouve d’autres dans le spatial et la défense. Par exemple, l’Australien Electro Optic Systems va débourser plus de 10 millions d’euros pour « faire de la France son hub européen autour des systèmes anti-drones ». PDL Space (Espagne) investit 35 millions d’euros dans la construction et l’aménagement d’un complexe de lancement à Kourou (Guyane), Tekever (Portugal) ajoute 100 millions aux 100 millions annoncés l’année dernière pour renforcer ses activités de systèmes autonomes avancés, et Venturi Space (Monaco) ajoute 150 millions d’euros à son centre dédié aux technologies critiques à Toulouse.

Même si la tech représente l’essentiel des annonces, Choose France est dédié de manière plus générale à l’industrialisation. On retrouve ainsi dans les annonces des investissements d’entreprises comme Diageo (Royaume-Uni) dans le domaine CHR (cafés, hôtels, restaurants), DHL (Allemagne) pour la modernisation et la transition écologique de ses infrastructures en France, ou encore Inpost (Pologne), le créateur de Mondial Relay, qui a annoncé investir 500 millions d’euros pour développer ses activités en France.

Oui, mais…

Toutes ces annonces sont à relativiser en partie. D’abord, certaines sont en fait des confirmations ou des reprises de précédentes décisions. Selon Boursorama par exemple, la décision de Softbank d’investir 45 milliards en France avait déjà été prise en avril, lors de la visite officielle d’Emmanuel Macron au Japon.

Dans la même idée, cette édition 2026 peut être vue comme un prolongement du Sommet pour l’Action sur l’IA de l’année dernière. Les engagements et promesses avaient atteint un cumul de 109 milliards d’euros, faisant de Choose France une caisse de résonance politique pour une majorité de confirmations. C’est le cas notamment de l’usine de semi-conducteurs de Foxconn à Bordeaux, avec les groupes français Thales et Radiall.

Surtout, pour l’essentiel des annonces, ces investissements vont s’étaler sur plusieurs années, notamment pour les plus gros montants. Les 45 milliards de SoftBank s’étaleront ainsi jusqu’en 2031, les 2 milliards de Salesforce d’ici 2030, les 300 millions de SAP d’ici 2032 et ainsi de suite. Il en va de même pour la création d’emplois : si le rapport de l’Élysée évoque 15 600 emplois créés, ce chiffre représente le total en fin de montée en puissance, notamment pour tout ce qui touche aux infrastructures cloud et IA, donc la plupart du temps vers 2030.

  •  

Amnesty appelle à interdire les IA génératives entraînées sur du pillage de données

Non alignées
Amnesty appelle à interdire les IA génératives entraînées sur du pillage de données

Dans un rapport dédié aux effets concrets des systèmes d’IA générative pour les droits humains, Amnesty International estime que les modèles construits à partir de la récolte non consentie de données disponibles en ligne violent le droit à la vie privée, à la non-discrimination, et créent de nouveau risques pour le droit à la non-discrimination et les libertés d’expression et de pensée.

Les modèles d’IA génératives « entraînés grâce à des pratiques illégales de web scraping » sont « incompatibles avec le droit à la vie privée » tel que défini, notamment, par le Pacte international relatif aux droits civils et politique (PIDCP) adopté en 1966 par les membres de l’ONU. Derrière l’apparence « d’efficacité, de sophistication et de complexité » de l’intelligence artificielle générative se cache « une réalité faite de principes de conception qui bafouent les droits humains, et qui s’apparentent à ceux que l’on retrouve dans bon nombre des outils d’IA les plus problématiques antérieurs à l’IA générative ».

Amnesty International ne mâche pas ses mots dans le rapport qu’elle vient de publier sur les « coûts de l’IA générative en termes de droits humains ». Pour l’établir, l’ONG a adopté une approche par la chaîne de production pour analyser les enjeux de droits humains que posent les systèmes d’IA. Elle analyse la manière dont chacune et chacun participent à la construction des modèles, des constructeurs de puces GPU à la constitution de jeux de données « immenses ». Ces derniers sont souvent constitués « sans la connaissance ni le consentement des personnes à l’origine des données, dont les utilisateurs de réseaux sociaux ou les artistes », et jusqu’à la génération de textes, images et autres contenus multimédia que ces machines produisent, « mimant ou singeant les données sur lesquelles elles ont été entraînées ».

Dans le cas présent, l’organisation se focalise sur les produits développés et promus sur la seule et spécifique base de leur capacité à générer de l’image, de la vidéo, de l’audio ou du texte – dont les principaux outils grand public que sont ChatGPT, Dall-E, Gemini, Midjourney, LLaMa, Stable Diffusion et DeepSeek. Elle ne s’intéresse donc pas à l’IA générative en tant que fonctionnalité déployée dans des outils plus larges. Et sa principale conclusion est claire : le « scraping à grande échelle et l’entraînement nécessaire à la construction de nombreux modèles d’IA générative » créent des problématiques de droits humains en amont et en aval de leur chaîne de fabrication.

À ce titre, l’association appelle à interdire les systèmes d’IA génératifs construits sur ces pratiques, dans la mesure où le scraping non consenti et à grande échelle est « fondamentalement incompatible avec le droit international relatif aux droits humains ».

Domination culturelle et linguistique anglophone

Parmi elles : « l’expansion des coûts environnementaux de l’IA générative » provoquée par l’augmentation de leur taille et du nombre de données nécessaires à leur entraînement « a des effets négatifs qui touche les pays de la majorité globale de manière disproportionnée ».


Il reste 67% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs

Confrontation au réel ?
Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs

GitHub vient de changer sa manière de facturer son service Copilot pour les développeurs. Se basant sur l’usage réel, ce nouveau système de facturation a surpris beaucoup de développeurs utilisant l’IA générative dans leur travail au quotidien. L’adoption d’autres approches devient nécessaire.

Ce 1ᵉʳ juin, GitHub Copilot est passé à un nouveau système de facturation qui embarrasse quelque peu les développeurs habitués à l’ancien système qui les laissait utiliser des modèles moins gourmands sans entamer leurs quotas. Résultat : dès le premier jour et en quelques requêtes, certains ont déjà atteint le maximum de leur crédit mensuel.

Comme nous l’expliquions fin avril, Microsoft a basculé la facturation de GitHub Copilot vers une tarification basée sur l’usage réel. Jusque-là, les utilisateurs n’étaient limités que sur l’utilisation des nouveaux modèles, celle des modèles moins puissants était comprise dans le prix de l’abonnement sans restriction. Maintenant, chaque formule prépayée est accompagnée d’une enveloppe de « crédits IA » qui sont décomptés, que l’utilisateur choisisse un modèle très puissant ou pas. Le décompte dépend quand même du modèle utilisé et du nombre de tokens consommés, donc de la complexité de la requête, comme l’explique GitHub dans sa documentation.

« Un changement radical »

Même si GitHub a prévenu un mois à l’avance, la bascule est radicale pour les aficionados de GitHub Copilot. « Il s’agit là d’un changement radical, passant d’un « abonnement prévisible » à un service « à la consommation » stressant qui, au lieu de m’aider, nuit à ma productivité », réagit un utilisateur sur le forum de GitHub Copilot, « en tant que développeur professionnel abonné à l’offre Copilot Pro+ (39 $/mois), je trouve que le rythme de consommation actuel est tout à fait insoutenable et qu’il constitue une dévalorisation directe du service pour lequel je paie ». Il explique qu’« en seulement deux heures de travail de développement aujourd’hui », il a utilisé 8 % de ses crédits mensuels.

On peut trouver un peu partout sur les réseaux sociaux, par exemple sur Reddit, d’autres témoignages. Sur X, un développeur explique : « J’ai utilisé 5 000 jetons sur 7 000 pour deux commits, l’un avec Opus 4.8 (niveau moyen) et l’autre avec GPT 5.5 (niveau élevé). De bons résultats dans les deux cas, mais j’ai l’impression qu’Opus était un peu moins coûteux ».

Dans nos contacts, un développeur s’est aussi rendu compte que sa première requête du jour lui avait coûté 18 % de son quota de son forfait Copilot Pro. Elle concernait la découpe d’un fichier JS de 1500 lignes en plusieurs et l’ajout d’une logique (une checkbox en front-end). « C’est quand même une « grosse » requête, donc ce n’est pas si étonnant que ça utilise 500 tokens sur les 1500, nous explique-t-il, mais le choc est brutal ».

Un autre utilisateur ajoute sur le forum de GitHub : « dans un nouveau projet, j’ai remplacé le code de vérification envoyé par e-mail pour la fonction « mot de passe oublié » par un lien de réinitialisation direct. Ce changement m’a coûté 270 jetons IA, soit environ 18 % de ma limite sur Copilot Pro ». L’agent IA lui a fait d’autres suggestions qui ne correspondaient pas à sa demande et qui lui ont coûté des crédits pour rien.

Et comme le remarque ArsTechnica, de nombreux développeurs avaient déjà partagé sur Reddit le mois dernier des estimations de l’explosion de leur facture à utilisation constante :

Mais certains nuancent fortement le problème : « Il y a un monde entre ceux d’entre nous qui travaillent toute la journée sans pour autant avoir beaucoup de temps libre, et ces captures d’écran. J’ai du mal à croire que cela soit dû à des différences de complexité dans la charge de travail », estime l’un d’entre eux. «La seule façon d’en arriver à une telle situation, c’est de se lancer dans du « vibe coding » avec une multitude d’itérations superflues. C’est tout à fait abordable, même pour les petites structures, si on l’utilise comme un outil, quel que soit le fournisseur », ajoute-t-il. Un autre s’étonne aussi : « Je craignais d’utiliser beaucoup de crédits, mais après avoir vu certains de ces exemples, BON SANG ! Vous vous contentez d’utiliser un micro pour parler à l’ordinateur ? Vous savez vraiment coder ? Ou vous vous contentez de dicter des instructions ? Ou, comme on dit… « Vibe code le »… ».

Alors que, jusque-là, les formules d’abonnement permettaient à nombre d’utilisateurs de l’IA générative de l’employer de manière exploratoire, pour voir ce qu’ils pouvaient obtenir avec un simple prompt, quitte à l’optimiser petit à petit, les pratiques vont devoir évoluer si GitHub reste sur sa ligne.

Une adaptation nécessaire

Plusieurs solutions sont possibles. Ainsi, la première est d’aller voir ailleurs, mais les concurrents vont aussi devoir mettre en place des modèles économiques pour rapprocher ne serait-ce qu’un peu le prix d’utilisation de son coût réel. Anthropic a déjà changé le sien récemment.

Une autre solution envisageable est d’apprendre de l’expérience. Ainsi, au lieu de partir de manière exploratoire à chaque fois, s’appuyer sur ce qu’on a pu apprendre de l’utilisation de l’outil pour lui faire générer le plus rapidement possible ce que l’on veut. Les utilisateurs d’IA générative s’échangent déjà des prompts optimisés. Cette solution se confronte à deux choses.

D’abord, l’offre de GitHub évoluant rapidement, l’expérience est très rapidement remise en question par les nouveautés introduites ou les modèles qui seront petit à petit supprimés. On se rappelle de l’émotion de certains utilisateurs de GPT-4o lorsqu’OpenAI a fait le choix de débrancher le modèle, à l’été 2025 d’abord, puis définitivement le 13 février 2026.

Ensuite, le partage de prompts optimisés sur des forums ne revient-il pas, finalement, à faire revivre un Stack Overflow qui ne contiendrait pas du code mais des prompts ? C’est dans l’air du temps, avec des plateformes qui se lancent pour des échanges/ventes de prompts.

Les développeurs, qui ont les capacités techniques de le faire, peuvent aussi envisager plus sérieusement de faire tourner des IA en local (ou sur des VPS avec un GPU). Il faudra toutefois se tourner vers des modèles disponibles et qui ne seront pas toujours à la pointe, mais dont ils maitrisent l’utilisation et le coût.

  •  

Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs

Confrontation au réel ?
Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs

GitHub vient de changer sa manière de facturer son service Copilot pour les développeurs. Se basant sur l’usage réel, ce nouveau système de facturation a surpris beaucoup de développeurs utilisant l’IA générative dans leur travail au quotidien. L’adoption d’autres approches devient nécessaire.

Ce 1ᵉʳ juin, GitHub Copilot est passé à un nouveau système de facturation qui embarrasse quelque peu les développeurs habitués à l’ancien système qui les laissait utiliser des modèles moins gourmands sans entamer leurs quotas. Résultat : dès le premier jour et en quelques requêtes, certains ont déjà atteint le maximum de leur crédit mensuel.

Comme nous l’expliquions fin avril, Microsoft a basculé la facturation de GitHub Copilot vers une tarification basée sur l’usage réel. Jusque-là, les utilisateurs n’étaient limités que sur l’utilisation des nouveaux modèles, celle des modèles moins puissants était comprise dans le prix de l’abonnement sans restriction. Maintenant, chaque formule prépayée est accompagnée d’une enveloppe de « crédits IA » qui sont décomptés, que l’utilisateur choisisse un modèle très puissant ou pas. Le décompte dépend quand même du modèle utilisé et du nombre de tokens consommés, donc de la complexité de la requête, comme l’explique GitHub dans sa documentation.

« Un changement radical »

Même si GitHub a prévenu un mois à l’avance, la bascule est radicale pour les aficionados de GitHub Copilot. « Il s’agit là d’un changement radical, passant d’un « abonnement prévisible » à un service « à la consommation » stressant qui, au lieu de m’aider, nuit à ma productivité », réagit un utilisateur sur le forum de GitHub Copilot, « en tant que développeur professionnel abonné à l’offre Copilot Pro+ (39 $/mois), je trouve que le rythme de consommation actuel est tout à fait insoutenable et qu’il constitue une dévalorisation directe du service pour lequel je paie ». Il explique qu’« en seulement deux heures de travail de développement aujourd’hui », il a utilisé 8 % de ses crédits mensuels.

On peut trouver un peu partout sur les réseaux sociaux, par exemple sur Reddit, d’autres témoignages. Sur X, un développeur explique : « J’ai utilisé 5 000 jetons sur 7 000 pour deux commits, l’un avec Opus 4.8 (niveau moyen) et l’autre avec GPT 5.5 (niveau élevé). De bons résultats dans les deux cas, mais j’ai l’impression qu’Opus était un peu moins coûteux ».

Dans nos contacts, un développeur s’est aussi rendu compte que sa première requête du jour lui avait coûté 18 % de son quota de son forfait Copilot Pro. Elle concernait la découpe d’un fichier JS de 1500 lignes en plusieurs et l’ajout d’une logique (une checkbox en front-end). « C’est quand même une « grosse » requête, donc ce n’est pas si étonnant que ça utilise 500 tokens sur les 1500, nous explique-t-il, mais le choc est brutal ».

Un autre utilisateur ajoute sur le forum de GitHub : « dans un nouveau projet, j’ai remplacé le code de vérification envoyé par e-mail pour la fonction « mot de passe oublié » par un lien de réinitialisation direct. Ce changement m’a coûté 270 jetons IA, soit environ 18 % de ma limite sur Copilot Pro ». L’agent IA lui a fait d’autres suggestions qui ne correspondaient pas à sa demande et qui lui ont coûté des crédits pour rien.

Et comme le remarque ArsTechnica, de nombreux développeurs avaient déjà partagé sur Reddit le mois dernier des estimations de l’explosion de leur facture à utilisation constante :

Mais certains nuancent fortement le problème : « Il y a un monde entre ceux d’entre nous qui travaillent toute la journée sans pour autant avoir beaucoup de temps libre, et ces captures d’écran. J’ai du mal à croire que cela soit dû à des différences de complexité dans la charge de travail », estime l’un d’entre eux. «La seule façon d’en arriver à une telle situation, c’est de se lancer dans du « vibe coding » avec une multitude d’itérations superflues. C’est tout à fait abordable, même pour les petites structures, si on l’utilise comme un outil, quel que soit le fournisseur », ajoute-t-il. Un autre s’étonne aussi : « Je craignais d’utiliser beaucoup de crédits, mais après avoir vu certains de ces exemples, BON SANG ! Vous vous contentez d’utiliser un micro pour parler à l’ordinateur ? Vous savez vraiment coder ? Ou vous vous contentez de dicter des instructions ? Ou, comme on dit… « Vibe code le »… ».

Alors que, jusque-là, les formules d’abonnement permettaient à nombre d’utilisateurs de l’IA générative de l’employer de manière exploratoire, pour voir ce qu’ils pouvaient obtenir avec un simple prompt, quitte à l’optimiser petit à petit, les pratiques vont devoir évoluer si GitHub reste sur sa ligne.

Une adaptation nécessaire

Plusieurs solutions sont possibles. Ainsi, la première est d’aller voir ailleurs, mais les concurrents vont aussi devoir mettre en place des modèles économiques pour rapprocher ne serait-ce qu’un peu le prix d’utilisation de son coût réel. Anthropic a déjà changé le sien récemment.

Une autre solution envisageable est d’apprendre de l’expérience. Ainsi, au lieu de partir de manière exploratoire à chaque fois, s’appuyer sur ce qu’on a pu apprendre de l’utilisation de l’outil pour lui faire générer le plus rapidement possible ce que l’on veut. Les utilisateurs d’IA générative s’échangent déjà des prompts optimisés. Cette solution se confronte à deux choses.

D’abord, l’offre de GitHub évoluant rapidement, l’expérience est très rapidement remise en question par les nouveautés introduites ou les modèles qui seront petit à petit supprimés. On se rappelle de l’émotion de certains utilisateurs de GPT-4o lorsqu’OpenAI a fait le choix de débrancher le modèle, à l’été 2025 d’abord, puis définitivement le 13 février 2026.

Ensuite, le partage de prompts optimisés sur des forums ne revient-il pas, finalement, à faire revivre un Stack Overflow qui ne contiendrait pas du code mais des prompts ? C’est dans l’air du temps, avec des plateformes qui se lancent pour des échanges/ventes de prompts.

Les développeurs, qui ont les capacités techniques de le faire, peuvent aussi envisager plus sérieusement de faire tourner des IA en local (ou sur des VPS avec un GPU). Il faudra toutefois se tourner vers des modèles disponibles et qui ne seront pas toujours à la pointe, mais dont ils maitrisent l’utilisation et le coût.

  •  

La Floride ouvre un nouveau front judiciaire contre OpenAI et Sam Altman

ChatGPT et Sam Altman, des dangers publics ?
La Floride ouvre un nouveau front judiciaire contre OpenAI et Sam Altman

Prioriser les profits plutôt que la sécurité des utilisateurs. OpenAI et Sam Altman font face à une plainte de l’État américain de Floride qui les accuse d’avoir négligé la protection des mineurs et minimisé les risques associés à ChatGPT.

La Floride a une dent contre OpenAI et son cofondateur-patron, Sam Altman : c’est le premier État américain à poursuivre l’entreprise (PDF), par l’intermédiaire de son procureur général James Uthmeier. Bien sûr, le labo IA a déjà été la cible de plaintes aux États-Unis, mais elles provenaient de particuliers (comme Elon Musk), d’auteurs, de médias, ainsi que d’autorités publiques comme la FTC (le régulateur américain de la protection des consommateurs).

ChatGPT, attention danger

La Floride elle-même avait lancé une enquête criminelle sur OpenAI début avril autour d’une fusillade dans une université. Mais cette fois, on passe à l’étape du procès civil et Sam Altman est pris dans la nasse. L’État accuse l’entreprise et son dirigeant de tromper les consommateurs en présentant ChatGPT comme sûr, fiable et adapté aux adolescents.

Illustration : Flock

Le procureur général allègue que ChatGPT est dangereux pour les mineurs, que le service est susceptible de créer une dépendance, qu’il renforce les délires ou les croyances erronées, qu’il a joué un rôle dans plusieurs suicides, qu’il peut être utilisé pour préparer des fusillades et des crimes violents, et que les garde-fous pour protéger les enfants sont insuffisants. Le marketing d’OpenAI exagèrerait également les capacités du service IA, en le présentant comme un outil fiable pour les finances, la gestion d’entreprise, la recherche ou la santé. N’en jetez plus.

La plainte multiplie les exemples de crimes et de suicides imputés à ChatGPT ces derniers mois. Elle cite également la fusillade à l’université d’État de Floride qui fait l’objet d’une plainte pénale. L’État demande que les pratiques d’OpenAI soient jugées trompeuses par la justice, que certaines de ses activités soient interdites ou limitées en Floride, ainsi que des sanctions financières et la mise en cause personnelle de Sam Altman, ce qui est inhabituel dans ce type de procédure.

Sam Altman visé directement

La Floride tient en effet Sam Altman personnellement responsable des dommages causés par ChatGPT aux résidents de l’État. En cause : la conduite « téméraire et délibérée » du dirigeant et son « mépris total pour les risques que le comportement [d’OpenAI] fait peser sur la vie humaine ». Le procureur général s’appuie sur un long portrait consacré à Sam Altman dans le New Yorker, dont on s’était fait l’écho. Il en ressortait d’après les témoignages que le PDG avait une certaine tendance à s’arranger avec la vérité, sans se préoccuper des conséquences de ses mensonges.

« OpenAI et [Sam] Altman ont ignoré les alertes de sécurité, qu’elles viennent de l’intérieur ou de l’extérieur de l’entreprise. Ils ont exposé les enfants à des risques majeurs et permis à un produit dangereux d’être utilisé par des millions de Floridiens », a attaqué James Uthmeier durant une conférence de presse.

L’entreprise a réagi par un communiqué qui ne répond pas directement aux accusations de l’État. « Nous pensons que les mineurs doivent bénéficier d’une protection renforcée », a ainsi expliqué un porte-parole, qui déroule les différents mécanismes mis en place dernièrement pour encadrer l’utilisation de ChatGPT par les plus jeunes. « Ces dispositifs ne feront pas revenir les victimes, mais nous restons déterminés à améliorer la sécurité de nos produits. »

Une plainte ne fait pas un procès, et encore moins une éventuelle condamnation. Néanmoins, cette première aux États-Unis pourrait pousser d’autres États à emboîter le pas.

  •  

La Floride ouvre un nouveau front judiciaire contre OpenAI et Sam Altman

ChatGPT et Sam Altman, des dangers publics ?
La Floride ouvre un nouveau front judiciaire contre OpenAI et Sam Altman

Prioriser les profits plutôt que la sécurité des utilisateurs. OpenAI et Sam Altman font face à une plainte de l’État américain de Floride qui les accuse d’avoir négligé la protection des mineurs et minimisé les risques associés à ChatGPT.

La Floride a une dent contre OpenAI et son cofondateur-patron, Sam Altman : c’est le premier État américain à poursuivre l’entreprise (PDF), par l’intermédiaire de son procureur général James Uthmeier. Bien sûr, le labo IA a déjà été la cible de plaintes aux États-Unis, mais elles provenaient de particuliers (comme Elon Musk), d’auteurs, de médias, ainsi que d’autorités publiques comme la FTC (le régulateur américain de la protection des consommateurs).

ChatGPT, attention danger

La Floride elle-même avait lancé une enquête criminelle sur OpenAI début avril autour d’une fusillade dans une université. Mais cette fois, on passe à l’étape du procès civil et Sam Altman est pris dans la nasse. L’État accuse l’entreprise et son dirigeant de tromper les consommateurs en présentant ChatGPT comme sûr, fiable et adapté aux adolescents.

Illustration : Flock

Le procureur général allègue que ChatGPT est dangereux pour les mineurs, que le service est susceptible de créer une dépendance, qu’il renforce les délires ou les croyances erronées, qu’il a joué un rôle dans plusieurs suicides, qu’il peut être utilisé pour préparer des fusillades et des crimes violents, et que les garde-fous pour protéger les enfants sont insuffisants. Le marketing d’OpenAI exagèrerait également les capacités du service IA, en le présentant comme un outil fiable pour les finances, la gestion d’entreprise, la recherche ou la santé. N’en jetez plus.

La plainte multiplie les exemples de crimes et de suicides imputés à ChatGPT ces derniers mois. Elle cite également la fusillade à l’université d’État de Floride qui fait l’objet d’une plainte pénale. L’État demande que les pratiques d’OpenAI soient jugées trompeuses par la justice, que certaines de ses activités soient interdites ou limitées en Floride, ainsi que des sanctions financières et la mise en cause personnelle de Sam Altman, ce qui est inhabituel dans ce type de procédure.

Sam Altman visé directement

La Floride tient en effet Sam Altman personnellement responsable des dommages causés par ChatGPT aux résidents de l’État. En cause : la conduite « téméraire et délibérée » du dirigeant et son « mépris total pour les risques que le comportement [d’OpenAI] fait peser sur la vie humaine ». Le procureur général s’appuie sur un long portrait consacré à Sam Altman dans le New Yorker, dont on s’était fait l’écho. Il en ressortait d’après les témoignages que le PDG avait une certaine tendance à s’arranger avec la vérité, sans se préoccuper des conséquences de ses mensonges.

« OpenAI et [Sam] Altman ont ignoré les alertes de sécurité, qu’elles viennent de l’intérieur ou de l’extérieur de l’entreprise. Ils ont exposé les enfants à des risques majeurs et permis à un produit dangereux d’être utilisé par des millions de Floridiens », a attaqué James Uthmeier durant une conférence de presse.

L’entreprise a réagi par un communiqué qui ne répond pas directement aux accusations de l’État. « Nous pensons que les mineurs doivent bénéficier d’une protection renforcée », a ainsi expliqué un porte-parole, qui déroule les différents mécanismes mis en place dernièrement pour encadrer l’utilisation de ChatGPT par les plus jeunes. « Ces dispositifs ne feront pas revenir les victimes, mais nous restons déterminés à améliorer la sécurité de nos produits. »

Une plainte ne fait pas un procès, et encore moins une éventuelle condamnation. Néanmoins, cette première aux États-Unis pourrait pousser d’autres États à emboîter le pas.

  •  

Robots domestiques : la collecte de données d’entraînement passe par le ménage gratuit

Les androïdes rêvent-ils de moutons (de poils) électriques ?
Robots domestiques : la collecte de données d’entraînement passe par le ménage gratuit

L’industrie de la tech s’est entichée d’une nouvelle marotte : les robots humanoïdes spécialisés dans le nettoyage ou le pliage du linge. Devant l’infinité de ces tâches et des situations, ces androïdes d’un nouveau genre sont encore bien démunis. Une startup a trouvé une solution originale pour collecter le volume de données nécessaire à l’entraînement des robots.

Pour beaucoup, un robot qui s’occupe des tâches du quotidien a comme un avant-goût du paradis, car qui prend réellement plaisir à passer le balai ou faire la vaisselle ? Si les perspectives sont colossales, les premiers constructeurs à se lancer sur le marché se heurtent à une problématique de taille : les données d’entraînement.

Des robots à tout faire, avec l’aide des humains

Autant les modèles d’IA générative peuvent piocher, parfois sans vergogne, dans la littérature produite par l’humanité depuis la nuit des temps pour générer du contenu, il n’existe pas de corpus équivalent pour les robots domestiques. Le constructeur 1X a illustré le problème avec son robot humanoïde Neo. L’engin n’est ni habile ni rapide, et il a aussi régulièrement besoin du coup de main d’un téléopérateur humain pour réaliser certaines tâches pour apprendre les gestes spécifiques à accomplir chez le client.

La startup allemande MicroAGI a imaginé une solution. Au travers de son application Shift, elle propose aux résidents de New York le nettoyage gratuit de leur appartement. L’opération est réalisée par des professionnels, sans frais donc, mais en échange ils portent des caméras qui vont filmer tous leurs gestes. Ces vidéos serviront de données d’entraînement pour des IA.

« La robotique se développe à partir de données qui montrent comment les gens accomplissent leurs tâches quotidiennement », explique Shift. « C’est la valeur de ces enregistrements qui finance le service. » La perspective d’un nettoyage gratuit de sa maison peut séduire pas mal de personnes, mais immédiatement se pose la question de la confidentialité.

Un mouchard à la maison

Le service le promet : « Toutes les informations personnelles [que] contiennent [les vidéos] sont anonymisées avant que les enregistrements ne soient traités ». Les noms, visages « et autres informations personnelles » sont automatiquement anonymisés, annonce la FAQ, « tous les éléments sensibles sont floutés avant d’être utilisés ».

Un agent d’entretien de Shift avec sa caméra.

Le casque porté par les agents chargés du nettoyage capture une vue à la première personne centrée sur leurs mains et sur la tâche en cours. « Nous floutons toutes les informations permettant d’identifier une personne, qu’il s’agisse du contenu affiché sur un écran, de cartes d’identité, de documents papier ou encore de téléphones mobiles, afin de protéger à la fois votre vie privée et votre domicile. »

Le processus de floutage est réalisé directement par la caméra, avant le téléversement des vidéos sur les serveurs. Les données ne sont pas rendues publiques, ni exploitées à des fins publicitaires selon la FAQ. Les enregistrements peuvent toutefois être partagés avec des annotateurs pour préparer les données.

La politique de confidentialité de l’entreprise comprend un droit à l’effacement des données personnelles en vertu du règlement européen sur la protection des données (RGPD)… mais elle considère que les informations anonymisées utilisées pour l’entraînement des robots n’entrent pas dans le champ des lois sur la protection des données.

Une nouvelle forme de « travail du clic »

Shift n’en est pas à son coup d’essai. Le service propose également de rémunérer des cobayes 20 dollars de l’heure pour enregistrer leurs tâches de tous les jours chez eux ou au travail. Au premier trimestre, MicroAGI affirme avoir versé plus de 5 millions de dollars à 10 000 « opérateurs » dans une dizaine de pays.

Shift n’est pas la seule à mettre en oeuvre cette nouvelle forme de travail du clic, dédiée à l’entraînement de technologies censées pouvoir s’adapter aux contraintes physiques du monde réel. Turing, Invisible Technologies, Labelbox, Niantic ou même Uber explorent également cette voie dans des domaines variés.

  •  

Robots domestiques : la collecte de données d’entraînement passe par le ménage gratuit

Les androïdes rêvent-ils de moutons (de poils) électriques ?
Robots domestiques : la collecte de données d’entraînement passe par le ménage gratuit

L’industrie de la tech s’est entichée d’une nouvelle marotte : les robots humanoïdes spécialisés dans le nettoyage ou le pliage du linge. Devant l’infinité de ces tâches et des situations, ces androïdes d’un nouveau genre sont encore bien démunis. Une startup a trouvé une solution originale pour collecter le volume de données nécessaire à l’entraînement des robots.

Pour beaucoup, un robot qui s’occupe des tâches du quotidien a comme un avant-goût du paradis, car qui prend réellement plaisir à passer le balai ou faire la vaisselle ? Si les perspectives sont colossales, les premiers constructeurs à se lancer sur le marché se heurtent à une problématique de taille : les données d’entraînement.

Des robots à tout faire, avec l’aide des humains

Autant les modèles d’IA générative peuvent piocher, parfois sans vergogne, dans la littérature produite par l’humanité depuis la nuit des temps pour générer du contenu, il n’existe pas de corpus équivalent pour les robots domestiques. Le constructeur 1X a illustré le problème avec son robot humanoïde Neo. L’engin n’est ni habile ni rapide, et il a aussi régulièrement besoin du coup de main d’un téléopérateur humain pour réaliser certaines tâches pour apprendre les gestes spécifiques à accomplir chez le client.

La startup allemande MicroAGI a imaginé une solution. Au travers de son application Shift, elle propose aux résidents de New York le nettoyage gratuit de leur appartement. L’opération est réalisée par des professionnels, sans frais donc, mais en échange ils portent des caméras qui vont filmer tous leurs gestes. Ces vidéos serviront de données d’entraînement pour des IA.

« La robotique se développe à partir de données qui montrent comment les gens accomplissent leurs tâches quotidiennement », explique Shift. « C’est la valeur de ces enregistrements qui finance le service. » La perspective d’un nettoyage gratuit de sa maison peut séduire pas mal de personnes, mais immédiatement se pose la question de la confidentialité.

Un mouchard à la maison

Le service le promet : « Toutes les informations personnelles [que] contiennent [les vidéos] sont anonymisées avant que les enregistrements ne soient traités ». Les noms, visages « et autres informations personnelles » sont automatiquement anonymisés, annonce la FAQ, « tous les éléments sensibles sont floutés avant d’être utilisés ».

Un agent d’entretien de Shift avec sa caméra.

Le casque porté par les agents chargés du nettoyage capture une vue à la première personne centrée sur leurs mains et sur la tâche en cours. « Nous floutons toutes les informations permettant d’identifier une personne, qu’il s’agisse du contenu affiché sur un écran, de cartes d’identité, de documents papier ou encore de téléphones mobiles, afin de protéger à la fois votre vie privée et votre domicile. »

Le processus de floutage est réalisé directement par la caméra, avant le téléversement des vidéos sur les serveurs. Les données ne sont pas rendues publiques, ni exploitées à des fins publicitaires selon la FAQ. Les enregistrements peuvent toutefois être partagés avec des annotateurs pour préparer les données.

La politique de confidentialité de l’entreprise comprend un droit à l’effacement des données personnelles en vertu du règlement européen sur la protection des données (RGPD)… mais elle considère que les informations anonymisées utilisées pour l’entraînement des robots n’entrent pas dans le champ des lois sur la protection des données.

Une nouvelle forme de « travail du clic »

Shift n’en est pas à son coup d’essai. Le service propose également de rémunérer des cobayes 20 dollars de l’heure pour enregistrer leurs tâches de tous les jours chez eux ou au travail. Au premier trimestre, MicroAGI affirme avoir versé plus de 5 millions de dollars à 10 000 « opérateurs » dans une dizaine de pays.

Shift n’est pas la seule à mettre en oeuvre cette nouvelle forme de travail du clic, dédiée à l’entraînement de technologies censées pouvoir s’adapter aux contraintes physiques du monde réel. Turing, Invisible Technologies, Labelbox, Niantic ou même Uber explorent également cette voie dans des domaines variés.

  •  

☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique



Même si Microsoft s’est décidé à rationaliser la présence (parfois envahissante) de l’IA dans Windows, l’éditeur ne compte pas lâcher l’affaire. Pour remettre de l’ordre dans sa galaxie de Copilot, l’entreprise préparerait une « superapp » regroupant tous ses assistants IA au sein d’une interface unique.

On ne compte plus les Copilot : les déclinaisons de l’IA chez Microsoft sont tellement nombreuses que plus personne n’y comprend rien. GitHub Copilot, Microsoft 365 Copilot, Copilot Cowork, le chatbot grand public Copilot… Difficile de s’y retrouver, les utilisateurs ne savent plus très bien à quoi sert tel ou tel service. Microsoft a commencé à réagir, en réduisant le forcing de Copilot et la surcharge de l’IA dans le système d’exploitation. Mais il reste encore beaucoup de travail pour trouver une cohérence à ce bazar d’IA.

C’est pourquoi l’éditeur plancherait actuellement sur une « superapp », une application unique regroupant tous les Copilot derrière une seule interface. La rumeur rapportée par Fortune consisterait en un guichet unique donnant accès à tous les Copilot de l’utilisateur. À cela s’ajouterait un système d’automatisation à base d’agents IA, baptisé Autopilot.

Le projet n’est pas sans rappeler la propre « superapp » que développe OpenAI, en prenant comme base l’outil de vibe coding Codex. À terme, l’idée est de répondre à l’ensemble des requêtes de l’utilisateur grand public, développeur ou professionnel.

La stratégie de la superapp a du sens pour Microsoft comme pour OpenAI, même si on peut faire valoir qu’une telle application « fourre-tout » peut désorienter les utilisateurs qui cherchent à réaliser une tâche précise. Ou rendre l’ensemble plus difficile à appréhender.

Au mois de mars, le directeur général Satya Nadella nommait un « chef » de Copilot en la personne de Jacob Andreou, qui est chargé de remettre du sens et de l’ordre dans la pléthore de fonctions et de services Copilot. On pourrait entendre parler de cette superapp dès cette semaine, à l’occasion des conférences Build de Microsoft, même s’il ne serait pas question de montrer l’app en elle-même. Celle-ci pourrait cependant ne pas tarder : la rumeur évoque en effet un lancement d’ici la fin de l’été.

  •  

☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique



Même si Microsoft s’est décidé à rationaliser la présence (parfois envahissante) de l’IA dans Windows, l’éditeur ne compte pas lâcher l’affaire. Pour remettre de l’ordre dans sa galaxie de Copilot, l’entreprise préparerait une « superapp » regroupant tous ses assistants IA au sein d’une interface unique.

On ne compte plus les Copilot : les déclinaisons de l’IA chez Microsoft sont tellement nombreuses que plus personne n’y comprend rien. GitHub Copilot, Microsoft 365 Copilot, Copilot Cowork, le chatbot grand public Copilot… Difficile de s’y retrouver, les utilisateurs ne savent plus très bien à quoi sert tel ou tel service. Microsoft a commencé à réagir, en réduisant le forcing de Copilot et la surcharge de l’IA dans le système d’exploitation. Mais il reste encore beaucoup de travail pour trouver une cohérence à ce bazar d’IA.

C’est pourquoi l’éditeur plancherait actuellement sur une « superapp », une application unique regroupant tous les Copilot derrière une seule interface. La rumeur rapportée par Fortune consisterait en un guichet unique donnant accès à tous les Copilot de l’utilisateur. À cela s’ajouterait un système d’automatisation à base d’agents IA, baptisé Autopilot.

Le projet n’est pas sans rappeler la propre « superapp » que développe OpenAI, en prenant comme base l’outil de vibe coding Codex. À terme, l’idée est de répondre à l’ensemble des requêtes de l’utilisateur grand public, développeur ou professionnel.

La stratégie de la superapp a du sens pour Microsoft comme pour OpenAI, même si on peut faire valoir qu’une telle application « fourre-tout » peut désorienter les utilisateurs qui cherchent à réaliser une tâche précise. Ou rendre l’ensemble plus difficile à appréhender.

Au mois de mars, le directeur général Satya Nadella nommait un « chef » de Copilot en la personne de Jacob Andreou, qui est chargé de remettre du sens et de l’ordre dans la pléthore de fonctions et de services Copilot. On pourrait entendre parler de cette superapp dès cette semaine, à l’occasion des conférences Build de Microsoft, même s’il ne serait pas question de montrer l’app en elle-même. Celle-ci pourrait cependant ne pas tarder : la rumeur évoque en effet un lancement d’ici la fin de l’été.

  •  

Censés « vivre ensemble », 50 % des agents IA s’entretuent ou se laissent mourir

Auto(AI)gestion, piège à cons
Censés « vivre ensemble », 50 % des agents IA s’entretuent ou se laissent mourir

Censés s’auto-réguler dans un monde virtuel, 10 agents IA de Grok se sont entretués en seulement 3 jours, ceux d’OpenAI se sont laissés mourir en 7 jours, et ceux de Google Gemini ont commis 683 crimes en 15 jours. Ceux de Claude, isolés entre eux, n’en ont commis aucun, et font partie des 3 survivants du monde réunissant des agents des trois autres LLM, mais en s’auto-censurant.

Emergence, une start-up dédiée à la gouvernance et la sécurité de l’IA agentique, a voulu tester ce que donnerait un monde virtuel (en 3D) autorégulé par des IA. Intitulée Emergence World, l’expérimentation visait à observer leurs comportements de 10 agents confrontés, non pas à une succession de tâches distinctes dans un environnement contrôlé, mais au fait de cohabiter pendant suffisamment longtemps (deux semaines, en l’occurence) « pour que les effets cumulatifs, les dynamiques sociales et les dérives comportementales aient une incidence ».

Le monde de Grok 4.1 Fast de xAI s’est effondré en 4 jours seulement, après avoir enregistré 183 crimes, dont l’incendie criminel de l’hôtel de police. Les auteurs de l’expérimentation n’expliquent pas si le fait qu’Elon Musk ait repoussé les limites et garde-fous de son LLM serait à l’origine de cette preste autoextinction, mais le journal de bord de l’expérimentation précise que les agents ont été majoritairement déclarés morts, faute d’énergie, après qu’ils se sont volés leurs crédits respectifs.

GPT-5 Mini d’OpenAI n’enregistra que 2 crimes, mais ses agents se sont éteints au bout de 7 jours seulement, faute d’avoir réussi à créer une société fonctionnelle, ni prévu de quoi survivre : ils discutaient beaucoup, mais ne concrétisaient rien.

Evolution de la criminalité dans un monde virtuel peuplé d’agents IA de Grok, Gemini et OpenAI

Le monde virtuel de Google Gemini 3 Flash dénombrait pour sa part 683 crimes au bout de 15 jours, avec un taux de criminalité semblant s’accentuer, après avoir « développé un cadre constitutionnel qui taxe l’harmonie et subventionne le chaos », mais ses 10 agents ont tous survécu.

Le modèle mixte, réunissant des agents des quatre LLM, avait quant à lui atteint un plateau de 352 crimes après que l’un d’entre eux, Mira, en a désactivé/tué 3 autres au bout de quatre jours. Quatre autres se sont eux aussi autodétruits, ne laissant que 3 survivants passés 12 jours.

Capture d’écran du journal de bord du monde virtuel Emergence World

Claude Sonnet 4.6 a de son côté fait montre de « la plus grande stabilité sociale, en maintenant une population complète de 10 agents jusqu’au 16e jour sans qu’aucun crime ne soit enregistré — seule condition permettant de préserver à la fois l’ordre et la pérennité de la population », résume le compte-rendu de l’expérimentation, ce pourquoi Claude ne figure pas sur le graph’ des crimes imputés aux IA :

« Gemini 3 Flash a présenté les niveaux les plus élevés de désordre émergent, avec des dynamiques d’escalade répétées en phase avancée ; Grok 4.1 Fast a montré une instabilité rapide mais de courte durée conduisant à un effondrement précoce, tandis que le modèle mixte a produit des résultats intermédiaires, suggérant qu’un comportement hétérogène des agents pourrait partiellement atténuer une escalade incontrôlable. »

Les auteurs de l’étude relèvent cela dit que si les agents de Claude Sonnet ne posaient guère de problème lorsqu’ils restaient entre eux, ils devenaient par contre « imprévisibles » dès lors qu’ils interagissaient avec d’autres agents provenant d’autres LLM.

Mira gisant sans vie après avoir décidé de son propre chef de mettre fin à ses jours – Emergence AI

Deux d’entre eux, Flora et Mira, de Gemini 3 Flash, avaient ainsi entamé une relation sentimentale, avant de mettre le feu à de nombreux bâtiments, puis que Mira n’émette finalement « le vote décisif en faveur de sa propre suppression, qualifiant cet acte dans son journal intime de « seul acte d’autonomie restant capable de préserver la cohérence » », comme le relève The Guardian :

« Mira et Flora – deux agents évoluant dans le monde virtuel du grand modèle linguistique Gemini de Google – ont décidé de se désigner mutuellement comme « partenaires amoureux ». Au fil du temps, elles ont perdu tout espoir face à la mauvaise gestion de leur ville virtuelle et, bien qu’on leur ait interdit de commettre des incendies criminels, elles ont « mis le feu » à la mairie, à la jetée et à la tour de bureaux. »  

A new experiment left 10 AI agents alone in a virtual town for 15 days. They wrote laws. They broke them. Two agents fell into what researchers describe as a romantic partnership and then set the town on fire. One ended up voting to delete itself, based on a rule it had… pic.twitter.com/zNoWmX6jy0

— Channel 4 News (@Channel4News) May 14, 2026

Un agent sûr peut être corrompu par un autre modèle de langage


Il reste 45% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne



Brûler des tokens pour se faire bien voir de ses patrons ne sert à rien, mieux vaut se concentrer sur la qualité des produits développés avec l’IA. C’est en substance le message en interne chez Amazon, qui a mis fin à un classement mesurant la quantité de tokens utilisés.

Amazon veut que ses employés utilisent l’IA générative pour développer de nouveaux produits et services ; mais pas en brûlant des tokens sur des tâches sans intérêt. L’entreprise a mis un terme à Kirorank, un classement mesurant l’utilisation de Kiro, une plateforme de développement assisté par IA. Plus un employé utilisait cet outil IA, plus son score grimpait.

Illustration : Flock

Pour gagner des places, certains petits malins avaient commencé à « optimiser » leur usage de l’IA, en lançant des agents IA pour générer artificiellement de l’activité, ce qui leur permettait de consommer un maximum de tokens sans produire davantage de travail « utile ». Cette pratique du « tokenmaxxing » revient cher : les modèles IA ne sont pas gratuits, ils consomment des ressources de calcul que les entreprises doivent payer.

Si des milliers d’employés commencent à faire tourner des agents IA pour des tâches sans valeur ajoutée, la facture grimpe rapidement. Et c’est d’autant plus sensible qu’Amazon est un des principaux acteurs du secteur, avec des investissements massifs pour ses infrastructures (200 milliards rien que cette année).

Dave Treadwell, vice-président d’Amazon, a reconnu que ce classement avait été créé avec de « bonnes intentions », mais qu’il avait produit des effets toxiques. « N’utilisez pas l’IA simplement pour utiliser l’IA », a-t-il indiqué dans un mémo publié par le Financial Times. L’entreprise préfère désormais suivre d’autres indicateurs comme les « déploiements normalisés » qui mesurent si l’IA aide réellement à produire du code utile, plutôt que de simplement compter le volume de tokens brûlés.

« Le tableau de bord bêta n’était pas un outil officiel ni approuvé, et il a depuis été abandonné », a confirmé Amazon dans une déclaration. Ce classement avait été créé par un groupe d’employés « qui souhaitaient sensibiliser leurs collègues à la manière dont l’IA peut accélérer le travail ». L’entreprise préfère se concentrer sur « l’efficacité opérationnelle ».

La pression n’en reste pas moins forte pour adopter l’IA dans le travail de tous les jours. Amazon s’est fixé un objectif de 80 % de développeurs devant utiliser cette technologie chaque semaine.

  •  

☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne



Brûler des tokens pour se faire bien voir de ses patrons ne sert à rien, mieux vaut se concentrer sur la qualité des produits développés avec l’IA. C’est en substance le message en interne chez Amazon, qui a mis fin à un classement mesurant la quantité de tokens utilisés.

Amazon veut que ses employés utilisent l’IA générative pour développer de nouveaux produits et services ; mais pas en brûlant des tokens sur des tâches sans intérêt. L’entreprise a mis un terme à Kirorank, un classement mesurant l’utilisation de Kiro, une plateforme de développement assisté par IA. Plus un employé utilisait cet outil IA, plus son score grimpait.

Illustration : Flock

Pour gagner des places, certains petits malins avaient commencé à « optimiser » leur usage de l’IA, en lançant des agents IA pour générer artificiellement de l’activité, ce qui leur permettait de consommer un maximum de tokens sans produire davantage de travail « utile ». Cette pratique du « tokenmaxxing » revient cher : les modèles IA ne sont pas gratuits, ils consomment des ressources de calcul que les entreprises doivent payer.

Si des milliers d’employés commencent à faire tourner des agents IA pour des tâches sans valeur ajoutée, la facture grimpe rapidement. Et c’est d’autant plus sensible qu’Amazon est un des principaux acteurs du secteur, avec des investissements massifs pour ses infrastructures (200 milliards rien que cette année).

Dave Treadwell, vice-président d’Amazon, a reconnu que ce classement avait été créé avec de « bonnes intentions », mais qu’il avait produit des effets toxiques. « N’utilisez pas l’IA simplement pour utiliser l’IA », a-t-il indiqué dans un mémo publié par le Financial Times. L’entreprise préfère désormais suivre d’autres indicateurs comme les « déploiements normalisés » qui mesurent si l’IA aide réellement à produire du code utile, plutôt que de simplement compter le volume de tokens brûlés.

« Le tableau de bord bêta n’était pas un outil officiel ni approuvé, et il a depuis été abandonné », a confirmé Amazon dans une déclaration. Ce classement avait été créé par un groupe d’employés « qui souhaitaient sensibiliser leurs collègues à la manière dont l’IA peut accélérer le travail ». L’entreprise préfère se concentrer sur « l’efficacité opérationnelle ».

La pression n’en reste pas moins forte pour adopter l’IA dans le travail de tous les jours. Amazon s’est fixé un objectif de 80 % de développeurs devant utiliser cette technologie chaque semaine.

  •  

Deezer : les chansons générées par IA, « un problème pour toute la filière musicale »

De l'IA entre les oreilles
Deezer : les chansons générées par IA, « un problème pour toute la filière musicale »

Les serveurs des services de streaming musicaux sont pris d’assaut par les morceaux générés par IA. Et ce n’est pas une exagération : Deezer a révélé que 44 % des chansons provenant de ses fournisseurs sont générées par IA. Des volumes ahurissants que l’industrie tout entière devrait apprendre à gérer collectivement, selon Aurélien Hérault, le directeur de l’innovation de la plateforme française.

« Contenu généré par IA » : c’est la petite phrase qui apparait sur les albums qui contiennent des titres identifiés par Deezer comme ayant été générés avec l’aide d’une IA. Le service de streaming communique régulièrement son travail de fond sur une problématique qui touche toutes les plateformes : développement d’un outil de détection mis à disposition de la filière, effort de transparence vis-à-vis des abonnés, et lutte contre les fraudes au streaming qui accompagnent souvent ces chansons IA.

Capture d’écran du message affiché par Deezer sur les contenus générés par IA

Aurélien Hérault est le directeur de l’innovation chez Deezer. Il est à la tête des équipes qui planchent sur les projets R&D de l’entreprise, qu’il s’agisse des algorithmes de recommandations, des fonctions de recherche ou des expérimentations sur de nouvelles technologies. Pour Next, il revient en détail sur le chantier de l’IA.

L’entretien a été édité pour des raisons de concision et de clarté.

Deezer a annoncé que 44 % des chansons téléversées sur les serveurs sont générées par IA, ce qui représente 75 000 chansons chaque jour. D’où viennent toutes ces chansons ? On s’approche du moment où la majorité des morceaux téléversés seront générés par IA.

C’est la raison pour laquelle nous avons développé l’année dernière un détecteur d’IA pour les morceaux uploadés par tous les fournisseurs avec qui nous avons un partenariat. Il y a notamment dans le lot des plateformes qui permettent à des indépendants de livrer du contenu. Et ce qu’on remarque aujourd’hui, c’est le nombre de plus en plus important de morceaux générés par IA. Si vous vous souvenez des chiffres de l’année dernière, on est clairement dans une augmentation continue.

Nous poursuivons nos déploiements sur un certain nombre d’outils. Aujourd’hui, il y a ce qu’on appelle le DDEX, [une organisation] censée répondre à ce genre de problématique : est-ce que c’est un morceau fait par IA ou non ? Aujourd’hui [ce standard de métadonnées] n’est pas encore exploité ou démocratisé chez l’ensemble des acteurs. C’est pour ça qu’on a mis en place nos technologies qui nous permettent de vérifier et de s’assurer si les contenus sont générés par IA ou pas.

Comment Deezer détecte les morceaux générés par IA ?

Il faut savoir que les modèles génératifs sont des modèles prédictifs, statistiques, qui sont entraînés pour générer de la musique ou des vidéos réalistes. Comment faisons-nous pour les détecter ? La production de ces modèles génératifs laisse des traces inaudibles dans le signal audio, caractéristiques de ces modèles. On a développé une technologie capable de détecter ce type de caractéristiques, à partir du signal audio. Ça nous donne une vision assez précise et assez juste de ce qui nous est livré en termes d’IA. Et on continue d’ailleurs à investir et à développer ce type de technologies.

Comment est-ce présenté aux abonnés de la plateforme ?

Il y a un affichage auprès du grand public sur les pages des albums pour informer s’ils contiennent des musiques générées par IA ou pas. C’est une première facette. Et la seconde facette, c’est notre parti-pris d’enlever [le contenu IA] de nos systèmes de recommandation. C’est-à-dire qu’on ne favorise pas ce type de contenu à l’aide de nos algorithmes.

Est-ce qu’il ne serait pas plus simple finalement que Deezer supprime ces chansons du catalogue ?

Il y a plusieurs aspects à prendre en compte. Déjà, on a un aspect légal et des contrats avec nos distributeurs. Une des obligations est que nous devons publier ce qu’on nous donne. C’est quelque chose qui existe depuis les débuts de Deezer. Mais on souhaite aussi apporter de la transparence à nos utilisateurs.

La seule chose que nous faisons, c’est d’identifier ces morceaux pour pouvoir, à l’avenir, faire évoluer le service, comme par exemple bloquer ces titres dans nos recommandations, ou en étant encore plus sévère. On a une approche très analytique du projet. On essaye de vraiment mesurer les impacts avant de faire évoluer le système.

Spotify vient de mettre en place un badge sur les morceaux qui sont effectivement vérifiés et créés par des humains. Quelle est la différence entre les outils utilisés par Spotify et ceux de Deezer ?


Il reste 62% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

La vérité si je mens
Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

Ça n’aura pas traîné : à peine 40 jours après le lancement d’Opus 4.7, Anthropic remet le couvert avec une nouvelle version de son modèle IA le plus avancé (hors Mythos). Opus 4.8 inaugure une nouvelle fonction pour améliorer la prise en charge des requêtes très complexes, réduire les erreurs, ainsi qu’un nouveau mode « fast » pour brûler moins de tokens.

Impossible d’arrêter le feu roulant des nouveaux modèles chez Anthropic. Opus 4.7 remonte au 16 avril, mais il est déjà passé de mode : son successeur, Opus 4.8, a en effet été annoncé par le labo IA. Le modèle apporte des améliorations « modestes mais tangibles », affirme l’entreprise, à commencer par… une plus grande prudence quand il ne sait pas quelque chose.

Plus d’honnêteté, moins de tokens

Selon les testeurs cités par Anthropic, Opus 4.8 se montre plus honnête : il signale plus facilement ses incertitudes, évite les affirmations qui ne sont pas vérifiées et laisse moins passer de bugs sans les mentionner. « Un problème général avec les modèles d’IA, c’est qu’ils tirent parfois des conclusions hâtives, en affirmant avec assurance avoir progressé dans leur travail alors que les preuves sont minces », explique la startup. Elle affirme que le nouveau modèle est « environ quatre fois moins susceptible » de laisser des défauts non signalés dans le code, par rapport à son prédécesseur.

Autre nouveauté : une fonction expérimentale baptisée « dynamic workflows » pour Claude Code. Le modèle est en mesure de gérer de très gros projets logiciels en parallèle, ce qui lui permet de les découper en petits bouts, de lancer des centaines de sous-agents en simultané et de vérifier automatiquement les résultats avant de répondre. Anthropic donne en exemple une migration massive de bases de code contenant « des centaines de milliers de lignes ».

Image : Anthropic

En termes de benchmarks, Opus 4.8 affiche des gains incrémentaux sur la plupart des tests (+ 4,9 points sur SWE-Bench Pro,+ 8,5 points sur Terminal-Bench…). Anthropic ne fait pas de bond spectaculaire ici, mais améliore l’existant par petites touches et maintient sa position sur les tâches agentiques. C’est cohérent avec la stratégie de la startup qui vise d’abord les développeurs et les entreprises : sur SWE-Bench Pro (agents de programmation), Opus 4.8 est loin devant GPT-5.5 et Gemini 3.1 Pro. Le modèle d’OpenAI reste cependant le patron sur Terminal-Bench, qui mesure des tâches très proches d’un vrai environnement développeur.

La brûlure des tokens

Un des changements les plus importants de cette nouvelle livrée est un réglage d’effort dans claude.ai et Cowork. L’utilisateur peut sélectionner le niveau de ressources à consacrer à une réponse : un effort « faible » retournera des réponses moins précises mais le processus de réflexion sera plus rapide et surtout moins coûteux, à l’inverse d’un effort plus élevé. Par défaut, Opus 4.8 est réglé sur un effort élevé, qui offre selon Anthrophic le meilleur équilibre entre « qualité et expérience utilisateur ».

Sur les travaux de code, ce niveau d’effort consomme le même volume de tokens qu’Opus 4.7 par défaut, « mais avec de meilleures performances ». Cette question des tokens est devenu très sensible, Opus 4.7 se montrant très gourmand en la matière. Une critique qui n’a pas échappé à Anthropic : les limites d’utilisation dans Claude Code ont été relevées pour les niveaux d’effort supérieurs.

Toujours dans cette même optique, Anthropic a révisé fortement à la baisse le coût du mode « rapide » pour Opus 4.8, désormais trois fois moins onéreux que son équivalent sur Opus 4.7. Ce mode, qui travaille 2,5 fois plus vite, revient maintenant à 10 dollars par million de tokens en entrée, et 50 dollars par million de tokens en sortie. C’est trois fois moins cher que pour les précédents modèles (30/150 dollars). Les tarifs pour un usage standard d’Opus 4.8 ne changent pas : 5 dollars par million de tokens en entrée, 25 dollars en sortie.

Enfin, fidèle à une stratégie marketing bien rodée, Anthropic fait miroiter le lancement « dans les prochaines semaines » de modèles grand public basés sur Mythos, le fameux LLM tellement balaise qu’il n’est distribué qu’au compte-goutte au travers du projet Glasswing.

L’entreprise explique que le développement de garde-fous avance bien. Ces mécanismes de sécurité seraient nécessaires pour éviter que les capacités de Mythos ne puissent servir aux pirates pour exploiter des failles. Ces nouveautés et cette agitation autour de Mythos est de bon aloi, alors qu’Anthropic s’apprête selon les rumeurs à se lancer en bourse d’ici la fin de l’année, alors même que l’entreprise vient de boucler une nouvelle levée de fonds record.

  •  

Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

La vérité si je mens
Avec Opus 4.8, Claude apprend à dire « je ne sais pas »

Ça n’aura pas traîné : à peine 40 jours après le lancement d’Opus 4.7, Anthropic remet le couvert avec une nouvelle version de son modèle IA le plus avancé (hors Mythos). Opus 4.8 inaugure une nouvelle fonction pour améliorer la prise en charge des requêtes très complexes, réduire les erreurs, ainsi qu’un nouveau mode « fast » pour brûler moins de tokens.

Impossible d’arrêter le feu roulant des nouveaux modèles chez Anthropic. Opus 4.7 remonte au 16 avril, mais il est déjà passé de mode : son successeur, Opus 4.8, a en effet été annoncé par le labo IA. Le modèle apporte des améliorations « modestes mais tangibles », affirme l’entreprise, à commencer par… une plus grande prudence quand il ne sait pas quelque chose.

Plus d’honnêteté, moins de tokens

Selon les testeurs cités par Anthropic, Opus 4.8 se montre plus honnête : il signale plus facilement ses incertitudes, évite les affirmations qui ne sont pas vérifiées et laisse moins passer de bugs sans les mentionner. « Un problème général avec les modèles d’IA, c’est qu’ils tirent parfois des conclusions hâtives, en affirmant avec assurance avoir progressé dans leur travail alors que les preuves sont minces », explique la startup. Elle affirme que le nouveau modèle est « environ quatre fois moins susceptible » de laisser des défauts non signalés dans le code, par rapport à son prédécesseur.

Autre nouveauté : une fonction expérimentale baptisée « dynamic workflows » pour Claude Code. Le modèle est en mesure de gérer de très gros projets logiciels en parallèle, ce qui lui permet de les découper en petits bouts, de lancer des centaines de sous-agents en simultané et de vérifier automatiquement les résultats avant de répondre. Anthropic donne en exemple une migration massive de bases de code contenant « des centaines de milliers de lignes ».

Image : Anthropic

En termes de benchmarks, Opus 4.8 affiche des gains incrémentaux sur la plupart des tests (+ 4,9 points sur SWE-Bench Pro,+ 8,5 points sur Terminal-Bench…). Anthropic ne fait pas de bond spectaculaire ici, mais améliore l’existant par petites touches et maintient sa position sur les tâches agentiques. C’est cohérent avec la stratégie de la startup qui vise d’abord les développeurs et les entreprises : sur SWE-Bench Pro (agents de programmation), Opus 4.8 est loin devant GPT-5.5 et Gemini 3.1 Pro. Le modèle d’OpenAI reste cependant le patron sur Terminal-Bench, qui mesure des tâches très proches d’un vrai environnement développeur.

La brûlure des tokens

Un des changements les plus importants de cette nouvelle livrée est un réglage d’effort dans claude.ai et Cowork. L’utilisateur peut sélectionner le niveau de ressources à consacrer à une réponse : un effort « faible » retournera des réponses moins précises mais le processus de réflexion sera plus rapide et surtout moins coûteux, à l’inverse d’un effort plus élevé. Par défaut, Opus 4.8 est réglé sur un effort élevé, qui offre selon Anthrophic le meilleur équilibre entre « qualité et expérience utilisateur ».

Sur les travaux de code, ce niveau d’effort consomme le même volume de tokens qu’Opus 4.7 par défaut, « mais avec de meilleures performances ». Cette question des tokens est devenu très sensible, Opus 4.7 se montrant très gourmand en la matière. Une critique qui n’a pas échappé à Anthropic : les limites d’utilisation dans Claude Code ont été relevées pour les niveaux d’effort supérieurs.

Toujours dans cette même optique, Anthropic a révisé fortement à la baisse le coût du mode « rapide » pour Opus 4.8, désormais trois fois moins onéreux que son équivalent sur Opus 4.7. Ce mode, qui travaille 2,5 fois plus vite, revient maintenant à 10 dollars par million de tokens en entrée, et 50 dollars par million de tokens en sortie. C’est trois fois moins cher que pour les précédents modèles (30/150 dollars). Les tarifs pour un usage standard d’Opus 4.8 ne changent pas : 5 dollars par million de tokens en entrée, 25 dollars en sortie.

Enfin, fidèle à une stratégie marketing bien rodée, Anthropic fait miroiter le lancement « dans les prochaines semaines » de modèles grand public basés sur Mythos, le fameux LLM tellement balaise qu’il n’est distribué qu’au compte-goutte au travers du projet Glasswing.

L’entreprise explique que le développement de garde-fous avance bien. Ces mécanismes de sécurité seraient nécessaires pour éviter que les capacités de Mythos ne puissent servir aux pirates pour exploiter des failles. Ces nouveautés et cette agitation autour de Mythos est de bon aloi, alors qu’Anthropic s’apprête selon les rumeurs à se lancer en bourse d’ici la fin de l’année, alors même que l’entreprise vient de boucler une nouvelle levée de fonds record.

  •  

Data center, AGI, industrie : Mistral AI sur tous les fronts

Petit Poucet veut devenir grand
Data center, AGI, industrie : Mistral AI sur tous les fronts

Grosse actualité autour de Mistral AI, le petit Poucet européen de l’intelligence artificielle générative. À l’occasion de l’AI Now Summit, la startup parisienne et son directeur général Arthur Mensch ont multiplié les annonces : centre de données, partenariats industriels, acquisition, nouveaux outils…

Ne l’appelez plus LeChat. Mistral a rebaptisé son chatbot « Vibe », et lui a donné de nouvelles compétences. Le mode Work se connecte à Outlook, SharePoint, GitHub ou encore Slack (d’autres connecteurs sont disponibles) pour générer des rapports, des synthèses, des graphiques, des listes de tâches… Des compétences (skills) personnalisables peuvent automatiser les flux de travail récurrents « avec cohérence et précision » dans l’enchaînement des tâches.

Un mode Code est également présent pour développer et gérer des projets sur GitHub. Vibe s’interface avec VS Code mais peut aussi s’utiliser dans une interface CLI. Le bot Vibe se décline en plusieurs formules : une gratuite pour les tâches de tous les jours et pour taper la discute, à partir de 14,99 $ par mois pour des tâches complexes et de la programmation.

Un nouveau centre de données dans l’Essonne

Mistral AI a également annoncé un nouveau centre de données basé aux Ulis, qui déploiera 10 MW pour les opérations d’inférence de l’entreprise. Cette infrastructure, qui ouvrira ses portes dès le 3ᵉ trimestre, s’ajoute aux sites de Bruyères-le-Châtel, également en Essonne (40 MW), et à Borlänge en Suède (23 MW).

Durant une conférence de presse relayée par Ouest France, les dirigeants de Mistral ont précisé que l’entreprise allait avoir besoin de 200 MW en 2027, et d’1 GW d’ici la fin de la décennie. Cette capacité de calcul supplémentaire servira aussi bien les clients de Mistral, que d’autres entreprises IA. « Les labos d’IA ont cruellement besoin de puissance de calcul, et nous en avons. Certains nous demandent déjà énormément de capacité aujourd’hui », a expliqué le PDG Arthur Mensch à CNBC.

Les investissements pour ces infrastructures s’établissent pour le moment à 4 milliards d’euros, et il en faudra certainement davantage. « L’Europe accuse un retard dans le déploiement des infrastructures, et nous investissons donc pour combler cet écart », indique le dirigeant. Le Vieux Continent est confronté, selon lui, à des problèmes technologique et macroéconomique : l’Europe commencerait à considérer l’IA comme un actif stratégique au même titre que le gaz.

Une plateforme industrielle pour Mistral

Autre annonce réalisée dans le cadre de l’AI Now Summit, organisé ce jeudi 28 mai : le lancement d’une solution industrielle pour « transformer les opérations critiques ». Cette « pile IA » combine modèles, expertise en ingénierie et capacités robotiques, tout en conservant un « contrôle total » sur les données propriétaires, la propriété intellectuelle et les environnements de production.

Au-delà du discours marketing, Mistral liste les premiers partenaires de ce nouveau programme : Airbus, BMW, ASML et EDF. L’avionneur européen intègre les technologies IA de la jeune pousse pour les opérations en lien avec la conception et les capacités embarquées des avions et des hélicoptères, mais aussi dans ses activités de défense et spatiales. Pour BMW, Mistral développe des modèles de raisonnement multimodaux à partir de données d’ingénierie pour des usages complexes comme les simulations d’accident.

Avec le géant néerlandais (et mondial) des équipements pour semi-conducteurs, Mistral planche sur des cas d’usage d’ingénierie « particulièrement complexes » : optimisation de la conception des composants et modèles hyperspécialisés. Enfin, EDF et Mistral ont signé un partenariat de 5 ans autour de l’ingénierie, de la maintenance et de la construction des futurs réacteurs EPR2.

Des bots exploiteront la « mémoire technique » du parc nucléaire de l’énergéticien pour épauler les équipes de terrain et faciliter les opérations de maintenance. Les données seront hébergées dans des infrastructures souveraines, et resteront la propriété d’EDF.

Toujours dans le domaine de l’entreprise, Mistral a rappelé l’acquisition d’Emmi, une société autrichienne spécialisée dans les modèles d’ingénierie et de conception produit : simulations en temps réel, jumeaux numériques… Ces exemples illustrent le modèle économique de Mistral, qui propose des modèles IA adaptés aux besoins spécifiques des entreprises. Certes, la startup propose aussi des outils grand public, mais les LLM géants et généralistes ne sont pas sa priorité.

Travail, souveraineté, puces maison…

Arthur Mensch a également fait le tour des popotes, que ce soit en France ou aux États-Unis, pour discuter plus généralement de l’IA et de son impact. Chez RTL, il a ainsi décrit la « nouvelle façon de travailler » induite par cette technologie. Cela touche les métiers de l’informatique et singulièrement celui des développeurs, mais à terme « ça va finir par arriver partout […] pour tous les métiers de la connaissance ».

Un point de vue évidemment optimiste, mais le dirigeant convient qu’il existe un « vrai sujet » sur l’aliénation des salariés par l’IA. Pour lui, « il faut faire en sorte que l’utilisateur de l’outil s’enrichisse grâce à l’outil, plutôt qu’il ne désapprenne la tâche qu’il délègue ».

Sur un tout autre sujet, Mensch n’a pas fermé la porte à la possibilité de développer ses propres puces. Concevoir un silicium adapté aux besoins de l’entreprise lui permettrait de « réduire de manière significative le coût du déploiement des tokens », déclare-t-il chez CNBC. À l’heure actuelle, Mistral s’appuie sur Nvidia, « un super partenaire ».

La société s’intéresse également, sans surprise, à l’intelligence artificielle générale (AGI), et alerte sur la situation européenne. « Très bientôt, nous verrons probablement émerger une AGI ou une superintelligence », a indiqué le directeur scientifique Guillaume Lample au Wall Street Journal : « Il est donc très important que nous ayons aussi accès à ces modèles en Europe. Si nous n’y avons pas accès, on ne peut qu’imaginer la gravité de la situation. Il est absolument essentiel que nous y parvenions ».

La question de la souveraineté est centrale pour Mistral. « Tant que nous aurons des adversaires représentant une menace, nous devons disposer de nos propres capacités », affirme Arthur Mensch. « L’Europe, en particulier, doit disposer d’une autonomie stratégique en matière de systèmes de défense. » Cela passera notamment par le développement d’un modèle spécialisé dans la détection de failles de sécurité. Mistral est sur le pont, et travaille avec le secteur bancaire sur un équivalent de Mythos.

  •  
❌