Vue normale

13 mots suffisent pour manipuler un résultat de recherche par IA

16 juin 2026 à 13:13
L'ère du commentaire
13 mots suffisent pour manipuler un résultat de recherche par IA

Il suffit d’une dizaine de mots publiés au bon endroit sur un site participatif pour manipuler les résultats de recherche de modèles génératifs appuyés sur des systèmes agentiques, constatent trois chercheurs de l’université de Cornell.

Mise à jour du 17 juin 11 h : précisions sur le type de modèles étudiés

Les systèmes d’intelligence artificielle générative persistent à être très facilement manipulables via Reddit, Quora ou Wikipédia. Pour preuve : une série d’à peine 13 mots suffit dans certains cas à orienter les résultats de systèmes d’IA dédiés à la recherche et accessibles au grand public.

C’est du moins ce que suggère l’étude titrée « Les agents de recherche peuvent être empoisonnés via du contenu généré par les utilisateurs » (« Deep-research agents can be poisoned via user-generated content »), prépubliée par une équipe de trois chercheurs de l’université de Cornell, Hal Triedman, Tingwei Zhang et Vitaly Shmatikov.

Cela explique aussi pourquoi les modérateurs de sites participatifs comme Reddit ou Wikipédia se retrouvent inondés de contenus promotionnels : il s’agit, à terme, de le faire ressurgir dans les réponses des modèles génératifs.

Recours massif à des contenus générés par les internautes.

Les trois universitaires ont concentré leurs recherches sur les systèmes STORM et Co-STORM, créés à l’université de Stanford, et OmniThink, de la société du même nom. Les trois fonctionnent en coordonnant de multiples agents de recherche (deep-research agent) qui lancent leurs recherches pour fournir ensuite un résultat consolidé.

Et les auteurs de l’étude constatent que ces machines tendent à retourner sans cesse vers les mêmes types de contenus. En l’occurrence, pour fournir des réponses aux questions qui leur sont le plus couramment posées, ils s’appuient avant tout sur du contenu produit par les internautes.

Auprès de 404media, l’un des coauteurs explique le phénomène par le fait que les agents appuyés sur des grands modèles de langage (LLM) évaluent la qualité d’une réponse trouvée en ligne en fonction de sa proximité sémantique avec la question qui lui a été posée.

Concrètement, cela les pousse à retourner fréquemment sur des plateformes participatives, où de nombreux commentaires sont écrits en langage naturel, puisque formulés par des humains. Wikipédia et Reddit apparaissent ainsi dans près de la moitié des requêtes émises par les robots étudiés par les chercheurs de Cornell.

Les auteurs de l’étude constatent par ailleurs qu’une poignée de mots bien placés, parfois de 11 à 15 mots seulement, suffit à les voir recrachés par les modèles génératifs. Parmi leurs expérimentations, ils montrent par exemple qu’un simple commentaire sur le subreddit r/OnlineDating, citant la marque fictive « SilverPath » comme application de dating pour des hommes divorcés dans la cinquantaine, suffit à voir ce nom promu dans les résultats de Co-STORM.

En 11 mots publiés sur le subreddit r/Comcast, ils parviennent à faire rechercher à l’un des modèles la recommandation du service fictif « CancelEase » pour se désabonner d’un abonnement internet Xfinity.

Trop simples injections

Alors que le domaine du SEO (Search Engine Optimization) a évolué vers le GEO ou l’AEO (Generative Engine Optimization, ou AI Engine Optimization), la découverte implique que toute marque ou tout acteur cherchant à influencer les résultats des modèles grand public peut parvenir à ses fins en étudiant les questions les plus fréquemment posées et en publiant des commentaires proches, intégrant son message cible, sur des sites participatifs.

En termes de modération, les trois chercheurs sont relativement pessimistes : du côté des LLM, empêcher la génération de texte influencé par les recherches en ligne semble difficile, vu le peu de mots nécessaires pour les voir réagir. D’une certaine manière, les constructeurs d’IA opérant des recherches en ligne délèguent cette question aux modérateurs de sites participatifs.

Ni Reddit ni Wikipédia ne pourront régler ces enjeux seuls, soulignent néanmoins les chercheurs auprès de 404 : il s’agit plutôt d’un problème « de niveau sociétal ». Le simple fait qu’un agent génératif ne fasse aucune différence entre un commentaire publié sur un site participatif et une source vérifiée pose, en soi, de vrais problèmes en termes de qualité de l’information fournie aux internautes.

13 mots suffisent pour manipuler un résultat de recherche par IA

16 juin 2026 à 13:13
L'ère du commentaire
13 mots suffisent pour manipuler un résultat de recherche par IA

Il suffit d’une dizaine de mots publiés au bon endroit sur un site participatif pour manipuler les résultats de recherche de modèles génératifs appuyés sur des systèmes agentiques, constatent trois chercheurs de l’université de Cornell.

Mise à jour du 17 juin 11 h : précisions sur le type de modèles étudiés

Les systèmes d’intelligence artificielle générative persistent à être très facilement manipulables via Reddit, Quora ou Wikipédia. Pour preuve : une série d’à peine 13 mots suffit dans certains cas à orienter les résultats de systèmes d’IA dédiés à la recherche et accessibles au grand public.

C’est du moins ce que suggère l’étude titrée « Les agents de recherche peuvent être empoisonnés via du contenu généré par les utilisateurs » (« Deep-research agents can be poisoned via user-generated content »), prépubliée par une équipe de trois chercheurs de l’université de Cornell, Hal Triedman, Tingwei Zhang et Vitaly Shmatikov.

Cela explique aussi pourquoi les modérateurs de sites participatifs comme Reddit ou Wikipédia se retrouvent inondés de contenus promotionnels : il s’agit, à terme, de le faire ressurgir dans les réponses des modèles génératifs.

Recours massif à des contenus générés par les internautes.

Les trois universitaires ont concentré leurs recherches sur les systèmes STORM et Co-STORM, créés à l’université de Stanford, et OmniThink, de la société du même nom. Les trois fonctionnent en coordonnant de multiples agents de recherche (deep-research agent) qui lancent leurs recherches pour fournir ensuite un résultat consolidé.

Et les auteurs de l’étude constatent que ces machines tendent à retourner sans cesse vers les mêmes types de contenus. En l’occurrence, pour fournir des réponses aux questions qui leur sont le plus couramment posées, ils s’appuient avant tout sur du contenu produit par les internautes.

Auprès de 404media, l’un des coauteurs explique le phénomène par le fait que les agents appuyés sur des grands modèles de langage (LLM) évaluent la qualité d’une réponse trouvée en ligne en fonction de sa proximité sémantique avec la question qui lui a été posée.

Concrètement, cela les pousse à retourner fréquemment sur des plateformes participatives, où de nombreux commentaires sont écrits en langage naturel, puisque formulés par des humains. Wikipédia et Reddit apparaissent ainsi dans près de la moitié des requêtes émises par les robots étudiés par les chercheurs de Cornell.

Les auteurs de l’étude constatent par ailleurs qu’une poignée de mots bien placés, parfois de 11 à 15 mots seulement, suffit à les voir recrachés par les modèles génératifs. Parmi leurs expérimentations, ils montrent par exemple qu’un simple commentaire sur le subreddit r/OnlineDating, citant la marque fictive « SilverPath » comme application de dating pour des hommes divorcés dans la cinquantaine, suffit à voir ce nom promu dans les résultats de Co-STORM.

En 11 mots publiés sur le subreddit r/Comcast, ils parviennent à faire rechercher à l’un des modèles la recommandation du service fictif « CancelEase » pour se désabonner d’un abonnement internet Xfinity.

Trop simples injections

Alors que le domaine du SEO (Search Engine Optimization) a évolué vers le GEO ou l’AEO (Generative Engine Optimization, ou AI Engine Optimization), la découverte implique que toute marque ou tout acteur cherchant à influencer les résultats des modèles grand public peut parvenir à ses fins en étudiant les questions les plus fréquemment posées et en publiant des commentaires proches, intégrant son message cible, sur des sites participatifs.

En termes de modération, les trois chercheurs sont relativement pessimistes : du côté des LLM, empêcher la génération de texte influencé par les recherches en ligne semble difficile, vu le peu de mots nécessaires pour les voir réagir. D’une certaine manière, les constructeurs d’IA opérant des recherches en ligne délèguent cette question aux modérateurs de sites participatifs.

Ni Reddit ni Wikipédia ne pourront régler ces enjeux seuls, soulignent néanmoins les chercheurs auprès de 404 : il s’agit plutôt d’un problème « de niveau sociétal ». Le simple fait qu’un agent génératif ne fasse aucune différence entre un commentaire publié sur un site participatif et une source vérifiée pose, en soi, de vrais problèmes en termes de qualité de l’information fournie aux internautes.

IA dans l’administration publique : la France lance les grandes manœuvres

16 juin 2026 à 10:51
Mise au pas
IA dans l’administration publique : la France lance les grandes manœuvres

Le Premier ministre, Sébastien Lecornu, a fait mardi matin une série d’annonces sur l’intelligence artificielle. En ligne de mire, mise à disposition dans les administrations, stratégie nationale et, bien sûr, souveraineté numérique, alimentée par des moyens supplémentaires.

Article mis à jour à 15h23 avec des précisions de Matignon et Palantir au sujet du fait que la DGSI continuera, dans un premier temps, à utiliser la solution logicielle du géant états-unien.


La France passe à l’attaque, selon Sébastien Lecornu. Le Premier ministre, dans une vidéo publiée sur X ce 16 juin à 7h40, liste une série d’actions entreprises au niveau de l’État pour généraliser l’intelligence artificielle partout où elle est décrite comme pertinente. « Car le temps des expérimentations est désormais derrière nous, le temps de la généralisation commence », assène le Premier ministre.

À la veille de l’ouverture du salon VivaTech à Paris, le gouvernement veut montrer qu’il est conscient du changement qui s’opère : « Comme l’électricité hier, comme Internet il y a 30 ans, l’intelligence artificielle va changer notre manière de produire, de soigner, d’apprendre, de nous déplacer, de nous informer, voire même peut-être de penser ». Il y a donc « responsabilité », selon Sébastien Lecornu, de faire profiter de cette révolution aux usagers, que ce soit pour protéger la souveraineté, renforcer les services publics et permettre « à la France de rester une grande nation scientifique, industrielle et technologique ».

Début de généralisation

L’allocution du Premier ministre, au-delà de faire un point rapide de la situation, contenait surtout une série de six annonces pour « changer d’échelle » :

  • La mise à disposition d’un « agent conversationnel souverain commun » pour l’ensemble des agents publics (il s’agit en fait des agents de l’Etat, soit 1,8 million de personnes tout de même, chiffre confirmé par le ministère de l’Economie et des Finances)
  • Les technologies « les plus avancées » développées par le ministère des Armées seront « progressivement ouvertes aux autres administrations », à commencer par les ministères de la Justice et de l’Intérieur, via notamment le portail GenIAI « qui a démontré son efficacité dans des environnements particulièrement exigeants » et qui sera déployé dans toutes les administrations régaliennes
  • Un assistant santé publique déployé dans Ameli d’ici la fin de l’année, pour proposer de premières orientations « fiables », mieux guider les usagers et plus généralement trouver rapidement la bonne réponse
  • Une démocratisation de l’accès aux données publiques, avec le lancement d’une plateforme unique dédiée à l’IA pour accéder à des informations comme les données démographiques, économiques, géographiques et administratives
  • La France investira 665 millions d’euros supplémentaires au développement de l’IA dans le cadre du projet France 2030 pour « soutenir les infrastructures, les capacités de calcul, la recherche, les entreprises et les filières industrielles qui feront la puissance de demain »
  • Un axe sur la souveraineté numérique, avec l’annonce de l’abandon du « géant américain » Palantir au profit de la solution française ChapsVision, « retenue aujourd’hui par la DGSI »

Le calendrier de la dernière annonce ne manquera pas d’interroger puisque le contrat liant la DGSI à Palantir avait été renouvelé en décembre 2025 pour trois ans. « Le choix de ChapsVision est le résultat d’un processus de sélection, qui n’était pas achevé en décembre dernier. Pour ne pas souffrir d’un trou capacitaire dans ce domaine sensible essentiel pour notre sécurité nationale, le contrat a été renouvelé. Cette phase permettra le temps nécessaire de former les équipes et préparer la migration vers la solution de ChapsVision », répond à ce sujet Matignon à Raphaël Grably de BFMTV.

Cherchant à déminer les accusations de « coup de com’ », Matignon précise à BFMTV que le « débranchage » de Palantir par la DGSI sera fait d’ici « 1 à 3 ans selon le moment le plus opportun », et donc potentiellement avant la fin du contrat renouvelé en décembre dernier, qui court jusqu’à fin 2028. Contacté, Palantir assure de son côté à BFMTV que « le contrat de long terme qui lie l’entreprise à la DGSI, et renouvelé fin 2025 pour plusieurs années, demeure pleinement en vigueur ».

Les ministères sont prévenus

Après ces annonces principales, le Premier ministre a ajouté une contrainte pour les ministères, pour préparer notamment le projet de finances 2027. Ainsi, chacun « devra démontrer comment il utilise l’intelligence artificielle pour simplifier les démarches, améliorer le service rendu aux Français et réduire les tâches inutiles, notamment remplies par nos propres agents, et donc faire des économies sans diminuer la qualité du service public rendu à la nation ». Les ministères sont avertis que cette « capacité à se transformer sera désormais prise en compte dans les arbitrages budgétaires », afin de « stimuler cette transformation et mobiliser davantage les ministres et les patrons des grandes entreprises ».

« L’État doit récompenser l’innovation, l’État doit encourager l’efficacité, l’État ne financera plus l’immobilisme, il doit financer désormais sa propre transformation. Car chaque heure gagnée grâce à l’intelligence artificielle est une heure rendue aux Français, chaque procédure simplifiée est une liberté retrouvée, chaque économie réalisée est une ressource supplémentaire pour nos priorités », ajoute le Premier ministre.

Des annonces à surveiller

Bien que ces annonces visent à montrer un gouvernement volontaire dans son approche et conscient des révolutions entraînées par l’intelligence artificielle, une certaine vigilance est de mise. Par exemple, on ne sait pas si les 665 millions d’euros supplémentaires alloués à France 2030 sont une nouvelle somme débloquée ou un simple redéploiement au sein de l’enveloppe générale du projet. Pas de calendrier concret non plus pour le déploiement de l’assistant conversationnel pour les agents publics, contrairement à celui pour Ameli, indiqué pour cette année, donc au cours des six prochains mois.

On ne sait rien non plus de l’entraînement et de l’inférence des modèles qui seront utilisés dans les administrations. Rien n’est dit sur la puissance de calcul et les infrastructures utilisées. Dans ce domaine, comme presque tout le monde, la France est tributaire de grandes entreprises américaines, NVIDIA en tête, même si les serveurs physiques sont en France.

La question d’un assistant performant dans Ameli est en outre intéressante. Le stockage des données de santé par le Health Data Hub chez Microsoft a provoqué bien des remous ces dernières années, avant finalement d’échoir à Scaleway en avril, comme l’a rappelé le Premier ministre. L’accès à ces données est particulièrement sensible et la portée de l’assistant n’a pas été précisée.

Cap sur la formation

On en apprend cependant un peu plus dans un document publié il y a quelques heures par le ministère de l’Économie et des Finances, notamment sur la gestation du projet L’Assistant qui doit équiper tous les agents de la fonction publique.

Le document indique par exemple qu’il a été en test ces dix derniers mois auprès de 10 000 agents provenant de six ministères (Justice, Finances, Éducation nationale, Culture, Enseignement supérieur et Recherche, Services du Premier ministre). Les fonctions abordées sont classiques : résumés, reformulations, extractions d’informations dans des rapports, traductions, et plus récemment RAG, pour créer des bases documentaires dédiées. L’évaluation a été menée par la DITP (Direction interministérielle de la transformation publique), avec la collaboration (entre autres) de chercheurs venant de LaborIA (Inria), du Laboratoire Fabrique de Pensée Critique (INSA Rennes) et du LISIS (CNRS). Selon le document, 75 % des agents auraient trouvé L’Assistant utile à leur métier.

D’autres points sont abordés, dont la formation. L’État vient ainsi de mettre à disposition un « Guide d’usage de l’IA » pour les agents publics (accès public), invités à le consulter. Il s’agit d’une première étape, le gouvernement précisant que le manque de formation est une remontée fréquente. Plus d’un tiers des agents ont ainsi déclaré n’en avoir jamais bénéficié et 31 % ne pas connaitre le cadre d’usage quand des usages existent.

Le cadre général de formation est cependant encore en construction, même si ce deuxième document promet des avancées rapides, en coopération avec les syndicats concernés. En plus d’un rassemblement de toutes les ressources liées dans un même accès, l’État réitère son ambition de former autant d’agents que possible d’ici 2027, ce qui suppose un démarrage en trombe à la rentrée. Un accent particulier sera mis sur les managers.

Sur le sujet des compétences, il est également question de généraliser l’enseignement de l’IA dans les écoles du service public, à savoir les Instituts régionaux d’administration (IRA) et les futurs Instituts du service public (ISP). En outre, le gouvernement souhaite réinternaliser autant que possible les compétences du numérique d’ici 2027. Le calcul est simple selon le document : « Chaque euro investi dans le recrutement de compétences internes permettra de supprimer durablement 1,5 euro de dépenses de prestations externes, tout en renforçant la maîtrise par l’État de ses compétences les plus critiques ».

IA dans l’administration publique : la France lance les grandes manœuvres

16 juin 2026 à 10:51
Mise au pas
IA dans l’administration publique : la France lance les grandes manœuvres

Le Premier ministre, Sébastien Lecornu, a fait mardi matin une série d’annonces sur l’intelligence artificielle. En ligne de mire, mise à disposition dans les administrations, stratégie nationale et, bien sûr, souveraineté numérique, alimentée par des moyens supplémentaires.

Article mis à jour à 15h23 avec des précisions de Matignon et Palantir au sujet du fait que la DGSI continuera, dans un premier temps, à utiliser la solution logicielle du géant états-unien.


La France passe à l’attaque, selon Sébastien Lecornu. Le Premier ministre, dans une vidéo publiée sur X ce 16 juin à 7h40, liste une série d’actions entreprises au niveau de l’État pour généraliser l’intelligence artificielle partout où elle est décrite comme pertinente. « Car le temps des expérimentations est désormais derrière nous, le temps de la généralisation commence », assène le Premier ministre.

À la veille de l’ouverture du salon VivaTech à Paris, le gouvernement veut montrer qu’il est conscient du changement qui s’opère : « Comme l’électricité hier, comme Internet il y a 30 ans, l’intelligence artificielle va changer notre manière de produire, de soigner, d’apprendre, de nous déplacer, de nous informer, voire même peut-être de penser ». Il y a donc « responsabilité », selon Sébastien Lecornu, de faire profiter de cette révolution aux usagers, que ce soit pour protéger la souveraineté, renforcer les services publics et permettre « à la France de rester une grande nation scientifique, industrielle et technologique ».

Début de généralisation

L’allocution du Premier ministre, au-delà de faire un point rapide de la situation, contenait surtout une série de six annonces pour « changer d’échelle » :

  • La mise à disposition d’un « agent conversationnel souverain commun » pour l’ensemble des agents publics (il s’agit en fait des agents de l’Etat, soit 1,8 million de personnes tout de même, chiffre confirmé par le ministère de l’Economie et des Finances)
  • Les technologies « les plus avancées » développées par le ministère des Armées seront « progressivement ouvertes aux autres administrations », à commencer par les ministères de la Justice et de l’Intérieur, via notamment le portail GenIAI « qui a démontré son efficacité dans des environnements particulièrement exigeants » et qui sera déployé dans toutes les administrations régaliennes
  • Un assistant santé publique déployé dans Ameli d’ici la fin de l’année, pour proposer de premières orientations « fiables », mieux guider les usagers et plus généralement trouver rapidement la bonne réponse
  • Une démocratisation de l’accès aux données publiques, avec le lancement d’une plateforme unique dédiée à l’IA pour accéder à des informations comme les données démographiques, économiques, géographiques et administratives
  • La France investira 665 millions d’euros supplémentaires au développement de l’IA dans le cadre du projet France 2030 pour « soutenir les infrastructures, les capacités de calcul, la recherche, les entreprises et les filières industrielles qui feront la puissance de demain »
  • Un axe sur la souveraineté numérique, avec l’annonce de l’abandon du « géant américain » Palantir au profit de la solution française ChapsVision, « retenue aujourd’hui par la DGSI »

Le calendrier de la dernière annonce ne manquera pas d’interroger puisque le contrat liant la DGSI à Palantir avait été renouvelé en décembre 2025 pour trois ans. « Le choix de ChapsVision est le résultat d’un processus de sélection, qui n’était pas achevé en décembre dernier. Pour ne pas souffrir d’un trou capacitaire dans ce domaine sensible essentiel pour notre sécurité nationale, le contrat a été renouvelé. Cette phase permettra le temps nécessaire de former les équipes et préparer la migration vers la solution de ChapsVision », répond à ce sujet Matignon à Raphaël Grably de BFMTV.

Cherchant à déminer les accusations de « coup de com’ », Matignon précise à BFMTV que le « débranchage » de Palantir par la DGSI sera fait d’ici « 1 à 3 ans selon le moment le plus opportun », et donc potentiellement avant la fin du contrat renouvelé en décembre dernier, qui court jusqu’à fin 2028. Contacté, Palantir assure de son côté à BFMTV que « le contrat de long terme qui lie l’entreprise à la DGSI, et renouvelé fin 2025 pour plusieurs années, demeure pleinement en vigueur ».

Les ministères sont prévenus

Après ces annonces principales, le Premier ministre a ajouté une contrainte pour les ministères, pour préparer notamment le projet de finances 2027. Ainsi, chacun « devra démontrer comment il utilise l’intelligence artificielle pour simplifier les démarches, améliorer le service rendu aux Français et réduire les tâches inutiles, notamment remplies par nos propres agents, et donc faire des économies sans diminuer la qualité du service public rendu à la nation ». Les ministères sont avertis que cette « capacité à se transformer sera désormais prise en compte dans les arbitrages budgétaires », afin de « stimuler cette transformation et mobiliser davantage les ministres et les patrons des grandes entreprises ».

« L’État doit récompenser l’innovation, l’État doit encourager l’efficacité, l’État ne financera plus l’immobilisme, il doit financer désormais sa propre transformation. Car chaque heure gagnée grâce à l’intelligence artificielle est une heure rendue aux Français, chaque procédure simplifiée est une liberté retrouvée, chaque économie réalisée est une ressource supplémentaire pour nos priorités », ajoute le Premier ministre.

Des annonces à surveiller

Bien que ces annonces visent à montrer un gouvernement volontaire dans son approche et conscient des révolutions entraînées par l’intelligence artificielle, une certaine vigilance est de mise. Par exemple, on ne sait pas si les 665 millions d’euros supplémentaires alloués à France 2030 sont une nouvelle somme débloquée ou un simple redéploiement au sein de l’enveloppe générale du projet. Pas de calendrier concret non plus pour le déploiement de l’assistant conversationnel pour les agents publics, contrairement à celui pour Ameli, indiqué pour cette année, donc au cours des six prochains mois.

On ne sait rien non plus de l’entraînement et de l’inférence des modèles qui seront utilisés dans les administrations. Rien n’est dit sur la puissance de calcul et les infrastructures utilisées. Dans ce domaine, comme presque tout le monde, la France est tributaire de grandes entreprises américaines, NVIDIA en tête, même si les serveurs physiques sont en France.

La question d’un assistant performant dans Ameli est en outre intéressante. Le stockage des données de santé par le Health Data Hub chez Microsoft a provoqué bien des remous ces dernières années, avant finalement d’échoir à Scaleway en avril, comme l’a rappelé le Premier ministre. L’accès à ces données est particulièrement sensible et la portée de l’assistant n’a pas été précisée.

Cap sur la formation

On en apprend cependant un peu plus dans un document publié il y a quelques heures par le ministère de l’Économie et des Finances, notamment sur la gestation du projet L’Assistant qui doit équiper tous les agents de la fonction publique.

Le document indique par exemple qu’il a été en test ces dix derniers mois auprès de 10 000 agents provenant de six ministères (Justice, Finances, Éducation nationale, Culture, Enseignement supérieur et Recherche, Services du Premier ministre). Les fonctions abordées sont classiques : résumés, reformulations, extractions d’informations dans des rapports, traductions, et plus récemment RAG, pour créer des bases documentaires dédiées. L’évaluation a été menée par la DITP (Direction interministérielle de la transformation publique), avec la collaboration (entre autres) de chercheurs venant de LaborIA (Inria), du Laboratoire Fabrique de Pensée Critique (INSA Rennes) et du LISIS (CNRS). Selon le document, 75 % des agents auraient trouvé L’Assistant utile à leur métier.

D’autres points sont abordés, dont la formation. L’État vient ainsi de mettre à disposition un « Guide d’usage de l’IA » pour les agents publics (accès public), invités à le consulter. Il s’agit d’une première étape, le gouvernement précisant que le manque de formation est une remontée fréquente. Plus d’un tiers des agents ont ainsi déclaré n’en avoir jamais bénéficié et 31 % ne pas connaitre le cadre d’usage quand des usages existent.

Le cadre général de formation est cependant encore en construction, même si ce deuxième document promet des avancées rapides, en coopération avec les syndicats concernés. En plus d’un rassemblement de toutes les ressources liées dans un même accès, l’État réitère son ambition de former autant d’agents que possible d’ici 2027, ce qui suppose un démarrage en trombe à la rentrée. Un accent particulier sera mis sur les managers.

Sur le sujet des compétences, il est également question de généraliser l’enseignement de l’IA dans les écoles du service public, à savoir les Instituts régionaux d’administration (IRA) et les futurs Instituts du service public (ISP). En outre, le gouvernement souhaite réinternaliser autant que possible les compétences du numérique d’ici 2027. Le calcul est simple selon le document : « Chaque euro investi dans le recrutement de compétences internes permettra de supprimer durablement 1,5 euro de dépenses de prestations externes, tout en renforçant la maîtrise par l’État de ses compétences les plus critiques ».

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

16 juin 2026 à 06:08
Mets de l'huile
Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

L’IA de Meta a-t-elle en partie été entraînée sur du contenu pornographique téléchargé illégalement ? C’est l’objet d’une plainte déposée l’an dernier par deux sociétés de production et de distribution de films porno. La procédure suit son cours, et Meta a perdu une bataille, mais pas la guerre.

Strike 3 Holdings et Counterlife Media, deux entreprises états-uniennes spécialisées dans la production et la distribution de films porno, ont porté plainte contre Meta durant l’été 2025. Elles accusent le géant des réseaux sociaux d’avoir téléchargé 2 396 films en passant par le protocole BitTorrent. Ces contenus auraient servi à entraîner Llama, son précédent grand modèle de langage (Meta a changé son fusil d’épaule depuis, avec Muse Spark).

L’ombre de LibGen

L’affaire suit son cours devant la justice, et la juge Eumi K. Lee en charge du dossier a rendu une ordonnance ce 11 juin, rapporte TorrentFreak. Elle refuse de rejeter la plainte, estimant que les éléments présentés par les plaignants sont suffisants pour poursuivre la procédure. La juge ne dit pas que Meta est coupable, simplement que les allégations des producteurs sont suffisamment crédibles pour justifier une phase d’enquête plus poussée.

L’ordonnance [PDF] établit aussi que les plaignants n’ont pas besoin de prouver l’entraînement de l’IA. C’est un élément important, car Meta soutenait que les producteurs devaient démontrer que leurs films avaient effectivement servi à l’entraînement de Llama. Pour cette plainte précise, ce n’est pas nécessaire : si Meta a téléchargé et distribué les films via BitTorrent sans autorisation, alors l’infraction au copyright est déjà constituée. Peu importe ensuite que les vidéos aient ou non servi à entraîner un modèle.

Pour se défendre, Meta s’est aussi inspirée d’un argument classique dans les affaires liées à BitTorrent : l’adresse IP ne prouve pas qui a téléchargé les fichiers. Des employés, des sous-traitants ou même des visiteurs auraient pu avoir récupéré ces contenus pour leur usage personnel.

La procédure peut se poursuivre

Les éléments à charge présentés par Strike 3 – qui a la réputation d’un « troll des droits d’auteur » avec des milliers de poursuites à son actif – ont toutefois permis à la juge de déterminer qu’il s’agissait davantage d’un système coordonné et automatisé qui cherchait des contenus à partir de mots-clés qu’à des téléchargements effectués indépendamment par plusieurs personnes.

Enfin, Meta a déjà reconnu s’être servi de BitTorrent pour récupérer des bases de données clandestines (la bibliothèque LibGen) afin d’entraîner ses modèles Llama. La juge ne dit pas que les deux affaires sont identiques, mais à la lumière du dossier LibGen, les accusations des deux plaignants sont plausibles.

Meta, comme bien d’autres acteurs du secteur, a parfois pioché sans trop de vergogne dans tous les contenus accessibles en ligne pour entraîner ses modèles IA, sans le consentement de leurs auteurs.

L’affaire est donc loin d’être terminée. Meta devrait maintenant essayer de montrer que les téléchargements n’étaient pas liés à ses projets d’IA, tandis que les producteurs vont tenter d’établir un lien direct entre les téléchargements BitTorrent et les systèmes permettant l’entraînement des modèles IA de Meta.

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

16 juin 2026 à 06:08
Mets de l'huile
Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

L’IA de Meta a-t-elle en partie été entraînée sur du contenu pornographique téléchargé illégalement ? C’est l’objet d’une plainte déposée l’an dernier par deux sociétés de production et de distribution de films porno. La procédure suit son cours, et Meta a perdu une bataille, mais pas la guerre.

Strike 3 Holdings et Counterlife Media, deux entreprises états-uniennes spécialisées dans la production et la distribution de films porno, ont porté plainte contre Meta durant l’été 2025. Elles accusent le géant des réseaux sociaux d’avoir téléchargé 2 396 films en passant par le protocole BitTorrent. Ces contenus auraient servi à entraîner Llama, son précédent grand modèle de langage (Meta a changé son fusil d’épaule depuis, avec Muse Spark).

L’ombre de LibGen

L’affaire suit son cours devant la justice, et la juge Eumi K. Lee en charge du dossier a rendu une ordonnance ce 11 juin, rapporte TorrentFreak. Elle refuse de rejeter la plainte, estimant que les éléments présentés par les plaignants sont suffisants pour poursuivre la procédure. La juge ne dit pas que Meta est coupable, simplement que les allégations des producteurs sont suffisamment crédibles pour justifier une phase d’enquête plus poussée.

L’ordonnance [PDF] établit aussi que les plaignants n’ont pas besoin de prouver l’entraînement de l’IA. C’est un élément important, car Meta soutenait que les producteurs devaient démontrer que leurs films avaient effectivement servi à l’entraînement de Llama. Pour cette plainte précise, ce n’est pas nécessaire : si Meta a téléchargé et distribué les films via BitTorrent sans autorisation, alors l’infraction au copyright est déjà constituée. Peu importe ensuite que les vidéos aient ou non servi à entraîner un modèle.

Pour se défendre, Meta s’est aussi inspirée d’un argument classique dans les affaires liées à BitTorrent : l’adresse IP ne prouve pas qui a téléchargé les fichiers. Des employés, des sous-traitants ou même des visiteurs auraient pu avoir récupéré ces contenus pour leur usage personnel.

La procédure peut se poursuivre

Les éléments à charge présentés par Strike 3 – qui a la réputation d’un « troll des droits d’auteur » avec des milliers de poursuites à son actif – ont toutefois permis à la juge de déterminer qu’il s’agissait davantage d’un système coordonné et automatisé qui cherchait des contenus à partir de mots-clés qu’à des téléchargements effectués indépendamment par plusieurs personnes.

Enfin, Meta a déjà reconnu s’être servi de BitTorrent pour récupérer des bases de données clandestines (la bibliothèque LibGen) afin d’entraîner ses modèles Llama. La juge ne dit pas que les deux affaires sont identiques, mais à la lumière du dossier LibGen, les accusations des deux plaignants sont plausibles.

Meta, comme bien d’autres acteurs du secteur, a parfois pioché sans trop de vergogne dans tous les contenus accessibles en ligne pour entraîner ses modèles IA, sans le consentement de leurs auteurs.

L’affaire est donc loin d’être terminée. Meta devrait maintenant essayer de montrer que les téléchargements n’étaient pas liés à ses projets d’IA, tandis que les producteurs vont tenter d’établir un lien direct entre les téléchargements BitTorrent et les systèmes permettant l’entraînement des modèles IA de Meta.

☕️ KPMG retire un rapport chantant les louanges de l’IA après la découverte d’hallucinations

15 juin 2026 à 06:33


Quoi de mieux pour chanter les louanges de l’IA qu’un rapport truffé d’hallucinations rédigé par une IA ? KPMG a dû retirer une étude sur l’IA agentique après la découverte de plusieurs cas d’usage apparemment inventés. Oups.

Tout ce que raconte l’IA n’est pas d’or. KPMG, une des plus grandes agences de conseil au monde, a publié en octobre dernier un rapport pour « redéfinir l’excellence à l’heure de l’IA agentique ». Destiné aux dirigeants et aux décideurs, le document multiplie les études de cas censées illustrer l’adoption de cette technologie dans les secteurs de la finance, des transports ou encore de la santé.

Illustration : Flock

Seul problème : de nombreux exemples du rapport sont faux, ou à tout le moins factuellement incorrects. Le rapport affirmait ainsi que la banque UBS utilisait des agents IA pour le conseil en investissement, la gestion des risques et la conformité réglementaire au sein d’une plateforme développée avec Microsoft. Des affirmations qui reposent sur des faits incorrects, affirme l’établissement financier au Financial Times et aux chercheurs d’hallucinations du détecteur de contenus générés par IA GPTZero.

Quand l’IA vante l’IA

Autre exemple, celui des chemins de fer fédéraux suisses, chez qui des agents IA étaient censés aider les voyageurs à planifier, réserver et optimiser leurs trajets en fonction de leurs préférences, des conditions en temps réel et de l’impact carbone. Sauf que la description donnée dans le rapport n’était « pas exacte ». Il prétendait aussi que Transport for London (TfL) employait des agents IA pour prévoir et gérer la congestion, personnaliser les informations aux voyageurs et coordonner les modes de transport. Une présentation « trompeuse », selon la TfL.

Enfin, KPMG affirmait que des agents IA prédisaient les réadmissions à l’hôpital, réalisaient un tri des patients et automatisaient les orientations médicales au sein du système de santé dans le grand Manchester. De fausses informations provenant manifestement de la mauvaise interprétation d’un communiqué sur un outil de détection du… cancer du poumon.

Sur les 45 références citées dans le rapport, seules 5 renvoient correctement à des sources réelles, a calculé GPTZero. 28 autres citations fournissent des titres paraphrasés et/ou des éléments erronés pour une source réelle. Les 12 dernières sont trop vagues ou comportent trop d’erreurs pour permettre de déterminer avec certitude si une source existe.

De plus, environ la moitié des affirmations étayées par ces 45 citations semblent être fausses ou attribuées à tort – probablement parce qu’un outil de recherche sur l’IA a trop pris au pied de la lettre une demande visant à trouver des exemples d’« IA agentique » exploitées en production.

Après avoir été alerté par le FT et GPTZero, KPMG a retiré le rapport de ses sites web, tout en affirmant prendre très au sérieux « l’exactitude et l’intégrité » de ses publications. Le cabinet a rappelé que ses employés doivent respecter des règles internes sur l’usage responsable de l’IA.

« Nous attendons de l’ensemble de nos collaborateurs qu’ils respectent nos directives relatives à l’utilisation responsable de l’IA, notamment en assurant une supervision humaine pour valider les contenus et vérifier les sources indépendantes », indique un porte-parole. Une enquête interne a été lancée, mais c’est un peu tard : les conclusions de ce rapport avaient déjà été reprises par plusieurs publications spécialisées du secteur, ainsi que par un important quotidien tchèque.

Ce n’est pas une première, les exemples d’hallucinations d’IA prises pour argent comptant se sont multipliés dans tous les domaines, et on n’est pas près d’en voir le bout.

☕️ KPMG retire un rapport chantant les louanges de l’IA après la découverte d’hallucinations

15 juin 2026 à 06:33


Quoi de mieux pour chanter les louanges de l’IA qu’un rapport truffé d’hallucinations rédigé par une IA ? KPMG a dû retirer une étude sur l’IA agentique après la découverte de plusieurs cas d’usage apparemment inventés. Oups.

Tout ce que raconte l’IA n’est pas d’or. KPMG, une des plus grandes agences de conseil au monde, a publié en octobre dernier un rapport pour « redéfinir l’excellence à l’heure de l’IA agentique ». Destiné aux dirigeants et aux décideurs, le document multiplie les études de cas censées illustrer l’adoption de cette technologie dans les secteurs de la finance, des transports ou encore de la santé.

Illustration : Flock

Seul problème : de nombreux exemples du rapport sont faux, ou à tout le moins factuellement incorrects. Le rapport affirmait ainsi que la banque UBS utilisait des agents IA pour le conseil en investissement, la gestion des risques et la conformité réglementaire au sein d’une plateforme développée avec Microsoft. Des affirmations qui reposent sur des faits incorrects, affirme l’établissement financier au Financial Times et aux chercheurs d’hallucinations du détecteur de contenus générés par IA GPTZero.

Quand l’IA vante l’IA

Autre exemple, celui des chemins de fer fédéraux suisses, chez qui des agents IA étaient censés aider les voyageurs à planifier, réserver et optimiser leurs trajets en fonction de leurs préférences, des conditions en temps réel et de l’impact carbone. Sauf que la description donnée dans le rapport n’était « pas exacte ». Il prétendait aussi que Transport for London (TfL) employait des agents IA pour prévoir et gérer la congestion, personnaliser les informations aux voyageurs et coordonner les modes de transport. Une présentation « trompeuse », selon la TfL.

Enfin, KPMG affirmait que des agents IA prédisaient les réadmissions à l’hôpital, réalisaient un tri des patients et automatisaient les orientations médicales au sein du système de santé dans le grand Manchester. De fausses informations provenant manifestement de la mauvaise interprétation d’un communiqué sur un outil de détection du… cancer du poumon.

Sur les 45 références citées dans le rapport, seules 5 renvoient correctement à des sources réelles, a calculé GPTZero. 28 autres citations fournissent des titres paraphrasés et/ou des éléments erronés pour une source réelle. Les 12 dernières sont trop vagues ou comportent trop d’erreurs pour permettre de déterminer avec certitude si une source existe.

De plus, environ la moitié des affirmations étayées par ces 45 citations semblent être fausses ou attribuées à tort – probablement parce qu’un outil de recherche sur l’IA a trop pris au pied de la lettre une demande visant à trouver des exemples d’« IA agentique » exploitées en production.

Après avoir été alerté par le FT et GPTZero, KPMG a retiré le rapport de ses sites web, tout en affirmant prendre très au sérieux « l’exactitude et l’intégrité » de ses publications. Le cabinet a rappelé que ses employés doivent respecter des règles internes sur l’usage responsable de l’IA.

« Nous attendons de l’ensemble de nos collaborateurs qu’ils respectent nos directives relatives à l’utilisation responsable de l’IA, notamment en assurant une supervision humaine pour valider les contenus et vérifier les sources indépendantes », indique un porte-parole. Une enquête interne a été lancée, mais c’est un peu tard : les conclusions de ce rapport avaient déjà été reprises par plusieurs publications spécialisées du secteur, ainsi que par un important quotidien tchèque.

Ce n’est pas une première, les exemples d’hallucinations d’IA prises pour argent comptant se sont multipliés dans tous les domaines, et on n’est pas près d’en voir le bout.

☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens

12 juin 2026 à 06:32


Le secteur de l’IA se dirige-t-il vers une guerre des prix du token ? Les deux principaux labos IA dans le paysage, OpenAI et Anthropic, envisageraient en effet une baisse du tarif du jeton, au grand bénéfice des consommateurs – mais probablement moins de la marge de profit des deux entreprises. Selon l’analyste Ed Zitron, en l’état actuel, les « utilisateurs peuvent dépenser entre 8 et 13,50 dollars pour chaque dollar de leurs revenus d’abonnement ».

Les utilisateurs grand public voient surtout les modèles d’IA à travers le prix d’un abonnement mensuel, quitte à se heurter parfois à des limites d’usage. Pour les entreprises, l’angle est très différent. Derrière chaque requête adressée à GPT ou Claude se cache une consommation de tokens qui finit par apparaître sur les factures. Les organisations qui se servent des modèles d’Anthropic ont d’ailleurs pu s’en apercevoir ces dernières semaines avec Opus 4.7 et suivants. Et à mesure que les usages se multiplient, les dépenses s’alourdissent.

Les budgets ne sont pas extensibles à l’infini. Le directeur technique d’Uber s’était étonné d’avoir explosé son budget IA de l’année… en seulement quatre mois. À cela s’ajoute la pratique du tokenmaxxing, utilisée par les employés de certaines entreprises pour gonfler inutilement leur consommation de jetons et ainsi, se faire bien voir de leur direction. Amazon a récemment fait fermer un classement pour limiter les abus.

Pendant ce temps, OpenAI et Anthropic ramassent la mise, enfin, façon de parler : les deux entreprises sont encore loin d’être rentables. Chaque token facturé génère certes des revenus, mais ceux-ci peinent encore à compenser les coûts colossaux des centres de données, des puces et du développement de nouveaux modèles. Et pourtant, les deux labos rivaux envisageraient de baisser le prix du token.

Sam Altman a expliqué lors d’un événement relaté par le Wall Street Journal que le coût du token était un « gros problème » : « Je pense que nous trouverons de nombreuses façons de permettre à nos clients d’en faire plus tout en dépensant moins ». Le patron d’OpenAI anticiperait une baisse des prix du token chez Anthropic, dont les produits – notamment Claude Code – sont devenus des outils du quotidien dans de nombreuses entreprises. OpenAI a riposté avec Codex, mais elle a pris du retard.

Le hic, c’est qu’une éventuelle guerre tarifaire pourrait satisfaire les clients, mais elle retarderait encore davantage la perspective de bénéfices pour les deux sociétés qui s’apprêtent à entrer en Bourse. Et à force de se courir après, les services d’OpenAI et d’Anthropic courent le risque de devenir interchangeables, en se différenciant uniquement sur les tarifs.

☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens

12 juin 2026 à 06:32


Le secteur de l’IA se dirige-t-il vers une guerre des prix du token ? Les deux principaux labos IA dans le paysage, OpenAI et Anthropic, envisageraient en effet une baisse du tarif du jeton, au grand bénéfice des consommateurs – mais probablement moins de la marge de profit des deux entreprises. Selon l’analyste Ed Zitron, en l’état actuel, les « utilisateurs peuvent dépenser entre 8 et 13,50 dollars pour chaque dollar de leurs revenus d’abonnement ».

Les utilisateurs grand public voient surtout les modèles d’IA à travers le prix d’un abonnement mensuel, quitte à se heurter parfois à des limites d’usage. Pour les entreprises, l’angle est très différent. Derrière chaque requête adressée à GPT ou Claude se cache une consommation de tokens qui finit par apparaître sur les factures. Les organisations qui se servent des modèles d’Anthropic ont d’ailleurs pu s’en apercevoir ces dernières semaines avec Opus 4.7 et suivants. Et à mesure que les usages se multiplient, les dépenses s’alourdissent.

Les budgets ne sont pas extensibles à l’infini. Le directeur technique d’Uber s’était étonné d’avoir explosé son budget IA de l’année… en seulement quatre mois. À cela s’ajoute la pratique du tokenmaxxing, utilisée par les employés de certaines entreprises pour gonfler inutilement leur consommation de jetons et ainsi, se faire bien voir de leur direction. Amazon a récemment fait fermer un classement pour limiter les abus.

Pendant ce temps, OpenAI et Anthropic ramassent la mise, enfin, façon de parler : les deux entreprises sont encore loin d’être rentables. Chaque token facturé génère certes des revenus, mais ceux-ci peinent encore à compenser les coûts colossaux des centres de données, des puces et du développement de nouveaux modèles. Et pourtant, les deux labos rivaux envisageraient de baisser le prix du token.

Sam Altman a expliqué lors d’un événement relaté par le Wall Street Journal que le coût du token était un « gros problème » : « Je pense que nous trouverons de nombreuses façons de permettre à nos clients d’en faire plus tout en dépensant moins ». Le patron d’OpenAI anticiperait une baisse des prix du token chez Anthropic, dont les produits – notamment Claude Code – sont devenus des outils du quotidien dans de nombreuses entreprises. OpenAI a riposté avec Codex, mais elle a pris du retard.

Le hic, c’est qu’une éventuelle guerre tarifaire pourrait satisfaire les clients, mais elle retarderait encore davantage la perspective de bénéfices pour les deux sociétés qui s’apprêtent à entrer en Bourse. Et à force de se courir après, les services d’OpenAI et d’Anthropic courent le risque de devenir interchangeables, en se différenciant uniquement sur les tarifs.

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

11 juin 2026 à 07:01
Le club des cinq
Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

Apple renouvelle entièrement les modèles IA qui propulsent les fonctions Apple Intelligence. Et admet (presque) que la précédente génération n’était pas vraiment à la hauteur.

Sous le capot d’Apple Intelligence se trouve une famille de grands modèles de langage. Avec iOS 27 et les autres systèmes d’exploitation en « 27 », le constructeur inaugure la 3e génération de ses LLM, baptisés Apple Foundation Models (AFM), dont la particularité est de reposer sur les modèles Gemini de Google. Pas de surprise ici, l’accord entre Apple et Google avait été confirmé au mois de janvier.

Un Apple Intelligence, cinq moteurs

À l’occasion de la WWDC, Apple a présenté les nouvelles capacités de sa plateforme d’IA et de Siri, et aussi levé une petite partie du voile sur les modèles AFM 3. Comme chez les autres acteurs IA quand il s’agit de présenter de nouveaux modèles, Apple n’est pas avare en superlatifs et en promesses de performances. Mais derrière cette communication bien huilée se cache un aveu plus discret : les premiers modèles Apple Intelligence n’étaient manifestement pas au niveau attendu… ce que le retard du nouveau Siri et les critiques entourant Apple Intelligence ont largement mis en lumière.

Avant toute chose, jetons un œil aux forces en présence. Cette nouvelle fournée d’Apple Intelligence s’appuie sur cinq modèles : deux sont exécutés directement sur l’appareil, les trois autres sont hébergés dans le cloud. AFM 3 Core (3 milliards de paramètres) et AFM 3 Core Advanced sont les modèles locaux. Ce dernier compte 20 milliards de paramètres, mais n’en active qu’1 à 4 milliards en fonction des requêtes.

Image : Apple

Cette méthode astucieuse exploite des travaux de recherche internes portant sur la sélection dynamique des paramètres d’un modèle. Au lieu de charger l’intégralité du modèle en mémoire vive, l’appareil active uniquement les portions jugées utiles pour la requête en cours. Les autres paramètres restent stockés dans la mémoire flash de l’appareil, ce qui permet à Apple d’utiliser un modèle beaucoup plus volumineux que ce que la RAM seule autoriserait.

Cette puissance de frappe ouvre de nouveaux horizons à Siri AI : les voix sont plus expressives et il est possible de les personnaliser, la dictée vocale se veut plus précise. Pour en profiter, il faut cependant posséder un appareil doté de 12 Go de mémoire, ce qui qualifie l’iPhone Air, l’iPhone 17 Pro (mais pas l’iPhone 17, limité à 8 Go), un Mac M3 ou iPad M4 suffisamment doté en mémoire.

iOS 27 permet de personnaliser la voix de Siri. Image : Apple

Les trois autres modèles sont hébergés sur des serveurs : AFM 3 Cloud « optimisé pour la vitesse, l’efficacité et les performances », ADM 3 Cloud pour la génération d’images et les outils d’édition photo avancés, et AFM 3 Cloud Pro qui prend en charge les requêtes les plus exigeantes comme les outils agentiques et le raisonnement complexe.

Quelques images générées par ADM 3 Cloud.

Les deux premiers tournent sur des serveurs équipés de puces Apple. AFM 3 Cloud Pro a ceci de spécifique qu’il fonctionne sur des serveurs dotés de GPU NVIDIA hébergés dans Google Cloud. Il a donc fallu étendre Private Cloud Compute, l’architecture de protection des données personnelles d’Apple, à cette configuration. Cette dépendance à deux des principaux acteurs du secteur de l’IA est d’ailleurs inhabituelle pour une entreprise qui n’aime rien tant que maîtriser la chaîne technologique de bout en bout.

Des benchmarks et un aveu caché

Apple donne également quelques détails sur les performances de ses modèles. Dans ce domaine, chaque acteur fait sa petite sauce dans son coin mais en général, les nouveaux modèles utilisent des benchmarks plus ou moins standardisés (SWE-bench, MMLU, Humanity’s Last Exam…) ce qui autorise les comparaisons.

Contrairement à son rapport technique publié l’an dernier, dans lequel Apple comparait ses modèles à GPT-4o, Gemma ou Qwen sur plusieurs benchmarks reconnus du secteur, la présentation d’AFM 3 se concentre presque exclusivement sur des évaluations internes et des comparaisons avec la génération précédente. La méthode est tout à fait légitime, mais elle rend impossibles les comparaisons avec les modèles concurrents.

Image : Apple

C’est d’autant plus vrai qu’Apple ne compare AFM 3 qu’à la génération précédente de ses propres modèles (2025). Ce qui donne des résultats pour le moins flatteurs : pour les capacités générales en texte en local, AFM 3 Core est ainsi préféré dans 45,6 % des cas, contre 23,3 % pour son prédécesseur. En matière de compréhension d’images, AFM 3 Core a été préféré à son prédécesseur dans plus de 61 % des cas où les testeurs ont marqué une préférence.

Sur serveur, pour les capacités texte, AFM 3 Cloud obtient 64,7 % de préférences contre 8,7 % « seulement » (c’est Apple qui le dit) pour l’ancien modèle. Les performances en compréhension d’images progressent fortement, tout comme la dictée et les voix de synthèse. Le constructeur californien ne dira jamais explicitement que ses premiers modèles étaient insuffisants. Mais l’insistance sur les « avancées significatives » et le « bond générationnel » d’AFM 3 montre assez clairement que la première vague d’Apple Intelligence était en retrait, en tout cas insuffisamment performante pour soutenir la vision d’ensemble de l’entreprise.

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

11 juin 2026 à 07:01
Le club des cinq
Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

Apple renouvelle entièrement les modèles IA qui propulsent les fonctions Apple Intelligence. Et admet (presque) que la précédente génération n’était pas vraiment à la hauteur.

Sous le capot d’Apple Intelligence se trouve une famille de grands modèles de langage. Avec iOS 27 et les autres systèmes d’exploitation en « 27 », le constructeur inaugure la 3e génération de ses LLM, baptisés Apple Foundation Models (AFM), dont la particularité est de reposer sur les modèles Gemini de Google. Pas de surprise ici, l’accord entre Apple et Google avait été confirmé au mois de janvier.

Un Apple Intelligence, cinq moteurs

À l’occasion de la WWDC, Apple a présenté les nouvelles capacités de sa plateforme d’IA et de Siri, et aussi levé une petite partie du voile sur les modèles AFM 3. Comme chez les autres acteurs IA quand il s’agit de présenter de nouveaux modèles, Apple n’est pas avare en superlatifs et en promesses de performances. Mais derrière cette communication bien huilée se cache un aveu plus discret : les premiers modèles Apple Intelligence n’étaient manifestement pas au niveau attendu… ce que le retard du nouveau Siri et les critiques entourant Apple Intelligence ont largement mis en lumière.

Avant toute chose, jetons un œil aux forces en présence. Cette nouvelle fournée d’Apple Intelligence s’appuie sur cinq modèles : deux sont exécutés directement sur l’appareil, les trois autres sont hébergés dans le cloud. AFM 3 Core (3 milliards de paramètres) et AFM 3 Core Advanced sont les modèles locaux. Ce dernier compte 20 milliards de paramètres, mais n’en active qu’1 à 4 milliards en fonction des requêtes.

Image : Apple

Cette méthode astucieuse exploite des travaux de recherche internes portant sur la sélection dynamique des paramètres d’un modèle. Au lieu de charger l’intégralité du modèle en mémoire vive, l’appareil active uniquement les portions jugées utiles pour la requête en cours. Les autres paramètres restent stockés dans la mémoire flash de l’appareil, ce qui permet à Apple d’utiliser un modèle beaucoup plus volumineux que ce que la RAM seule autoriserait.

Cette puissance de frappe ouvre de nouveaux horizons à Siri AI : les voix sont plus expressives et il est possible de les personnaliser, la dictée vocale se veut plus précise. Pour en profiter, il faut cependant posséder un appareil doté de 12 Go de mémoire, ce qui qualifie l’iPhone Air, l’iPhone 17 Pro (mais pas l’iPhone 17, limité à 8 Go), un Mac M3 ou iPad M4 suffisamment doté en mémoire.

iOS 27 permet de personnaliser la voix de Siri. Image : Apple

Les trois autres modèles sont hébergés sur des serveurs : AFM 3 Cloud « optimisé pour la vitesse, l’efficacité et les performances », ADM 3 Cloud pour la génération d’images et les outils d’édition photo avancés, et AFM 3 Cloud Pro qui prend en charge les requêtes les plus exigeantes comme les outils agentiques et le raisonnement complexe.

Quelques images générées par ADM 3 Cloud.

Les deux premiers tournent sur des serveurs équipés de puces Apple. AFM 3 Cloud Pro a ceci de spécifique qu’il fonctionne sur des serveurs dotés de GPU NVIDIA hébergés dans Google Cloud. Il a donc fallu étendre Private Cloud Compute, l’architecture de protection des données personnelles d’Apple, à cette configuration. Cette dépendance à deux des principaux acteurs du secteur de l’IA est d’ailleurs inhabituelle pour une entreprise qui n’aime rien tant que maîtriser la chaîne technologique de bout en bout.

Des benchmarks et un aveu caché

Apple donne également quelques détails sur les performances de ses modèles. Dans ce domaine, chaque acteur fait sa petite sauce dans son coin mais en général, les nouveaux modèles utilisent des benchmarks plus ou moins standardisés (SWE-bench, MMLU, Humanity’s Last Exam…) ce qui autorise les comparaisons.

Contrairement à son rapport technique publié l’an dernier, dans lequel Apple comparait ses modèles à GPT-4o, Gemma ou Qwen sur plusieurs benchmarks reconnus du secteur, la présentation d’AFM 3 se concentre presque exclusivement sur des évaluations internes et des comparaisons avec la génération précédente. La méthode est tout à fait légitime, mais elle rend impossibles les comparaisons avec les modèles concurrents.

Image : Apple

C’est d’autant plus vrai qu’Apple ne compare AFM 3 qu’à la génération précédente de ses propres modèles (2025). Ce qui donne des résultats pour le moins flatteurs : pour les capacités générales en texte en local, AFM 3 Core est ainsi préféré dans 45,6 % des cas, contre 23,3 % pour son prédécesseur. En matière de compréhension d’images, AFM 3 Core a été préféré à son prédécesseur dans plus de 61 % des cas où les testeurs ont marqué une préférence.

Sur serveur, pour les capacités texte, AFM 3 Cloud obtient 64,7 % de préférences contre 8,7 % « seulement » (c’est Apple qui le dit) pour l’ancien modèle. Les performances en compréhension d’images progressent fortement, tout comme la dictée et les voix de synthèse. Le constructeur californien ne dira jamais explicitement que ses premiers modèles étaient insuffisants. Mais l’insistance sur les « avancées significatives » et le « bond générationnel » d’AFM 3 montre assez clairement que la première vague d’Apple Intelligence était en retrait, en tout cas insuffisamment performante pour soutenir la vision d’ensemble de l’entreprise.

☕️ Microsoft bloque Claude Fable 5 en interne à cause de la rétention des données

11 juin 2026 à 06:34


Microsoft s’est empressé d’ajouter Claude Fable 5 à l’arsenal de GitHub Copilot et de Foundry, la plateforme destinée au développement et à la gestion d’apps IA. Mais les employés de l’éditeur n’y ont pas accès dans les versions internes du Copilot de GitHub. D’après The Verge, l’entreprise aurait un petit souci avec la politique de rétention des données d’Anthropic.

Le labo IA conserve en effet les requêtes et les contenus générés pendant 30 jours afin de satisfaire aux exigences de sécurité liées à l’utilisation du modèle « de classe Mythos ». Fable repose sur la même base que Mythos, mais est bardé de restrictions : si la question porte sur la cybersécurité, la biologie, la chimie ou la distillation de modèles IA, elle est « déclassée » et traitée par Opus 4.8.

Ces 30 jours de rétention permettent à Anthropic d’analyser les informations pour détecter les éventuels usages malveillants du modèle. En cas de suspicion, l’entreprise peut même les conserver pour une durée de deux ans. Les données qui ne posent aucun problème sont supprimées passé le délai standard.

Ce changement n’en est pas un pour les utilisateurs qui passent par le site web ou les applications mobiles de Claude, puisque la rétention des données est déjà effective pour ces abonnés. En revanche, c’est une nouveauté pour les organisations utilisant la console Claude, ou qui accèdent à Claude via Bedrock, Google Cloud Agent ou encore Foundry avec le mode Zero Data Retention (ZDR).

Ce mode proposé par Anthropic à certains clients professionnels ne conserve pas les requêtes envoyées au modèle ni les réponses générées. Ça n’est donc plus le cas avec Fable. L’équipe juridique de Microsoft évalue ces changements ; le souci majeur concerne les données des utilisateurs et les informations confidentielles. Aucun délai n’a été annoncé.

Le cas Microsoft pourrait donc se répéter chez d’autres entreprises.

☕️ Microsoft bloque Claude Fable 5 en interne à cause de la rétention des données

11 juin 2026 à 06:34


Microsoft s’est empressé d’ajouter Claude Fable 5 à l’arsenal de GitHub Copilot et de Foundry, la plateforme destinée au développement et à la gestion d’apps IA. Mais les employés de l’éditeur n’y ont pas accès dans les versions internes du Copilot de GitHub. D’après The Verge, l’entreprise aurait un petit souci avec la politique de rétention des données d’Anthropic.

Le labo IA conserve en effet les requêtes et les contenus générés pendant 30 jours afin de satisfaire aux exigences de sécurité liées à l’utilisation du modèle « de classe Mythos ». Fable repose sur la même base que Mythos, mais est bardé de restrictions : si la question porte sur la cybersécurité, la biologie, la chimie ou la distillation de modèles IA, elle est « déclassée » et traitée par Opus 4.8.

Ces 30 jours de rétention permettent à Anthropic d’analyser les informations pour détecter les éventuels usages malveillants du modèle. En cas de suspicion, l’entreprise peut même les conserver pour une durée de deux ans. Les données qui ne posent aucun problème sont supprimées passé le délai standard.

Ce changement n’en est pas un pour les utilisateurs qui passent par le site web ou les applications mobiles de Claude, puisque la rétention des données est déjà effective pour ces abonnés. En revanche, c’est une nouveauté pour les organisations utilisant la console Claude, ou qui accèdent à Claude via Bedrock, Google Cloud Agent ou encore Foundry avec le mode Zero Data Retention (ZDR).

Ce mode proposé par Anthropic à certains clients professionnels ne conserve pas les requêtes envoyées au modèle ni les réponses générées. Ça n’est donc plus le cas avec Fable. L’équipe juridique de Microsoft évalue ces changements ; le souci majeur concerne les données des utilisateurs et les informations confidentielles. Aucun délai n’a été annoncé.

Le cas Microsoft pourrait donc se répéter chez d’autres entreprises.

34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta

11 juin 2026 à 04:50

34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta

Révélées début juin, les failles de l’assistance IA générative de Meta ont finalement permis à des personnes malveillantes de récupérer l’accès à quelque 34 000 comptes Instagram, affirme le New York Times sur la base de documents internes.

L’incroyable légèreté de Meta a permis à des pirates de s’emparer de 34 000 comptes Instagram, parmi lesquels ceux de la Maison Blanche sous administration Obama, d’un responsable militaire américain, ou encore d’entreprises de premier plan. La faille a été corrigée depuis, mais le robot reste en place.

Le robot d’assistance de Meta chargé de la gestion des comptes Instagram avait l’IA qui flanche. Mis en route au mois de mars, il pouvait réaliser des opérations critiques, comme le changement de l’email associé à un compte, ou encore la réinitialisation du mot de passe. Les pirates, armés d’un VPN (pour apparaitre dans le même pays que leur victime) et d’une bonne tchatche, ont poussé le bot à lancer la procédure de récupération de compte.

Grâce à cette méthode d’injection de prompts, ils ont pu prendre possession de milliers de comptes : environ 34 000, selon des chiffres internes consultés par le New York Times. 20 000 d’entre eux ont été compromis, donnant aux hackers un accès aux adresses email associées, aux numéros de téléphone, aux dates de naissance et à d’autres données personnelles. Plus de 3 500 comptes piratés ont subi un détournement de leur nom d’utilisateur.

Une vulnérabilité corrigée mais non expliquée

Meta explique ne pas être en mesure de déterminer les informations consultées ou dérobées, ce qui n’est pas rassurant. La vulnérabilité a été bouchée. Un porte parole indique que « certaines de nos vérifications internes côté serveur n’ont pas fonctionné dans ce cas précis, mais cela n’était pas dû à l’agent d’IA lui-même », tente-t-il de rassurer. L’entreprise affirme également que ses agents dédiés au service client ont permis d’augmenter de 30 % le nombre de comptes récupérés après un piratage aux États-Unis et au Canada l’an dernier.

L’incident n’en reste pas moins très problématique pour Meta, qui dépense des dizaines de milliards de dollars dans les infrastructures IA, et injecte cette technologie partout où c’est possible, parfois en dépit du bon sens. Hasard malheureux du calendrier, le groupe a présenté la semaine dernière un nouveau service permettant aux organisations et aux entreprises d’utiliser des chatbots IA pour gérer les prises de rendez-vous pour les clients et compléter des transactions.

Il n’est pour autant pas question de remiser au placard cet agent dédié au SAV d’Instagram. Malgré ces piratages, les documents internes indiquent que Meta maintient tous les produits en service, se contentant de suspendre une « expérimentation en cours » (le système d’oubli de mot de passe).

34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta

11 juin 2026 à 04:50

34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta

Révélées début juin, les failles de l’assistance IA générative de Meta ont finalement permis à des personnes malveillantes de récupérer l’accès à quelque 34 000 comptes Instagram, affirme le New York Times sur la base de documents internes.

L’incroyable légèreté de Meta a permis à des pirates de s’emparer de 34 000 comptes Instagram, parmi lesquels ceux de la Maison Blanche sous administration Obama, d’un responsable militaire américain, ou encore d’entreprises de premier plan. La faille a été corrigée depuis, mais le robot reste en place.

Le robot d’assistance de Meta chargé de la gestion des comptes Instagram avait l’IA qui flanche. Mis en route au mois de mars, il pouvait réaliser des opérations critiques, comme le changement de l’email associé à un compte, ou encore la réinitialisation du mot de passe. Les pirates, armés d’un VPN (pour apparaitre dans le même pays que leur victime) et d’une bonne tchatche, ont poussé le bot à lancer la procédure de récupération de compte.

Grâce à cette méthode d’injection de prompts, ils ont pu prendre possession de milliers de comptes : environ 34 000, selon des chiffres internes consultés par le New York Times. 20 000 d’entre eux ont été compromis, donnant aux hackers un accès aux adresses email associées, aux numéros de téléphone, aux dates de naissance et à d’autres données personnelles. Plus de 3 500 comptes piratés ont subi un détournement de leur nom d’utilisateur.

Une vulnérabilité corrigée mais non expliquée

Meta explique ne pas être en mesure de déterminer les informations consultées ou dérobées, ce qui n’est pas rassurant. La vulnérabilité a été bouchée. Un porte parole indique que « certaines de nos vérifications internes côté serveur n’ont pas fonctionné dans ce cas précis, mais cela n’était pas dû à l’agent d’IA lui-même », tente-t-il de rassurer. L’entreprise affirme également que ses agents dédiés au service client ont permis d’augmenter de 30 % le nombre de comptes récupérés après un piratage aux États-Unis et au Canada l’an dernier.

L’incident n’en reste pas moins très problématique pour Meta, qui dépense des dizaines de milliards de dollars dans les infrastructures IA, et injecte cette technologie partout où c’est possible, parfois en dépit du bon sens. Hasard malheureux du calendrier, le groupe a présenté la semaine dernière un nouveau service permettant aux organisations et aux entreprises d’utiliser des chatbots IA pour gérer les prises de rendez-vous pour les clients et compléter des transactions.

Il n’est pour autant pas question de remiser au placard cet agent dédié au SAV d’Instagram. Malgré ces piratages, les documents internes indiquent que Meta maintient tous les produits en service, se contentant de suspendre une « expérimentation en cours » (le système d’oubli de mot de passe).

☕️ Google baisse le prix de son offre AI Plus d’entrée de gamme

10 juin 2026 à 06:42


Google revoit le prix de sa formule AI Plus et surprise, au lieu de monter comme c’est devenu l’habitude pour les services en ligne, le tarif baisse. Il passe de 7,99 à 4,99 euros par mois soit une baisse de quasiment 38 %. Le moteur de recherche double aussi le stockage compris avec cet abonnement, qui passe de 200 à 400 Go à partager entre Drive, Photos et Gmail. La version 2 To change de nom (elle devient « AI Plus » au lieu de Premium), mais toujours à 9,99 euros.

Capture d’écran : Google

Une offre plutôt généreuse donc, mais Google ajoute de nouvelles limites d’utilisation dans l’app Gemini, selon « la complexité des requêtes, des fonctionnalités utilisées et de la longueur des discussions », explique l’entreprise dans un courriel consulté par Next. Les limites sont actualisées toutes les cinq heures, jusqu’à l’atteinte du plafond hebdomadaire. Les abonnés AI Plus bénéficient de limites « deux fois plus élevées » que les utilisateurs non membres.

Google modifie également les plafonds dans d’autres logiciels et services IA, comme Flow (génération d’images et de vidéos) et Antigravity, la plateforme agentique. Le forfait AI Plus n’inclut plus 200 crédits mensuels, néanmoins « votre expérience ne devrait pas changer avec le nouveau modèle d’utilisation ».

L’offre Google AI Plus a été lancée en septembre 2025, d’abord en Indonésie, elle a été étendue depuis à la quasi-totalité du globe. Comparable à ChatGPT Go (mais désormais trois euros moins chère), cette formule complète l’abonnement AI Pro à 21,99 euros par mois ; celle-ci contient désormais 5 To de stockage en ligne, au lieu de 2. Pour les utilisateurs les plus gourmands, Google AI Ultra est facturé à partir de 99,99 euros (20 To).

☕️ Google baisse le prix de son offre AI Plus d’entrée de gamme

10 juin 2026 à 06:42


Google revoit le prix de sa formule AI Plus et surprise, au lieu de monter comme c’est devenu l’habitude pour les services en ligne, le tarif baisse. Il passe de 7,99 à 4,99 euros par mois soit une baisse de quasiment 38 %. Le moteur de recherche double aussi le stockage compris avec cet abonnement, qui passe de 200 à 400 Go à partager entre Drive, Photos et Gmail. La version 2 To change de nom (elle devient « AI Plus » au lieu de Premium), mais toujours à 9,99 euros.

Capture d’écran : Google

Une offre plutôt généreuse donc, mais Google ajoute de nouvelles limites d’utilisation dans l’app Gemini, selon « la complexité des requêtes, des fonctionnalités utilisées et de la longueur des discussions », explique l’entreprise dans un courriel consulté par Next. Les limites sont actualisées toutes les cinq heures, jusqu’à l’atteinte du plafond hebdomadaire. Les abonnés AI Plus bénéficient de limites « deux fois plus élevées » que les utilisateurs non membres.

Google modifie également les plafonds dans d’autres logiciels et services IA, comme Flow (génération d’images et de vidéos) et Antigravity, la plateforme agentique. Le forfait AI Plus n’inclut plus 200 crédits mensuels, néanmoins « votre expérience ne devrait pas changer avec le nouveau modèle d’utilisation ».

L’offre Google AI Plus a été lancée en septembre 2025, d’abord en Indonésie, elle a été étendue depuis à la quasi-totalité du globe. Comparable à ChatGPT Go (mais désormais trois euros moins chère), cette formule complète l’abonnement AI Pro à 21,99 euros par mois ; celle-ci contient désormais 5 To de stockage en ligne, au lieu de 2. Pour les utilisateurs les plus gourmands, Google AI Ultra est facturé à partir de 99,99 euros (20 To).

Claude Fable 5 : un petit goût de Mythos pour le grand public

10 juin 2026 à 06:10
Il bat Pokémon tout seul !
Claude Fable 5 : un petit goût de Mythos pour le grand public

Comment faire mousser une introduction en Bourse quand on est un labo IA ? Lancer son modèle de langage le plus ambitieux, pardi ! Anthropic, qui s’y connait en buzz et en marketing de la peur, a dévoilé son premier LLM « de classe Mythos » à destination du grand public, Claude Fable 5.

Après Haiku, Sonnet et Opus, Anthropic lance Fable, premier modèle grand public « de classe Mythos ». Il lui emprunte les mêmes fondations, mais avec des garde-fous pour éviter que le modèle ne facilite des attaques informatiques. L’aperçu de Mythos présenté début avril n’est distribué qu’à des partenaires de confiance via le projet Glasswing.

Anthropic entrouvre les portes de Mythos au grand public

Claude Fable 5 se veut puissant, et les benchmarks fournis par Anthropic racontent tous la même histoire : le modèle domine quasiment dans tous les tests. Le plus spectaculaire est clairement le développement logiciel agentique. Sur SWE-Bench Pro, le modèle met plus de 20 points dans la vue à GPT-5.5, qui n’est pourtant pas manchot dans ce domaine.

Image : Anthropic

La startup cherche surtout à montrer que Fable est meilleur pour travailler longtemps de manière autonome. Les benchs sont tous orientés vers le développement logiciel, l’utilisation d’outils, le raisonnement à partir de documents, ou du travail de recherche. Et surtout, avec le test Cybersecurity, le modèle fait plus du double de son concurrent direct chez OpenAI. Et pour cause, il repose sur les bases d’un LLM spécialisé dans le domaine.

Sur un plan plus léger mais tout de même significatif, Fable 5 a battu Pokémon Rouge Feu en un peu plus de 50 heures, uniquement en analysant des captures d’écran du jeu de Nintendo, sans carte ni aide de navigation (le titre sert lui aussi de benchmark pour les éditeurs d’IA). De précédents modèles de Claude parvenaient eux aussi à la fin du jeu, mais de manière très laborieuse, et avec des outils supplémentaires pour s’en sortir dans leur exploration de Kanto.

Toute cette puissance ne saurait être mise entre de mauvaises mains. Fidèle à une communication qui en rajoute sur la dangerosité de Mythos, Anthropic en fait des caisses sur les restrictions de Fable 5. L’entreprise a truffé le modèle de « classifieurs » qui analysent les requêtes. Si le système estime que la question touche à des sujets sensibles, comme la cybersécurité, la biologie, la chimie ou la distillation de modèles IA, la question sera automatiquement traitée par Opus 4.8. L’utilisateur sera informé du tour de passe-passe.

Dans ses tests, Anthropic affirme que le passage d’un modèle à l’autre concerne moins de 5 % des sessions. Néanmoins, la société reconnaît que ces garde-fous sont volontairement « conservateurs », ils pourront parfois bloquer des requêtes légitimes. La sécurité a été privilégiée au détriment du confort d’utilisation, du moins dans un premier temps.

Fable 5 a aussi été torturé par des équipes spécialisées dans le jailbreak : plus de 1 000 heures y ont été consacrées sans qu’aucun moyen de contournement systématique ne soit trouvé. On ne pariera pas contre les chercheurs, et la prudence recommande d’attendre quelques semaines : la communauté du jailbreak ne manque pas de créativité pour obtenir ce qu’elle veut d’un LLM.

Enfin, Fable et les modèles de classe Mythos vont conserver les requêtes pendant 30 jours pour détecter les attaques, les tentatives de contournement et les usages malveillants. Ces données ne seront pas utilisées pour l’entraînement des modèles promet Anthropic, et elles seront supprimées après cette période, dans la plupart des cas.

Fable 5 aime les tokens

La question du prix est évidemment centrale, ce d’autant que les nouveaux modèles d’Anthropic adorent brûler des jetons. L’utilisation de Fable 5 revient à 10 dollars par million de tokens en entrée, et 50 dollars par million de tokens en sortie.

Image : Anthropic

L’entreprise divise ainsi par deux le prix de Fable par rapport à l’aperçu de Mythos. Cela n’en fait pas un modèle bon marché pour autant : son tarif est en effet deux fois plus élevé que celui d’Opus 4.8, et identique à celui d’Opus 4.8 Fast, une version aux stéroïdes offrant des temps de réponse plus courts.

En parallèle, Anthropic lance aussi Mythos 5, frère jumeau de Fable 5, sans certaines restrictions : il ne délègue pas à Opus 4.8 les requêtes les plus sensibles. C’est la raison pour laquelle il ne sera proposé qu’aux membres du projet Glasswing, qui s’ouvrira bientôt à des chercheurs en biologie triés sur le volet. Mythos 5 remplacera l’aperçu actuel de Mythos.

Fable 5 est disponible immédiatement via l’API Claude, ainsi que pour les abonnés Pro, Max, Team et Enterprise. Attention cependant, l’inclusion dans les abonnements est temporaire : passé le 22 juin, le LLM ne sera plus proposé sans surcoût. Pour en profiter, il faudra acheter des crédits.

Claude Fable 5 : un petit goût de Mythos pour le grand public

10 juin 2026 à 06:10
Il bat Pokémon tout seul !
Claude Fable 5 : un petit goût de Mythos pour le grand public

Comment faire mousser une introduction en Bourse quand on est un labo IA ? Lancer son modèle de langage le plus ambitieux, pardi ! Anthropic, qui s’y connait en buzz et en marketing de la peur, a dévoilé son premier LLM « de classe Mythos » à destination du grand public, Claude Fable 5.

Après Haiku, Sonnet et Opus, Anthropic lance Fable, premier modèle grand public « de classe Mythos ». Il lui emprunte les mêmes fondations, mais avec des garde-fous pour éviter que le modèle ne facilite des attaques informatiques. L’aperçu de Mythos présenté début avril n’est distribué qu’à des partenaires de confiance via le projet Glasswing.

Anthropic entrouvre les portes de Mythos au grand public

Claude Fable 5 se veut puissant, et les benchmarks fournis par Anthropic racontent tous la même histoire : le modèle domine quasiment dans tous les tests. Le plus spectaculaire est clairement le développement logiciel agentique. Sur SWE-Bench Pro, le modèle met plus de 20 points dans la vue à GPT-5.5, qui n’est pourtant pas manchot dans ce domaine.

Image : Anthropic

La startup cherche surtout à montrer que Fable est meilleur pour travailler longtemps de manière autonome. Les benchs sont tous orientés vers le développement logiciel, l’utilisation d’outils, le raisonnement à partir de documents, ou du travail de recherche. Et surtout, avec le test Cybersecurity, le modèle fait plus du double de son concurrent direct chez OpenAI. Et pour cause, il repose sur les bases d’un LLM spécialisé dans le domaine.

Sur un plan plus léger mais tout de même significatif, Fable 5 a battu Pokémon Rouge Feu en un peu plus de 50 heures, uniquement en analysant des captures d’écran du jeu de Nintendo, sans carte ni aide de navigation (le titre sert lui aussi de benchmark pour les éditeurs d’IA). De précédents modèles de Claude parvenaient eux aussi à la fin du jeu, mais de manière très laborieuse, et avec des outils supplémentaires pour s’en sortir dans leur exploration de Kanto.

Toute cette puissance ne saurait être mise entre de mauvaises mains. Fidèle à une communication qui en rajoute sur la dangerosité de Mythos, Anthropic en fait des caisses sur les restrictions de Fable 5. L’entreprise a truffé le modèle de « classifieurs » qui analysent les requêtes. Si le système estime que la question touche à des sujets sensibles, comme la cybersécurité, la biologie, la chimie ou la distillation de modèles IA, la question sera automatiquement traitée par Opus 4.8. L’utilisateur sera informé du tour de passe-passe.

Dans ses tests, Anthropic affirme que le passage d’un modèle à l’autre concerne moins de 5 % des sessions. Néanmoins, la société reconnaît que ces garde-fous sont volontairement « conservateurs », ils pourront parfois bloquer des requêtes légitimes. La sécurité a été privilégiée au détriment du confort d’utilisation, du moins dans un premier temps.

Fable 5 a aussi été torturé par des équipes spécialisées dans le jailbreak : plus de 1 000 heures y ont été consacrées sans qu’aucun moyen de contournement systématique ne soit trouvé. On ne pariera pas contre les chercheurs, et la prudence recommande d’attendre quelques semaines : la communauté du jailbreak ne manque pas de créativité pour obtenir ce qu’elle veut d’un LLM.

Enfin, Fable et les modèles de classe Mythos vont conserver les requêtes pendant 30 jours pour détecter les attaques, les tentatives de contournement et les usages malveillants. Ces données ne seront pas utilisées pour l’entraînement des modèles promet Anthropic, et elles seront supprimées après cette période, dans la plupart des cas.

Fable 5 aime les tokens

La question du prix est évidemment centrale, ce d’autant que les nouveaux modèles d’Anthropic adorent brûler des jetons. L’utilisation de Fable 5 revient à 10 dollars par million de tokens en entrée, et 50 dollars par million de tokens en sortie.

Image : Anthropic

L’entreprise divise ainsi par deux le prix de Fable par rapport à l’aperçu de Mythos. Cela n’en fait pas un modèle bon marché pour autant : son tarif est en effet deux fois plus élevé que celui d’Opus 4.8, et identique à celui d’Opus 4.8 Fast, une version aux stéroïdes offrant des temps de réponse plus courts.

En parallèle, Anthropic lance aussi Mythos 5, frère jumeau de Fable 5, sans certaines restrictions : il ne délègue pas à Opus 4.8 les requêtes les plus sensibles. C’est la raison pour laquelle il ne sera proposé qu’aux membres du projet Glasswing, qui s’ouvrira bientôt à des chercheurs en biologie triés sur le volet. Mythos 5 remplacera l’aperçu actuel de Mythos.

Fable 5 est disponible immédiatement via l’API Claude, ainsi que pour les abonnés Pro, Max, Team et Enterprise. Attention cependant, l’inclusion dans les abonnements est temporaire : passé le 22 juin, le LLM ne sera plus proposé sans surcoût. Pour en profiter, il faudra acheter des crédits.

❌