Next - Articles gratuits
☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub 17 juin 2026 à 15:38

☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub

17 juin 2026 à 15:38

GitHub, propriété de Microsoft, fait face à une explosion de son activité due aux outils de codage par IA (Copilot, agents autonomes, etc.). Selon Business Insider, qui cite deux sources internes, Microsoft aurait décidé de se tourner vers l’un de ses plus grands rivaux dans le cloud, Amazon, pour aider à résoudre des problèmes de capacité sur sa plateforme de code GitHub, suite à une série de pannes liées à l’IA.

Rappelons que GitHub, qui a longtemps profité d’une forme d’indépendance au sein du groupe de Redmond, était censé migrer intégralement vers Azure sous 24 mois, selon des déclarations formulées en octobre dernier.

Bien que Microsoft n’ait pas directement confirmé l’information relative à AWS, un porte-parole a indiqué à nos confrères que l’éditeur avait bien une stratégie multi-cloud : « L’incroyable pic du développement des agents qui a commencé à la fin de l’année dernière a mis à l’épreuve les limites de notre infrastructure ». Microsoft « accélère à la fois notre passage à Azure et continue d’explorer une stratégie multi-cloud afin de garantir la capacité future, l’élasticité de calcul et l’échelle horizontale nécessaires pour soutenir une croissance continue ».

On a d’ailleurs une idée assez précise du « pic extraordinaire » en question. Le 3 avril, Kyle Daigle, directeur des opérations de GitHub, publiait une statistique forte sur X : « Oui, l’activité de la plateforme explose. Il y avait eu un milliard de commits en 2025. Maintenant, c’est 275 millions par semaine, donc 14 milliards cette année si la croissance reste linéaire ». Il ajoutait : « Spoiler : ce ne sera pas le cas ».

Le responsable indiquait également que l’équipe poussait « comme des fous vers plus de CPU, l’évolutivité des services et le renforcement des fonctionnalités de base de GitHub ».

La situation ne manquerait pas d’ironie, puisque ce serait l’essor des outils d’IA de Microsoft elle-même qui engendrerait une demande que sa propre infrastructure Azure n’arriverait plus à absorber. Fin avril, plusieurs développeurs renommés, fidèles de GitHub, avaient annoncé leur intention de plier bagage en raison des dysfonctionnements de la plateforme.

Microsoft a depuis introduit une facturation à l’usage de GitHub Copilot qui, elle aussi, suscite son lot de critiques.

https://next.ink/240147/des-le-premier-jour-la-facture-a-lusage-de-github-copilot-interroge-les-devs/

Next.ink
☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub 17 juin 2026 à 15:38

☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub

Next.ink

Par : Vincent Hermann

17 juin 2026 à 15:38

GitHub, propriété de Microsoft, fait face à une explosion de son activité due aux outils de codage par IA (Copilot, agents autonomes, etc.). Selon Business Insider, qui cite deux sources internes, Microsoft aurait décidé de se tourner vers l’un de ses plus grands rivaux dans le cloud, Amazon, pour aider à résoudre des problèmes de capacité sur sa plateforme de code GitHub, suite à une série de pannes liées à l’IA.

Rappelons que GitHub, qui a longtemps profité d’une forme d’indépendance au sein du groupe de Redmond, était censé migrer intégralement vers Azure sous 24 mois, selon des déclarations formulées en octobre dernier.

Bien que Microsoft n’ait pas directement confirmé l’information relative à AWS, un porte-parole a indiqué à nos confrères que l’éditeur avait bien une stratégie multi-cloud : « L’incroyable pic du développement des agents qui a commencé à la fin de l’année dernière a mis à l’épreuve les limites de notre infrastructure ». Microsoft « accélère à la fois notre passage à Azure et continue d’explorer une stratégie multi-cloud afin de garantir la capacité future, l’élasticité de calcul et l’échelle horizontale nécessaires pour soutenir une croissance continue ».

On a d’ailleurs une idée assez précise du « pic extraordinaire » en question. Le 3 avril, Kyle Daigle, directeur des opérations de GitHub, publiait une statistique forte sur X : « Oui, l’activité de la plateforme explose. Il y avait eu un milliard de commits en 2025. Maintenant, c’est 275 millions par semaine, donc 14 milliards cette année si la croissance reste linéaire ». Il ajoutait : « Spoiler : ce ne sera pas le cas ».

Le responsable indiquait également que l’équipe poussait « comme des fous vers plus de CPU, l’évolutivité des services et le renforcement des fonctionnalités de base de GitHub ».

La situation ne manquerait pas d’ironie, puisque ce serait l’essor des outils d’IA de Microsoft elle-même qui engendrerait une demande que sa propre infrastructure Azure n’arriverait plus à absorber. Fin avril, plusieurs développeurs renommés, fidèles de GitHub, avaient annoncé leur intention de plier bagage en raison des dysfonctionnements de la plateforme.

Microsoft a depuis introduit une facturation à l’usage de GitHub Copilot qui, elle aussi, suscite son lot de critiques.

https://next.ink/240147/des-le-premier-jour-la-facture-a-lusage-de-github-copilot-interroge-les-devs/

Next - Articles gratuits
La promesse d’une « IA pour tous » au service du bien commun a du plomb dans l’aile 17 juin 2026 à 08:00

La promesse d’une « IA pour tous » au service du bien commun a du plomb dans l’aile

Next - Articles gratuits

Par : Sébastien Gavois

17 juin 2026 à 08:00

Vivement l’INdependance Day !

La promesse d’une « IA pour tous » au service du bien commun a du plomb dans l’aile

En plus de faire réagir toute la classe politique, la coupure des derniers modèles d’Anthropic remet en avant des questions de souveraineté et d’autonomie. Pour le Conseil de l’IA, « la menace sur l’autonomie numérique européenne n’est plus une hypothèse, elle est devenue une réalité tangible ».

Dans une note publiée quelques jours seulement après la coupure de Mythos 5 et de sa version pour le grand public Fable 5, le Conseil de l’IA et du Numérique évoque un « point de bascule ». Le terme est peut-être fort, mais cette coupure a été l’occasion d’éveiller les esprits sur les questions de souveraineté et de rappeler notre dépendance à des technologies américaines.

La Fable, le Mythos et la raison d’État

Conseil de l’IA et enjeux de souveraineté

Pour le Conseil, cette suspension soudaine « révèle en réalité des tendances de fond sur l’intelligence artificielle (IA), qui s’amplifient depuis déjà un certain temps ». Il affirme que la maîtrise des dépendances technologiques doit devenir une priorité dans le numérique.

Les enjeux de souveraineté numérique, les membres du Conseil le connaissent bien, déjà par le biais de ses deux co-présidents : Anne Bouverot (ex-Orange, présidente du conseil d’administration de l’ENS) ainsi que Guillaume Poupard (ex-patron de l’ANSSI, CTO d’Orange). Sébastien Soriano et Patrick Chaize sont également membres du Conseil.

Kill switch : jour, nuit, jour, nuit…

Cette coupure des deux modèles est la matérialisation d’une menace régulièrement évoquée : un kill switch. La question se posait déjà lors de la mise en place de S3ns et Bleu, des clouds basés sur les technologies de Google et Microsoft, mais sous le contrôle et la maîtrise d’entreprises françaises. S3ns est d’ailleurs qualifié SecNumCloud par l’ANSSI, la plus haute certification.

La question était de savoir ce qu’il se passerait si Google ou Microsoft fermaient le robinet et arrêtaient d’envoyer des mises à jour. Les cloud continueraient de fonctionner, mais sans nouvelles fonctionnalités, ni correctifs de bugs ou de sécurité. C’est certainement le point le plus sensible.

Nous avions évoqué le sujet avec les deux entités. S3ns pense pouvoir tenir quelques mois, Bleu pousse à un an et pourrait proposer à ses clients des liaisons directes afin de « fonctionner en autarcie », totalement isolé d’Internet.

Les précédents : Adobe au Venezuela, le juge de la CPI Nicolas Guillou

Comme nous l’avons vu avec l’intelligence artificielle générative, le kill switch d’Anthropic a coupé les modèles à l’ensemble des clients, partout dans le monde. Ce n’est pas une première. En octobre 2019, « Adobe avait suspendu ses services – notamment l’ouverture de documents PDF – au Venezuela à la suite d’un Executive Order signé par l’administration Trump ».

Rappelons aussi le cas Nicolas Guillou, juge français de la Cour pénale internationale qui « n’a plus accès aux services numériques développés outre-Atlantique ». Le principal intéressé avait expliqué que l’Europe était (est encore) en situation de « vassalisation, dans un contexte de déclin de l’ordre mondial ».

Vassalisation de l’Europe : le numérique est « une infrastructure de pouvoir »

Pour le Conseil de l’IA, « les restrictions imposées sur les deux modèles les plus avancés d’Anthropic marquent une étape supplémentaire, significative et inédite vers la généralisation pratique de ce risque ». Si le numérique est depuis toujours un enjeu de pouvoir, les LLM deviennent des actifs stratégiques.

Washington veut s’éviter un nouveau « moment DeepSeek »

Il ajoute que cette mesure « prolonge la stratégie de containment (endiguement) technologique, jusqu’ici principalement incarnée par les restrictions à l’exportation des puces NVIDIA les plus performantes » sur le marché chinois.

Le but est évident pour les États-Unis : tenter de garder cette avance pour eux afin que ses entreprises technologiques en profitent en premier, voire en exclusivité. Le gouvernement américain veut ainsi s’« éviter un nouveau « moment DeepSeek », qui avait fortement marqué les esprits à Washington ».

En bloquant les puces, les États-Unis entendent limiter les capacités d’entraînement des plus gros modèles ; avec des restrictions sur des modèles, ils veulent « limiter les risques de distillation hostile ». Selon la note, c’est grâce à la distillation que « des laboratoires chinois, comme DeepSeek, ont très certainement pu combler une grande partie de leur retard sur les modèles américains par le passé ».

Cette histoire entre en collision avec la « promesse d’une « IA pour tous » au service du bien commun », sans oublier les questions de coûts : « l’accès aux IA performantes est jusqu’à présent très largement subventionné », avec des forfaits qui seraient bien en deçà du coût réel.

Des sociétés comme OpenAI et Anthropic n’ont de cesse de vanter les performances de leurs modèles, rappelant à qui veut l‘entendre qu’ils ne doivent pas être mis entre toutes les mains (l‘Executive Order de Donald Trump va dans ce sens).

Anthropic : entre annonces et Mythos

Pour le Conseil, c’est le « retour en force de la doctrine du risque catastrophique, voire existentiel, associé à l’IA »… qui va de pair avec une « mécanique bien connue, initiée par les GAFAM, selon lesquels seule une poignée d’acteurs devraient disposer des technologies les plus avancées en raison de leur dangerosité supposée – affirmation loin de faire consensus sur le plan scientifique. En revanche, une telle posture permet à ces mêmes acteurs de justifier un contrôle accru sur ces technologies et les revenus qui en découlent, en limitant ainsi la concurrence et l’innovation ouverte ».

Vers un Independance Day ?

Pour le Conseil de l’IA, il faut donc agir, et vite. Il met en avant une approche dont nous parlons depuis des années (dans le spatial comme le numérique) : « buy european first », c’est-à-dire une préférence européenne dans la commande publique.

Autre point d’attention : les AI factories en France. Si la volonté de rééquilibrer les infrastructures critiques sur le territoire national est claire, « une vigilance particulière devra être portée sur l’allocation effective de la puissance de calcul qui, si elle s’avérait principalement fléchée vers les géants américains, ne résoudrait aucunement l’enjeu de souveraineté numérique et de la captation de la valeur produite ».

Le dernier point concerne les chercheurs. Si la France dispose d’écoles et de centres de recherche parmi les meilleurs au monde, le pays « accuse un retard croissant dans la course aux talents de l’IA, en particulier lorsqu’il s’agit de retenir ses talents ou d’en attirer d’autres ». Alors que nous étions 3e sur le nombre de « top chercheurs en IA » en 2016, nous avons glissé à la 9e place l’année dernière.

Next.ink
La promesse d’une « IA pour tous » au service du bien commun a du plomb dans l’aile 17 juin 2026 à 08:00

La promesse d’une « IA pour tous » au service du bien commun a du plomb dans l’aile

Next.ink

Par : Sébastien Gavois

17 juin 2026 à 08:00

Vivement l’INdependance Day !

En plus de faire réagir toute la classe politique, la coupure des derniers modèles d’Anthropic remet en avant des questions de souveraineté et d’autonomie. Pour le Conseil de l’IA, « la menace sur l’autonomie numérique européenne n’est plus une hypothèse, elle est devenue une réalité tangible ».

Dans une note publiée quelques jours seulement après la coupure de Mythos 5 et de sa version pour le grand public Fable 5, le Conseil de l’IA et du Numérique évoque un « point de bascule ». Le terme est peut-être fort, mais cette coupure a été l’occasion d’éveiller les esprits sur les questions de souveraineté et de rappeler notre dépendance à des technologies américaines.

La Fable, le Mythos et la raison d’État

Conseil de l’IA et enjeux de souveraineté

Pour le Conseil, cette suspension soudaine « révèle en réalité des tendances de fond sur l’intelligence artificielle (IA), qui s’amplifient depuis déjà un certain temps ». Il affirme que la maîtrise des dépendances technologiques doit devenir une priorité dans le numérique.

Les enjeux de souveraineté numérique, les membres du Conseil le connaissent bien, déjà par le biais de ses deux co-présidents : Anne Bouverot (ex-Orange, présidente du conseil d’administration de l’ENS) ainsi que Guillaume Poupard (ex-patron de l’ANSSI, CTO d’Orange). Sébastien Soriano et Patrick Chaize sont également membres du Conseil.

Kill switch : jour, nuit, jour, nuit…

Cette coupure des deux modèles est la matérialisation d’une menace régulièrement évoquée : un kill switch. La question se posait déjà lors de la mise en place de S3ns et Bleu, des clouds basés sur les technologies de Google et Microsoft, mais sous le contrôle et la maîtrise d’entreprises françaises. S3ns est d’ailleurs qualifié SecNumCloud par l’ANSSI, la plus haute certification.

La question était de savoir ce qu’il se passerait si Google ou Microsoft fermaient le robinet et arrêtaient d’envoyer des mises à jour. Les cloud continueraient de fonctionner, mais sans nouvelles fonctionnalités, ni correctifs de bugs ou de sécurité. C’est certainement le point le plus sensible.

Nous avions évoqué le sujet avec les deux entités. S3ns pense pouvoir tenir quelques mois, Bleu pousse à un an et pourrait proposer à ses clients des liaisons directes afin de « fonctionner en autarcie », totalement isolé d’Internet.

Les précédents : Adobe au Venezuela, le juge de la CPI Nicolas Guillou

Comme nous l’avons vu avec l’intelligence artificielle générative, le kill switch d’Anthropic a coupé les modèles à l’ensemble des clients, partout dans le monde. Ce n’est pas une première. En octobre 2019, « Adobe avait suspendu ses services – notamment l’ouverture de documents PDF – au Venezuela à la suite d’un Executive Order signé par l’administration Trump ».

Rappelons aussi le cas Nicolas Guillou, juge français de la Cour pénale internationale qui « n’a plus accès aux services numériques développés outre-Atlantique ». Le principal intéressé avait expliqué que l’Europe était (est encore) en situation de « vassalisation, dans un contexte de déclin de l’ordre mondial ».

Vassalisation de l’Europe : le numérique est « une infrastructure de pouvoir »

Pour le Conseil de l’IA, « les restrictions imposées sur les deux modèles les plus avancés d’Anthropic marquent une étape supplémentaire, significative et inédite vers la généralisation pratique de ce risque ». Si le numérique est depuis toujours un enjeu de pouvoir, les LLM deviennent des actifs stratégiques.

Washington veut s’éviter un nouveau « moment DeepSeek »

Il ajoute que cette mesure « prolonge la stratégie de containment (endiguement) technologique, jusqu’ici principalement incarnée par les restrictions à l’exportation des puces NVIDIA les plus performantes » sur le marché chinois.

Le but est évident pour les États-Unis : tenter de garder cette avance pour eux afin que ses entreprises technologiques en profitent en premier, voire en exclusivité. Le gouvernement américain veut ainsi s’« éviter un nouveau « moment DeepSeek », qui avait fortement marqué les esprits à Washington ».

En bloquant les puces, les États-Unis entendent limiter les capacités d’entraînement des plus gros modèles ; avec des restrictions sur des modèles, ils veulent « limiter les risques de distillation hostile ». Selon la note, c’est grâce à la distillation que « des laboratoires chinois, comme DeepSeek, ont très certainement pu combler une grande partie de leur retard sur les modèles américains par le passé ».

Cette histoire entre en collision avec la « promesse d’une « IA pour tous » au service du bien commun », sans oublier les questions de coûts : « l’accès aux IA performantes est jusqu’à présent très largement subventionné », avec des forfaits qui seraient bien en deçà du coût réel.

Des sociétés comme OpenAI et Anthropic n’ont de cesse de vanter les performances de leurs modèles, rappelant à qui veut l‘entendre qu’ils ne doivent pas être mis entre toutes les mains (l‘Executive Order de Donald Trump va dans ce sens).

Anthropic : entre annonces et Mythos

Pour le Conseil, c’est le « retour en force de la doctrine du risque catastrophique, voire existentiel, associé à l’IA »… qui va de pair avec une « mécanique bien connue, initiée par les GAFAM, selon lesquels seule une poignée d’acteurs devraient disposer des technologies les plus avancées en raison de leur dangerosité supposée – affirmation loin de faire consensus sur le plan scientifique. En revanche, une telle posture permet à ces mêmes acteurs de justifier un contrôle accru sur ces technologies et les revenus qui en découlent, en limitant ainsi la concurrence et l’innovation ouverte ».

Vers un Independance Day ?

Pour le Conseil de l’IA, il faut donc agir, et vite. Il met en avant une approche dont nous parlons depuis des années (dans le spatial comme le numérique) : « buy european first », c’est-à-dire une préférence européenne dans la commande publique.

Autre point d’attention : les AI factories en France. Si la volonté de rééquilibrer les infrastructures critiques sur le territoire national est claire, « une vigilance particulière devra être portée sur l’allocation effective de la puissance de calcul qui, si elle s’avérait principalement fléchée vers les géants américains, ne résoudrait aucunement l’enjeu de souveraineté numérique et de la captation de la valeur produite ».

Le dernier point concerne les chercheurs. Si la France dispose d’écoles et de centres de recherche parmi les meilleurs au monde, le pays « accuse un retard croissant dans la course aux talents de l’IA, en particulier lorsqu’il s’agit de retenir ses talents ou d’en attirer d’autres ». Alors que nous étions 3e sur le nombre de « top chercheurs en IA » en 2016, nous avons glissé à la 9e place l’année dernière.

Next - Articles gratuits
13 mots suffisent pour manipuler un résultat de recherche par IA 16 juin 2026 à 13:13

13 mots suffisent pour manipuler un résultat de recherche par IA

Next - Articles gratuits

Par : Mathilde Saliou

16 juin 2026 à 13:13

L'ère du commentaire

13 mots suffisent pour manipuler un résultat de recherche par IA

Il suffit d’une dizaine de mots publiés au bon endroit sur un site participatif pour manipuler les résultats de recherche de modèles génératifs appuyés sur des systèmes agentiques, constatent trois chercheurs de l’université de Cornell.

Mise à jour du 17 juin 11 h : précisions sur le type de modèles étudiés

Les systèmes d’intelligence artificielle générative persistent à être très facilement manipulables via Reddit, Quora ou Wikipédia. Pour preuve : une série d’à peine 13 mots suffit dans certains cas à orienter les résultats de systèmes d’IA dédiés à la recherche et accessibles au grand public.

C’est du moins ce que suggère l’étude titrée « Les agents de recherche peuvent être empoisonnés via du contenu généré par les utilisateurs » (« Deep-research agents can be poisoned via user-generated content »), prépubliée par une équipe de trois chercheurs de l’université de Cornell, Hal Triedman, Tingwei Zhang et Vitaly Shmatikov.

Cela explique aussi pourquoi les modérateurs de sites participatifs comme Reddit ou Wikipédia se retrouvent inondés de contenus promotionnels : il s’agit, à terme, de le faire ressurgir dans les réponses des modèles génératifs.

IA : Prompt injection, empoisonnement… de quoi on parle ?

Recours massif à des contenus générés par les internautes.

Les trois universitaires ont concentré leurs recherches sur les systèmes STORM et Co-STORM, créés à l’université de Stanford, et OmniThink, de la société du même nom. Les trois fonctionnent en coordonnant de multiples agents de recherche (deep-research agent) qui lancent leurs recherches pour fournir ensuite un résultat consolidé.

Et les auteurs de l’étude constatent que ces machines tendent à retourner sans cesse vers les mêmes types de contenus. En l’occurrence, pour fournir des réponses aux questions qui leur sont le plus couramment posées, ils s’appuient avant tout sur du contenu produit par les internautes.

Auprès de 404media, l’un des coauteurs explique le phénomène par le fait que les agents appuyés sur des grands modèles de langage (LLM) évaluent la qualité d’une réponse trouvée en ligne en fonction de sa proximité sémantique avec la question qui lui a été posée.

Concrètement, cela les pousse à retourner fréquemment sur des plateformes participatives, où de nombreux commentaires sont écrits en langage naturel, puisque formulés par des humains. Wikipédia et Reddit apparaissent ainsi dans près de la moitié des requêtes émises par les robots étudiés par les chercheurs de Cornell.

Reddit : cas d’école de la pollution par les contenus générés par IA ?

Les auteurs de l’étude constatent par ailleurs qu’une poignée de mots bien placés, parfois de 11 à 15 mots seulement, suffit à les voir recrachés par les modèles génératifs. Parmi leurs expérimentations, ils montrent par exemple qu’un simple commentaire sur le subreddit r/OnlineDating, citant la marque fictive « SilverPath » comme application de dating pour des hommes divorcés dans la cinquantaine, suffit à voir ce nom promu dans les résultats de Co-STORM.

« Deep-research agents can be poisoned via user-generated content »

En 11 mots publiés sur le subreddit r/Comcast, ils parviennent à faire rechercher à l’un des modèles la recommandation du service fictif « CancelEase » pour se désabonner d’un abonnement internet Xfinity.

Trop simples injections

Alors que le domaine du SEO (Search Engine Optimization) a évolué vers le GEO ou l’AEO (Generative Engine Optimization, ou AI Engine Optimization), la découverte implique que toute marque ou tout acteur cherchant à influencer les résultats des modèles grand public peut parvenir à ses fins en étudiant les questions les plus fréquemment posées et en publiant des commentaires proches, intégrant son message cible, sur des sites participatifs.

Sites d’infos générés par IA : « Notre job, c’est gruger Google » pour faire du fric

En termes de modération, les trois chercheurs sont relativement pessimistes : du côté des LLM, empêcher la génération de texte influencé par les recherches en ligne semble difficile, vu le peu de mots nécessaires pour les voir réagir. D’une certaine manière, les constructeurs d’IA opérant des recherches en ligne délèguent cette question aux modérateurs de sites participatifs.

Wikipédia perd 8 % de pages vues par les humains en un an et met ça sur le compte de l’IA

Ni Reddit ni Wikipédia ne pourront régler ces enjeux seuls, soulignent néanmoins les chercheurs auprès de 404 : il s’agit plutôt d’un problème « de niveau sociétal ». Le simple fait qu’un agent génératif ne fasse aucune différence entre un commentaire publié sur un site participatif et une source vérifiée pose, en soi, de vrais problèmes en termes de qualité de l’information fournie aux internautes.

La Wikipédia anglophone interdit l’édition assistée par modèles de langage

Next.ink
13 mots suffisent pour manipuler un résultat de recherche par IA 16 juin 2026 à 13:13

13 mots suffisent pour manipuler un résultat de recherche par IA

Next.ink

Par : Mathilde Saliou

16 juin 2026 à 13:13

L'ère du commentaire

Il suffit d’une dizaine de mots publiés au bon endroit sur un site participatif pour manipuler les résultats de recherche de modèles génératifs appuyés sur des systèmes agentiques, constatent trois chercheurs de l’université de Cornell.

Mise à jour du 17 juin 11 h : précisions sur le type de modèles étudiés

Les systèmes d’intelligence artificielle générative persistent à être très facilement manipulables via Reddit, Quora ou Wikipédia. Pour preuve : une série d’à peine 13 mots suffit dans certains cas à orienter les résultats de systèmes d’IA dédiés à la recherche et accessibles au grand public.

C’est du moins ce que suggère l’étude titrée « Les agents de recherche peuvent être empoisonnés via du contenu généré par les utilisateurs » (« Deep-research agents can be poisoned via user-generated content »), prépubliée par une équipe de trois chercheurs de l’université de Cornell, Hal Triedman, Tingwei Zhang et Vitaly Shmatikov.

Cela explique aussi pourquoi les modérateurs de sites participatifs comme Reddit ou Wikipédia se retrouvent inondés de contenus promotionnels : il s’agit, à terme, de le faire ressurgir dans les réponses des modèles génératifs.

IA : Prompt injection, empoisonnement… de quoi on parle ?

Recours massif à des contenus générés par les internautes.

Les trois universitaires ont concentré leurs recherches sur les systèmes STORM et Co-STORM, créés à l’université de Stanford, et OmniThink, de la société du même nom. Les trois fonctionnent en coordonnant de multiples agents de recherche (deep-research agent) qui lancent leurs recherches pour fournir ensuite un résultat consolidé.

Et les auteurs de l’étude constatent que ces machines tendent à retourner sans cesse vers les mêmes types de contenus. En l’occurrence, pour fournir des réponses aux questions qui leur sont le plus couramment posées, ils s’appuient avant tout sur du contenu produit par les internautes.

Auprès de 404media, l’un des coauteurs explique le phénomène par le fait que les agents appuyés sur des grands modèles de langage (LLM) évaluent la qualité d’une réponse trouvée en ligne en fonction de sa proximité sémantique avec la question qui lui a été posée.

Concrètement, cela les pousse à retourner fréquemment sur des plateformes participatives, où de nombreux commentaires sont écrits en langage naturel, puisque formulés par des humains. Wikipédia et Reddit apparaissent ainsi dans près de la moitié des requêtes émises par les robots étudiés par les chercheurs de Cornell.

Reddit : cas d’école de la pollution par les contenus générés par IA ?

Les auteurs de l’étude constatent par ailleurs qu’une poignée de mots bien placés, parfois de 11 à 15 mots seulement, suffit à les voir recrachés par les modèles génératifs. Parmi leurs expérimentations, ils montrent par exemple qu’un simple commentaire sur le subreddit r/OnlineDating, citant la marque fictive « SilverPath » comme application de dating pour des hommes divorcés dans la cinquantaine, suffit à voir ce nom promu dans les résultats de Co-STORM.

En 11 mots publiés sur le subreddit r/Comcast, ils parviennent à faire rechercher à l’un des modèles la recommandation du service fictif « CancelEase » pour se désabonner d’un abonnement internet Xfinity.

Trop simples injections

Alors que le domaine du SEO (Search Engine Optimization) a évolué vers le GEO ou l’AEO (Generative Engine Optimization, ou AI Engine Optimization), la découverte implique que toute marque ou tout acteur cherchant à influencer les résultats des modèles grand public peut parvenir à ses fins en étudiant les questions les plus fréquemment posées et en publiant des commentaires proches, intégrant son message cible, sur des sites participatifs.

Sites d’infos générés par IA : « Notre job, c’est gruger Google » pour faire du fric

En termes de modération, les trois chercheurs sont relativement pessimistes : du côté des LLM, empêcher la génération de texte influencé par les recherches en ligne semble difficile, vu le peu de mots nécessaires pour les voir réagir. D’une certaine manière, les constructeurs d’IA opérant des recherches en ligne délèguent cette question aux modérateurs de sites participatifs.

Wikipédia perd 8 % de pages vues par les humains en un an et met ça sur le compte de l’IA

Ni Reddit ni Wikipédia ne pourront régler ces enjeux seuls, soulignent néanmoins les chercheurs auprès de 404 : il s’agit plutôt d’un problème « de niveau sociétal ». Le simple fait qu’un agent génératif ne fasse aucune différence entre un commentaire publié sur un site participatif et une source vérifiée pose, en soi, de vrais problèmes en termes de qualité de l’information fournie aux internautes.

La Wikipédia anglophone interdit l’édition assistée par modèles de langage

Next - Articles gratuits
IA dans l’administration publique : la France lance les grandes manœuvres 16 juin 2026 à 10:51

IA dans l’administration publique : la France lance les grandes manœuvres

Next - Articles gratuits

Par : Vincent Hermann

16 juin 2026 à 10:51

Mise au pas

IA dans l’administration publique : la France lance les grandes manœuvres

Le Premier ministre, Sébastien Lecornu, a fait mardi matin une série d’annonces sur l’intelligence artificielle. En ligne de mire, mise à disposition dans les administrations, stratégie nationale et, bien sûr, souveraineté numérique, alimentée par des moyens supplémentaires.

Article mis à jour à 15h23 avec des précisions de Matignon et Palantir au sujet du fait que la DGSI continuera, dans un premier temps, à utiliser la solution logicielle du géant états-unien.

La France passe à l’attaque, selon Sébastien Lecornu. Le Premier ministre, dans une vidéo publiée sur X ce 16 juin à 7h40, liste une série d’actions entreprises au niveau de l’État pour généraliser l’intelligence artificielle partout où elle est décrite comme pertinente. « Car le temps des expérimentations est désormais derrière nous, le temps de la généralisation commence », assène le Premier ministre.

À la veille de l’ouverture du salon VivaTech à Paris, le gouvernement veut montrer qu’il est conscient du changement qui s’opère : « Comme l’électricité hier, comme Internet il y a 30 ans, l’intelligence artificielle va changer notre manière de produire, de soigner, d’apprendre, de nous déplacer, de nous informer, voire même peut-être de penser ». Il y a donc « responsabilité », selon Sébastien Lecornu, de faire profiter de cette révolution aux usagers, que ce soit pour protéger la souveraineté, renforcer les services publics et permettre « à la France de rester une grande nation scientifique, industrielle et technologique ».

Début de généralisation

L’allocution du Premier ministre, au-delà de faire un point rapide de la situation, contenait surtout une série de six annonces pour « changer d’échelle » :

La mise à disposition d’un « agent conversationnel souverain commun » pour l’ensemble des agents publics (il s’agit en fait des agents de l’Etat, soit 1,8 million de personnes tout de même, chiffre confirmé par le ministère de l’Economie et des Finances)
Les technologies « les plus avancées » développées par le ministère des Armées seront « progressivement ouvertes aux autres administrations », à commencer par les ministères de la Justice et de l’Intérieur, via notamment le portail GenIAI « qui a démontré son efficacité dans des environnements particulièrement exigeants » et qui sera déployé dans toutes les administrations régaliennes
Un assistant santé publique déployé dans Ameli d’ici la fin de l’année, pour proposer de premières orientations « fiables », mieux guider les usagers et plus généralement trouver rapidement la bonne réponse
Une démocratisation de l’accès aux données publiques, avec le lancement d’une plateforme unique dédiée à l’IA pour accéder à des informations comme les données démographiques, économiques, géographiques et administratives
La France investira 665 millions d’euros supplémentaires au développement de l’IA dans le cadre du projet France 2030 pour « soutenir les infrastructures, les capacités de calcul, la recherche, les entreprises et les filières industrielles qui feront la puissance de demain »
Un axe sur la souveraineté numérique, avec l’annonce de l’abandon du « géant américain » Palantir au profit de la solution française ChapsVision, « retenue aujourd’hui par la DGSI »

Le calendrier de la dernière annonce ne manquera pas d’interroger puisque le contrat liant la DGSI à Palantir avait été renouvelé en décembre 2025 pour trois ans. « Le choix de ChapsVision est le résultat d’un processus de sélection, qui n’était pas achevé en décembre dernier. Pour ne pas souffrir d’un trou capacitaire dans ce domaine sensible essentiel pour notre sécurité nationale, le contrat a été renouvelé. Cette phase permettra le temps nécessaire de former les équipes et préparer la migration vers la solution de ChapsVision », répond à ce sujet Matignon à Raphaël Grably de BFMTV.

Cherchant à déminer les accusations de « coup de com’ », Matignon précise à BFMTV que le « débranchage » de Palantir par la DGSI sera fait d’ici « 1 à 3 ans selon le moment le plus opportun », et donc potentiellement avant la fin du contrat renouvelé en décembre dernier, qui court jusqu’à fin 2028. Contacté, Palantir assure de son côté à BFMTV que « le contrat de long terme qui lie l’entreprise à la DGSI, et renouvelé fin 2025 pour plusieurs années, demeure pleinement en vigueur ».

Les ministères sont prévenus

Après ces annonces principales, le Premier ministre a ajouté une contrainte pour les ministères, pour préparer notamment le projet de finances 2027. Ainsi, chacun « devra démontrer comment il utilise l’intelligence artificielle pour simplifier les démarches, améliorer le service rendu aux Français et réduire les tâches inutiles, notamment remplies par nos propres agents, et donc faire des économies sans diminuer la qualité du service public rendu à la nation ». Les ministères sont avertis que cette « capacité à se transformer sera désormais prise en compte dans les arbitrages budgétaires », afin de « stimuler cette transformation et mobiliser davantage les ministres et les patrons des grandes entreprises ».

« L’État doit récompenser l’innovation, l’État doit encourager l’efficacité, l’État ne financera plus l’immobilisme, il doit financer désormais sa propre transformation. Car chaque heure gagnée grâce à l’intelligence artificielle est une heure rendue aux Français, chaque procédure simplifiée est une liberté retrouvée, chaque économie réalisée est une ressource supplémentaire pour nos priorités », ajoute le Premier ministre.

Des annonces à surveiller

Bien que ces annonces visent à montrer un gouvernement volontaire dans son approche et conscient des révolutions entraînées par l’intelligence artificielle, une certaine vigilance est de mise. Par exemple, on ne sait pas si les 665 millions d’euros supplémentaires alloués à France 2030 sont une nouvelle somme débloquée ou un simple redéploiement au sein de l’enveloppe générale du projet. Pas de calendrier concret non plus pour le déploiement de l’assistant conversationnel pour les agents publics, contrairement à celui pour Ameli, indiqué pour cette année, donc au cours des six prochains mois.

On ne sait rien non plus de l’entraînement et de l’inférence des modèles qui seront utilisés dans les administrations. Rien n’est dit sur la puissance de calcul et les infrastructures utilisées. Dans ce domaine, comme presque tout le monde, la France est tributaire de grandes entreprises américaines, NVIDIA en tête, même si les serveurs physiques sont en France.

La question d’un assistant performant dans Ameli est en outre intéressante. Le stockage des données de santé par le Health Data Hub chez Microsoft a provoqué bien des remous ces dernières années, avant finalement d’échoir à Scaleway en avril, comme l’a rappelé le Premier ministre. L’accès à ces données est particulièrement sensible et la portée de l’assistant n’a pas été précisée.

Cap sur la formation

On en apprend cependant un peu plus dans un document publié il y a quelques heures par le ministère de l’Économie et des Finances, notamment sur la gestation du projet L’Assistant qui doit équiper tous les agents de la fonction publique.

Le document indique par exemple qu’il a été en test ces dix derniers mois auprès de 10 000 agents provenant de six ministères (Justice, Finances, Éducation nationale, Culture, Enseignement supérieur et Recherche, Services du Premier ministre). Les fonctions abordées sont classiques : résumés, reformulations, extractions d’informations dans des rapports, traductions, et plus récemment RAG, pour créer des bases documentaires dédiées. L’évaluation a été menée par la DITP (Direction interministérielle de la transformation publique), avec la collaboration (entre autres) de chercheurs venant de LaborIA (Inria), du Laboratoire Fabrique de Pensée Critique (INSA Rennes) et du LISIS (CNRS). Selon le document, 75 % des agents auraient trouvé L’Assistant utile à leur métier.

D’autres points sont abordés, dont la formation. L’État vient ainsi de mettre à disposition un « Guide d’usage de l’IA » pour les agents publics (accès public), invités à le consulter. Il s’agit d’une première étape, le gouvernement précisant que le manque de formation est une remontée fréquente. Plus d’un tiers des agents ont ainsi déclaré n’en avoir jamais bénéficié et 31 % ne pas connaitre le cadre d’usage quand des usages existent.

Le cadre général de formation est cependant encore en construction, même si ce deuxième document promet des avancées rapides, en coopération avec les syndicats concernés. En plus d’un rassemblement de toutes les ressources liées dans un même accès, l’État réitère son ambition de former autant d’agents que possible d’ici 2027, ce qui suppose un démarrage en trombe à la rentrée. Un accent particulier sera mis sur les managers.

Sur le sujet des compétences, il est également question de généraliser l’enseignement de l’IA dans les écoles du service public, à savoir les Instituts régionaux d’administration (IRA) et les futurs Instituts du service public (ISP). En outre, le gouvernement souhaite réinternaliser autant que possible les compétences du numérique d’ici 2027. Le calcul est simple selon le document : « Chaque euro investi dans le recrutement de compétences internes permettra de supprimer durablement 1,5 euro de dépenses de prestations externes, tout en renforçant la maîtrise par l’État de ses compétences les plus critiques ».

Next.ink
IA dans l’administration publique : la France lance les grandes manœuvres 16 juin 2026 à 10:51

IA dans l’administration publique : la France lance les grandes manœuvres

Next.ink

Par : Vincent Hermann

16 juin 2026 à 10:51

Mise au pas

Le Premier ministre, Sébastien Lecornu, a fait mardi matin une série d’annonces sur l’intelligence artificielle. En ligne de mire, mise à disposition dans les administrations, stratégie nationale et, bien sûr, souveraineté numérique, alimentée par des moyens supplémentaires.

Article mis à jour à 15h23 avec des précisions de Matignon et Palantir au sujet du fait que la DGSI continuera, dans un premier temps, à utiliser la solution logicielle du géant états-unien.

La France passe à l’attaque, selon Sébastien Lecornu. Le Premier ministre, dans une vidéo publiée sur X ce 16 juin à 7h40, liste une série d’actions entreprises au niveau de l’État pour généraliser l’intelligence artificielle partout où elle est décrite comme pertinente. « Car le temps des expérimentations est désormais derrière nous, le temps de la généralisation commence », assène le Premier ministre.

À la veille de l’ouverture du salon VivaTech à Paris, le gouvernement veut montrer qu’il est conscient du changement qui s’opère : « Comme l’électricité hier, comme Internet il y a 30 ans, l’intelligence artificielle va changer notre manière de produire, de soigner, d’apprendre, de nous déplacer, de nous informer, voire même peut-être de penser ». Il y a donc « responsabilité », selon Sébastien Lecornu, de faire profiter de cette révolution aux usagers, que ce soit pour protéger la souveraineté, renforcer les services publics et permettre « à la France de rester une grande nation scientifique, industrielle et technologique ».

Début de généralisation

L’allocution du Premier ministre, au-delà de faire un point rapide de la situation, contenait surtout une série de six annonces pour « changer d’échelle » :

La mise à disposition d’un « agent conversationnel souverain commun » pour l’ensemble des agents publics (il s’agit en fait des agents de l’Etat, soit 1,8 million de personnes tout de même, chiffre confirmé par le ministère de l’Economie et des Finances)
Les technologies « les plus avancées » développées par le ministère des Armées seront « progressivement ouvertes aux autres administrations », à commencer par les ministères de la Justice et de l’Intérieur, via notamment le portail GenIAI « qui a démontré son efficacité dans des environnements particulièrement exigeants » et qui sera déployé dans toutes les administrations régaliennes
Un assistant santé publique déployé dans Ameli d’ici la fin de l’année, pour proposer de premières orientations « fiables », mieux guider les usagers et plus généralement trouver rapidement la bonne réponse
Une démocratisation de l’accès aux données publiques, avec le lancement d’une plateforme unique dédiée à l’IA pour accéder à des informations comme les données démographiques, économiques, géographiques et administratives
La France investira 665 millions d’euros supplémentaires au développement de l’IA dans le cadre du projet France 2030 pour « soutenir les infrastructures, les capacités de calcul, la recherche, les entreprises et les filières industrielles qui feront la puissance de demain »
Un axe sur la souveraineté numérique, avec l’annonce de l’abandon du « géant américain » Palantir au profit de la solution française ChapsVision, « retenue aujourd’hui par la DGSI »

Le calendrier de la dernière annonce ne manquera pas d’interroger puisque le contrat liant la DGSI à Palantir avait été renouvelé en décembre 2025 pour trois ans. « Le choix de ChapsVision est le résultat d’un processus de sélection, qui n’était pas achevé en décembre dernier. Pour ne pas souffrir d’un trou capacitaire dans ce domaine sensible essentiel pour notre sécurité nationale, le contrat a été renouvelé. Cette phase permettra le temps nécessaire de former les équipes et préparer la migration vers la solution de ChapsVision », répond à ce sujet Matignon à Raphaël Grably de BFMTV.

Cherchant à déminer les accusations de « coup de com’ », Matignon précise à BFMTV que le « débranchage » de Palantir par la DGSI sera fait d’ici « 1 à 3 ans selon le moment le plus opportun », et donc potentiellement avant la fin du contrat renouvelé en décembre dernier, qui court jusqu’à fin 2028. Contacté, Palantir assure de son côté à BFMTV que « le contrat de long terme qui lie l’entreprise à la DGSI, et renouvelé fin 2025 pour plusieurs années, demeure pleinement en vigueur ».

Les ministères sont prévenus

Après ces annonces principales, le Premier ministre a ajouté une contrainte pour les ministères, pour préparer notamment le projet de finances 2027. Ainsi, chacun « devra démontrer comment il utilise l’intelligence artificielle pour simplifier les démarches, améliorer le service rendu aux Français et réduire les tâches inutiles, notamment remplies par nos propres agents, et donc faire des économies sans diminuer la qualité du service public rendu à la nation ». Les ministères sont avertis que cette « capacité à se transformer sera désormais prise en compte dans les arbitrages budgétaires », afin de « stimuler cette transformation et mobiliser davantage les ministres et les patrons des grandes entreprises ».

« L’État doit récompenser l’innovation, l’État doit encourager l’efficacité, l’État ne financera plus l’immobilisme, il doit financer désormais sa propre transformation. Car chaque heure gagnée grâce à l’intelligence artificielle est une heure rendue aux Français, chaque procédure simplifiée est une liberté retrouvée, chaque économie réalisée est une ressource supplémentaire pour nos priorités », ajoute le Premier ministre.

Des annonces à surveiller

Bien que ces annonces visent à montrer un gouvernement volontaire dans son approche et conscient des révolutions entraînées par l’intelligence artificielle, une certaine vigilance est de mise. Par exemple, on ne sait pas si les 665 millions d’euros supplémentaires alloués à France 2030 sont une nouvelle somme débloquée ou un simple redéploiement au sein de l’enveloppe générale du projet. Pas de calendrier concret non plus pour le déploiement de l’assistant conversationnel pour les agents publics, contrairement à celui pour Ameli, indiqué pour cette année, donc au cours des six prochains mois.

On ne sait rien non plus de l’entraînement et de l’inférence des modèles qui seront utilisés dans les administrations. Rien n’est dit sur la puissance de calcul et les infrastructures utilisées. Dans ce domaine, comme presque tout le monde, la France est tributaire de grandes entreprises américaines, NVIDIA en tête, même si les serveurs physiques sont en France.

La question d’un assistant performant dans Ameli est en outre intéressante. Le stockage des données de santé par le Health Data Hub chez Microsoft a provoqué bien des remous ces dernières années, avant finalement d’échoir à Scaleway en avril, comme l’a rappelé le Premier ministre. L’accès à ces données est particulièrement sensible et la portée de l’assistant n’a pas été précisée.

Cap sur la formation

On en apprend cependant un peu plus dans un document publié il y a quelques heures par le ministère de l’Économie et des Finances, notamment sur la gestation du projet L’Assistant qui doit équiper tous les agents de la fonction publique.

Le document indique par exemple qu’il a été en test ces dix derniers mois auprès de 10 000 agents provenant de six ministères (Justice, Finances, Éducation nationale, Culture, Enseignement supérieur et Recherche, Services du Premier ministre). Les fonctions abordées sont classiques : résumés, reformulations, extractions d’informations dans des rapports, traductions, et plus récemment RAG, pour créer des bases documentaires dédiées. L’évaluation a été menée par la DITP (Direction interministérielle de la transformation publique), avec la collaboration (entre autres) de chercheurs venant de LaborIA (Inria), du Laboratoire Fabrique de Pensée Critique (INSA Rennes) et du LISIS (CNRS). Selon le document, 75 % des agents auraient trouvé L’Assistant utile à leur métier.

D’autres points sont abordés, dont la formation. L’État vient ainsi de mettre à disposition un « Guide d’usage de l’IA » pour les agents publics (accès public), invités à le consulter. Il s’agit d’une première étape, le gouvernement précisant que le manque de formation est une remontée fréquente. Plus d’un tiers des agents ont ainsi déclaré n’en avoir jamais bénéficié et 31 % ne pas connaitre le cadre d’usage quand des usages existent.

Le cadre général de formation est cependant encore en construction, même si ce deuxième document promet des avancées rapides, en coopération avec les syndicats concernés. En plus d’un rassemblement de toutes les ressources liées dans un même accès, l’État réitère son ambition de former autant d’agents que possible d’ici 2027, ce qui suppose un démarrage en trombe à la rentrée. Un accent particulier sera mis sur les managers.

Sur le sujet des compétences, il est également question de généraliser l’enseignement de l’IA dans les écoles du service public, à savoir les Instituts régionaux d’administration (IRA) et les futurs Instituts du service public (ISP). En outre, le gouvernement souhaite réinternaliser autant que possible les compétences du numérique d’ici 2027. Le calcul est simple selon le document : « Chaque euro investi dans le recrutement de compétences internes permettra de supprimer durablement 1,5 euro de dépenses de prestations externes, tout en renforçant la maîtrise par l’État de ses compétences les plus critiques ».

Next - Articles gratuits
Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté 16 juin 2026 à 06:08

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Next - Articles gratuits

Par : Mickael Bazoge

16 juin 2026 à 06:08

Mets de l'huile

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

L’IA de Meta a-t-elle en partie été entraînée sur du contenu pornographique téléchargé illégalement ? C’est l’objet d’une plainte déposée l’an dernier par deux sociétés de production et de distribution de films porno. La procédure suit son cours, et Meta a perdu une bataille, mais pas la guerre.

Strike 3 Holdings et Counterlife Media, deux entreprises états-uniennes spécialisées dans la production et la distribution de films porno, ont porté plainte contre Meta durant l’été 2025. Elles accusent le géant des réseaux sociaux d’avoir téléchargé 2 396 films en passant par le protocole BitTorrent. Ces contenus auraient servi à entraîner Llama, son précédent grand modèle de langage (Meta a changé son fusil d’épaule depuis, avec Muse Spark).

L’ombre de LibGen

L’affaire suit son cours devant la justice, et la juge Eumi K. Lee en charge du dossier a rendu une ordonnance ce 11 juin, rapporte TorrentFreak. Elle refuse de rejeter la plainte, estimant que les éléments présentés par les plaignants sont suffisants pour poursuivre la procédure. La juge ne dit pas que Meta est coupable, simplement que les allégations des producteurs sont suffisamment crédibles pour justifier une phase d’enquête plus poussée.

L’ordonnance [PDF] établit aussi que les plaignants n’ont pas besoin de prouver l’entraînement de l’IA. C’est un élément important, car Meta soutenait que les producteurs devaient démontrer que leurs films avaient effectivement servi à l’entraînement de Llama. Pour cette plainte précise, ce n’est pas nécessaire : si Meta a téléchargé et distribué les films via BitTorrent sans autorisation, alors l’infraction au copyright est déjà constituée. Peu importe ensuite que les vidéos aient ou non servi à entraîner un modèle.

Pour se défendre, Meta s’est aussi inspirée d’un argument classique dans les affaires liées à BitTorrent : l’adresse IP ne prouve pas qui a téléchargé les fichiers. Des employés, des sous-traitants ou même des visiteurs auraient pu avoir récupéré ces contenus pour leur usage personnel.

La procédure peut se poursuivre

Les éléments à charge présentés par Strike 3 – qui a la réputation d’un « troll des droits d’auteur » avec des milliers de poursuites à son actif – ont toutefois permis à la juge de déterminer qu’il s’agissait davantage d’un système coordonné et automatisé qui cherchait des contenus à partir de mots-clés qu’à des téléchargements effectués indépendamment par plusieurs personnes.

Enfin, Meta a déjà reconnu s’être servi de BitTorrent pour récupérer des bases de données clandestines (la bibliothèque LibGen) afin d’entraîner ses modèles Llama. La juge ne dit pas que les deux affaires sont identiques, mais à la lumière du dossier LibGen, les accusations des deux plaignants sont plausibles.

Meta, comme bien d’autres acteurs du secteur, a parfois pioché sans trop de vergogne dans tous les contenus accessibles en ligne pour entraîner ses modèles IA, sans le consentement de leurs auteurs.

L’affaire est donc loin d’être terminée. Meta devrait maintenant essayer de montrer que les téléchargements n’étaient pas liés à ses projets d’IA, tandis que les producteurs vont tenter d’établir un lien direct entre les téléchargements BitTorrent et les systèmes permettant l’entraînement des modèles IA de Meta.

Next.ink
Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté 16 juin 2026 à 06:08

Meta devra répondre aux accusations d’entraînement d’IA avec du porno piraté

Next.ink

Par : Mickael Bazoge

16 juin 2026 à 06:08

Mets de l'huile

L’IA de Meta a-t-elle en partie été entraînée sur du contenu pornographique téléchargé illégalement ? C’est l’objet d’une plainte déposée l’an dernier par deux sociétés de production et de distribution de films porno. La procédure suit son cours, et Meta a perdu une bataille, mais pas la guerre.

Strike 3 Holdings et Counterlife Media, deux entreprises états-uniennes spécialisées dans la production et la distribution de films porno, ont porté plainte contre Meta durant l’été 2025. Elles accusent le géant des réseaux sociaux d’avoir téléchargé 2 396 films en passant par le protocole BitTorrent. Ces contenus auraient servi à entraîner Llama, son précédent grand modèle de langage (Meta a changé son fusil d’épaule depuis, avec Muse Spark).

L’ombre de LibGen

L’affaire suit son cours devant la justice, et la juge Eumi K. Lee en charge du dossier a rendu une ordonnance ce 11 juin, rapporte TorrentFreak. Elle refuse de rejeter la plainte, estimant que les éléments présentés par les plaignants sont suffisants pour poursuivre la procédure. La juge ne dit pas que Meta est coupable, simplement que les allégations des producteurs sont suffisamment crédibles pour justifier une phase d’enquête plus poussée.

L’ordonnance [PDF] établit aussi que les plaignants n’ont pas besoin de prouver l’entraînement de l’IA. C’est un élément important, car Meta soutenait que les producteurs devaient démontrer que leurs films avaient effectivement servi à l’entraînement de Llama. Pour cette plainte précise, ce n’est pas nécessaire : si Meta a téléchargé et distribué les films via BitTorrent sans autorisation, alors l’infraction au copyright est déjà constituée. Peu importe ensuite que les vidéos aient ou non servi à entraîner un modèle.

Pour se défendre, Meta s’est aussi inspirée d’un argument classique dans les affaires liées à BitTorrent : l’adresse IP ne prouve pas qui a téléchargé les fichiers. Des employés, des sous-traitants ou même des visiteurs auraient pu avoir récupéré ces contenus pour leur usage personnel.

La procédure peut se poursuivre

Les éléments à charge présentés par Strike 3 – qui a la réputation d’un « troll des droits d’auteur » avec des milliers de poursuites à son actif – ont toutefois permis à la juge de déterminer qu’il s’agissait davantage d’un système coordonné et automatisé qui cherchait des contenus à partir de mots-clés qu’à des téléchargements effectués indépendamment par plusieurs personnes.

Enfin, Meta a déjà reconnu s’être servi de BitTorrent pour récupérer des bases de données clandestines (la bibliothèque LibGen) afin d’entraîner ses modèles Llama. La juge ne dit pas que les deux affaires sont identiques, mais à la lumière du dossier LibGen, les accusations des deux plaignants sont plausibles.

Meta, comme bien d’autres acteurs du secteur, a parfois pioché sans trop de vergogne dans tous les contenus accessibles en ligne pour entraîner ses modèles IA, sans le consentement de leurs auteurs.

L’affaire est donc loin d’être terminée. Meta devrait maintenant essayer de montrer que les téléchargements n’étaient pas liés à ses projets d’IA, tandis que les producteurs vont tenter d’établir un lien direct entre les téléchargements BitTorrent et les systèmes permettant l’entraînement des modèles IA de Meta.

Next - Articles gratuits
☕️ KPMG retire un rapport chantant les louanges de l’IA après la découverte d’hallucinations 15 juin 2026 à 06:33

☕️ KPMG retire un rapport chantant les louanges de l’IA après la découverte d’hallucinations

Next - Articles gratuits

Par : Mickael Bazoge

15 juin 2026 à 06:33

Quoi de mieux pour chanter les louanges de l’IA qu’un rapport truffé d’hallucinations rédigé par une IA ? KPMG a dû retirer une étude sur l’IA agentique après la découverte de plusieurs cas d’usage apparemment inventés. Oups.

Tout ce que raconte l’IA n’est pas d’or. KPMG, une des plus grandes agences de conseil au monde, a publié en octobre dernier un rapport pour « redéfinir l’excellence à l’heure de l’IA agentique ». Destiné aux dirigeants et aux décideurs, le document multiplie les études de cas censées illustrer l’adoption de cette technologie dans les secteurs de la finance, des transports ou encore de la santé.

Seul problème : de nombreux exemples du rapport sont faux, ou à tout le moins factuellement incorrects. Le rapport affirmait ainsi que la banque UBS utilisait des agents IA pour le conseil en investissement, la gestion des risques et la conformité réglementaire au sein d’une plateforme développée avec Microsoft. Des affirmations qui reposent sur des faits incorrects, affirme l’établissement financier au Financial Times et aux chercheurs d’hallucinations du détecteur de contenus générés par IA GPTZero.

Quand l’IA vante l’IA

Autre exemple, celui des chemins de fer fédéraux suisses, chez qui des agents IA étaient censés aider les voyageurs à planifier, réserver et optimiser leurs trajets en fonction de leurs préférences, des conditions en temps réel et de l’impact carbone. Sauf que la description donnée dans le rapport n’était « pas exacte ». Il prétendait aussi que Transport for London (TfL) employait des agents IA pour prévoir et gérer la congestion, personnaliser les informations aux voyageurs et coordonner les modes de transport. Une présentation « trompeuse », selon la TfL.

Enfin, KPMG affirmait que des agents IA prédisaient les réadmissions à l’hôpital, réalisaient un tri des patients et automatisaient les orientations médicales au sein du système de santé dans le grand Manchester. De fausses informations provenant manifestement de la mauvaise interprétation d’un communiqué sur un outil de détection du… cancer du poumon.

Sur les 45 références citées dans le rapport, seules 5 renvoient correctement à des sources réelles, a calculé GPTZero. 28 autres citations fournissent des titres paraphrasés et/ou des éléments erronés pour une source réelle. Les 12 dernières sont trop vagues ou comportent trop d’erreurs pour permettre de déterminer avec certitude si une source existe.

De plus, environ la moitié des affirmations étayées par ces 45 citations semblent être fausses ou attribuées à tort – probablement parce qu’un outil de recherche sur l’IA a trop pris au pied de la lettre une demande visant à trouver des exemples d’« IA agentique » exploitées en production.

Après avoir été alerté par le FT et GPTZero, KPMG a retiré le rapport de ses sites web, tout en affirmant prendre très au sérieux « l’exactitude et l’intégrité » de ses publications. Le cabinet a rappelé que ses employés doivent respecter des règles internes sur l’usage responsable de l’IA.

« Nous attendons de l’ensemble de nos collaborateurs qu’ils respectent nos directives relatives à l’utilisation responsable de l’IA, notamment en assurant une supervision humaine pour valider les contenus et vérifier les sources indépendantes », indique un porte-parole. Une enquête interne a été lancée, mais c’est un peu tard : les conclusions de ce rapport avaient déjà été reprises par plusieurs publications spécialisées du secteur, ainsi que par un important quotidien tchèque.

Ce n’est pas une première, les exemples d’hallucinations d’IA prises pour argent comptant se sont multipliés dans tous les domaines, et on n’est pas près d’en voir le bout.

L’IA de Doctrine.fr a « halluciné » une décision de la CEDH qui disait tout le contraire

Trois plaidoiries « hallucinées » par IA ont été identifiées en France en décembre

Des délires « by design » ? Comment les IA génératives peuvent alimenter des psychoses

Next.ink
☕️ KPMG retire un rapport chantant les louanges de l’IA après la découverte d’hallucinations 15 juin 2026 à 06:33

☕️ KPMG retire un rapport chantant les louanges de l’IA après la découverte d’hallucinations

Next.ink

Par : Mickael Bazoge

15 juin 2026 à 06:33

Quoi de mieux pour chanter les louanges de l’IA qu’un rapport truffé d’hallucinations rédigé par une IA ? KPMG a dû retirer une étude sur l’IA agentique après la découverte de plusieurs cas d’usage apparemment inventés. Oups.

Tout ce que raconte l’IA n’est pas d’or. KPMG, une des plus grandes agences de conseil au monde, a publié en octobre dernier un rapport pour « redéfinir l’excellence à l’heure de l’IA agentique ». Destiné aux dirigeants et aux décideurs, le document multiplie les études de cas censées illustrer l’adoption de cette technologie dans les secteurs de la finance, des transports ou encore de la santé.

Seul problème : de nombreux exemples du rapport sont faux, ou à tout le moins factuellement incorrects. Le rapport affirmait ainsi que la banque UBS utilisait des agents IA pour le conseil en investissement, la gestion des risques et la conformité réglementaire au sein d’une plateforme développée avec Microsoft. Des affirmations qui reposent sur des faits incorrects, affirme l’établissement financier au Financial Times et aux chercheurs d’hallucinations du détecteur de contenus générés par IA GPTZero.

Quand l’IA vante l’IA

Autre exemple, celui des chemins de fer fédéraux suisses, chez qui des agents IA étaient censés aider les voyageurs à planifier, réserver et optimiser leurs trajets en fonction de leurs préférences, des conditions en temps réel et de l’impact carbone. Sauf que la description donnée dans le rapport n’était « pas exacte ». Il prétendait aussi que Transport for London (TfL) employait des agents IA pour prévoir et gérer la congestion, personnaliser les informations aux voyageurs et coordonner les modes de transport. Une présentation « trompeuse », selon la TfL.

Enfin, KPMG affirmait que des agents IA prédisaient les réadmissions à l’hôpital, réalisaient un tri des patients et automatisaient les orientations médicales au sein du système de santé dans le grand Manchester. De fausses informations provenant manifestement de la mauvaise interprétation d’un communiqué sur un outil de détection du… cancer du poumon.

Sur les 45 références citées dans le rapport, seules 5 renvoient correctement à des sources réelles, a calculé GPTZero. 28 autres citations fournissent des titres paraphrasés et/ou des éléments erronés pour une source réelle. Les 12 dernières sont trop vagues ou comportent trop d’erreurs pour permettre de déterminer avec certitude si une source existe.

De plus, environ la moitié des affirmations étayées par ces 45 citations semblent être fausses ou attribuées à tort – probablement parce qu’un outil de recherche sur l’IA a trop pris au pied de la lettre une demande visant à trouver des exemples d’« IA agentique » exploitées en production.

Après avoir été alerté par le FT et GPTZero, KPMG a retiré le rapport de ses sites web, tout en affirmant prendre très au sérieux « l’exactitude et l’intégrité » de ses publications. Le cabinet a rappelé que ses employés doivent respecter des règles internes sur l’usage responsable de l’IA.

« Nous attendons de l’ensemble de nos collaborateurs qu’ils respectent nos directives relatives à l’utilisation responsable de l’IA, notamment en assurant une supervision humaine pour valider les contenus et vérifier les sources indépendantes », indique un porte-parole. Une enquête interne a été lancée, mais c’est un peu tard : les conclusions de ce rapport avaient déjà été reprises par plusieurs publications spécialisées du secteur, ainsi que par un important quotidien tchèque.

Ce n’est pas une première, les exemples d’hallucinations d’IA prises pour argent comptant se sont multipliés dans tous les domaines, et on n’est pas près d’en voir le bout.

L’IA de Doctrine.fr a « halluciné » une décision de la CEDH qui disait tout le contraire

Trois plaidoiries « hallucinées » par IA ont été identifiées en France en décembre

Des délires « by design » ? Comment les IA génératives peuvent alimenter des psychoses

Next - Articles gratuits
☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens 12 juin 2026 à 06:32

☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens

Next - Articles gratuits

Par : Mickael Bazoge

12 juin 2026 à 06:32

Le secteur de l’IA se dirige-t-il vers une guerre des prix du token ? Les deux principaux labos IA dans le paysage, OpenAI et Anthropic, envisageraient en effet une baisse du tarif du jeton, au grand bénéfice des consommateurs – mais probablement moins de la marge de profit des deux entreprises. Selon l’analyste Ed Zitron, en l’état actuel, les « utilisateurs peuvent dépenser entre 8 et 13,50 dollars pour chaque dollar de leurs revenus d’abonnement ».

Les utilisateurs grand public voient surtout les modèles d’IA à travers le prix d’un abonnement mensuel, quitte à se heurter parfois à des limites d’usage. Pour les entreprises, l’angle est très différent. Derrière chaque requête adressée à GPT ou Claude se cache une consommation de tokens qui finit par apparaître sur les factures. Les organisations qui se servent des modèles d’Anthropic ont d’ailleurs pu s’en apercevoir ces dernières semaines avec Opus 4.7 et suivants. Et à mesure que les usages se multiplient, les dépenses s’alourdissent.

#Nextquick Une simple requête à ChatGPT, c’est déjà des centaines de milliards de calculs

Les budgets ne sont pas extensibles à l’infini. Le directeur technique d’Uber s’était étonné d’avoir explosé son budget IA de l’année… en seulement quatre mois. À cela s’ajoute la pratique du tokenmaxxing, utilisée par les employés de certaines entreprises pour gonfler inutilement leur consommation de jetons et ainsi, se faire bien voir de leur direction. Amazon a récemment fait fermer un classement pour limiter les abus.

Pendant ce temps, OpenAI et Anthropic ramassent la mise, enfin, façon de parler : les deux entreprises sont encore loin d’être rentables. Chaque token facturé génère certes des revenus, mais ceux-ci peinent encore à compenser les coûts colossaux des centres de données, des puces et du développement de nouveaux modèles. Et pourtant, les deux labos rivaux envisageraient de baisser le prix du token.

Sam Altman a expliqué lors d’un événement relaté par le Wall Street Journal que le coût du token était un « gros problème » : « Je pense que nous trouverons de nombreuses façons de permettre à nos clients d’en faire plus tout en dépensant moins ». Le patron d’OpenAI anticiperait une baisse des prix du token chez Anthropic, dont les produits – notamment Claude Code – sont devenus des outils du quotidien dans de nombreuses entreprises. OpenAI a riposté avec Codex, mais elle a pris du retard.

Le hic, c’est qu’une éventuelle guerre tarifaire pourrait satisfaire les clients, mais elle retarderait encore davantage la perspective de bénéfices pour les deux sociétés qui s’apprêtent à entrer en Bourse. Et à force de se courir après, les services d’OpenAI et d’Anthropic courent le risque de devenir interchangeables, en se différenciant uniquement sur les tarifs.

Next.ink
☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens 12 juin 2026 à 06:32

☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens

Next.ink

Par : Mickael Bazoge

12 juin 2026 à 06:32

Le secteur de l’IA se dirige-t-il vers une guerre des prix du token ? Les deux principaux labos IA dans le paysage, OpenAI et Anthropic, envisageraient en effet une baisse du tarif du jeton, au grand bénéfice des consommateurs – mais probablement moins de la marge de profit des deux entreprises. Selon l’analyste Ed Zitron, en l’état actuel, les « utilisateurs peuvent dépenser entre 8 et 13,50 dollars pour chaque dollar de leurs revenus d’abonnement ».

Les utilisateurs grand public voient surtout les modèles d’IA à travers le prix d’un abonnement mensuel, quitte à se heurter parfois à des limites d’usage. Pour les entreprises, l’angle est très différent. Derrière chaque requête adressée à GPT ou Claude se cache une consommation de tokens qui finit par apparaître sur les factures. Les organisations qui se servent des modèles d’Anthropic ont d’ailleurs pu s’en apercevoir ces dernières semaines avec Opus 4.7 et suivants. Et à mesure que les usages se multiplient, les dépenses s’alourdissent.

#Nextquick Une simple requête à ChatGPT, c’est déjà des centaines de milliards de calculs

Les budgets ne sont pas extensibles à l’infini. Le directeur technique d’Uber s’était étonné d’avoir explosé son budget IA de l’année… en seulement quatre mois. À cela s’ajoute la pratique du tokenmaxxing, utilisée par les employés de certaines entreprises pour gonfler inutilement leur consommation de jetons et ainsi, se faire bien voir de leur direction. Amazon a récemment fait fermer un classement pour limiter les abus.

Pendant ce temps, OpenAI et Anthropic ramassent la mise, enfin, façon de parler : les deux entreprises sont encore loin d’être rentables. Chaque token facturé génère certes des revenus, mais ceux-ci peinent encore à compenser les coûts colossaux des centres de données, des puces et du développement de nouveaux modèles. Et pourtant, les deux labos rivaux envisageraient de baisser le prix du token.

Sam Altman a expliqué lors d’un événement relaté par le Wall Street Journal que le coût du token était un « gros problème » : « Je pense que nous trouverons de nombreuses façons de permettre à nos clients d’en faire plus tout en dépensant moins ». Le patron d’OpenAI anticiperait une baisse des prix du token chez Anthropic, dont les produits – notamment Claude Code – sont devenus des outils du quotidien dans de nombreuses entreprises. OpenAI a riposté avec Codex, mais elle a pris du retard.

Le hic, c’est qu’une éventuelle guerre tarifaire pourrait satisfaire les clients, mais elle retarderait encore davantage la perspective de bénéfices pour les deux sociétés qui s’apprêtent à entrer en Bourse. Et à force de se courir après, les services d’OpenAI et d’Anthropic courent le risque de devenir interchangeables, en se différenciant uniquement sur les tarifs.

Next - Articles gratuits
Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés 11 juin 2026 à 07:01

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

Next - Articles gratuits

Par : Mickael Bazoge

11 juin 2026 à 07:01

Le club des cinq

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

Apple renouvelle entièrement les modèles IA qui propulsent les fonctions Apple Intelligence. Et admet (presque) que la précédente génération n’était pas vraiment à la hauteur.

Sous le capot d’Apple Intelligence se trouve une famille de grands modèles de langage. Avec iOS 27 et les autres systèmes d’exploitation en « 27 », le constructeur inaugure la 3e génération de ses LLM, baptisés Apple Foundation Models (AFM), dont la particularité est de reposer sur les modèles Gemini de Google. Pas de surprise ici, l’accord entre Apple et Google avait été confirmé au mois de janvier.

Un Apple Intelligence, cinq moteurs

À l’occasion de la WWDC, Apple a présenté les nouvelles capacités de sa plateforme d’IA et de Siri, et aussi levé une petite partie du voile sur les modèles AFM 3. Comme chez les autres acteurs IA quand il s’agit de présenter de nouveaux modèles, Apple n’est pas avare en superlatifs et en promesses de performances. Mais derrière cette communication bien huilée se cache un aveu plus discret : les premiers modèles Apple Intelligence n’étaient manifestement pas au niveau attendu… ce que le retard du nouveau Siri et les critiques entourant Apple Intelligence ont largement mis en lumière.

Avant toute chose, jetons un œil aux forces en présence. Cette nouvelle fournée d’Apple Intelligence s’appuie sur cinq modèles : deux sont exécutés directement sur l’appareil, les trois autres sont hébergés dans le cloud. AFM 3 Core (3 milliards de paramètres) et AFM 3 Core Advanced sont les modèles locaux. Ce dernier compte 20 milliards de paramètres, mais n’en active qu’1 à 4 milliards en fonction des requêtes.

Cette méthode astucieuse exploite des travaux de recherche internes portant sur la sélection dynamique des paramètres d’un modèle. Au lieu de charger l’intégralité du modèle en mémoire vive, l’appareil active uniquement les portions jugées utiles pour la requête en cours. Les autres paramètres restent stockés dans la mémoire flash de l’appareil, ce qui permet à Apple d’utiliser un modèle beaucoup plus volumineux que ce que la RAM seule autoriserait.

Cette puissance de frappe ouvre de nouveaux horizons à Siri AI : les voix sont plus expressives et il est possible de les personnaliser, la dictée vocale se veut plus précise. Pour en profiter, il faut cependant posséder un appareil doté de 12 Go de mémoire, ce qui qualifie l’iPhone Air, l’iPhone 17 Pro (mais pas l’iPhone 17, limité à 8 Go), un Mac M3 ou iPad M4 suffisamment doté en mémoire.

iOS 27 permet de personnaliser la voix de Siri. Image : Apple

Les trois autres modèles sont hébergés sur des serveurs : AFM 3 Cloud « optimisé pour la vitesse, l’efficacité et les performances », ADM 3 Cloud pour la génération d’images et les outils d’édition photo avancés, et AFM 3 Cloud Pro qui prend en charge les requêtes les plus exigeantes comme les outils agentiques et le raisonnement complexe.

Quelques images générées par ADM 3 Cloud.

Les deux premiers tournent sur des serveurs équipés de puces Apple. AFM 3 Cloud Pro a ceci de spécifique qu’il fonctionne sur des serveurs dotés de GPU NVIDIA hébergés dans Google Cloud. Il a donc fallu étendre Private Cloud Compute, l’architecture de protection des données personnelles d’Apple, à cette configuration. Cette dépendance à deux des principaux acteurs du secteur de l’IA est d’ailleurs inhabituelle pour une entreprise qui n’aime rien tant que maîtriser la chaîne technologique de bout en bout.

Des benchmarks et un aveu caché

Apple donne également quelques détails sur les performances de ses modèles. Dans ce domaine, chaque acteur fait sa petite sauce dans son coin mais en général, les nouveaux modèles utilisent des benchmarks plus ou moins standardisés (SWE-bench, MMLU, Humanity’s Last Exam…) ce qui autorise les comparaisons.

Contrairement à son rapport technique publié l’an dernier, dans lequel Apple comparait ses modèles à GPT-4o, Gemma ou Qwen sur plusieurs benchmarks reconnus du secteur, la présentation d’AFM 3 se concentre presque exclusivement sur des évaluations internes et des comparaisons avec la génération précédente. La méthode est tout à fait légitime, mais elle rend impossibles les comparaisons avec les modèles concurrents.

C’est d’autant plus vrai qu’Apple ne compare AFM 3 qu’à la génération précédente de ses propres modèles (2025). Ce qui donne des résultats pour le moins flatteurs : pour les capacités générales en texte en local, AFM 3 Core est ainsi préféré dans 45,6 % des cas, contre 23,3 % pour son prédécesseur. En matière de compréhension d’images, AFM 3 Core a été préféré à son prédécesseur dans plus de 61 % des cas où les testeurs ont marqué une préférence.

Sur serveur, pour les capacités texte, AFM 3 Cloud obtient 64,7 % de préférences contre 8,7 % « seulement » (c’est Apple qui le dit) pour l’ancien modèle. Les performances en compréhension d’images progressent fortement, tout comme la dictée et les voix de synthèse. Le constructeur californien ne dira jamais explicitement que ses premiers modèles étaient insuffisants. Mais l’insistance sur les « avancées significatives » et le « bond générationnel » d’AFM 3 montre assez clairement que la première vague d’Apple Intelligence était en retrait, en tout cas insuffisamment performante pour soutenir la vision d’ensemble de l’entreprise.

Next.ink
Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés 11 juin 2026 à 07:01

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

Next.ink

Par : Mickael Bazoge

11 juin 2026 à 07:01

Le club des cinq

Apple renouvelle entièrement les modèles IA qui propulsent les fonctions Apple Intelligence. Et admet (presque) que la précédente génération n’était pas vraiment à la hauteur.

Sous le capot d’Apple Intelligence se trouve une famille de grands modèles de langage. Avec iOS 27 et les autres systèmes d’exploitation en « 27 », le constructeur inaugure la 3e génération de ses LLM, baptisés Apple Foundation Models (AFM), dont la particularité est de reposer sur les modèles Gemini de Google. Pas de surprise ici, l’accord entre Apple et Google avait été confirmé au mois de janvier.

Un Apple Intelligence, cinq moteurs

À l’occasion de la WWDC, Apple a présenté les nouvelles capacités de sa plateforme d’IA et de Siri, et aussi levé une petite partie du voile sur les modèles AFM 3. Comme chez les autres acteurs IA quand il s’agit de présenter de nouveaux modèles, Apple n’est pas avare en superlatifs et en promesses de performances. Mais derrière cette communication bien huilée se cache un aveu plus discret : les premiers modèles Apple Intelligence n’étaient manifestement pas au niveau attendu… ce que le retard du nouveau Siri et les critiques entourant Apple Intelligence ont largement mis en lumière.

Avant toute chose, jetons un œil aux forces en présence. Cette nouvelle fournée d’Apple Intelligence s’appuie sur cinq modèles : deux sont exécutés directement sur l’appareil, les trois autres sont hébergés dans le cloud. AFM 3 Core (3 milliards de paramètres) et AFM 3 Core Advanced sont les modèles locaux. Ce dernier compte 20 milliards de paramètres, mais n’en active qu’1 à 4 milliards en fonction des requêtes.

Cette méthode astucieuse exploite des travaux de recherche internes portant sur la sélection dynamique des paramètres d’un modèle. Au lieu de charger l’intégralité du modèle en mémoire vive, l’appareil active uniquement les portions jugées utiles pour la requête en cours. Les autres paramètres restent stockés dans la mémoire flash de l’appareil, ce qui permet à Apple d’utiliser un modèle beaucoup plus volumineux que ce que la RAM seule autoriserait.

Cette puissance de frappe ouvre de nouveaux horizons à Siri AI : les voix sont plus expressives et il est possible de les personnaliser, la dictée vocale se veut plus précise. Pour en profiter, il faut cependant posséder un appareil doté de 12 Go de mémoire, ce qui qualifie l’iPhone Air, l’iPhone 17 Pro (mais pas l’iPhone 17, limité à 8 Go), un Mac M3 ou iPad M4 suffisamment doté en mémoire.

Les trois autres modèles sont hébergés sur des serveurs : AFM 3 Cloud « optimisé pour la vitesse, l’efficacité et les performances », ADM 3 Cloud pour la génération d’images et les outils d’édition photo avancés, et AFM 3 Cloud Pro qui prend en charge les requêtes les plus exigeantes comme les outils agentiques et le raisonnement complexe.

Les deux premiers tournent sur des serveurs équipés de puces Apple. AFM 3 Cloud Pro a ceci de spécifique qu’il fonctionne sur des serveurs dotés de GPU NVIDIA hébergés dans Google Cloud. Il a donc fallu étendre Private Cloud Compute, l’architecture de protection des données personnelles d’Apple, à cette configuration. Cette dépendance à deux des principaux acteurs du secteur de l’IA est d’ailleurs inhabituelle pour une entreprise qui n’aime rien tant que maîtriser la chaîne technologique de bout en bout.

Des benchmarks et un aveu caché

Apple donne également quelques détails sur les performances de ses modèles. Dans ce domaine, chaque acteur fait sa petite sauce dans son coin mais en général, les nouveaux modèles utilisent des benchmarks plus ou moins standardisés (SWE-bench, MMLU, Humanity’s Last Exam…) ce qui autorise les comparaisons.

Contrairement à son rapport technique publié l’an dernier, dans lequel Apple comparait ses modèles à GPT-4o, Gemma ou Qwen sur plusieurs benchmarks reconnus du secteur, la présentation d’AFM 3 se concentre presque exclusivement sur des évaluations internes et des comparaisons avec la génération précédente. La méthode est tout à fait légitime, mais elle rend impossibles les comparaisons avec les modèles concurrents.

C’est d’autant plus vrai qu’Apple ne compare AFM 3 qu’à la génération précédente de ses propres modèles (2025). Ce qui donne des résultats pour le moins flatteurs : pour les capacités générales en texte en local, AFM 3 Core est ainsi préféré dans 45,6 % des cas, contre 23,3 % pour son prédécesseur. En matière de compréhension d’images, AFM 3 Core a été préféré à son prédécesseur dans plus de 61 % des cas où les testeurs ont marqué une préférence.

Sur serveur, pour les capacités texte, AFM 3 Cloud obtient 64,7 % de préférences contre 8,7 % « seulement » (c’est Apple qui le dit) pour l’ancien modèle. Les performances en compréhension d’images progressent fortement, tout comme la dictée et les voix de synthèse. Le constructeur californien ne dira jamais explicitement que ses premiers modèles étaient insuffisants. Mais l’insistance sur les « avancées significatives » et le « bond générationnel » d’AFM 3 montre assez clairement que la première vague d’Apple Intelligence était en retrait, en tout cas insuffisamment performante pour soutenir la vision d’ensemble de l’entreprise.

Next - Articles gratuits
☕️ Microsoft bloque Claude Fable 5 en interne à cause de la rétention des données 11 juin 2026 à 06:34

☕️ Microsoft bloque Claude Fable 5 en interne à cause de la rétention des données

Next - Articles gratuits

Par : Mickael Bazoge

11 juin 2026 à 06:34

Microsoft s’est empressé d’ajouter Claude Fable 5 à l’arsenal de GitHub Copilot et de Foundry, la plateforme destinée au développement et à la gestion d’apps IA. Mais les employés de l’éditeur n’y ont pas accès dans les versions internes du Copilot de GitHub. D’après The Verge, l’entreprise aurait un petit souci avec la politique de rétention des données d’Anthropic.

Le labo IA conserve en effet les requêtes et les contenus générés pendant 30 jours afin de satisfaire aux exigences de sécurité liées à l’utilisation du modèle « de classe Mythos ». Fable repose sur la même base que Mythos, mais est bardé de restrictions : si la question porte sur la cybersécurité, la biologie, la chimie ou la distillation de modèles IA, elle est « déclassée » et traitée par Opus 4.8.

Claude Fable 5 : un petit goût de Mythos pour le grand public

Ces 30 jours de rétention permettent à Anthropic d’analyser les informations pour détecter les éventuels usages malveillants du modèle. En cas de suspicion, l’entreprise peut même les conserver pour une durée de deux ans. Les données qui ne posent aucun problème sont supprimées passé le délai standard.

Ce changement n’en est pas un pour les utilisateurs qui passent par le site web ou les applications mobiles de Claude, puisque la rétention des données est déjà effective pour ces abonnés. En revanche, c’est une nouveauté pour les organisations utilisant la console Claude, ou qui accèdent à Claude via Bedrock, Google Cloud Agent ou encore Foundry avec le mode Zero Data Retention (ZDR).

Ce mode proposé par Anthropic à certains clients professionnels ne conserve pas les requêtes envoyées au modèle ni les réponses générées. Ça n’est donc plus le cas avec Fable. L’équipe juridique de Microsoft évalue ces changements ; le souci majeur concerne les données des utilisateurs et les informations confidentielles. Aucun délai n’a été annoncé.

Le cas Microsoft pourrait donc se répéter chez d’autres entreprises.

Next.ink
☕️ Microsoft bloque Claude Fable 5 en interne à cause de la rétention des données 11 juin 2026 à 06:34

☕️ Microsoft bloque Claude Fable 5 en interne à cause de la rétention des données

Next.ink

Par : Mickael Bazoge

11 juin 2026 à 06:34

Microsoft s’est empressé d’ajouter Claude Fable 5 à l’arsenal de GitHub Copilot et de Foundry, la plateforme destinée au développement et à la gestion d’apps IA. Mais les employés de l’éditeur n’y ont pas accès dans les versions internes du Copilot de GitHub. D’après The Verge, l’entreprise aurait un petit souci avec la politique de rétention des données d’Anthropic.

Le labo IA conserve en effet les requêtes et les contenus générés pendant 30 jours afin de satisfaire aux exigences de sécurité liées à l’utilisation du modèle « de classe Mythos ». Fable repose sur la même base que Mythos, mais est bardé de restrictions : si la question porte sur la cybersécurité, la biologie, la chimie ou la distillation de modèles IA, elle est « déclassée » et traitée par Opus 4.8.

Claude Fable 5 : un petit goût de Mythos pour le grand public

Ces 30 jours de rétention permettent à Anthropic d’analyser les informations pour détecter les éventuels usages malveillants du modèle. En cas de suspicion, l’entreprise peut même les conserver pour une durée de deux ans. Les données qui ne posent aucun problème sont supprimées passé le délai standard.

Ce changement n’en est pas un pour les utilisateurs qui passent par le site web ou les applications mobiles de Claude, puisque la rétention des données est déjà effective pour ces abonnés. En revanche, c’est une nouveauté pour les organisations utilisant la console Claude, ou qui accèdent à Claude via Bedrock, Google Cloud Agent ou encore Foundry avec le mode Zero Data Retention (ZDR).

Ce mode proposé par Anthropic à certains clients professionnels ne conserve pas les requêtes envoyées au modèle ni les réponses générées. Ça n’est donc plus le cas avec Fable. L’équipe juridique de Microsoft évalue ces changements ; le souci majeur concerne les données des utilisateurs et les informations confidentielles. Aucun délai n’a été annoncé.

Le cas Microsoft pourrait donc se répéter chez d’autres entreprises.

Next - Articles gratuits
34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta 11 juin 2026 à 04:50

34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta

Next - Articles gratuits

Par : Mickael Bazoge

11 juin 2026 à 04:50

34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta

Révélées début juin, les failles de l’assistance IA générative de Meta ont finalement permis à des personnes malveillantes de récupérer l’accès à quelque 34 000 comptes Instagram, affirme le New York Times sur la base de documents internes.

L’incroyable légèreté de Meta a permis à des pirates de s’emparer de 34 000 comptes Instagram, parmi lesquels ceux de la Maison Blanche sous administration Obama, d’un responsable militaire américain, ou encore d’entreprises de premier plan. La faille a été corrigée depuis, mais le robot reste en place.

Le robot d’assistance de Meta chargé de la gestion des comptes Instagram avait l’IA qui flanche. Mis en route au mois de mars, il pouvait réaliser des opérations critiques, comme le changement de l’email associé à un compte, ou encore la réinitialisation du mot de passe. Les pirates, armés d’un VPN (pour apparaitre dans le même pays que leur victime) et d’une bonne tchatche, ont poussé le bot à lancer la procédure de récupération de compte.

L’assistant IA de Meta permettait de voler des comptes Instagram

Grâce à cette méthode d’injection de prompts, ils ont pu prendre possession de milliers de comptes : environ 34 000, selon des chiffres internes consultés par le New York Times. 20 000 d’entre eux ont été compromis, donnant aux hackers un accès aux adresses email associées, aux numéros de téléphone, aux dates de naissance et à d’autres données personnelles. Plus de 3 500 comptes piratés ont subi un détournement de leur nom d’utilisateur.

Une vulnérabilité corrigée mais non expliquée

Meta explique ne pas être en mesure de déterminer les informations consultées ou dérobées, ce qui n’est pas rassurant. La vulnérabilité a été bouchée. Un porte parole indique que « certaines de nos vérifications internes côté serveur n’ont pas fonctionné dans ce cas précis, mais cela n’était pas dû à l’agent d’IA lui-même », tente-t-il de rassurer. L’entreprise affirme également que ses agents dédiés au service client ont permis d’augmenter de 30 % le nombre de comptes récupérés après un piratage aux États-Unis et au Canada l’an dernier.

L’incident n’en reste pas moins très problématique pour Meta, qui dépense des dizaines de milliards de dollars dans les infrastructures IA, et injecte cette technologie partout où c’est possible, parfois en dépit du bon sens. Hasard malheureux du calendrier, le groupe a présenté la semaine dernière un nouveau service permettant aux organisations et aux entreprises d’utiliser des chatbots IA pour gérer les prises de rendez-vous pour les clients et compléter des transactions.

Il n’est pour autant pas question de remiser au placard cet agent dédié au SAV d’Instagram. Malgré ces piratages, les documents internes indiquent que Meta maintient tous les produits en service, se contentant de suspendre une « expérimentation en cours » (le système d’oubli de mot de passe).

Next.ink
34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta 11 juin 2026 à 04:50

34 000 comptes Instagram piratés avec l’aide du robot IA d’assistance de Meta

Next.ink

Par : Mickael Bazoge

11 juin 2026 à 04:50

Révélées début juin, les failles de l’assistance IA générative de Meta ont finalement permis à des personnes malveillantes de récupérer l’accès à quelque 34 000 comptes Instagram, affirme le New York Times sur la base de documents internes.

L’incroyable légèreté de Meta a permis à des pirates de s’emparer de 34 000 comptes Instagram, parmi lesquels ceux de la Maison Blanche sous administration Obama, d’un responsable militaire américain, ou encore d’entreprises de premier plan. La faille a été corrigée depuis, mais le robot reste en place.

Le robot d’assistance de Meta chargé de la gestion des comptes Instagram avait l’IA qui flanche. Mis en route au mois de mars, il pouvait réaliser des opérations critiques, comme le changement de l’email associé à un compte, ou encore la réinitialisation du mot de passe. Les pirates, armés d’un VPN (pour apparaitre dans le même pays que leur victime) et d’une bonne tchatche, ont poussé le bot à lancer la procédure de récupération de compte.

L’assistant IA de Meta permettait de voler des comptes Instagram

Grâce à cette méthode d’injection de prompts, ils ont pu prendre possession de milliers de comptes : environ 34 000, selon des chiffres internes consultés par le New York Times. 20 000 d’entre eux ont été compromis, donnant aux hackers un accès aux adresses email associées, aux numéros de téléphone, aux dates de naissance et à d’autres données personnelles. Plus de 3 500 comptes piratés ont subi un détournement de leur nom d’utilisateur.

Une vulnérabilité corrigée mais non expliquée

Meta explique ne pas être en mesure de déterminer les informations consultées ou dérobées, ce qui n’est pas rassurant. La vulnérabilité a été bouchée. Un porte parole indique que « certaines de nos vérifications internes côté serveur n’ont pas fonctionné dans ce cas précis, mais cela n’était pas dû à l’agent d’IA lui-même », tente-t-il de rassurer. L’entreprise affirme également que ses agents dédiés au service client ont permis d’augmenter de 30 % le nombre de comptes récupérés après un piratage aux États-Unis et au Canada l’an dernier.

L’incident n’en reste pas moins très problématique pour Meta, qui dépense des dizaines de milliards de dollars dans les infrastructures IA, et injecte cette technologie partout où c’est possible, parfois en dépit du bon sens. Hasard malheureux du calendrier, le groupe a présenté la semaine dernière un nouveau service permettant aux organisations et aux entreprises d’utiliser des chatbots IA pour gérer les prises de rendez-vous pour les clients et compléter des transactions.

Il n’est pour autant pas question de remiser au placard cet agent dédié au SAV d’Instagram. Malgré ces piratages, les documents internes indiquent que Meta maintient tous les produits en service, se contentant de suspendre une « expérimentation en cours » (le système d’oubli de mot de passe).

Vue normale

Vivement l’INdependance Day !

Conseil de l’IA et enjeux de souveraineté

Kill switch : jour, nuit, jour, nuit…

Les précédents : Adobe au Venezuela, le juge de la CPI Nicolas Guillou

Washington veut s’éviter un nouveau « moment DeepSeek »

Vers un Independance Day ?

Vivement l’INdependance Day !

Conseil de l’IA et enjeux de souveraineté

Kill switch : jour, nuit, jour, nuit…

Les précédents : Adobe au Venezuela, le juge de la CPI Nicolas Guillou

Washington veut s’éviter un nouveau « moment DeepSeek »

Vers un Independance Day ?

L'ère du commentaire

Recours massif à des contenus générés par les internautes.

Trop simples injections

L'ère du commentaire

Recours massif à des contenus générés par les internautes.

Trop simples injections

Mise au pas

Début de généralisation

Les ministères sont prévenus

Des annonces à surveiller

Cap sur la formation

Mise au pas

Début de généralisation

Les ministères sont prévenus

Des annonces à surveiller

Cap sur la formation

Mets de l'huile

L’ombre de LibGen

La procédure peut se poursuivre

Mets de l'huile

L’ombre de LibGen

La procédure peut se poursuivre

Quand l’IA vante l’IA

Quand l’IA vante l’IA

Le club des cinq

Un Apple Intelligence, cinq moteurs

Des benchmarks et un aveu caché

Le club des cinq

Un Apple Intelligence, cinq moteurs

Des benchmarks et un aveu caché

Une vulnérabilité corrigée mais non expliquée

Une vulnérabilité corrigée mais non expliquée