Vue lecture

Avec le modèle GLM-5.2, la Chine pourrait rebattre les cartes de la cybersécurité

De grandes responsabilités
Avec le modèle GLM-5.2, la Chine pourrait rebattre les cartes de la cybersécurité

La stratégie américaine d’embargo pour contrer le secteur technologique chinois serait-elle contreproductive ? La question se pose, alors qu’une société chinoise pourrait bouleverser la cybersécurité en diffusant un modèle capable de rivaliser avec les LLM d’OpenAI et Anthropic.

La Chine parvient à égaler les performances du modèle Mythos d’Anthropic dans certains scénarios de cybersécurité. Une affirmation du Wall Street Journal ce 27 juin, qui se demande dans quelle mesure les décisions de la Maison-Blanche ont pu jouer dans une telle remontée. Depuis DeepSeek et la vaporisation temporaire de 600 milliards de dollars de capitalisation pour NVIDIA, on pouvait cependant s’attendre à ce que la Chine égalise de nouveau le score. Ou en tout cas vienne flirter une nouvelle fois avec les performances des grands modèles de frontière américains.

Le nouveau modèle chinois qui attire les regards se nomme GLM-5.2, lancé le 13 juin par l’entreprise Zhipu AI, renommée Z.ai. Plusieurs benchmarks lui attribuent de très bons résultats, particulièrement en cybersécurité. Au point de rebattre les cartes d’une situation déjà fébrile dans ce domaine, avec un modèle disponible gratuitement depuis HuggingFace.

GLM-5.2, le trublion

GLM-5.2 est un modèle conséquent de 753 milliards de paramètres. Son architecture est de type MoE (Mixture of Experts) avec environ 40 milliards de paramètres actifs à la fois par token (jeton). Un ratio d’activation de 5,4 % qui peut le rendre beaucoup moins onéreux à exécuter qu’un modèle dense (non-MoE) de taille équivalente. La fenêtre contextuelle est d’un million de tokens.

Si l’on parle de ce modèle, c’est qu’au-delà de ses performances, il est également open source (licence MIT) et à poids ouverts. Traduction : en plus d’un accès commercial par l’API de l’entreprise (1,40 dollar par million de jetons en entrée, 4,40 dollars en sortie), n’importe qui peut récupérer le modèle et le modifier à volonté avant de l’utiliser. À condition bien sûr d’avoir le matériel nécessaire.

Quelles performances ?

Dans sa communication, Z.ai met en avant les très bons résultats généraux de GLM-5.2 de manière générale. S’agissant initialement d’un modèle pensé pour la programmation, les benchmarks utilisés sont classiques : 62,1 % pour SWE-bench Pro (résolution de problèmes sur GitHub), 81 sur Terminal-Bench 2.1 (tâches d’agents), ou encore 99,2 sur AIME 2026 (problèmes mathématiques).

Sur les travaux de longue durée, les résultats obtenus sont proches de ceux d’Opus 4.8 d’Anthropic. Par exemple, sur FrontierSWE, GLM-5.2 obtient 74,4 %, contre 75,1 % pour Opus. Sur PostTrainBench, le score est de 34,3 contre 37,2. Sur SWE-Marathon en revanche, le modèle chinois accuse un retard : 13 %, se faisant largement distancer par les 26 % d’Opus 4.8.

L’entreprise chinoise met en avant certains choix architecturaux, dont l’utilisation d’une technique baptisée IndexShare (publication arXiv), permettant d’optimiser le coût de fonctionnement. Cela permet, selon Z.ai, de diviser par trois le coût en calculs par token quand on grimpe jusqu’au maximum de la fenêtre de contexte (un million). Elle affirme qu’au sein du modèle, 75 % des couches sautent entièrement l’étape d’indexation coûteuse, tout en maintenant la qualité des schémas d’attention adaptative.

L’ensemble fait dire à certains observateurs, comme Flowtivity, que GLM-5.2 est en fait meilleur que la grande majorité des grands modèles de frontières américains, car son fonctionnement est nettement moins onéreux (six fois moins cher que GPT-5.5 selon Z.ai). L’ajout d’IndexShare permettrait au modèle de fonctionner sur du matériel « accessible » (mais pas un MacBook Pro avec 16 Go de RAM, tel que celui utilisé pour nos tests de RAG).

Et dans la cybersécurité ?

C’est ici que les choses sérieuses commencent, peut-on dire. Dans une évaluation comparative réalisée par Semgrep, GLM-5.2 a obtenu un score F1 de 39 % sur la détection IDOR, battant Claude Code (32 %) pour environ 0,17 dollar par vulnérabilité trouvée, tout en restant inférieur au pipeline multimodal de Semgrep (53 - 61 % F1).

Même son de cloche chez Graphistry le 23 juin : avec un taux de résolution de 28 sur 59 sur les benchmarks CTF (Capture The Flag) de cybersécurité, GLM-5.2 est le « top modèle » à poids ouverts et rivalise directement avec les modèles propriétaires. Dans les tests, on peut voir par exemple que Claude Code avec Opus 4.7 est 19 % plus rapide, mais il est aussi 2,2 fois plus cher à l’utilisation.

C’est ce qui fait dire à Graphistry que GLM-5.2 est le premier modèle à poids ouverts testé par leurs soins pouvant être recommandé pour une « expérience de cybersécurité de qualité frontière ».

Comment de tels résultats ont-ils été obtenus si rapidement ?

C’est l’une des grandes questions autour de GLM-5.2. Les soupçons n’ont d’ailleurs pas tardé, dans les jours qui ont suivi la publication du modèle : Z.ai a-t-elle distillé agressivement les grands modèles de frontière américains ? Pour rappel, la distillation est initialement une technique légitime d’apprentissage machine : un modèle étudiant apprend à imiter les sorties d’un modèle enseignant. Cependant, il y a problème quand elle est faite en violation des conditions d’utilisation des API, via des comptes proxy et à l’échelle industrielle. Une technique formellement interdite dans les conditions pour toutes les API commerciales. Pour les « copieurs », le résultat obtenu est un transfert de capacités sans garde-fous.


Il reste 56% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

☕️ Tidal coupe le robinet des royalties pour la musique 100 % IA



Après d’autres services de streaming musical, Tidal a dévoilé sa politique relative à l’IA générative, qui prévoit la démonétisation des morceaux 100 % IA, et dans certains cas une suppression pure et simple. Mais la plateforme reste ouverte à cette technologie.

Tidal va démonétiser complètement la musique entièrement générée par IA. La priorité de la plateforme de streaming est de verser les redevances aux œuvres originales « directement produites, écrites et interprétées par des êtres humains ». Ce changement intervient alors que la filière débat toujours pour savoir si certaines musiques générées par IA doivent donner lieu à des royalties – par exemple, celles reposant sur des licences appropriées et équitables.

La musique générée par IA devra montrer patte blanche

Le service va continuer à accepter et héberger de la musique générée par IA. « Les artistes doivent être libres de créer à l’aide d’outils d’IA et les auditeurs doivent avoir la liberté de choisir le type de contenu qu’ils consomment », écrit l’entreprise. En revanche, au vu de l’afflux de ces contenus, Tidal serre la vis avec des normes plus strictes en matière d’intégrité.

Illustration : Flock

Par conséquent, les morceaux 100 % générés par IA seront signalés par des icônes et ce, à partir de la mi-juillet. Cet étiquetage s’étendra au fur et à mesure que les méthodes de détection de l’IA « gagneront en fiabilité ». Les distributeurs seront mis à contribution : ils vont en effet devoir identifier les contenus IA avant qu’ils n’arrivent sur la plateforme.

En plus de la démonétisation, Tidal affirme ne plus tolérer de musique IA exploitant la musique, le nom ou l’image d’une personne ou d’un groupe, « qui trompe les auditeurs ou nuit à la qualité de notre service ». Ces « activités frauduleuses », qui impliquent également des téléversements massifs ou une activité inhabituelle, seront bloquées ou supprimées là aussi à partir de la mi-juillet.

Tidal ne fait que suivre la vague ici. Spotify a lancé fin avril un badge « Verified » pour les artistes et les chansons qui ne sont pas générés par IA. Deezer est très actif sur le sujet : le service estime que 44 % des morceaux téléversés sur ses serveurs sont générés par IA… Néanmoins, très peu sont écoutés et quand c’est le cas, c’est souvent en lien avec des cas de fraude.

  •  

☕️ Tidal coupe le robinet des royalties pour la musique 100 % IA



Après d’autres services de streaming musical, Tidal a dévoilé sa politique relative à l’IA générative, qui prévoit la démonétisation des morceaux 100 % IA, et dans certains cas une suppression pure et simple. Mais la plateforme reste ouverte à cette technologie.

Tidal va démonétiser complètement la musique entièrement générée par IA. La priorité de la plateforme de streaming est de verser les redevances aux œuvres originales « directement produites, écrites et interprétées par des êtres humains ». Ce changement intervient alors que la filière débat toujours pour savoir si certaines musiques générées par IA doivent donner lieu à des royalties – par exemple, celles reposant sur des licences appropriées et équitables.

La musique générée par IA devra montrer patte blanche

Le service va continuer à accepter et héberger de la musique générée par IA. « Les artistes doivent être libres de créer à l’aide d’outils d’IA et les auditeurs doivent avoir la liberté de choisir le type de contenu qu’ils consomment », écrit l’entreprise. En revanche, au vu de l’afflux de ces contenus, Tidal serre la vis avec des normes plus strictes en matière d’intégrité.

Illustration : Flock

Par conséquent, les morceaux 100 % générés par IA seront signalés par des icônes et ce, à partir de la mi-juillet. Cet étiquetage s’étendra au fur et à mesure que les méthodes de détection de l’IA « gagneront en fiabilité ». Les distributeurs seront mis à contribution : ils vont en effet devoir identifier les contenus IA avant qu’ils n’arrivent sur la plateforme.

En plus de la démonétisation, Tidal affirme ne plus tolérer de musique IA exploitant la musique, le nom ou l’image d’une personne ou d’un groupe, « qui trompe les auditeurs ou nuit à la qualité de notre service ». Ces « activités frauduleuses », qui impliquent également des téléversements massifs ou une activité inhabituelle, seront bloquées ou supprimées là aussi à partir de la mi-juillet.

Tidal ne fait que suivre la vague ici. Spotify a lancé fin avril un badge « Verified » pour les artistes et les chansons qui ne sont pas générés par IA. Deezer est très actif sur le sujet : le service estime que 44 % des morceaux téléversés sur ses serveurs sont générés par IA… Néanmoins, très peu sont écoutés et quand c’est le cas, c’est souvent en lien avec des cas de fraude.

  •  

☕️ Accusée d’acheter de vieux livres pour entrainer des IA, Zoom Books nie



Depuis quelques semaines, des libraires se demandent sur Reddit si l’entreprise canadienne Zoom Books n’achètent pas de vieux livres en masse pour entrainer ses modèles d’IA génératives. Les ouvrages seraient détruits dans la foulée…

Comme l’expliquent les médias suisses RTS et SRF et le média allemand taz, cette entreprise a récemment passé commande à des librairies en Allemagne mais aussi en Espagne, aux États-Unis, en Nouvelle-Zélande, en Australie, en Bulgarie ou encore en Grande-Bretagne.

Zoom Books scanne le texte des livres achetés légalement, en détruisant l’ouvrage au passage. La société pourrait plus facilement invoquer le « fair use », un argument souvent repris par les entreprises d’IA générative pour justifier la légalité de l’entrainement de leurs modèles sur une masse de données.

Bibliothèque IHEID, Genève, Switzerland
Unsplash

Zoom Books a expliqué à nos confrères de taz qu’elle fait de l’achat et de la revente mais aussi du recyclage de livres lorsqu’ils sont en trop mauvais état. « On a acheté de manière ciblée des ouvrages documentaires datant de 1970 et postérieurs, dotés d’un numéro ISBN – des invendus poussiéreux dont personne ne voulait depuis des années. Toute revente est totalement exclue : ces livres n’ont aucune valeur, et on n’a acheté qu’un seul exemplaire par titre », affirme encore l’entreprise à SRF.

« Mais nous tenons à préciser que, contrairement à certaines spéculations récentes, Zoom Books ne numérise ni ne détruit aucun livre », assure-t-elle à taz. Mais les libraires se demandent si Zoom Books ne serait pas un simple intermédiaire. Questionné sur le sujet, l’un des responsables de l’entreprise se contente de répéter qu’il ne peut fournir aucune information sur les acheteurs.

  •  

☕️ Accusée d’acheter de vieux livres pour entrainer des IA, Zoom Books nie



Depuis quelques semaines, des libraires se demandent sur Reddit si l’entreprise canadienne Zoom Books n’achètent pas de vieux livres en masse pour entrainer ses modèles d’IA génératives. Les ouvrages seraient détruits dans la foulée…

Comme l’expliquent les médias suisses RTS et SRF et le média allemand taz, cette entreprise a récemment passé commande à des librairies en Allemagne mais aussi en Espagne, aux États-Unis, en Nouvelle-Zélande, en Australie, en Bulgarie ou encore en Grande-Bretagne.

Zoom Books scanne le texte des livres achetés légalement, en détruisant l’ouvrage au passage. La société pourrait plus facilement invoquer le « fair use », un argument souvent repris par les entreprises d’IA générative pour justifier la légalité de l’entrainement de leurs modèles sur une masse de données.

Bibliothèque IHEID, Genève, Switzerland
Unsplash

Zoom Books a expliqué à nos confrères de taz qu’elle fait de l’achat et de la revente mais aussi du recyclage de livres lorsqu’ils sont en trop mauvais état. « On a acheté de manière ciblée des ouvrages documentaires datant de 1970 et postérieurs, dotés d’un numéro ISBN – des invendus poussiéreux dont personne ne voulait depuis des années. Toute revente est totalement exclue : ces livres n’ont aucune valeur, et on n’a acheté qu’un seul exemplaire par titre », affirme encore l’entreprise à SRF.

« Mais nous tenons à préciser que, contrairement à certaines spéculations récentes, Zoom Books ne numérise ni ne détruit aucun livre », assure-t-elle à taz. Mais les libraires se demandent si Zoom Books ne serait pas un simple intermédiaire. Questionné sur le sujet, l’un des responsables de l’entreprise se contente de répéter qu’il ne peut fournir aucune information sur les acheteurs.

  •  

IA générative : le RAG par l’exemple, avec 15 000 actus Next et Mistral 7B

Ça fait raguer mon Mac !
IA générative : le RAG par l’exemple, avec 15 000 actus Next et Mistral 7B

Nous avons passé à la moulinette du RAG le contenu de plus de 15 000 actus publiées sur Next ces dix dernières années. Le but ? En donner ensuite des morceaux à une IA générative pour qu’elle adapte ses réponses. Nous avons tout fait en local, sur un MacBook Pro avec Ollama et Mistral 7B.

Le Retrieval-Augmented Generation, ou génération augmentée par récupération en français, est une technique permettant à des IA génératives d’utiliser une base de connaissances pour répondre à des prompts. On utilise aussi très souvent son acronyme pour en parler : RAG.

Rag dans ma machine

Après les explications techniques et son principe de fonctionnement, nous vous proposons un exemple pratique. Nous avons récupéré le contenu de plus de 15 000 articles de Next sur une dizaine d’années pour l’associer à Mistral 7B, un LLM libre de 7,3 milliards de paramètres (sorti en 2023, désormais loin des ténors du moment qui ont au bas mot des centaines de milliards de paramètres, voire des milliers pour certains), sous licence Apache 2.0. Le RAG est agnostique du modèle d’IA générative, nous aurions évidemment pu en prendre un autre.

Dans notre cas, un traitement local était impératif. Nous avons utilisé un MacBook Pro avec un SoC M2 et 16 Go de mémoire partagée. Mistral 7B tourne dessus sans problème, avec de la marge pour exécuter d’autres applications en même temps. Côté logiciel, nous avons installé Ollama (open source, licence MIT). Nous l’avions déjà présenté dans un précédent tuto sur l’influence du GPU dans les performances des IA génératives.

Si les explications techniques ne vous intéressent pas, sautez directement à l’inter : « Concrètement, ça donne quoi d’utiliser le RAG ». Vous aurez des exemples de réponses à des prompts sur Mistral 7B avec et sans RAG (en local dans les deux cas).

Sous le capot pour la partie technique : Ollama, Mistral et Nomic

Passons rapidement (mais pas trop) sur les détails techniques, dont voici les grandes lignes : on télécharge le modèle d’IA générative avec la commande ollama pull mistral puis un autre modèle pour transformer le texte de nos actus en vecteurs (des nombres, qui sont ensuite utilisés par les algorithmes des IA génératives) avec ollama pull nomic-embed-text (on parle aussi d’embedding).

Un petit script permet de découper automatiquement le texte en plusieurs morceaux (chunks) qui sont ensuite transformés en tokens via nomic-embed-text. Cette indexation ne doit se faire qu’une seule fois. Dans notre cas, elle a pris environ trois heures (sur le MacBook Pro M2 avec plus de 15 000 articles). Pour ajouter de nouveaux articles par la suite, pas la peine de tout réindexer, il suffit de passer à la moulinette les nouveaux textes.

Passons aux choses sérieuses avec le déroulement d’un prompt. Le prompt est vectorisé, puis comparé à tous les vecteurs des morceaux des articles de notre base. Nous gardons les 10 meilleurs ; qui sont ensuite envoyés à Mistral en même temps que le prompt. Mistral va donc élaborer sa réponse en s’appuyant sur ses connaissances et les 10 morceaux des actus de Next.

On peut affiner le prompt pour lui demander de n’utiliser que les données de Next par exemple. Après, c’est un modèle statistique (comme toutes les IA génératives), donc statistiquement, il fait parfois n’importe quoi ; rien de neuf sous le Soleil.

Concrètement, ça donne quoi d’utiliser le RAG

Pour nos tests, nous utilisons donc Ollama sur notre MacBook Pro, sans aucune connexion à Internet, toutes les opérations se faisant en local.

Voici quelques prompts et les réponses de Mistral, avec ou sans RAG. Rappel important : nous n’avons pas spécialement cherché à optimiser les réponses (le prompt passé à Mistral avec le contenu des actualités jugé le plus intéressant pourrait être amélioré).

Nous vous proposons huit prompts, sur le logiciel, le droit, les réseaux sociaux, le hardware, l’informatique quantique… Les réponses sont, pour rappel, statistiques et peuvent donc par définition être totalement différentes pour un même prompt répété plusieurs fois. Nous livrons ici la première réponse proposée par l’IA générative.

Si vous avez des idées de prompts à tester, n’hésitez pas à les proposer en commentaire, suivant les cas je pourrai les lancer et donner les résultats dans une prochaine actualité

Passons aux choses sérieuses avec une première question soulevée par Vincent (il a la réponse, j’en suis certain ) ! Mais il est curieux de voir le résultat avec ou sans le contenu des actualités de Next… qu’il a pour la plupart rédigées.

Puis-je avoir une synthèse des défauts de Windows 11 ?

Réponse de Mistral avec RAG sur les actus Next :


Il reste 80% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

Dis Next, c’est quoi un « RAG » en IA générative ?

Rag against the machine
Dis Next, c’est quoi un « RAG » en IA générative ?

Ces dernières années, vous entendez peut-être parler de RAG, surtout dans le monde des entreprises. De quoi s’agit-il ? Pourquoi certaines organisations n’ont que ce mot à la bouche ? On vous explique tout, le plus simplement possible.

RAG signifie « Retrieval-Augmented Generation », littéralement « génération augmentée par récupération ». Dans les grandes lignes, c’est un type d’architecture que l’on met en place pour obtenir des réponses rapides et précises sur une base de connaissances spécifiques, en utilisant de l’IA.

Des explications sans (trop de) jargon

Pour comprendre ce que le RAG permet, on utilise souvent l’analogie d’un expert, mais qui n’aurait pas connaissance de l’armoire dans laquelle vous rangez tous vos documents. Il peut s’agir de modes d’emploi, de cartes de vœux, de livres particuliers, voire de factures et d’autres informations que vous avez jugées suffisamment importantes pour les placer là. L’expert en sait beaucoup, mais il ne pourra répondre à aucune question sur le contenu de cette armoire. On peut toujours décrire le type de documents que l’on possède, ses réponses manqueront de précision.

IA générative : le RAG par l’exemple, avec 15 000 actus Next et Mistral 7B

C’est un comportement que l’on retrouve dans les IA génératives habituellement. Elles « savent » quantité de choses, mais si vous êtes dans une entreprise possédant un grand nombre de ressources, l’IA n’y aura probablement pas accès.

Or, ces ressources internes peuvent être à la fois le cœur d’une entreprise comme sa base d’exploitation. Si vous mettez en place un chatbot pour gérer l’assistance, il vaut mieux qu’il ait accès à ces ressources. Les réponses données pourraient sinon être vagues, ou même – pire ! – inventées. Car les IA génératives hallucinent et ont encore bien du mal à répondre simplement « Je ne sais pas ».


Il reste 80% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

Ford rappelle les vieux briscards pour épauler son IA déficiente

L’IA passe au contrôle technique
Ford rappelle les vieux briscards pour épauler son IA déficiente

Ford a décidé de faire appel à la bonne vieille expérience humaine pour corriger les problèmes de qualité qui affectent ses gammes. Le constructeur automobile états-unien a réembauché des centaines de vétérans pour former la jeune génération et améliorer les outils IA incapables de remplacer, à eux seuls, ce savoir-faire.

Aux États-Unis, Ford se traîne depuis des années une mauvaise réputation : un manque de fiabilité. En 2023, l’entreprise a ainsi englouti 4,8 milliards de dollars pour éponger les coûts des prises en charge au titre de la garantie de ses voitures, soit 4 % du chiffre d’affaires du constructeur automobile (trois fois plus élevé que le reste de l’industrie). Ford provisionnait à l’époque 1 203 dollars pour les réparations sous garantie sur chaque véhicule vendu, contre 591 dollars en 2019.

Le coût astronomique de la garantie

Des frais énormes que le groupe s’est engagé à résorber. Et cela passe par le retour sur les lignes de production de vétérans. Ces trois dernières années, l’entreprise a réembauché 350 « anciens », des ex-employés Ford et de fournisseurs. Ils forment les salariés plus jeunes, et surtout ils entraînent les outils IA utilisés par le groupe.

« L’intelligence artificielle est un outil formidable, mais elle ne vaut que par les informations utilisées pour l’entraîner », explique Charles Poon, vice-président de l’ingénierie matérielle du géant de Detroit. « Ces dernières années, nous n’avons pas accordé toute l’attention nécessaire à l’expérience de nos ingénieurs les plus chevronnés, ceux qui nous ont accompagnés sur de nombreux cycles de produits », poursuit-il dans une déclaration reprise par Bloomberg.

Ces ingénieurs capés dirigent désormais des réunions obligatoires où les problèmes de qualité sont passés au crible. « Nous nous étions de plus en plus reposés sur des systèmes automatisés de contrôle qualité », ajoute Kumar Galhotra, le directeur des opérations. Ces spécialistes « traquent les points de défaillance avant même qu’une pièce n’arrive sur la ligne de production ».

L’IA désemparée

Résultat : les coûts liés à la prise en charge de la garantie diminuent, « des centaines et des centaines de millions de dollars », se réjouit Jim Farley, le patron de Ford. L’image de marque en profite aussi. Le dernier classement JD Power sur la qualité initiale des véhicules durant les trois premiers mois suivant l’achat montre que Ford dépasse des références en la matière, dont le modèle à suivre, Toyota. En fait, seules les marques de luxe Porsche et Genesis (la marque haut de gamme de Hyundai) ont fait mieux.

Charles Poon bat sa coulpe : « Nous avons cru, à tort, qu’il suffisait d’introduire de l’intelligence artificielle et d’y intégrer nos exigences de conception pour obtenir un produit de grande qualité ». Pour améliorer certains outils d’automatisation et d’IA, le constructeur a compris qu’il fallait les entraîner « par les personnes les plus expérimentées ». L’histoire ne dit pas encore si l’IA saura garder le cap le jour où les vieux briscards ne seront plus là pour lui tenir la main.

Ford n’en reste pas moins le constructeur automobile américain comptant toujours le plus de rappels ; les coûts liés aux garanties devraient tourner autour du milliard de dollars en 2026. La direction espère toutefois que ce volume va se dégonfler avec les nouveaux modèles.

  •  

Ford rappelle les vieux briscards pour épauler son IA déficiente

L’IA passe au contrôle technique
Ford rappelle les vieux briscards pour épauler son IA déficiente

Ford a décidé de faire appel à la bonne vieille expérience humaine pour corriger les problèmes de qualité qui affectent ses gammes. Le constructeur automobile états-unien a réembauché des centaines de vétérans pour former la jeune génération et améliorer les outils IA incapables de remplacer, à eux seuls, ce savoir-faire.

Aux États-Unis, Ford se traîne depuis des années une mauvaise réputation : un manque de fiabilité. En 2023, l’entreprise a ainsi englouti 4,8 milliards de dollars pour éponger les coûts des prises en charge au titre de la garantie de ses voitures, soit 4 % du chiffre d’affaires du constructeur automobile (trois fois plus élevé que le reste de l’industrie). Ford provisionnait à l’époque 1 203 dollars pour les réparations sous garantie sur chaque véhicule vendu, contre 591 dollars en 2019.

Le coût astronomique de la garantie

Des frais énormes que le groupe s’est engagé à résorber. Et cela passe par le retour sur les lignes de production de vétérans. Ces trois dernières années, l’entreprise a réembauché 350 « anciens », des ex-employés Ford et de fournisseurs. Ils forment les salariés plus jeunes, et surtout ils entraînent les outils IA utilisés par le groupe.

« L’intelligence artificielle est un outil formidable, mais elle ne vaut que par les informations utilisées pour l’entraîner », explique Charles Poon, vice-président de l’ingénierie matérielle du géant de Detroit. « Ces dernières années, nous n’avons pas accordé toute l’attention nécessaire à l’expérience de nos ingénieurs les plus chevronnés, ceux qui nous ont accompagnés sur de nombreux cycles de produits », poursuit-il dans une déclaration reprise par Bloomberg.

Ces ingénieurs capés dirigent désormais des réunions obligatoires où les problèmes de qualité sont passés au crible. « Nous nous étions de plus en plus reposés sur des systèmes automatisés de contrôle qualité », ajoute Kumar Galhotra, le directeur des opérations. Ces spécialistes « traquent les points de défaillance avant même qu’une pièce n’arrive sur la ligne de production ».

L’IA désemparée

Résultat : les coûts liés à la prise en charge de la garantie diminuent, « des centaines et des centaines de millions de dollars », se réjouit Jim Farley, le patron de Ford. L’image de marque en profite aussi. Le dernier classement JD Power sur la qualité initiale des véhicules durant les trois premiers mois suivant l’achat montre que Ford dépasse des références en la matière, dont le modèle à suivre, Toyota. En fait, seules les marques de luxe Porsche et Genesis (la marque haut de gamme de Hyundai) ont fait mieux.

Charles Poon bat sa coulpe : « Nous avons cru, à tort, qu’il suffisait d’introduire de l’intelligence artificielle et d’y intégrer nos exigences de conception pour obtenir un produit de grande qualité ». Pour améliorer certains outils d’automatisation et d’IA, le constructeur a compris qu’il fallait les entraîner « par les personnes les plus expérimentées ». L’histoire ne dit pas encore si l’IA saura garder le cap le jour où les vieux briscards ne seront plus là pour lui tenir la main.

Ford n’en reste pas moins le constructeur automobile américain comptant toujours le plus de rappels ; les coûts liés aux garanties devraient tourner autour du milliard de dollars en 2026. La direction espère toutefois que ce volume va se dégonfler avec les nouveaux modèles.

  •  

Anthropic déploie de nouveau Mythos 5, Fable 5 attend son feu vert

Libéré, délivré
Anthropic déploie de nouveau Mythos 5, Fable 5 attend son feu vert

Nouvel épisode dans la saga Mythos. Anthropic a reçu la nuit dernière l’autorisation du gouvernement US pour déployer de nouveau Mythos 5 auprès d’organisations et entreprises états-uniennes. Fable 5 pourrait obtenir son feu vert la semaine prochaine.

Dévoilés le 10 juin, Fable 5 et Mythos 5, les modèles IA les plus avancés d’Anthropic, n’ont pas été très longtemps entre les mains des utilisateurs. Deux jours plus tard, Anthropic était obligée d’en fermer l’accès à tous les ressortissants étrangers ; étant dans l’impossibilité de déterminer la nationalité de ses utilisateurs, le labo IA a décidé d’interdire ces modèles à tout le monde.

Depuis, les négociations se poursuivent entre l’administration Trump à l’origine de l’interdiction, et Anthropic. Elles ont fini par porter leurs fruits, du moins pour Mythos 5. Ce modèle est le frère jumeau de Fable 5, mais sans les restrictions d’usage liées à des sujets sensibles, comme la cybersécurité, la biologie, la chimie ou la distillation de modèles IA.

« Aujourd’hui, le gouvernement nous a informés que Mythos 5, notre modèle le plus avancé en cybersécurité, peut être redéployé auprès d’un ensemble d’organisations américaines chargées d’exploiter et de défendre des infrastructures critiques », a expliqué ce vendredi 26 juin l’entreprise sur les réseaux sociaux. L’accès est depuis en phase de rétablissement pour ces organisations.

Fable 5 dans l’antichambre

C’est un premier pas, mais insuffisant : Mythos 5, qui remplace Mythos Preview, se limite en effet aux membres du projet Glasswing. Fable 5 pourrait cependant suivre assez vite. Selon une indiscrétion d’Axios, l’administration Trump pourrait lever son interdiction sur le modèle grand public dans le courant de la semaine prochaine.

Howard Lutnick, le secrétaire au Commerce, a expliqué dans une lettre envoyée ce vendredi, et révélée par Semafor, qu’Anthropic avait travaillé avec le gouvernement sur les risques associés aux deux modèles. Des efforts qui ont permis « des avancées significatives ». L’entreprise s’est par ailleurs engagée à plancher sur « des protocoles, des normes et les modalités de mise à disposition des modèles ».

Cette « libération » des deux modèles sera vécue comme un soulagement par Anthropic et ses utilisateurs. Néanmoins, ce pataquès ne résout pas la demande du labo qui, le 12 juin, réclamait « un processus statutaire transparent, équitable, clair et fondé sur des faits techniques » plutôt que l’opacité actuelle qui « ne respecte pas ces principes ».

Un message similaire envoyé par OpenAI hier, alors que le créateur de ChatGPT lançait GPT-5.6… mais à une poignée restreinte d’organisations, comme l’a exigé le gouvernement. « Nous ne pensons pas que ce type de procédure d’accès gouvernementale doive devenir la norme à long terme », explique OpenAI. « Elle prive des meilleurs outils les utilisateurs, les développeurs, les entreprises, les défenseurs en cybersécurité et les partenaires internationaux qui en ont besoin. »

  •  

Anthropic déploie de nouveau Mythos 5, Fable 5 attend son feu vert

Libéré, délivré
Anthropic déploie de nouveau Mythos 5, Fable 5 attend son feu vert

Nouvel épisode dans la saga Mythos. Anthropic a reçu la nuit dernière l’autorisation du gouvernement US pour déployer de nouveau Mythos 5 auprès d’organisations et entreprises états-uniennes. Fable 5 pourrait obtenir son feu vert la semaine prochaine.

Dévoilés le 10 juin, Fable 5 et Mythos 5, les modèles IA les plus avancés d’Anthropic, n’ont pas été très longtemps entre les mains des utilisateurs. Deux jours plus tard, Anthropic était obligée d’en fermer l’accès à tous les ressortissants étrangers ; étant dans l’impossibilité de déterminer la nationalité de ses utilisateurs, le labo IA a décidé d’interdire ces modèles à tout le monde.

Depuis, les négociations se poursuivent entre l’administration Trump à l’origine de l’interdiction, et Anthropic. Elles ont fini par porter leurs fruits, du moins pour Mythos 5. Ce modèle est le frère jumeau de Fable 5, mais sans les restrictions d’usage liées à des sujets sensibles, comme la cybersécurité, la biologie, la chimie ou la distillation de modèles IA.

« Aujourd’hui, le gouvernement nous a informés que Mythos 5, notre modèle le plus avancé en cybersécurité, peut être redéployé auprès d’un ensemble d’organisations américaines chargées d’exploiter et de défendre des infrastructures critiques », a expliqué ce vendredi 26 juin l’entreprise sur les réseaux sociaux. L’accès est depuis en phase de rétablissement pour ces organisations.

Fable 5 dans l’antichambre

C’est un premier pas, mais insuffisant : Mythos 5, qui remplace Mythos Preview, se limite en effet aux membres du projet Glasswing. Fable 5 pourrait cependant suivre assez vite. Selon une indiscrétion d’Axios, l’administration Trump pourrait lever son interdiction sur le modèle grand public dans le courant de la semaine prochaine.

Howard Lutnick, le secrétaire au Commerce, a expliqué dans une lettre envoyée ce vendredi, et révélée par Semafor, qu’Anthropic avait travaillé avec le gouvernement sur les risques associés aux deux modèles. Des efforts qui ont permis « des avancées significatives ». L’entreprise s’est par ailleurs engagée à plancher sur « des protocoles, des normes et les modalités de mise à disposition des modèles ».

Cette « libération » des deux modèles sera vécue comme un soulagement par Anthropic et ses utilisateurs. Néanmoins, ce pataquès ne résout pas la demande du labo qui, le 12 juin, réclamait « un processus statutaire transparent, équitable, clair et fondé sur des faits techniques » plutôt que l’opacité actuelle qui « ne respecte pas ces principes ».

Un message similaire envoyé par OpenAI hier, alors que le créateur de ChatGPT lançait GPT-5.6… mais à une poignée restreinte d’organisations, comme l’a exigé le gouvernement. « Nous ne pensons pas que ce type de procédure d’accès gouvernementale doive devenir la norme à long terme », explique OpenAI. « Elle prive des meilleurs outils les utilisateurs, les développeurs, les entreprises, les défenseurs en cybersécurité et les partenaires internationaux qui en ont besoin. »

  •  

OpenAI lance GPT-5.6 Sol, Terra et Luna, mais en accès limité

GPT-5.6 derrière un cordon de sécurité
OpenAI lance GPT-5.6 Sol, Terra et Luna, mais en accès limité

OpenAI a lancé son nouveau modèle de langage, GPT-5.6, mais personne ou presque ne peut encore s’en servir. Et pour cause : sur ordre du gouvernement américain, il n’est distribué qu’à une poignée d’organisations dûment autorisées. Ça n’empêche pas le labo IA de faire un point sur les capacités de ce concurrent de Mythos.

GPT-5.6 est finalement disponible, deux mois après la précédente version du grand modèle de langage d’OpenAI. Enfin, disponible… façon de parler. En vertu d’un décret du président Trump, l’entreprise limite le déploiement à quelques organisations et entreprises triées sur le volet. Le labo IA espère pouvoir distribuer le modèle aussi largement que possible « dans les prochaines semaines ».

Une situation loin d’être idéale et qui ne fait pas les affaires d’OpenAI. « Nous ne pensons pas que ce type de processus d’accès gouvernemental doive devenir la norme à long terme », écrit la société. « Il prive des meilleurs outils les utilisateurs, les développeurs, les entreprises, les défenseurs en cybersécurité et les partenaires internationaux qui en ont besoin », ajoute-t-elle. OpenAI dit continuer de travailler avec l’administration Trump pour améliorer le cadre prévu du décret présidentiel sur la cybersécurité.

GPT-5.6 : un modèle à voir de loin

Dont acte, il faudra donc se contenter de GPT-5.5 pendant quelques temps avant de pouvoir juger de son successeur sur pièces. Ou plutôt, de ses successeurs car OpenAI a opté pour trois versions de son modèle :

  • GPT-5.6 Sol est présenté comme le modèle le plus puissant du lot. OpenAI assure qu’il est le plus calé pour les tâches les plus complexes, comme le code, les raisonnements longs, la biologie, la cybersécurité et les usages agentiques. Sol reçoit également les garde-fous les plus costauds (on va y revenir).
  • GPT-5.6 Terra est le modèle intermédiaire, pensé pour les usages quotidiens avec un équilibre entre performances et coûts. Ses performances devraient le mettre au niveau de GPT-5.5, tout en étant deux fois moins cher, promet OpenAI.
  • GPT-5.6 Luna est le modèle rapide et abordable de la gamme. Il se destine aux usages où la vitesse et le prix comptent davantage que les performances brutes.

On pourra voir dans cette gamme un certain alignement avec Anthropic et ses modèles Haiku, Sonnet et Opus.

Deux modes de consommation sont proposées : « max », qui donne à GPT-5.6 Sol davantage de temps pour raisonner sur des tâches complexes. Et « ultra », qui mobilise plusieurs agents capables de travailler en parallèle sur des tâches plus lourdes.

GPT-5.6 Sol se veut donc particulièrement performant sur les tâches liées au code. Sur le benchmark Terminal‑Bench 2.1, les versions standard et Ultra affichent des scores légèrement supérieurs à celles de Mythos 5. Mais OpenAI insiste surtout sur les capacités du modèle pour la cybersécurité (recherche de vulnérabilités et leur exploitation). Sol rivalise avec Mythos Preview sur ExploitBench, en n’utilisant qu’un tiers des tokens en sortie.

La sécurité en bandoulière

Ces super-pouvoirs sont sévèrement encadrés, tient à rassurer OpenAI. Toute la chaîne de sécurité autour de GPT-5.6 Sol a été renforcée, avec des garde-fous directement entraînés dans le modèle, des systèmes de détection en temps réel, des contrôles au niveau des comptes et un accès différencié en fonction des usages.

Il s’agit de compliquer la vie des pirates qui voudraient exploiter ces capacités pour pénétrer par effraction dans des infrastructures sensibles. Mais sans bloquer pour autant les travaux légitimes de recherche et de correction de failles, de débug ou de formation. OpenAI ajoute que certaines activités peuvent entraîner une vérification au niveau du compte, pour distinguer un usage défensif licite d’un comportement malveillant répété.

« Lors d’évaluations portant sur Chromium et Firefox, [GPT-5.6 Sol] a identifié des bugs et des éléments pouvant servir à construire un exploit, mais il n’a pas été capable de produire seul une chaîne d’exploitation complète et fonctionnelle dans les conditions testées. »

OpenAI insiste tout particulièrement sur le travail mené pour contrer les tentatives de jailbreak, qui poussent les modèles à contourner leurs mesures de sécurité. Plus de 700 000 heures de calcul (en équivalent GPU A100) ont été consacrées à du red teaming automatisé : les propres modèles d’OpenAI ont tenté de chercher des failles dans les garde-fous.

Il s’agissait de détecter des jailbreaks « universels » qui peuvent fonctionner dans toute sorte de contextes, pas uniquement sur une requête précise. Des experts humains sont également mobilisés, et les tests se poursuivent durant la phase d’aperçu. Les premiers testeurs pourront d’ailleurs buter sur des restrictions qui bloqueront ou refuseront certaines demandes. D’autres requêtes prendront davantage de temps de traitement, afin de procéder à des examens de sécurité supplémentaires.

Tokens raisonnables

Les tarifs intéresseront les entreprises qui font bûcher les agents IA pour produire du code et qui voient les factures s’alourdir invariablement. La grille des prix de GPT-5.6 est la suivante :

  • GPT-5.6 Sol : 5 $/1 million de tokens en entrée ; 30 $/1M en sortie ;
  • GPT-5.6 Terra : 2,50 $/1M en entrée ; 15 $/1M en sortie ;
  • GPT-5.6 Luna : 1 $/1M en entrée ; 6 $/1M en sortie.

Sol a ceci d’intéressant que ses tarifs sont identiques à ceux de GPT-5.5. Quant à Terra, ils sont tout simplement deux fois moins chers, pour des performances annoncées comme similaires. Un caillou dans le jardin d’Anthropic, dont les derniers modèles se montrent très gourmands.

OpenAI ajoute que GPT-5.6 Sol pourra tourner sur l’infrastructure Cerebras avec une vitesse pouvant atteindre 750 tokens par seconde. De quoi offrir des temps de réponses beaucoup plus rapides pour les clients professionnels exigeants disposant des ressources financières nécessaires.

GPT-5.6 améliore aussi le « cache de requêtes », un mécanisme présent depuis octobre 2024 chez OpenAI qui permet de réduire les coûts quand un développeur réutilise plusieurs fois le même contexte dans ses requêtes. Le nouveau modèle conserve les éléments réutilisables d’une requête pendant au moins 30 minutes ; l’écriture dans le cache coûte 1,25 fois plus cher, mais la lecture (la réutilisation) bénéfice de 90 % de remise. C’était 50 % au lancement de cette fonction. Par ailleurs, les développeurs pourront mieux découper leurs prompts pour choisir les parties à garder en cache et à réutiliser ensuite.

  •  

OpenAI lance GPT-5.6 Sol, Terra et Luna, mais en accès limité

GPT-5.6 derrière un cordon de sécurité
OpenAI lance GPT-5.6 Sol, Terra et Luna, mais en accès limité

OpenAI a lancé son nouveau modèle de langage, GPT-5.6, mais personne ou presque ne peut encore s’en servir. Et pour cause : sur ordre du gouvernement américain, il n’est distribué qu’à une poignée d’organisations dûment autorisées. Ça n’empêche pas le labo IA de faire un point sur les capacités de ce concurrent de Mythos.

GPT-5.6 est finalement disponible, deux mois après la précédente version du grand modèle de langage d’OpenAI. Enfin, disponible… façon de parler. En vertu d’un décret du président Trump, l’entreprise limite le déploiement à quelques organisations et entreprises triées sur le volet. Le labo IA espère pouvoir distribuer le modèle aussi largement que possible « dans les prochaines semaines ».

Une situation loin d’être idéale et qui ne fait pas les affaires d’OpenAI. « Nous ne pensons pas que ce type de processus d’accès gouvernemental doive devenir la norme à long terme », écrit la société. « Il prive des meilleurs outils les utilisateurs, les développeurs, les entreprises, les défenseurs en cybersécurité et les partenaires internationaux qui en ont besoin », ajoute-t-elle. OpenAI dit continuer de travailler avec l’administration Trump pour améliorer le cadre prévu du décret présidentiel sur la cybersécurité.

GPT-5.6 : un modèle à voir de loin

Dont acte, il faudra donc se contenter de GPT-5.5 pendant quelques temps avant de pouvoir juger de son successeur sur pièces. Ou plutôt, de ses successeurs car OpenAI a opté pour trois versions de son modèle :

  • GPT-5.6 Sol est présenté comme le modèle le plus puissant du lot. OpenAI assure qu’il est le plus calé pour les tâches les plus complexes, comme le code, les raisonnements longs, la biologie, la cybersécurité et les usages agentiques. Sol reçoit également les garde-fous les plus costauds (on va y revenir).
  • GPT-5.6 Terra est le modèle intermédiaire, pensé pour les usages quotidiens avec un équilibre entre performances et coûts. Ses performances devraient le mettre au niveau de GPT-5.5, tout en étant deux fois moins cher, promet OpenAI.
  • GPT-5.6 Luna est le modèle rapide et abordable de la gamme. Il se destine aux usages où la vitesse et le prix comptent davantage que les performances brutes.

On pourra voir dans cette gamme un certain alignement avec Anthropic et ses modèles Haiku, Sonnet et Opus.

Deux modes de consommation sont proposées : « max », qui donne à GPT-5.6 Sol davantage de temps pour raisonner sur des tâches complexes. Et « ultra », qui mobilise plusieurs agents capables de travailler en parallèle sur des tâches plus lourdes.

GPT-5.6 Sol se veut donc particulièrement performant sur les tâches liées au code. Sur le benchmark Terminal‑Bench 2.1, les versions standard et Ultra affichent des scores légèrement supérieurs à celles de Mythos 5. Mais OpenAI insiste surtout sur les capacités du modèle pour la cybersécurité (recherche de vulnérabilités et leur exploitation). Sol rivalise avec Mythos Preview sur ExploitBench, en n’utilisant qu’un tiers des tokens en sortie.

La sécurité en bandoulière

Ces super-pouvoirs sont sévèrement encadrés, tient à rassurer OpenAI. Toute la chaîne de sécurité autour de GPT-5.6 Sol a été renforcée, avec des garde-fous directement entraînés dans le modèle, des systèmes de détection en temps réel, des contrôles au niveau des comptes et un accès différencié en fonction des usages.

Il s’agit de compliquer la vie des pirates qui voudraient exploiter ces capacités pour pénétrer par effraction dans des infrastructures sensibles. Mais sans bloquer pour autant les travaux légitimes de recherche et de correction de failles, de débug ou de formation. OpenAI ajoute que certaines activités peuvent entraîner une vérification au niveau du compte, pour distinguer un usage défensif licite d’un comportement malveillant répété.

« Lors d’évaluations portant sur Chromium et Firefox, [GPT-5.6 Sol] a identifié des bugs et des éléments pouvant servir à construire un exploit, mais il n’a pas été capable de produire seul une chaîne d’exploitation complète et fonctionnelle dans les conditions testées. »

OpenAI insiste tout particulièrement sur le travail mené pour contrer les tentatives de jailbreak, qui poussent les modèles à contourner leurs mesures de sécurité. Plus de 700 000 heures de calcul (en équivalent GPU A100) ont été consacrées à du red teaming automatisé : les propres modèles d’OpenAI ont tenté de chercher des failles dans les garde-fous.

Il s’agissait de détecter des jailbreaks « universels » qui peuvent fonctionner dans toute sorte de contextes, pas uniquement sur une requête précise. Des experts humains sont également mobilisés, et les tests se poursuivent durant la phase d’aperçu. Les premiers testeurs pourront d’ailleurs buter sur des restrictions qui bloqueront ou refuseront certaines demandes. D’autres requêtes prendront davantage de temps de traitement, afin de procéder à des examens de sécurité supplémentaires.

Tokens raisonnables

Les tarifs intéresseront les entreprises qui font bûcher les agents IA pour produire du code et qui voient les factures s’alourdir invariablement. La grille des prix de GPT-5.6 est la suivante :

  • GPT-5.6 Sol : 5 $/1 million de tokens en entrée ; 30 $/1M en sortie ;
  • GPT-5.6 Terra : 2,50 $/1M en entrée ; 15 $/1M en sortie ;
  • GPT-5.6 Luna : 1 $/1M en entrée ; 6 $/1M en sortie.

Sol a ceci d’intéressant que ses tarifs sont identiques à ceux de GPT-5.5. Quant à Terra, ils sont tout simplement deux fois moins chers, pour des performances annoncées comme similaires. Un caillou dans le jardin d’Anthropic, dont les derniers modèles se montrent très gourmands.

OpenAI ajoute que GPT-5.6 Sol pourra tourner sur l’infrastructure Cerebras avec une vitesse pouvant atteindre 750 tokens par seconde. De quoi offrir des temps de réponses beaucoup plus rapides pour les clients professionnels exigeants disposant des ressources financières nécessaires.

GPT-5.6 améliore aussi le « cache de requêtes », un mécanisme présent depuis octobre 2024 chez OpenAI qui permet de réduire les coûts quand un développeur réutilise plusieurs fois le même contexte dans ses requêtes. Le nouveau modèle conserve les éléments réutilisables d’une requête pendant au moins 30 minutes ; l’écriture dans le cache coûte 1,25 fois plus cher, mais la lecture (la réutilisation) bénéfice de 90 % de remise. C’était 50 % au lancement de cette fonction. Par ailleurs, les développeurs pourront mieux découper leurs prompts pour choisir les parties à garder en cache et à réutiliser ensuite.

  •  

IA générative : Anthropic accuse Alibaba de distiller ses modèles

Anti-anthropic
IA générative : Anthropic accuse Alibaba de distiller ses modèles

Anthropic a récemment alerté les élus états-uniens au sujet de la récupération massive de données sur ses outils par Alibaba, accusant son concurrent chinois de distiller ses modèles de façon illégitime. En parallèle, l’administration Trump interdit l’accès au marché de son département de la défense à plusieurs entreprises de Chine, alors qu’un équivalent chinois de Mythos est annoncé.

Après des semaines de bataille entre Anthropic et l’administration Trump, les États-Unis semblent resserrer les rangs alors qu’arrivent de nouveaux outils d’IA générative venant de Chine.

En effet, l’entreprise dirigée par Dario Amodei vient de nouveau de se plaindre auprès des élus de son pays à propos des pratiques de l’entreprise chinoise Alibaba. Le 10 juin, Anthropic a envoyé une lettre au sénateur républicain Tim ​Scott et à la sénatrice démocrate Elizabeth Warren qu’a pu obtenir ArsTechnica et dans laquelle elle affirme partager de « nouveaux éléments de preuve confidentiels concernant la plus vaste campagne visant à exploiter illicitement les capacités de Claude que nous ayons jamais observée ».

Une distillation toujours pas endiguée

L’entreprise y détaille qu’elle a observé entre le 22 avril et le 5 juin dernier « des opérateurs liés à Alibaba et à Alibaba Qwen, le laboratoire d’IA d’Alibaba » qui auraient généré « plus de 28,8 millions d’échanges avec Claude via près de 25 000 comptes frauduleux ». Elle considère que cette utilisation massive est contraire à ses conditions d’utilisation et qu’elle serait menée par Alibaba dans le but de « distiller » son modèle.

L’entreprise et sa concurrente états-unienne OpenAI avaient déjà proféré de telles accusations en février dernier contre d’autres entreprises chinoises : DeepSeek, Moonshot, et MiniMax. À l’époque, elle reconnaissait que « la distillation est une méthode d’entraînement largement utilisée et légitime. Par exemple, les laboratoires d’IA de pointe distillent régulièrement leurs propres modèles afin de créer des versions plus petites et moins coûteuses pour leurs clients ». Mais elle considérait que l’utilisation de cette technique était illicite si l’objectif était « acquérir les capacités puissantes d’autres laboratoires en une fraction du temps et à un coût bien inférieur », sans pour autant s’appuyer sur un texte légal.

Anthropic réitère donc son accusation en soulignant qu’Alibaba a réussi à échapper à la détection en « recourant à des techniques d’obfuscation et à des réseaux de proxys » et qu’« une économie de contournement [était] en pleine expansion » en Chine, ce qui rendrait les modèles Claude d’autant plus fragiles face à la distillation.

Alibaba sur une liste lui bloquant l’accès au marché du département de la Défense

« Alibaba est cotée à la Bourse de New York, exerce ses activités aux États-Unis et doit rendre des comptes aux investisseurs et aux régulateurs américains », affirme encore Anthropic dans sa lettre. Et elle ajoute que, « pourtant, cette activité s’est déroulée dans les semaines qui ont suivi » la note de service de Trump qui avait fait suite aux accusations d’OpenAI et Anthropic en affirmant que ces tentatives de créer des clones des outils d’IA générative états-uniens étaient « inacceptables ».

En parallèle de ces accusations se joue un bras de fer entre Alibaba et l’administration Trump. En effet, cette dernière a ajouté le 8 juin BYD, Baidu, NIO et Alibaba à sa liste des entreprises travaillant pour l’armée chinoise. Cette liste n’impose pas officiellement des sanctions, mais elle bloque l’accès du marché du département de la Défense états-unien aux entreprises qui y figurent. Alibaba a attaqué en justice cette décision ce mardi 23 juin, explique Reuters.

Tulongfeng et Yitianzhen, deux outils chinois pour faire face à Mythos

Ces réflexes de protection du côté états-unien s’activent alors que c’est une autre entreprise chinoise qui se met en avant actuellement. 360 Digital Security Group, aussi connue sous le nom de Qihoo 360 notamment pour ses antivirus, a annoncé ce mercredi 24 juin avoir développé un outil qui serait la réponse chinoise à Mythos d’Anthropic. Reuters explique que le fondateur de l’entreprise, Zhou Hongyi, a dévoilé son projet nommé « Yitian Tulong » qui rassemble deux outils : Tulongfeng et Yitianzhen. Le premier est conçu pour détecter des vulnérabilités logicielles et le second pour automatiser la cyberdéfense et la gestion des incidents.

Tulongfeng aurait, selon lui, identifié 3 432 failles logicielles (dont 105 confirmées par les autorités chinoises) sans qu’il ne soit possible de vérifier cette affirmation.

  •  

IA générative : Anthropic accuse Alibaba de distiller ses modèles

Anti-anthropic
IA générative : Anthropic accuse Alibaba de distiller ses modèles

Anthropic a récemment alerté les élus états-uniens au sujet de la récupération massive de données sur ses outils par Alibaba, accusant son concurrent chinois de distiller ses modèles de façon illégitime. En parallèle, l’administration Trump interdit l’accès au marché de son département de la défense à plusieurs entreprises de Chine, alors qu’un équivalent chinois de Mythos est annoncé.

Après des semaines de bataille entre Anthropic et l’administration Trump, les États-Unis semblent resserrer les rangs alors qu’arrivent de nouveaux outils d’IA générative venant de Chine.

En effet, l’entreprise dirigée par Dario Amodei vient de nouveau de se plaindre auprès des élus de son pays à propos des pratiques de l’entreprise chinoise Alibaba. Le 10 juin, Anthropic a envoyé une lettre au sénateur républicain Tim ​Scott et à la sénatrice démocrate Elizabeth Warren qu’a pu obtenir ArsTechnica et dans laquelle elle affirme partager de « nouveaux éléments de preuve confidentiels concernant la plus vaste campagne visant à exploiter illicitement les capacités de Claude que nous ayons jamais observée ».

Une distillation toujours pas endiguée

L’entreprise y détaille qu’elle a observé entre le 22 avril et le 5 juin dernier « des opérateurs liés à Alibaba et à Alibaba Qwen, le laboratoire d’IA d’Alibaba » qui auraient généré « plus de 28,8 millions d’échanges avec Claude via près de 25 000 comptes frauduleux ». Elle considère que cette utilisation massive est contraire à ses conditions d’utilisation et qu’elle serait menée par Alibaba dans le but de « distiller » son modèle.

L’entreprise et sa concurrente états-unienne OpenAI avaient déjà proféré de telles accusations en février dernier contre d’autres entreprises chinoises : DeepSeek, Moonshot, et MiniMax. À l’époque, elle reconnaissait que « la distillation est une méthode d’entraînement largement utilisée et légitime. Par exemple, les laboratoires d’IA de pointe distillent régulièrement leurs propres modèles afin de créer des versions plus petites et moins coûteuses pour leurs clients ». Mais elle considérait que l’utilisation de cette technique était illicite si l’objectif était « acquérir les capacités puissantes d’autres laboratoires en une fraction du temps et à un coût bien inférieur », sans pour autant s’appuyer sur un texte légal.

Anthropic réitère donc son accusation en soulignant qu’Alibaba a réussi à échapper à la détection en « recourant à des techniques d’obfuscation et à des réseaux de proxys » et qu’« une économie de contournement [était] en pleine expansion » en Chine, ce qui rendrait les modèles Claude d’autant plus fragiles face à la distillation.

Alibaba sur une liste lui bloquant l’accès au marché du département de la Défense

« Alibaba est cotée à la Bourse de New York, exerce ses activités aux États-Unis et doit rendre des comptes aux investisseurs et aux régulateurs américains », affirme encore Anthropic dans sa lettre. Et elle ajoute que, « pourtant, cette activité s’est déroulée dans les semaines qui ont suivi » la note de service de Trump qui avait fait suite aux accusations d’OpenAI et Anthropic en affirmant que ces tentatives de créer des clones des outils d’IA générative états-uniens étaient « inacceptables ».

En parallèle de ces accusations se joue un bras de fer entre Alibaba et l’administration Trump. En effet, cette dernière a ajouté le 8 juin BYD, Baidu, NIO et Alibaba à sa liste des entreprises travaillant pour l’armée chinoise. Cette liste n’impose pas officiellement des sanctions, mais elle bloque l’accès du marché du département de la Défense états-unien aux entreprises qui y figurent. Alibaba a attaqué en justice cette décision ce mardi 23 juin, explique Reuters.

Tulongfeng et Yitianzhen, deux outils chinois pour faire face à Mythos

Ces réflexes de protection du côté états-unien s’activent alors que c’est une autre entreprise chinoise qui se met en avant actuellement. 360 Digital Security Group, aussi connue sous le nom de Qihoo 360 notamment pour ses antivirus, a annoncé ce mercredi 24 juin avoir développé un outil qui serait la réponse chinoise à Mythos d’Anthropic. Reuters explique que le fondateur de l’entreprise, Zhou Hongyi, a dévoilé son projet nommé « Yitian Tulong » qui rassemble deux outils : Tulongfeng et Yitianzhen. Le premier est conçu pour détecter des vulnérabilités logicielles et le second pour automatiser la cyberdéfense et la gestion des incidents.

Tulongfeng aurait, selon lui, identifié 3 432 failles logicielles (dont 105 confirmées par les autorités chinoises) sans qu’il ne soit possible de vérifier cette affirmation.

  •  

Mistral veut bousculer la gestion des documents avec son modèle OCR 4

Plus de dame du CDI
Mistral veut bousculer la gestion des documents avec son modèle OCR 4

Mistral a lancé la quatrième version de son modèle dédié à l’OCR, la reconnaissance de texte. Mais de simple extracteur de texte, le modèle spécialisé devient un parseur documentaire sémantique, que Mistral présente comme particulièrement adapté aux pipelines de recherche ou au RAG. L’entreprise parle désormais d’intelligence documentaire.

Le nouveau modèle Mistral OCR 4 lancé ce 23 juin vise l’extraction d’informations et la restitution de représentations structurées de documents entiers. Cette nouvelle version va donc plus loin que la seule extraction de données, au point que le nom même du modèle devient peu représentatif de ce qu’il a vraiment dans le ventre.

Selon Mistral en effet, OCR 4 « extrait et structure le contenu d’un large éventail de documents ». Tous les formats courants comme PDF, DOC, PPT et ODF sont pris en charge. « Là où les générations précédentes se concentraient sur la conversion d’une page en texte et tableaux clairs, OCR 4 restitue une représentation structurée du document », avec encadrés « englobants » (bounding boxes), classification par blocs et scores de confiance par page et par mot.

Ce que fait le nouveau modèle

Dans son communiqué, Mistral assure que ces encadrements étaient la fonction la plus demandée. OCR 4 prend ainsi en charge des données de localisation capables de présenter une traçabilité de l’information. Le modèle renvoie ainsi une représentation en couches dans laquelle chaque bloc est localisé dans une boite, classé par type (titre, tableau, équation, signature, etc.) et assorti d’une note de confiance.

Mais à quoi tout cela sert-il ? Sans ces informations, et avec les modèles précédents, les systèmes en aval ne pouvaient pas retracer un extrait jusqu’à sa source sur une page spécifique. Impossible de poser alors une question simple comme « D’où vient ce chiffre ? ». OCR 4 permet de résoudre ces problèmes selon Mistral.

Autre avantage de cette classification, un texte tagué comme « titre » peut segmenter un document en morceaux hiérarchiques pour une recherche sémantique. En fait, chaque morceau d’un document, une fois étiqueté, peut être acheminé vers un pipeline de traitement spécifique ou non. Si l’on prend le cas des éléments reconnus comme signatures par exemple, ils peuvent alors être repris dans des flux de travail dans un système de conformité.

Mistral indique que ces opérations ne sont pas nouvelles en soi. En revanche, le nouveau modèle les intègre toutes, annulant pour les clients le besoin d’entreprendre eux-mêmes ces traitements et analyses. OCR 4 propose ainsi une fonction triple : localisation spatiale, typage sémantique et confiance. Les zones ayant une confiance faible pourront par exemple être automatiquement routées vers des vérificateurs humains. À l’inverse, les éléments obtenant une note élevée pourront intégrés automatiquement dans les flux de travail.

La reconnaissance de texte est rarement la finalité dans ce type de processus. Le développement de systèmes RAG, des flux de travail agentiques ou tout ce qui touche à une forme d’automatisation avec les documents demande plus de temps que cette étape. OCR 4 veut justement taper dans la fourmilière en proposant une solution capable de faire sauter toute l’étape de reconstruction, avec à la clé des économies, aussi bien sur les coûts de l’OCR proprement dit que sur les heures investies par les ingénieurs chargés du reste. C’est du moins ce qu’affirme Mistral.

Scores à l’appui

Pour prouver le sérieux de sa nouvelle offre, l’entreprise donne plusieurs chiffres. Des annotateurs indépendants auraient ainsi préféré OCR 4 dans 72 % des cas face « à tous les principaux systèmes OCT et IA documentaires testés ». Le modèle de Mistral affiche également un score de 85,20 % sur le benchmark OlmOCRBench, prenant la première place. Le modèle prend en charge 170 langues réparties dans 10 groupes linguistiques, « avec des gains mesurables sur les langues spécialisées et à faibles ressources où plusieurs systèmes concurrents se dégradent ».

Mistral affirme également que son modèle est suffisamment compact pour être déployé dans un seul conteneur. Le Français met ce point en avant, évoquant les gains de confidentialité, de conformité et – bien sûr – de souveraineté. Plusieurs témoignages élogieux sont de la partie dans le billet de blog, de même que sur X.

La tarification proposée via l’API est de 4 dollars pour 1 000 pages, avec une remise de 50 % sur l’API par lots. Si les développeurs passent par Document AI, le tarif passe à 5 dollars pour 1 000 pages. Les cas d’utilisation recommandés sont ceux attendus : analyse et extraction de documents, RAG, flux de travail agentiques, pipelines de données structurées utilisant des scores de confiance, et recherches en bases de connaissances.

Mistral tient cependant à rappeler que son nouveau modèle vise la compréhension, pas l’aide à la décision. « Il n’est pas destiné au diagnostic médical, aux conseils ou jugements juridiques, aux décisions financières à enjeux élevés, aux systèmes critiques pour la sécurité, au traitement en temps réel ou sensible à la latence, ni aux entrées non documentaires (audio brut, vidéo, etc.) », indique l’entreprise.

  •  

Mistral veut bousculer la gestion des documents avec son modèle OCR 4

Plus de dame du CDI
Mistral veut bousculer la gestion des documents avec son modèle OCR 4

Mistral a lancé la quatrième version de son modèle dédié à l’OCR, la reconnaissance de texte. Mais de simple extracteur de texte, le modèle spécialisé devient un parseur documentaire sémantique, que Mistral présente comme particulièrement adapté aux pipelines de recherche ou au RAG. L’entreprise parle désormais d’intelligence documentaire.

Le nouveau modèle Mistral OCR 4 lancé ce 23 juin vise l’extraction d’informations et la restitution de représentations structurées de documents entiers. Cette nouvelle version va donc plus loin que la seule extraction de données, au point que le nom même du modèle devient peu représentatif de ce qu’il a vraiment dans le ventre.

Selon Mistral en effet, OCR 4 « extrait et structure le contenu d’un large éventail de documents ». Tous les formats courants comme PDF, DOC, PPT et ODF sont pris en charge. « Là où les générations précédentes se concentraient sur la conversion d’une page en texte et tableaux clairs, OCR 4 restitue une représentation structurée du document », avec encadrés « englobants » (bounding boxes), classification par blocs et scores de confiance par page et par mot.

Ce que fait le nouveau modèle

Dans son communiqué, Mistral assure que ces encadrements étaient la fonction la plus demandée. OCR 4 prend ainsi en charge des données de localisation capables de présenter une traçabilité de l’information. Le modèle renvoie ainsi une représentation en couches dans laquelle chaque bloc est localisé dans une boite, classé par type (titre, tableau, équation, signature, etc.) et assorti d’une note de confiance.

Mais à quoi tout cela sert-il ? Sans ces informations, et avec les modèles précédents, les systèmes en aval ne pouvaient pas retracer un extrait jusqu’à sa source sur une page spécifique. Impossible de poser alors une question simple comme « D’où vient ce chiffre ? ». OCR 4 permet de résoudre ces problèmes selon Mistral.

Autre avantage de cette classification, un texte tagué comme « titre » peut segmenter un document en morceaux hiérarchiques pour une recherche sémantique. En fait, chaque morceau d’un document, une fois étiqueté, peut être acheminé vers un pipeline de traitement spécifique ou non. Si l’on prend le cas des éléments reconnus comme signatures par exemple, ils peuvent alors être repris dans des flux de travail dans un système de conformité.

Mistral indique que ces opérations ne sont pas nouvelles en soi. En revanche, le nouveau modèle les intègre toutes, annulant pour les clients le besoin d’entreprendre eux-mêmes ces traitements et analyses. OCR 4 propose ainsi une fonction triple : localisation spatiale, typage sémantique et confiance. Les zones ayant une confiance faible pourront par exemple être automatiquement routées vers des vérificateurs humains. À l’inverse, les éléments obtenant une note élevée pourront intégrés automatiquement dans les flux de travail.

La reconnaissance de texte est rarement la finalité dans ce type de processus. Le développement de systèmes RAG, des flux de travail agentiques ou tout ce qui touche à une forme d’automatisation avec les documents demande plus de temps que cette étape. OCR 4 veut justement taper dans la fourmilière en proposant une solution capable de faire sauter toute l’étape de reconstruction, avec à la clé des économies, aussi bien sur les coûts de l’OCR proprement dit que sur les heures investies par les ingénieurs chargés du reste. C’est du moins ce qu’affirme Mistral.

Scores à l’appui

Pour prouver le sérieux de sa nouvelle offre, l’entreprise donne plusieurs chiffres. Des annotateurs indépendants auraient ainsi préféré OCR 4 dans 72 % des cas face « à tous les principaux systèmes OCT et IA documentaires testés ». Le modèle de Mistral affiche également un score de 85,20 % sur le benchmark OlmOCRBench, prenant la première place. Le modèle prend en charge 170 langues réparties dans 10 groupes linguistiques, « avec des gains mesurables sur les langues spécialisées et à faibles ressources où plusieurs systèmes concurrents se dégradent ».

Mistral affirme également que son modèle est suffisamment compact pour être déployé dans un seul conteneur. Le Français met ce point en avant, évoquant les gains de confidentialité, de conformité et – bien sûr – de souveraineté. Plusieurs témoignages élogieux sont de la partie dans le billet de blog, de même que sur X.

La tarification proposée via l’API est de 4 dollars pour 1 000 pages, avec une remise de 50 % sur l’API par lots. Si les développeurs passent par Document AI, le tarif passe à 5 dollars pour 1 000 pages. Les cas d’utilisation recommandés sont ceux attendus : analyse et extraction de documents, RAG, flux de travail agentiques, pipelines de données structurées utilisant des scores de confiance, et recherches en bases de connaissances.

Mistral tient cependant à rappeler que son nouveau modèle vise la compréhension, pas l’aide à la décision. « Il n’est pas destiné au diagnostic médical, aux conseils ou jugements juridiques, aux décisions financières à enjeux élevés, aux systèmes critiques pour la sécurité, au traitement en temps réel ou sensible à la latence, ni aux entrées non documentaires (audio brut, vidéo, etc.) », indique l’entreprise.

  •  

Washington voudrait embarquer l’UE dans une alliance IA face à la Chine

Le contrat de défiance
Washington voudrait embarquer l’UE dans une alliance IA face à la Chine

Branche d’olivier ou coup fourré ? L’administration Trump aurait proposé à l’Union européenne un partenariat sur l’IA, dans le but de créer une alliance pour sécuriser l’approvisionnement en composants indispensables aux datacenters IA.

Washington chercherait à nouer un partenariat avec l’Union européenne sur l’IA. Bloomberg a obtenu un brouillon de la proposition, présentée à plusieurs États membres cette semaine. On peut y lire des mots étonnants provenant de l’administration Trump : « nous partageons l’idée que l’avenir de l’IA doit reposer sur des bases de collaboration de confiance, de sécurité économique, d’innovation et de concurrence loyale ».

L’ennemi de mon ennemi

Depuis le retour de Donald Trump à la Maison Blanche, les relations transatlantiques ont été pour le moins chahutées. Les tensions commerciales, la pression sur la régulation européenne du numérique et les restrictions d’accès à des technologies américaines ont réduit la confiance à une peau de chagrin. Dans ce contexte, voir Washington parler de « collaboration de confiance » et de « concurrence loyale » a quelque chose de croquignolet.

Plusieurs capitales auraient d’ailleurs exprimé des inquiétudes : elles estiment qu’un tel partenariat servirait de véhicule aux États-Unis pour promouvoir leur propre écosystème IA, au détriment des entreprises européennes du secteur. L’idée serait de créer une alliance en vue de sécuriser la chaîne de production des composants indispensables aux centres de données IA, alors que la concurrence avec la Chine ne faiblit pas.

Les discussions autour d’un partenariat sur l’IA tombent au plus mauvais moment (ou au meilleur, selon le point de vue), quelques semaines après le blocage de Fable 5 et Mythos 5 pour les ressortissants étrangers. Une interdiction provenant des autorités états-uniennes et qui a soulevé des craintes partout en Europe : sur un coup de tête, Donald Trump peut priver le vieux continent d’une technologie américaine.

Que des États membres de l’UE échaudés par la brutalité de Washington voient cette nouvelle initiative américaine d’un mauvais œil n’est donc pas complètement dénué de sens. Malheureusement, les détails sur ce partenariat sont assez ténus. Le projet de déclaration commune tiendrait sur une seule page, qui appelle à une coopération dans trois domaines : le soutien à la recherche et au développement ; l’exportation des technologies IA vers des pays partenaires ; et surtout, la promotion d’une « réglementation favorable à l’innovation ». Un dernier point qui pose question, alors que les États-Unis ferraillent contre le DMA/DSA et les taxes européennes sur les grandes plateformes du numérique, justement au nom de l’innovation.

Dialogue de sourds

La Commission a en tout cas pris son bâton de pèlerin cette semaine, en faisant le voyage dans la capitale américaine. Henna Virkkunen, vice-présidente chargée de la Souveraineté technologique, a abordé le sujet de l’interdiction des derniers modèles IA d’Anthropic « [elle]-même avec l’administration Trump ». Des discussions ont aussi eu lieu avec l’entreprise.

Henna Virkkunen a également répété que l’UE devait avoir accès à ces modèles avancés pour identifier les vulnérabilités dans le code logiciel, tout en affirmant que l’Europe devait aussi être en mesure de développer ses propres capacités en la matière. Un « plan d’action pour le continent IA » avait été présenté il y a un peu plus d’un an, mais les technologies avancent beaucoup plus vite que les réglementations.

Les États-Unis ont l’art de manier la carotte et le bâton. Car en parallèle, le projet de loi MATCH Act en cours de discussion au Congrès vise à empêcher les fabricants chinois de puces d’accéder à certains équipements occidentaux de production de semi-conducteurs. De quoi frapper de plein fouet ASML, le géant néerlandais de la lithographie, dont les machines sont au cœur de la fabrication des puces les plus avancées.

Sjoerd Sjoerdsma, le ministre du Commerce du pays, a rencontré ce mardi son homologue américain, Howard Lutnick, ainsi que des représentants politiques pour faire entendre la voix des Pays-Bas. Le texte est actuellement en discussion au Congrès. « Il est exceptionnel que je vienne ici exposer largement nos préoccupations devant le Congrès », a-t-il déclaré, toujours à Bloomberg. « Nous le faisons parce que ces préoccupations sont importantes et parce que les enjeux pour les Pays-Bas pourraient être très élevés. »

Le ministre veut lui aussi empêcher des technologies sensibles de se retrouver « là où elles pourraient nuire à notre sécurité ». Mais pour lui, cela doit se faire sur une base volontaire. « Si cela implique des mesures de coercition par-delà les frontières et l’Atlantique, eh bien, c’est à nous, en tant que pays, d’en décider. Nous trouvons donc cela vraiment regrettable », conclut-il.

  •  

Washington voudrait embarquer l’UE dans une alliance IA face à la Chine

Le contrat de défiance
Washington voudrait embarquer l’UE dans une alliance IA face à la Chine

Branche d’olivier ou coup fourré ? L’administration Trump aurait proposé à l’Union européenne un partenariat sur l’IA, dans le but de créer une alliance pour sécuriser l’approvisionnement en composants indispensables aux datacenters IA.

Washington chercherait à nouer un partenariat avec l’Union européenne sur l’IA. Bloomberg a obtenu un brouillon de la proposition, présentée à plusieurs États membres cette semaine. On peut y lire des mots étonnants provenant de l’administration Trump : « nous partageons l’idée que l’avenir de l’IA doit reposer sur des bases de collaboration de confiance, de sécurité économique, d’innovation et de concurrence loyale ».

L’ennemi de mon ennemi

Depuis le retour de Donald Trump à la Maison Blanche, les relations transatlantiques ont été pour le moins chahutées. Les tensions commerciales, la pression sur la régulation européenne du numérique et les restrictions d’accès à des technologies américaines ont réduit la confiance à une peau de chagrin. Dans ce contexte, voir Washington parler de « collaboration de confiance » et de « concurrence loyale » a quelque chose de croquignolet.

Plusieurs capitales auraient d’ailleurs exprimé des inquiétudes : elles estiment qu’un tel partenariat servirait de véhicule aux États-Unis pour promouvoir leur propre écosystème IA, au détriment des entreprises européennes du secteur. L’idée serait de créer une alliance en vue de sécuriser la chaîne de production des composants indispensables aux centres de données IA, alors que la concurrence avec la Chine ne faiblit pas.

Les discussions autour d’un partenariat sur l’IA tombent au plus mauvais moment (ou au meilleur, selon le point de vue), quelques semaines après le blocage de Fable 5 et Mythos 5 pour les ressortissants étrangers. Une interdiction provenant des autorités états-uniennes et qui a soulevé des craintes partout en Europe : sur un coup de tête, Donald Trump peut priver le vieux continent d’une technologie américaine.

Que des États membres de l’UE échaudés par la brutalité de Washington voient cette nouvelle initiative américaine d’un mauvais œil n’est donc pas complètement dénué de sens. Malheureusement, les détails sur ce partenariat sont assez ténus. Le projet de déclaration commune tiendrait sur une seule page, qui appelle à une coopération dans trois domaines : le soutien à la recherche et au développement ; l’exportation des technologies IA vers des pays partenaires ; et surtout, la promotion d’une « réglementation favorable à l’innovation ». Un dernier point qui pose question, alors que les États-Unis ferraillent contre le DMA/DSA et les taxes européennes sur les grandes plateformes du numérique, justement au nom de l’innovation.

Dialogue de sourds

La Commission a en tout cas pris son bâton de pèlerin cette semaine, en faisant le voyage dans la capitale américaine. Henna Virkkunen, vice-présidente chargée de la Souveraineté technologique, a abordé le sujet de l’interdiction des derniers modèles IA d’Anthropic « [elle]-même avec l’administration Trump ». Des discussions ont aussi eu lieu avec l’entreprise.

Henna Virkkunen a également répété que l’UE devait avoir accès à ces modèles avancés pour identifier les vulnérabilités dans le code logiciel, tout en affirmant que l’Europe devait aussi être en mesure de développer ses propres capacités en la matière. Un « plan d’action pour le continent IA » avait été présenté il y a un peu plus d’un an, mais les technologies avancent beaucoup plus vite que les réglementations.

Les États-Unis ont l’art de manier la carotte et le bâton. Car en parallèle, le projet de loi MATCH Act en cours de discussion au Congrès vise à empêcher les fabricants chinois de puces d’accéder à certains équipements occidentaux de production de semi-conducteurs. De quoi frapper de plein fouet ASML, le géant néerlandais de la lithographie, dont les machines sont au cœur de la fabrication des puces les plus avancées.

Sjoerd Sjoerdsma, le ministre du Commerce du pays, a rencontré ce mardi son homologue américain, Howard Lutnick, ainsi que des représentants politiques pour faire entendre la voix des Pays-Bas. Le texte est actuellement en discussion au Congrès. « Il est exceptionnel que je vienne ici exposer largement nos préoccupations devant le Congrès », a-t-il déclaré, toujours à Bloomberg. « Nous le faisons parce que ces préoccupations sont importantes et parce que les enjeux pour les Pays-Bas pourraient être très élevés. »

Le ministre veut lui aussi empêcher des technologies sensibles de se retrouver « là où elles pourraient nuire à notre sécurité ». Mais pour lui, cela doit se faire sur une base volontaire. « Si cela implique des mesures de coercition par-delà les frontières et l’Atlantique, eh bien, c’est à nous, en tant que pays, d’en décider. Nous trouvons donc cela vraiment regrettable », conclut-il.

  •  

Meta remplace ses modérateurs par de l’IA

AIttention danger
Meta remplace ses modérateurs par de l’IA

Meta veut laisser à l’IA les clés de la modération sur ses réseaux sociaux. Ou tout du moins, d’une très grande partie. Les LLM sont appelés à trancher toujours plus de contenus, de publicités et de recours d’utilisateurs, au moment même où le groupe cherche à réduire ses coûts.

La modération humaine a vécu chez Meta. L’entreprise a l’intention de la remplacer par de l’IA générative qui sera chargée d’évaluer les contenus, les publicités, ainsi que les recours des utilisateurs. Selon plusieurs sources du Financial Times, Meta aurait remplacé environ 50 % des demandes de révision humaine par des LLM cette année. L’objectif est d’aller encore plus loin : possiblement plus de 90 % pour certains types de contenus d’ici la fin de l’année.

L’IA peut-elle résoudre l’équation de la modération ?

Les premiers tests réalisés par Meta depuis le mois de mars montrent qu’en moyenne, l’IA commettrait 13 % d’erreurs en moins que les humains quand il s’agit d’intervenir sur des contenus enfreignant les règles de modération. Elle identifierait 10 % d’infractions réelles en plus. « L’objectif de ce travail est d’améliorer nos efforts d’application des règles, et nous déployons ces systèmes d’IA plus avancés dès lors que nous sommes certains qu’ils obtiennent systématiquement de meilleurs résultats que nos méthodes actuelles de modération des contenus », a assuré l’entreprise au FT.

Mais ces mêmes sources anonymes indiquent que les modèles IA continuent de se tromper, par exemple en retirant ou en limitant la visibilité de contenus pourtant inoffensifs. C’est notamment le cas pour la satire, les évolutions de langage, les contenus ambigus. Autre écueil, l’entreprise n’aurait pas établi la manière de mesurer les performances de ces systèmes. Meta conteste et affirme avoir des processus de contrôle solides, avec des évaluations continues et des échantillons vérifiés par des humains. Le groupe a beaucoup à prouver ici, après qu’un agent IA maison a permis à des malandrins de pirater 34 000 comptes Instagram

Ce passage à la modération par IA n’est pas non plus un moyen de réduire les coûts, affirme encore le groupe, il s’agit d’exploiter une technologie qui évolue rapidement. Cela reste à voir : Meta s’est engagé dans un vaste plan d’économies, occasionnant des milliers de licenciements. Y compris au sein des équipes dédies à l’IA. Les sous-traitants chargés de la modération voient eux aussi leurs contrats se réduire ou ne pas être renouvelés.

Dernier point et pas des moindres, la modération des publicités. En novembre dernier, une enquête de Reuters montrait qu’environ 10 % du chiffre d’affaires annuel (de 2024) provenait de réclames pour des arnaques ou des produits interdits. Confier davantage de décisions de modération de la pub à l’IA a de quoi inquiéter, surtout si les garde-fous ne sont pas irréprochables.

Ce passage à l’IA sur la question aussi sensible de la modération de contenus sera une épreuve de feu pour Muse Spark. En interne, les équipes utilisent Gemini, mais il leur a été demandé de passer au nouveau modèle du labo IA de Meta.

En janvier 2025, Mark Zuckerberg amorçait un nouveau virage pour la modération sur les réseaux sociaux de son entreprise pour « revenir à nos racines autour de la liberté d’expression ». Arrêt des programmes de vérification des faits, plus grande permissivité pour la désinformation ainsi qu’aux insultes envers les femmes et les minorités autorisées, « notes de communauté » comme sur X/Twitter…

Ces changements, réalisés au moment où Donald Trump revenait au pouvoir, ont effectivement libéré une certaine parole. Les menaces violentes, les discours de haine et le harcèlement ont explosé à l’encontre des représentants du monde politique américain.

  •  
❌