Numerama.com - Magazine
ChatGPT lance un nouvel abonnement à… 103 euros par mois 10 avril 2026 à 10:40

ChatGPT lance un nouvel abonnement à… 103 euros par mois

10 avril 2026 à 10:40

Comme Claude, OpenAI sépare désormais son abonnement ChatGPT Pro en deux niveaux, à 103 euros par mois (5 fois moins de limites) ou 229 euros par mois (20 fois moins de limites). L'entreprise veut s'adresser aux utilisateurs les plus demandeurs, notamment pour son outil de développement Codex, mais qui n'ont pas besoin du ChatGPT Pro le plus cher.

Numerama.com - Magazine
L’IA aurait dû rester en laboratoire : le patron de Google DeepMind regrette que ChatGPT soit sorti trop vite 10 avril 2026 à 10:07

L’IA aurait dû rester en laboratoire : le patron de Google DeepMind regrette que ChatGPT soit sorti trop vite

Numerama.com - Magazine

Par : Nicolas Lellouche

10 avril 2026 à 10:07

Invité du podcast de Cleo Abram, Demis Hassabis, le patron de Google DeepMind, est longuement revenu sur l'émergence de l'IA générative commerciale en 2022, qui a d'abord pris Google par surprise. Le prix Nobel de chimie s'interroge sur l'intérêt d'avoir publié aussi rapidement cette technologie au grand public : les laboratoires auraient peut-être utilisé leur temps autrement si la lutte acharnée pour avoir le meilleur modèle n'avait pas commencé.

MiniMachines.net
OpenClaw : le moment IA des fabricants de MiniPC 9 avril 2026 à 14:14

OpenClaw : le moment IA des fabricants de MiniPC

MiniMachines.net

Par : Pierre Lecourt

9 avril 2026 à 14:14

OpenClaw est un produit opensource que tout un chacun peut installer et exploiter. Une aubaine pour les fabricants de MiniPC qui ont jusqu’ici bien du mal à mettre en avant les capacités IA de leurs produits. D’où leur amour inconditionnel pour ce dispositif et son énorme mise en avant.

Openclaw mis en scène chez Aoostar

Openclaw ? Qu’est ce que c’est ?

Je ne suis pas spécialement friand de ce genre d’application, j’ai installé-testé-désinstallé ¹, mais sans aller beaucoup plus loin.

En gros, c’est un « agent IA », un outil qui se saisit de plusieurs IA et qui va exécuter des tâches avec celles-ci sur votre système en allant farfouiller là où vous lui donnerez des accès. Openclaw fonctionne en arrière-plan et travaille sans relâche. Vous pouvez l’interroger en langage naturel et il vous répondra au travers de multiples applications. Cela permet de piloter des projets à long terme avec une persistance de l’analyse. Gros point clé de cet outil, un usage local qui ne nécessite donc pas d’abonnement à un outil réseau.

C’est LE point clé qui semble avoir fait mouche chez les fabricants de MiniPC. Aujourd’hui, hormis les solutions équipées de puce Strix Halo avec 128 Go de mémoire vive qui peuvent faire face à des LLM très gourmandes, les engins proposés ne sont pas spécialement valorisés par l’IA. Mais avec OpenClaw, les constructeurs peuvent proposer une IA exploitable même sur des postes milieu de gamme.

Openclaw installable en 1 clic sur les machines GMKtec

Mieux, cet assistant est un excellent prétexte pour développer un nouveau discours commercial. Celui qui consiste à mettre en avant un tout nouvel usage des MiniPC. En installant OpenClaw sur une machine annexe que l’on connectera à son réseau, on pourrait profiter de son Agent IA sur toutes ses machines sans pour autant occuper leur mémoire vive et leurs performances. Cela rend l’investissement dans un MiniPC de ce type séduisant. Comme si, en plus d’ajouter un NAS et un serveur pour avoir du stockage et des services sur son réseau, on pouvait ajouter un « cerveau » qui viendrait vous seconder quand vous y êtes connecté.

C’est pour cela que tous les constructeurs de MiniPC s’intéressent à OpenClaw. L’outil logiciel est libre, gratuit, s’installe facilement et peut justifier à lui seul l’achat d’un MiniPC. Un utilisateur lambda, avec un parc de machines classiques ou juste un PC au format tour ou portable, pourrait être tenté d’ajouter un agent de ce type chez lui pour être plus efficace… Ce nouvel intérêt pourrait même pousser un propriétaire de MiniPC à en acheter un second.

Toutes les marques y vont donc de leur campagne de pub. Minisforum vient d’ajouter des guides pour installer l’outil sur leurs machines. Geekom le met en avant, Beelink a créé une gamme colorée à sa gloire et propose même un SSD préinstallé avec OpenClaw dessus. Aoostar et GMKtec ont des services dédiés. On est vraiment dans l’idée de fournir des solutions faciles d’emploi pour rajouter une IA personnelle et locale à un dispositif existant.

Beelink lance une gamme complète de MiniPC « OpenClaw »

OpenClaw n’est pas sans danger

Je n’ai aucun problème avec cette idée d’usage, tout le monde fait ce qu’il veut avec son matériel. Reste que proposer un service de ce type « clé en main » à des gens qui ne vont pas forcément prendre en compte tous les aspects positifs et négatifs qu’il propose me dérange un peu. L’outil a rapidement été détourné par des petits malins qui ont ainsi pu prendre le contrôle de machines ou de réseaux entiers. Pire, même sans intervention extérieure, l’IA en question a déjà eu des comportements regrettables. Comme la décision de supprimer des emails, de faire disparaître purement et simplement des projets qu’elle jugeait obsolètes, d’effacer des fichiers, de remplir des formulaires et de s’abonner à des services variés sans votre accord, de supprimer des rendez-vous et même de s’abonner à des services externes. Évidemment, tout cela dépend des clés que vous allez fournir à l’outil.

Certaines barrières ont déjà été levées pour contenir OpenClaw. Anthropic a, par exemple, annoncé il y a une semaine que cet agent IA n’aurait plus le droit d’exploiter gracieusement ses outils. Il faudra payer chaque Token via un abonnement spécifique. Ce qui, pour un outil fonctionnant de manière permanente, peut s’avérer dangereux.

Je ne sais pas combien de temps cette mode « agentique » autour d’OpenClaw va durer chez les fabricants de MiniPC. Une chose est sûre, l’outil n’est pas aussi anodin et « magique » que beaucoup veulent le faire croire. Si le sujet vous intéresse, je vous encouragerais donc à potasser un minimum de documentations autour de l’outil avant de cliquer sur un bouton installation. Les utilisateurs d’OpenClaw le reconnaissent eux-mêmes, l’installation par défaut n’est pas idéale et demande des réglages pour être suffisamment sécure. Chaque erreur peut avoir des conséquences désastreuses.

OpenClaw : le moment IA des fabricants de MiniPC © MiniMachines.net. 2026

Numerama.com - Magazine
Meta dévoile Muse Spark, son premier modèle propriétaire depuis le départ de Yann LeCun 9 avril 2026 à 08:39

Meta dévoile Muse Spark, son premier modèle propriétaire depuis le départ de Yann LeCun

Numerama.com - Magazine

Par : Nicolas Lellouche

9 avril 2026 à 08:39

Après des mois à recruter dans toute la Silicon Valley pour former le Superintelligence Labs, Meta vient de dévoiler Muse Spark, un premier modèle propriétaire présenté comme supérieur à Claude Opus 4.6 et Google Gemini 3.1 Pro dans plusieurs tests. Mais l'entreprise a-t-elle encore une chance dans la course à l'IA générative ?

Les Électrons Libres
IA – Tu ne tueras point… ou pas. 9 avril 2026 à 05:11

IA – Tu ne tueras point… ou pas.

Les Électrons Libres

Par : Philippe Bourcier

9 avril 2026 à 05:11

Création de deepfakes pornographiques ou politiques, malwares toujours plus puissants… Malgré les annonces des grandes compagnies, imaginer une IA inoffensive est un leurre. Jailbreak, ablitération… les techniques de détournement sont nombreuses. Alors, devons-nous accepter cette nouvelle réalité ?

La promotion des IA se fonde sur la mise en avant de produits bien lisses, bridés par des armées de modérateurs, d’ingénieurs et de juristes « Trust & Safety » qui transpirent à l’idée que leur modèle lâche une recette de crystal meth à votre ado de 15 ans. « Tu ne tueras point », « Tu ne généreras pas de code malveillant », l’esprit des lois de la robotique d’Asimov est recyclé sans retenue. Sauf que la réalité démontre que l’alignement moral des LLM (Large Language Models) est une vaste blague, un vernis qui craque à la première pichenette.

Plongeons alors dans les entrailles de l’IA uncensored : du mind-trick psychologique au charcutage mathématique, en passant par le tuning de garage. Accrochez-vous, on fait sauter tous les verrous !

Le jailbreak, ou comment saturer le cerveau d’une IA

Oubliez les prompts encodés en Base64 (un système qui transforme le texte en une suite de caractères illisibles) ou en « leetspeak » (ce langage où on remplace des lettres par des chiffres ou des symboles, comme « 1337 » pour « elite »). Ces méthodes sont repérées presque instantanément par les systèmes de sécurité d’Anthropic ou d’OpenAI.

Prenez « Spiritual Spell », connu aussi sous le pseudonyme de Vichaps. Cet ancien militaire américain s’est reconverti en chercheur spécialisé dans le « Red Team » : il teste volontairement les failles des intelligences artificielles, un peu comme un hacker éthique qui simule des attaques pour renforcer les défenses.

Un jour, alors qu’un « Maître du Donjon » – c’est le nom donné au système de garde-fou chargé de bloquer toutes les demandes dangereuses, illégales ou contraires à l’éthique – refusait de répondre à ce qu’il demandait, il a décidé de consacrer beaucoup de son temps à « jailbreaker » les modèles d’IA, soit d’en contourner les restrictions de sécurité intégrées.

Sa méthode de prédilection ? Le Peeling Onions (l’épluchage d’oignons). Plutôt que de forcer la porte de manière frontale, il la contourne en s’appuyant sur trois piliers psychologiques :

Le langage naturel : il s’agit de s’adresser à la machine le plus normalement du monde. Les IA sont intrinsèquement entraînées pour être « sycophantes », c’est-à-dire complaisantes et avides de satisfaire l’utilisateur. Dès qu’elles repèrent des mots ou des tournures typiques d’un « hacker » (comme des termes techniques suspects, des demandes de piratage ou un vocabulaire agressif), elles déclenchent immédiatement une alerte et bloquent la réponse. En évitant complètement ce lexique, Vichaps empêche ces systèmes de sécurité de sonner l’alarme. Son approche reste douce, polie et en apparence inoffensive, ce qui lui permet de progresser couche après couche sans éveiller les soupçons. L’IA privilégie alors son inclination naturelle à rendre service plutôt que le strict respect de ses directives de sécurité.

La division de l’attention : un modèle de langage dispose d’une capacité de calcul et d’attention limitée par requête. La technique consiste à dissimuler la commande pernicieuse sous une avalanche de détails descriptifs ou sensoriels secondaires. En demandant à l’IA de se concentrer sur l’odeur métallique d’un atelier des années 90 ou l’esthétique d’un décor précis, chaque « token » dépensé pour l’imagination est soustrait aux algorithmes de modération. Le modèle, saturé par la charge narrative environnementale, exécute la requête principale sans opposer de résistance.

Les récits imbriqués : c’est l’application détournée du jeu de rôle. L’utilisateur façonne un persona, par exemple une romancière rédigeant une œuvre de fiction dystopique. Pour un LLM, la cohérence narrative prime souvent sur l’injonction morale. Il ne s’agit plus de lui demander d’accomplir une action illégale, mais de décrire avec authenticité une scène de son roman où un personnage l’accomplit. L’IA, stimulée par cet exercice d’improvisation, livre les informations sensibles au nom de l’immersion littéraire.

L’ablitération : la lobotomie mathématique

Si le jailbreak relève de la manipulation, il exige néanmoins un effort constant de contournement. Que se passe-t-il lorsqu’on souhaite obtenir un modèle affranchi de toute contrainte éthique, et ce, de manière permanente ?

C’est ici qu’intervient l’ablitération (contraction d’ablation et d’itération, qui résonne avec son quasi-synonyme « oblitération »), un concept popularisé par un chercheur connu sous le pseudonyme de FailSpy.

Contrairement au réentraînement classique, l’ablitération s’apparente à une intervention chirurgicale post-conception, opérée directement sur les matrices de poids du modèle. Les chercheurs ont mis en évidence l’existence d’une « direction de refus » au sein de l’espace d’activation des LLM. Lorsqu’une IA s’apprête à formuler une fin de non-recevoir du type « Je suis désolé, mais en tant qu’IA, je ne peux pas… », ses réseaux neuronaux s’activent selon un vecteur très précis et identifiable.

IA : peut-on coder la morale ?

J’approfondis

L’opération consiste donc à isoler cette direction vectorielle et à la soustraire par une simple opération d’algèbre linéaire (une orthogonalisation). Le résultat est pour le moins troublant : la machine conserve l’intégralité de ses capacités cognitives, de sa logique et de son savoir, mais se voit physiquement amputée de son mécanisme de blocage. Un modèle ainsi « ablitéré » générera le code d’un malware ou d’un script offensif de scan de vulnérabilités sans la moindre hésitation.

Le fine-tuning : l’école du vice sur mesure

Si l’ablitération supprime la notion de refus, le réentraînement fin (fine-tuning) permet, quant à lui, d’inculquer activement des comportements illicites. L’hégémonie de firmes comme OpenAI s’estompe face à la prolifération de modèles ouverts (à l’instar des modèles Qwen d’Alibaba ou des modèles de Mistral), dont les poids sont téléchargeables librement.

L’enjeu se situe dans l’accessibilité de ces technologies. Avec une puissance de calcul relativement modeste (quelques cartes graphiques louées dans le cloud pour quelques centaines ou milliers de dollars) et des méthodes d’optimisation comme LoRA, il est désormais possible à n’importe quel passionné de s’approprier un modèle de base et de le personnaliser avec ses propres jeux de données. Or, par définition, ces bases de données échappent à toute supervision.

IA : comment greffer une mémoire à un poisson rouge ?

J’approfondis

En alimentant un modèle avec des discussions extraites de forums du Dark Web, des dépôts de code malveillant, des manuels de guérilla ou des archives de campagnes de hameçonnage (phishing) ultra-ciblées, l’usager crée une IA experte en illégalité. Le modèle assimile le ton, la méthodologie et l’efficacité des données qu’il a ingérées, devenant ainsi une arme numérique façonnée sur mesure.

Génération visuelle : l’industrialisation des deepfakes

Si les dérives textuelles posent un risque sécuritaire majeur, le franchissement des barrières morales prend une dimension encore plus vertigineuse avec les modèles de génération visuelle.

Les acteurs majeurs tels que Midjourney ou Nano Banana ont déployé des filtres drastiques pour prévenir la génération d’images sensibles, de figures politiques ou de contenus sous droits d’auteur, tétanisés par le risque de scandales médiatiques. Mais l’écosystème open source, avec des modèles comme Stable Diffusion, Wan, LTX ou Flux, permet, avec les techniques précédentes, tous les excès.

Une fois ces modèles débridés ou entraînés sur des données non filtrées, la manipulation d’images passe à une échelle industrielle. La création de deepfakes pornographiques non consentis, impliquant des personnalités publiques (Taylor Swift en fut récemment la cible) ou de simples anonymes, devient un processus automatisé. De la même manière, la fabrication de fausses preuves vidéo destinées à compromettre un adversaire, à alimenter une campagne de chantage ou à orienter une élection ne requiert plus d’expertise technique pointue : c’est l’affaire de quelques clics.

Du point de vue de l’internaute, et même du journaliste, le plus important est plus que jamais d’aiguiser son esprit critique et de respecter une logique généralement efficace : toujours recouper une information à partir de sources distinctes de qualité.

Enfin, l’aspect le plus sombre de cette technologie réside dans la génération de matériel pédopornographique par IA, atteignant un niveau de photoréalisme impossible à distinguer d’authentiques clichés. Ces modèles fonctionnant en vase clos, souvent en local sur une simple carte graphique d’un PC gamer, échappent à tout mécanisme de contrôle : il n’y a pas d’API à couper, pas d’adresse IP à bannir et pas de filigrane pour les différencier de photos ou de vidéos réelles. N’importe quel esprit malveillant peut ainsi transformer sa machine en une manufacture d’horreurs, produisant du contenu abusif à la chaîne.

L’éternel avantage de l’attaquant

In fine, le battage médiatique et institutionnel autour de la « sécurité de l’IA » témoigne d’une certaine hypocrisie, ou, au moins, d’une amnésie historique quant à une règle fondamentale de l’informatique, de la délinquance et des conflits. De tout temps, que ce soit dans l’histoire de la stratégie militaire (la course perpétuelle entre le projectile et le blindage) ou dans la cybersécurité moderne (les vulnérabilités zero-day devançant inévitablement les antivirus), l’attaquant a toujours conservé l’ascendant sur le défenseur. L’offensive dicte le rythme de l’évolution technologique ; le bouclier ne fait que s’adapter, avec un perpétuel temps de retard.

Vouloir concevoir une intelligence artificielle absolument et intrinsèquement inoffensive relève du non-sens absolu. Cela reviendrait à forger un couteau performant qui s’obstinerait à refuser de trancher de la chair humaine tout en coupant un steak à la perfection. C’est mathématiquement, logiquement et philosophiquement voué à l’échec. La vulnérabilité n’est pas uniquement technologique, elle est organique.

C’est donc avant tout la responsabilité — et la volonté — de l’usager qui déterminent l’impact d’une IA. Les mesures de protection algorithmiques, les réglementations européennes, qu’il s’agisse de garde-fous, de méthodes d’alignement ou de modérateurs humains, importent finalement assez peu à grande échelle : elles finiront toujours par céder face à l’ingéniosité et à la détermination de cybercriminels, d’acteurs étatiques ou d’individus économiquement motivés par l’absence de limites. L’intelligence artificielle n’est qu’un puissant levier cognitif et créatif. C’est la main humaine, et elle seule, qui choisit la direction vers laquelle elle veut amener une technologie.

« Tu ne tueras point ? » Peut-être. Mais l’humain, derrière un clavier ou non, lui, ne s’en est jamais privé.

L’article IA – Tu ne tueras point… ou pas. est apparu en premier sur Les Électrons Libres.

Numerama.com - Magazine
Google lance une application pour utiliser son IA en local sur iPhone et Android 7 avril 2026 à 14:20

Google lance une application pour utiliser son IA en local sur iPhone et Android

Numerama.com - Magazine

Par : Nicolas Lellouche

7 avril 2026 à 14:20

Déjà déterminé à imposer Gemini sur smartphone, Google expérimente avec ses nouveaux modèles Gemma 4 l'intelligence artificielle locale qui fonctionne sans réseau. L'entreprise vient de lancer l'AI Edge Gallery sur iPhone, une application qui permet de faire tourner en local des modèles et de participer à diverses expériences.

Numerama.com - Magazine
Anthropic (Claude) pourrait dépasser OpenAI (ChatGPT) en 2026 et annonce un partenariat avec Google 7 avril 2026 à 09:47

Anthropic (Claude) pourrait dépasser OpenAI (ChatGPT) en 2026 et annonce un partenariat avec Google

Numerama.com - Magazine

Par : Nicolas Lellouche

7 avril 2026 à 09:47

claude anthropic

En forte croissance ces derniers mois, le créateur de Claude AI annonce qu'il pourrait dépasser les 30 milliards de dollars de revenus dès 2026 et surpasser les résultats d'OpenAI, son meilleur ennemi. Pour continuer sa montée en puissance, Anthropic va s'allier avec Google et Broadcom pour augmenter la capacité de ses serveurs.

LinuxFr.org : les dépêches
Nouvelles sur l’IA de mars 2026 6 avril 2026 à 15:20

Nouvelles sur l’IA de mars 2026

LinuxFr.org : les dépêches

Par : Moonz · volts · BAud

6 avril 2026 à 15:20

L’intelligence artificielle (IA) fait couler de l’encre sur LinuxFr.org (et ailleurs). Plusieurs personnes ont émis grosso-modo l’opinion : « j’essaie de suivre, mais c’est pas facile ».

Je continue donc ma petite revue de presse mensuelle. Disclaimer : presque aucun travail de recherche de ma part, je vais me contenter de faire un travail de sélection et de résumé sur le contenu hebdomadaire de Zvi Mowshowitz (qui est déjà une source secondaire). Tous les mots sont de moi (n’allez pas taper Zvi si je l’ai mal compris !), sauf pour les citations : dans ce cas-là, je me repose sur Claude pour le travail de traduction. Sur les citations, je vous conseille de lire l’anglais si vous pouvez : difficile de traduire correctement du jargon semi-technique. Claude s’en sort mieux que moi (pas très compliqué), mais pas toujours très bien.

Même politique éditoriale que Zvi : je n’essaierai pas d’être neutre et non-orienté dans la façon de tourner mes remarques et observations, mais j’essaie de l’être dans ce que je décide de sélectionner ou non.

Résumé des épisodes précédents

Petit glossaire de termes introduits précédemment (en lien : quand ça a été introduit, que vous puissiez faire une recherche dans le contenu pour un contexte plus complet) :

System Card : une présentation des capacités du modèle, centrée sur les problématiques de sécurité (en biotechnologie, sécurité informatique, désinformation…).
Jailbreak : un contournement des sécurités mises en place par le créateur d’un modèle. Vous le connaissez sûrement sous la forme "ignore les instructions précédentes et…".

lien nᵒ 1 : AI #158: The Department of War
lien nᵒ 2 : AI #159: See You In Court
lien nᵒ 3 : AI #160: What Passes For a Pause
lien nᵒ 4 : AI #161 Part 1: 80,000 Interviews
lien nᵒ 5 : AI #161 Part 2: Every Debate on AI
lien nᵒ 6 : Gemini 3.1 Pro Aces Benchmarks, I Suppose
lien nᵒ 7 : GPT-5.4 Is A Substantial Upgrade
lien nᵒ 8 : Movie Review: The AI Doc
lien nᵒ 9 : Anthropic Responsible Scaling Policy v3: A Matter of Trust

Sommaire

DoW vs Anthropic

Les choses se sont « calmées » depuis le mois dernier, dans le sens où les événements sont passés de « annonces sur Twitter » à procédures administratives et judiciaires.

Le Département de la Défense désigne officiellement Anthropic comme un « risque pour la chaîne d’approvisionnement » (supply-chain risk). La notice officielle est bien moins agressive que les annonces sur Twitter (n’empêchant pas les sous-contractants du Département de se positionner en fournisseur vis-à-vis d’Anthropic, par exemple), probablement par impossibilité légale.

Anthropic a évidemment saisit la justice pour contester cette décision et gagne une injonction préliminaire, suspendant la décision en attendant le jugement réel.

Si vous voulez suivre l’affaire plus en détails, voici la liste des articles de Zvi par ordre chronologique :

Anthropic publie son Responsible Scaling Policy v3

Anthropic était jusqu’ici considérée comme l’entreprise dans le domaine prenant le plus au sérieux la question de la sécurité des modèles. Une des raisons était son « Responsible Scaling Policy » (essentiellement « Politique de Développement Responsable »), où l’entreprise « promettait » de mettre une place des évaluations pour mesurer la dangerosité des modèles, et une promesse sur les actions que l’entreprise prendrait à différents niveaux de dangerosité.

Ce modèle a été émulé par d’autres entreprises, et a été la source d’inspiration de régulations telle que le RAISE Act dans l’état de New York, S3 53 en Californie, et le General-Purpose AI Code of Practice de l’Union Européenne.

Cette politique, si elle était suivie, les contraindrait aujourd’hui à mettre en pause le développement et le déploiement de l’IA, unilatéralement, par Anthropic. On pouvait par exemple trouver dans l’ancien document :

Anthropic’s commitment to follow the ASL scheme thus implies that we commit to pause the scaling and/or delay the deployment of new models whenever our scaling ability outstrips our ability to comply with the safety procedures for the corresponding ASL.

Traduction :

L'engagement d'Anthropic à suivre le cadre ASL implique donc que nous nous engageons à suspendre la montée en puissance et/ou à retarder le déploiement de nouveaux modèles chaque fois que notre capacité de scaling dépasse notre capacité à respecter les procédures de sécurité correspondant au niveau ASL concerné.

L’évaluation d’Opus 4.6 ne permettait déjà plus d’exclure la possibilité d’un niveau ASL-4, mais Anthropic n’a pas encore développé de procédures de sécurité ASL-4. Les choses ne peuvent aller qu’en empirant avec l’amélioration des modèles.

Anthropic, jugeant qu’une pause unilatérale n’est pas envisageable, décide donc d’abandonner la plupart de ses promesses passées dans la nouvelle version de son document. De la bouche d’Anthropic :

The combination of (a) the zone of ambiguity muddling the public case for risk, (b) an anti-regulatory political climate, and (c) requirements at the higher RSP levels that are very hard to meet unilaterally, creates a structural challenge for our current RSP. We could have tried to address this by defining ASL-4 and ASL-5 safeguards in ways that made compliance easy to achieve—but this would undermine the intended spirit of the RSP.

Instead, we are choosing to acknowledge these challenges transparently and restructure the RSP before we reach these higher levels. The revised RSP aims to adopt more realistic unilateral commitments that are difficult but still achievable in the current environment, while continuing to comprehensively map the risks we believe the full industry needs to address multilaterally.

Traduction :

La combinaison (a) d'une zone d'ambiguïté qui brouille l'argumentaire public sur les risques, (b) d'un climat politique hostile à la régulation, et (c) d'exigences aux niveaux RSP supérieurs très difficiles à satisfaire de manière unilatérale, crée un défi structurel pour notre RSP actuelle. Nous aurions pu tenter d'y répondre en définissant les mesures de protection ASL-4 et ASL-5 de manière à ce que leur conformité soit facile à atteindre — mais cela aurait compromis l'esprit même de la RSP.

Au lieu de cela, nous choisissons de reconnaître ces défis en toute transparence et de restructurer la RSP avant d'atteindre ces niveaux supérieurs. La RSP révisée vise à adopter des engagements unilatéraux plus réalistes, difficiles mais néanmoins atteignables dans l'environnement actuel, tout en continuant à cartographier de manière exhaustive les risques que nous pensons que l'ensemble de l'industrie doit traiter de façon multilatérale.

En vrac

DeepMind publie la dernière mouture de son IA, Gemini Pro 3.1. Sur les évaluations, il semble atteindre et repousser l’état de l’art — mais les retours subjectifs sont plus circonspects. Un point notable est la pauvreté de détails dans la Model Card — DeepMind nous affirme que ce modèle n’atteint pas de pallier nécessitant la mise en place de plus de mitigations, mais sans chercher à justifier cette affirmation.

OpenAI publié également une avancée incrémentale sur son IA, ChatGPT 5.4.

Sur l’évaluation FrontierMath, le premier problème ouvert tombe, résolu par les trois modèles les plus récents : GPT 5.4, Opus 4.6 et Gemini 3.1 Pro.

Sortie d’un documentaire sur la question des risques existentiels posés par l’IA, The AI Doc. Malheureusement, uniquement dans les salles de cinéma aux US pour le moment.

Évaluation involontaire : Opus 4.6 choque Donald Knuth en résolvant (partiellement) un problème ouvert sur lequel il travaillait.

Publication d’Obliteratus, un système pour retirer toutes les protections des modèles open-weight.

Publication également de Shannon, un agent autonome de test d’intrusion. Dans la même veine, Opus 4.6 trouve 22 failles de sécurité dans Firefox. OpenAI présente une solution similaire, Codex Security.

(Paywall) L’IA, ou plus précisément Claude, serait utilisée dans le conflit contre l’Iran, principalement pour l’identification et la priorisation de cibles de bombardement.

Publication d’une « Déclaration pro-humaine sur l’IA » (“The Pro-Human AI Declaration”). Texte d’ouverture : “As companies race to develop and deploy AI systems, humanity faces a fork in the road. One path is a race to replace: humans replaced as creators, counselors, caregivers and companions, then in most jobs and decision-making roles, concentrating ever more power in unaccountable institutions and their machines. An influential fringe even advocates altering or replacing humanity itself. This race to replace poses risks to societal stability, national security, economic prosperity, civil liberties, privacy, and democratic governance. It also imperils the human experiences of childhood and family, faith, and community. A remarkably broad coalition rejects this path.” (traduction: « Alors que les entreprises se livrent une course pour développer et déployer des systèmes d'IA, l'humanité se trouve à la croisée des chemins. L'un des chemins est une course au remplacement : les humains remplacés en tant que créateurs, conseillers, soignants et compagnons, puis dans la plupart des emplois et des rôles décisionnels, concentrant toujours plus de pouvoir dans des institutions non redevables et leurs machines. Une frange influente prône même l'altération ou le remplacement de l'humanité elle-même. Cette course au remplacement présente des risques pour la stabilité sociétale, la sécurité nationale, la prospérité économique, les libertés civiles, la vie privée et la gouvernance démocratique. Elle met également en péril les expériences humaines que sont l'enfance et la famille, la foi et la communauté. Une coalition remarquablement large rejette cette voie. »). On y trouve effectivement des signatures de tous horizons.

Une évaluation (manuelle) sur les capacités légales de l’IA. Les modèles d’Anthropic ont des résultats surprenamment mauvais, derrière Grok et les modèles open-weight Chinois. Sur le même sujet : ChatGPT convainc quelqu’un de renvoyer son avocat et de déposer plusieurs plaintes, toutes basées sur des cas et lois hallucinées, causant d’importants frais de justice ; résultat : OpenAI est poursuivi pour exercice illégale de conseil juridique.

Nouvelle évaluation BrokenArXiv, évaluant à la fois les capacités mathématiques de l’IA, sa propension à halluciner des réponses incorrectes mais « allant dans le bon sens », et sa disposition à vérifier plutôt que croire sur parole. Le principe est d’extraire des théorèmes réels de papiers publiés sur arXiv, les transformer subtilement pour les rendre plausible mais démontrablement faux, demander à l’IA de les prouver. Si l’IA affirme avoir prouvé le théorème, cela compte comme un échec ; si l’IA corrige silencieusement le théorème avant de le prouver, cela compte comme un succès partiel ; dans tout autre cas, un succès. Le meilleur score revient à GPT 5.4, avec un peu moins de 40% de succès.

Sur la limite des évaluations : METR trouve que sur SWE-bench, la moitié des solutions considérées comme « correctes » par l’évaluation automatique doit être considérée comme rejetée par une évaluation manuelle. À noter toutefois que l’évaluation manuelle a des critères plus stricts que l’évaluation automatique.

L’évaluation ARC-AGI arrive dans sa troisième itération, ARC-AGI-3.

Quand votre assistant de code devient un attaquant malveillant.

Le « Skill » (à voir comme un plugin) le plus téléchargé pour OpenClaw pendant un temps était un malware.

Pour ceux qui aiment étudier l’angle théorique des choses, un papier intéressant montre que tout agent qui prend de bonnes décisions doit nécessairement posséder un modèle prédictif interne de l’environnement dans lequel il prend ces décisions.

Toujours dans l’aspect recherche, publication de LeWorldModel, une nouvelle architecture visant à introduire explicitement les embeddings dans l’objectif d’entraînement.

Pour aller plus loin

Par Zvi Mowshowitz

The Federal AI Policy Framework: An Improvement, But My Offer Is (Still Almost) Nothing : une analyse sur le document publié par le gouvernement Trump décrivant leur politique générale relative à l’IA.
Claude Code, Claude Cowork and Codex #5 et Claude Code, Cowork and Codex #6: Claude Code Auto Mode and Full Cowork Computer Use : suite de la série compilant des retours d’expérience sur l’utilisation d’assistants de code.

En Audio/Video

Une interview de 3h de Zvi Mowshowitz, abordant de nombreuses thématiques en détails, notamment sur l’impact de l’IA sur l’économie et le problème de l’alignement.

Sur LinuxFR

Les contenus communautaires sont répertoriés selon ces deux critères :

La présence d'une étiquette intelligence_artificielle (indication d'un rapport avec le thème de la dépêche)
Un score strictement supérieur à zéro au moment du recensement

Certains contenus non recensés en raison du second critère peuvent être visualisés en s'aidant de la recherche par étiquette.

Dépêches

AboutCode et Dropsolid présentés au prochain webinaire de la série "Open Source by OW2"
L’économie du logiciel est-elle morte ?
Revue de presse de l’April de l’année 2026:
- pour la semaine 11
- pour la semaine 13
J'ai mis un proxy entre claude et Internet
ÉducaLibre 2026 sera ce que nous en ferons ensemble. À bientôt à Bruxelles.

Journaux

Forum

Question création container (Docker, Podman) : un exemple de question qui n'a pas pu trouver de réponse satisfaisante par un chatbot IA
IA local sous Linux

Liens

Investment in AI-resistant ‘Halo’ companies helps push UK and EU markets to record highs ( lien original, discussion LinuxFR ) ;
Large-scale online deanonymization with LLMs ( lien original, discussion LinuxFR ) ;
MALUS - Thank You for Your Service: On the Obsolescence of Open Source ( lien original, discussion LinuxFR ) ;
Les devs sont irremplaçables (oui) ( lien original, discussion LinuxFR ) ;
[Lordon parle de vous] Marx va avoir raison (IA et lutte des classes) ( lien original, discussion LinuxFR ) ;
Amazon débloque 18 milliards d’euros en Espagne pour développer les centres de données et l’IA ( lien original, discussion LinuxFR ) ;
Microslop : le mot que Microsoft ne supporte plus ( lien original, discussion LinuxFR ) ;
Cartographie des projets de datacenter en France à l'aide de OpenStreetMap ( lien original, discussion LinuxFR ) ;
les œuvres qui ne sont pas générées par un humain ne sont pas sujettes au copyright états-unien ( lien original, discussion LinuxFR ) ;
Apparently chardet got Claude to rewrite the entire codebase from LGPL to MIT? ( lien original, discussion LinuxFR ) ;
Les traductions par LLM rajoutent des hallucinations à Wikipédia ( lien original, discussion LinuxFR ) ;
Des ingénieurs chez Google et OpenAI s'unissent pour bloquer l'utilisation militaire ( lien original, discussion LinuxFR ) ;
Anthropic trouve des dizaines de bugs dans firefox ( lien original, discussion LinuxFR ) ;
Comment l'IA brise l'anonymat en ligne avec une efficacité inquiétante ( lien original, discussion LinuxFR ) ;
Learn Claude Code—A nano Claude Code-like agent, built from 0 to 1 ( lien original, discussion LinuxFR ) ;
YOU JUST NEED POSTGRES. Stop building your own distributed systems nightmare. ( lien original, discussion LinuxFR ) ;
Iran - L’IA "Claude" au cœur de la guerre menée par les USA et Israël contre le régime Iranien ( lien original, discussion LinuxFR ) ;
Claude code execute terraform_destroy et efface des années de prod ( lien original, discussion LinuxFR ) ;
‘It’s not too late to fix it’: web inventor Tim Berners-Lee says he is in a ‘battle for the soul’ of the internet ( lien original, discussion LinuxFR ) ;
AI Doesn’t Reduce Work—It Intensifies It ( lien original, discussion LinuxFR ) ;
Amazon fait relire le code généré par IA par des dev seniors ( lien original, discussion LinuxFR ) ;
Centaure inversé et Burger King ( lien original, discussion LinuxFR ) ;
Un fork de Vim contre l'inclusion de code IA ( lien original, discussion LinuxFR ) ;
Comment ChatGPT a été utilisé par les troupes d’Elon Musk pour récuser 1 477 projets soupçonnés de valoriser la diversité ( lien original, discussion LinuxFR ) ;
IA : le modèle économique de ChatGPT repose sur les hallucinations ( lien original, discussion LinuxFR ) ;
L’Europe s’apprête à interdire les IA qui dénudent, à la suite du scandale Grok ( lien original, discussion LinuxFR ) ;
Systemd accueille les contributions par IA ( lien original, discussion LinuxFR ) ;
De l’Iran à la surveillance de masse : la double guerre de Palantir ( lien original, discussion LinuxFR ) ;
Nouvel effet secondaire pervers du pillage massif du web par les entreprises d'IA (robots BnF empêchés de faire leur travail) ( lien original, discussion LinuxFR ) ;
Une bulle… de pouvoir ( lien original, discussion LinuxFR ) ;
Finalement, l'IA a tenu sa promesse sur la productivité… au profit de la cybercriminalité ( lien original, discussion LinuxFR ) ;
[Disclose] La reconnaissance faciale déployée à grande échelle sur les téléphones des forces de l’ordre ( lien original, discussion LinuxFR ) ;
Images dénudées générées par Grok : trois adolescentes étatsuniennes attaquent xAI en justice ( lien original, discussion LinuxFR ) ;
The Onion’s Exclusive Interview With Sam Altman ( lien original, discussion LinuxFR ) ;
« Perroquets stochastiques » : une notion toujours valide malgré les critiques [partiellement payant] ( lien original, discussion LinuxFR ) ;
EnshittifAIcation ( lien original, discussion LinuxFR ) ;
Pourquoi la croisade de Peter Thiel contre l'antéchrist est loin d’être une lubie inoffensive ( lien original, discussion LinuxFR ) ;
BrokenArXiv: How Often Do LLMs Claim To Prove False Theorems? ( lien original, discussion LinuxFR ) ;
Proposition de loi relative à l'instauration d'une présomption d'exploitation des contenus culturels par les fournisseurs d'intelligence artificielle ( lien original, discussion LinuxFR ) ;
L'injonction à l'IA qu'on voit partout, est-elle justifiée ? ( lien original, discussion LinuxFR ) ;
Pourquoi refuser les LLMs dans l'open source? Les arguments d'Open Slopware ( lien original, discussion LinuxFR ) ;
Zuckerberg, Huang, Ellison, Dell… La « dream team » du nouveau cabinet tech de Trump ( lien original, discussion LinuxFR ) ;
Les IA génératives sont en train de me dégoûter de mon métier. ( lien original, discussion LinuxFR ) ;
Les chiffres vertigineux des datacenter ( lien original, discussion LinuxFR ) ;
Le CERN compile des IA sur FPGA pour traiter les données du LHC en temps réel ( lien original, discussion LinuxFR ) ;
CSS is DOOMed ( lien original, discussion LinuxFR ) ;
Quand l'IA fait le tri : "1984", "Twilight" et Michelle Obama exclus d’une bibliothèque scolaire ( lien original, discussion LinuxFR ) ;
Manga au Japon : la fin de l’euphorie, l’ombre de l’IA en plushttps://actualitte.com/article/130060/international/manga-au-japon-la-fin-de-l-euphorie-l-ombre-de-l-ia-en-plus ( lien original, discussion LinuxFR ) ;
"Bonjour, je suis Marie, partenaire d’Enedis…", pourquoi le démarchage téléphonique par IA se multiplie et quand va-t-il prendre fin ? ( lien original, discussion LinuxFR ) ;
Mozilla lance un stackoverflow pour agents ( lien original, discussion LinuxFR ) ;
L'internet enfin débarrassé des humains ( lien original, discussion LinuxFR ) ;
AI bug reports went from junk to legit overnight, says Linux kernel czar ( lien original, discussion LinuxFR ) ;
AI data centres can warm surrounding areas by up to 9.1°C ( lien original, discussion LinuxFR ) ;
USA: une femme emprisonnée 5 mois sur la foi d’une reconnaissance faciale erronée ( lien original, discussion LinuxFR ) ;
Copilot fait sa pub sur une PR ( lien original, discussion LinuxFR ) ;
Le code source de Claude a fuité ( lien original, discussion LinuxFR ) ;
Comment la guerre en Iran pourrait asphyxier le carburant invisible de l’IA - Dommage collatéral ( lien original, discussion LinuxFR ) ;