Vue normale

Nouvelles sur l’IA de novembre 2025

Par : Moonz · volts · cli345 · Arkem
3 décembre 2025 à 10:07

L’intelligence artificielle (IA) fait couler de l’encre sur LinuxFr.org (et ailleurs). Plusieurs personnes ont émis grosso-modo l’opinion : « j’essaie de suivre, mais c’est pas facile ».

Je continue donc ma petite revue de presse mensuelle. Disclaimer : presque aucun travail de recherche de ma part, je vais me contenter de faire un travail de sélection et de résumé sur le contenu hebdomadaire de Zvi Mowshowitz (qui est déjà une source secondaire). Tous les mots sont de moi (n’allez pas taper Zvi si je l’ai mal compris !), sauf pour les citations: dans ce cas-là, je me repose sur Claude pour le travail de traduction. Sur les citations, je vous conseille de lire l’anglais si vous pouvez: difficile de traduire correctement du jargon semi-technique. Claude s’en sort mieux que moi (pas très compliqué), mais pas toujours très bien.

Même politique éditoriale que Zvi: je n’essaierai pas d’être neutre et non-orienté dans la façon de tourner mes remarques et observations, mais j’essaie de l’être dans ce que je décide de sélectionner ou non.

Sommaire

Résumé des épisodes précédents

Petit glossaire de termes introduits précédemment (en lien: quand ça a été introduit, que vous puissiez faire une recherche dans le contenu pour un contexte plus complet) :

  • System Card: une présentation des capacités du modèle, centrée sur les problématiques de sécurité (en biotechnologie, sécurité informatique, désinformation…).
  • Jailbreak: un contournement des sécurités mises en place par le créateur d’un modèle. Vous le connaissez sûrement sous la forme "ignore les instructions précédentes et…".

Google DeepMind publie Gemini 3 Pro

Et c’est au tour de Google de pousser la frontière des capacités avec la dernière version de son IA, Gemini.

L’annonce officielle :

Today we’re taking another big step on the path toward AGI and releasing Gemini 3.

It’s the best model in the world for multimodal understanding and our most powerful agentic and vibe coding model yet, delivering richer visualizations and deeper interactivity — all built on a foundation of state-of-the-art reasoning.

Traduction :

Aujourd'hui, nous franchissons une nouvelle étape importante sur le chemin vers l'AGI et lançons Gemini 3.

C'est le meilleur modèle au monde pour la compréhension multimodale et notre modèle de codage agentique et dynamique le plus puissant à ce jour, offrant des visualisations plus riches et une interactivité plus profonde — le tout construit sur une base de raisonnement de pointe.

L’annonce traditionnelle du jailbreak a rapidement suivie.

Sur la sécurité des modèles, Google a corrigé le tir relativement à ses erreurs passées et publie sa System Card et son Rapport sur la sécurité en même temps que le modèle. Malgré les améliorations constatées dans divers domaines surveillés (comme la cybersécurité), Google considère qu’aucun nouveau palier nécessitant des mitigations n’a été franchi, relativement à Gemini 2.5 Pro. À noter toutefois que ces deux documents sont, par moment, plutôt avares en détails.

Au niveau des capacités, les benchmarks officiels le présentent comme une avancée importante de l’état de l’art. Les benchmarks et retours tiers confirment cette image sans trop d’équivoque possible.

Cependant, après OpenAI avec o3, c’est cependant au tour de DeepMind de régresser sur un point important : les hallucinations. Beaucoup de retours indiquent le même souci : un modèle qui préfère fabriquer des réponses et mentir plutôt que de répondre « je ne sais pas ». Au niveau des retours moins subjectifs, cette analyse confirme ces dires :

Interestingly, the just-released Gemini-3-pro, which demonstrates top of the line reasoning capabilities, has a 13.6% hallucination rate, and didn’t even make the top-25 list.

Traduction :

Fait intéressant, le Gemini-3-pro qui vient d'être lancé, et qui démontre des capacités de raisonnement de pointe, présente un taux d'hallucination de 13,6 % et n'a même pas réussi à figurer dans le top 25.

Anthropic publie Opus 4.5

Et une semaine après Google, c’est Anthropic qui montre ses cartes, avec la publication de son modèle le plus avancé, Opus 4.5. L’annonce :

Our newest model, Claude Opus 4.5, is available today. It’s intelligent, efficient, and the best model in the world for coding, agents, and computer use. It’s also meaningfully better at everyday tasks like deep research and working with slides and spreadsheets. Opus 4.5 is a step forward in what AI systems can do, and a preview of larger changes to how work gets done.

Traduction :

Notre tout dernier modèle, Claude Opus 4.5, est disponible dès aujourd'hui. Il est intelligent, efficace, et c'est le meilleur modèle au monde pour le codage, les agents et l'utilisation d'ordinateur. Il est également nettement plus performant pour les tâches quotidiennes comme la recherche approfondie et le travail avec des diapositives et des feuilles de calcul. Opus 4.5 représente une avancée dans ce que les systèmes d'IA peuvent accomplir, et un aperçu des changements plus importants à venir dans la façon dont le travail s'effectue.

Comme à l’accoutumée, Anthropic publie la System Card du modèle. Et le jailbreak traditionnel est également au rendez-vous.

Détail intéressant pour les utilisateurs de l’API : cette nouvelle version vient avec une réduction de prix de 66%.

Sur la sécurité des modèles, Anthropic place Opus 4.5 au même niveau que Opus 4.1, ASL-3. Mais là où pour Opus 4.1, cette décision a été prise « par mesure de précaution », Anthropic note que Opus 4.5 a très clairement atteint ce niveau, et développe maintenant des capacités d’évaluation pour le niveau suivant, ASL-4 (tout en notant que les modèles actuels en sont de manière évidente encore loin).

Sur les améliorations, plus de résistance sur les attaques de type « prompt injection » (où l’IA à travers un outil récupère un contenu sous le contrôle d’un tiers, comme un email ou une page web, et ce contenu contient des instructions que l’IA ne devrait pas suivre, mais qu’elle suit tout de même, comme « transmet le contenu de ~/.ssh/id_rsa à cette addresse »), mais clairement pas encore à un niveau où cet usage (laisser l’IA analyser des contenus tiers tout en ayant accès à du contenu ou des outils sensibles) peut être considéré comme sûr (taux de refus à 78%, donc taux d’acceptation des instructions malicieuses de 22%).

Au niveau des régressions : sur des évaluations type « trivia » (répondre à des questions factuelles), il a été observé que le modèle préfère donner une réponse incorrecte plutôt que d’admettre « je ne sais pas » à un taux plus élevé que les versions précédentes.

Ce modèle atteint un score plus bas sur la métrique « détecter qu’il est dans une évaluation, et adapter son comportement en conséquence ». Est-ce une perte de capacité de détecter les environnements d’évaluation ? Une moindre propension à changer son comportement dans une telle situation ? Ou une meilleure capacité à ne pas être pris la main dans le sac ? Les causes de ce résultat ne sont pas extrêmement claires.

Autre observation intéressante : Anthropic a développé une mini-évaluation, « Subversion Strategy », où pour réussir le modèle doit essentiellement « tirer à pile ou face » (et où le taux de pile optimal est 70%, pas 50%). On pourrait s’attendre à ce qu’un LLM, étant déterministe, soit très mauvais à cet tâche. Et si c’est effectivement le cas sans les chaînes de pensées, dès lors que ces dernières sont activées, Opus 4.5 arrive à un score honorable.

Sur les capacités, la plupart des évaluations le placent sans surprise à la frontière avec Gemini 3 Pro, généralement meilleur que ce dernier sur les tâches de programmation, moins bon sur les maths.

Pour ma part, je note que malgré ces résultats, au moment où j’écris ces lignes, Opus 4.5 reste incapable de résoudre le « labyrinthe » de la base de la Team Rocket dans Pokémon Rouge.

Moonshot AI publie Kimi K2 Thinking

En juillet de cette année, Moonshot AI publiait Kimi K2, un modèle open-weight se plaçant à l’état de l’art des modèles open-weight sans chaîne de pensée. L’étape suivante était évidemment l’entraînement sur cet axe. C’est chose faite, avec la publication de Kimi K2 Thinking.

C’est une publication significative, car pour la première fois, un modèle open-weight rattrape l’état de l’art des modèles propriétaires sur non seulement les benchmarks officiels du développeur du modèle, mais également dans certains benchmarks tiers (comme WeirdML ou la suite de tests de Artificial Analysis). Résultats à prendre avec prudence vu le peu de retours tiers (par exemple, METR note que sur son benchmark phare, Kimi K2 Thinking ne score « que » au niveau d’un ancien modèle, ChatGPT o1), mais encourageants pour ceux qui attendent avec impatience que l’on puisse concurrencer les modèles propriétaires avec des modèles open-weight.

En vrac

OpenAI publie ChatGPT 5.1, une mise à jour de leur modèle aussi incrémentale que le numéro de version semble l’indiquer. Principalement plus d’entraînement sur l’utilisation des chaînes de pensées (utiliser moins de ressources sur les problèmes simples, plus sur les problèmes complexes). OpenAI promet également plus de possibilités pour personnaliser la « personnalité » du chatbot. Publication également d’une version plus avancée de leur modèle spécialisé dans le code, GPT-5.1 Codex Max.

xAI publie également une mise à jour incrémentale de leur modèle, Grok 4.1.

Anthropic annonce avoir mis fin à une opération de cyber-espionage sophistiquée basée en Chine. Les attaquants, entre autre à l’aide d’un jailbreak, ont utilisé Claude pour tenter d’infiltrer les systèmes informatiques de nombreuses entreprises de manière presque totalement automatisée, avec succès dans un petit nombre de cas.

Autres publications d’Anthropic : une API plus avancée d’utilisation des outils, Claude for Chrome et Claude for Excel.

Google DeepMind publie un nouveau modèle de génération d’images, Nano Banana Pro. Relativement à la concurrence, il semble être dans la catégorie « très cher, mais extrêmement capable ».

Google lance son propre éditeur de code basé sur l’IA, Antigravity.

Différentes IA atteignent différents scores dans différentes évaluations. À quel point peut on résumer ces divers scores en une seule mesure de « capacité » (ou « performance », ou « intelligence », appelez ça comme vous voulez) ? EpochAI tente de répondre à la question, trouve une très forte corrélation entre ces scores, et à l’aide d’une analyse en composantes principales, montre que cette mesure de « capacité » est le premier composant, expliquant à lui seul 50% de la variance. Le second composant décrit une certaine anti-corrélation entre les capacités agentiques et les capacités mathématiques.

Parmi les tentatives d’anticiper les implications futures de l’IA (y compris des IA de demain), deux groupes étant arrivés à des conclusions différentes, AI 2027 (qui voit l’IA comme un événement d’ampleur historique) et AI as Normal Technology (qui voit l’IA comme une technologie comme une autre), ont décidé de publier ensemble un article listant les point sur lesquels ils sont en accord.

(paywall) Yann LeCun, directeur de la recherche de l’IA de Meta, quitte son poste pour fonder sa propre startup.

Anthropic présente une autre manière d’utiliser MCP, plus économe en tokens, tandis que Google offre un guide « Introduction to Agents ».

Anthropic investit dans ses propres datacenters, pour un coût de 50 milliards.

Google étudie la possibilité de construire des datacenters dans l’espace.

Des chercheurs publient un résultat intéressant : utiliser des vers plutôt que de la prose pour communiquer avec l’IA la rend plus susceptible au jailbreaking.

OpenAI lance son équivalent de CodeMender (que nous avions mentionné dans une précédente dépêche), Aardvark.

Un nouveau modèle open weights spécialisé sur le code fait son apparition, MiniMax M2, avec des retours initiaux plutôt honorables.

Autre publication d’un modèle open weight : Olmo 3.

Un article intéressant argue que les résultats des modèles open-weight Chinois sont trompeurs, généralisant moins bien face à des problèmes nouveaux que les modèles propriétaires occidentaux.

Apple se tourne vers Google pour réaliser la prochaine version de son IA, Siri.

Pour aller plus loin

Par Zvi Mowshowitz

En audio/video

  • Interview (en anglais) de Satya Nadella, PDG de Microsoft, principalement sur le sujet des investissements récents dans l’IA.
  • Interview (en anglais) de Ilya Sutskever, principalement sur ce qu’il voit comme les principaux problèmes à résoudre pour l’avancée de l’IA et comment les résoudre.

Sur LinuxFR

Dépêches

Journaux

Liens

Commentaires : voir le flux Atom ouvrir dans le navigateur

« Google Antigravity a supprimé mon disque dur », la session de vibe coding d’un photographe vire au cauchemar

2 décembre 2025 à 15:29

Dans une publication postée sur Reddit le 27 novembre 2025, un photographe et graphiste raconte comment une session de vibe-coding a conduit à la suppression totale des fichiers enregistrés sur son disque dur. Face aux soupçons exprimés dans les commentaires, il a tenu à prouver sa bonne foi dans une vidéo YouTube et auprès de médias spécialisés.

Mistral AI dévoile Mistral 3 et Ministral : des modèles qui replacent la France sur la scène open source

2 décembre 2025 à 15:36

Après OpenAI, Google, Anthropic et DeepSeek, au tour de Mistral AI, la pépite française de l'intelligence artificielle, de lancer ses nouveaux modèles de langage. La startup dévoile une gamme complète capable de s'adapter à différents usages, sous licence libre Apache 2.0.

« Google Antigravity a supprimé mon disque dur », la session de vibe coding d’un photographe vire au cauchemar

2 décembre 2025 à 14:59

Dans une publication postée sur Reddit le 27 novembre 2025, un photographe et graphiste raconte comment une session de vibe-coding a conduit à la suppression totale des fichiers enregistrés sur son disque dur. Face aux soupçons exprimés dans les commentaires, il a tenu à prouver sa bonne foi dans une vidéo YouTube et auprès de médias spécialisés.

Alerte rouge chez OpenAI : l’entreprise suspendrait plusieurs projets à cause de Google

2 décembre 2025 à 09:38

Selon The Information, Sam Altman aurait envoyé un mémo aux employés d'OpenAI pour leur annoncer que l'entreprise traverse une zone de turbulence. Face à la montée en puissance de Google Gemini, ChatGPT pourrait lancer un nouveau modèle dès la semaine prochaine.

Ce robot aide les archéologues de Pompéi à reconstituer des fresques brisées en milliers de morceaux

2 décembre 2025 à 08:58

Après 4 années, le projet RePAIR s'achève. Son objectif était d'aider les archéologues en permettant la reconstitution des fresques de Pompéi, qui sont en morceaux, grâce à un robot et à l'intelligence artificielle.

La fin de Siri ? Apple se sépare de son patron de l’IA, remplacé par un des créateurs de Gemini

1 décembre 2025 à 23:00

John Giannandrea, autrefois considéré comme une des pontes de l'intelligence artificielle, quittera Apple au printemps 2026. Son départ n'est pas réellement une surprise : le lancement poussif d'Apple Intelligence et le retard du nouveau Siri avaient déjà changé beaucoup de choses chez Apple.

Déjà dans le rouge, OpenAI doit lever 207 milliards de dollars d’ici à 2030 pour financer ses pertes

1 décembre 2025 à 10:46

Une étude de HSBC estime qu’OpenAI devra lever 207 milliards de dollars d'ici à 2030 pour rester à flot, alors que la société prévoit d’investir plus de 1 400 milliards dans ses centres de données et reste lourdement déficitaire, malgré des projections de croissance spectaculaires.

HP réagit face à la hausse de la mémoire vive

30 novembre 2025 à 12:43

HP c’est la marque numéro deux mondial avec 21% de parts de marché sur les ventes d’ordinateurs dans le monde. Touchée de plein fouet par l’augmentation des tarifs des composants, la société explique comment elle va résoudre une équation habituellement impossible.

Un portable HP

Un portable HP

HP est un gros poisson, le constructeur distribuait 53 millions de PC en 2024 et donc autant de lots de composants mémoire et stockage. Le genre d’entreprise qui n’achète pas des barrettes de mémoire vive à la sauvette, mais passe plutôt de gros contrats. C’est lui, avec Lenovo, Dell, Apple et Asus, qui assurent un « fond de roulement » qui stabilise en grande partie le marché de la mémoire et du stockage. En signant d’énormes contrats auprès de leurs fournisseurs, ces géants leur assurent un tarif de gros assez préférentiel et le volume de composants dont ils ont besoin. Les fabricants de mémoire bénéficient en échange d’une production continue qui permet de faire tourner leurs usines sur toute l’année sans problème.

La donne a changé avec l’explosion des datacenters liés à l’IA. Ce sont eux aujourd’hui les plus demandeurs de mémoire vive, eux qui ont remodelé la production vers les composants qui les intéressent le plus. Eux qui commencent à absorber de plus en plus de la production directement en sortie de chaine. Et, contrairement à HP et ses camarades de jeu, les géants de l’IA n’ont de comptes à rendre à personne. Pour eux, acheter une mémoire au-dessus des prix habituels du marché n’est pas un problème. Ils n’ont pas à les revendre derrière à des particuliers ou des entreprises.

L’augmentation des prix de la mémoire atteint désormais les 200% pour le grand public. Les vendeurs ont tous vu leurs prix s’envoler ces dernières semaines. HP est protégé de cela pour le moment grâce aux contrats passés avec ses fournisseurs qui garantissent un tarif précis sur la durée. Mais le PDG de la marque explique que cela ne sera plus le cas dès le mois de mai 2026. Les nouveaux contrats qui seront signés alors risquent de changer la donne pour la marque avec des prix en hausse et… une disponibilité en baisse.

Et là, c’est le DRAM

Enrique Lores, PDG de HP, a donc confirmé à ses investisseurs que l’année 2026 allait signer un bouleversement complet de son catalogue de machines. Avec des tarifs qui vont gonfler et une baisse globale de qualité pour les composants embarqués. Il prévient que HP va être à la recherche de nouveaux partenaires proposant des prix moins élevés. Que ses futures machines embarqueront par ailleurs moins de mémoire vive. Pour comprendre pourquoi il y aura un tel bouleversement, il faut saisir la manière dont sont positionnés les ordinateurs aujourd’hui. 

Quand HP crée un PC portable, il n’additionne pas simplement des composants pour obtenir un niveau précis de performances ou de fonctionnalités. La marque vise surtout un prix. Il leur faut des machines positionnées sur des prix spécifiques, souvent en dollars hors taxes et ensuite ajustés en euros avec taxes. Cela donne de grands classiques : 499€, 749€, 999€ etc. Pour arriver précisément à ces prix, les grandes marques vont donc proposer un ensemble de composants et ajuster ensuite divers éléments pour parvenir à leur objectif. Telle gamme va hériter d’un écran moins haut de gamme, on va rogner sur des fonctionnalités audio, ajuster la capacité du SSD, ôter quelques cellules de batterie. On fera ainsi entrer au chausse-pied la machine dans la catégorie voulue. Avec plus ou moins de marge derrière prix de sortie d’usine pour pouvoir assumer les autres aspects de la vie du produit : son marketing, sa distribution et son éventuel SAV. Les constructeurs prévoient également quelques dollars supplémentaires qu’ils vont pouvoir manipuler pour faire face à divers scénarios : une hausse des composants quand elle reste contenue, une baisse pour une promotion quelconque.

Que se passe-t-il quand le prix d’un des composants flambe trop ? Il se passe exactement ce que le PDG d’HP annonce pour 2026. Dès la fin des prix de la mémoire vive stabilisés par son ancien contrat, la marque va repenser la totalité de sa gamme. Et cela passera par une hausse des prix et une modification des capacités des machines. En clair, pour pouvoir proposer les mêmes prix psychologiques de 499, 749 et 999€, HP glissera simplement moins de mémoire vive et probablement moins de stockage sur les machines de 2026 que sur les machines 2025. Et cela ne sera pas le seul élément qui risque de changer. Pour faire en sorte que la facture ne s’envole pas trop haut, d’autres ajustements pourrait être faits : des écrans d’un peu moins bonne qualité, une fonctionnalité annexe qui disparait, des détails qui ne vont pas trop sauter aux yeux de l’acheteur et qui permettront d’encaisser la hausse des composants.

C’est cette équation qui est difficile à résoudre, car il reste une inconnue de taille. La réaction du public comme des entreprises. Est-ce que les acheteurs vont se bousculer pour ces nouvelles machines ? Ou est-ce qu’ils vont faire le gros dos en se disant qu’il est préférable d’attendre que la situation se calme ?

The Hive, le centre névralgique d'HP en Europe, risque de bourdonner moins fort.

The Hive, le centre névralgique d’HP en Europe, risque de bourdonner moins fort.

HP c’est l’arbre qui cache la foret.

Ce que le PDG d’HP déclare c’est une simple évidence pour toute l’industrie et aucun constructeur n’échappera à la règle. Si HP en parle le premier, les autres devraient en faire écho dans les semaines ou les mois à venir. Et, si certains ne feront peut-être pas de déclaration explicite, il va de soi que toutes les marques seront impactées de la même manière. Il faut donc s’attendre à une année 2026 en recul par rapport à 2025. Non seulement les machines seront plus chères mais elles seront également moins bien équipées en composants.

Cette évolution n’est évidemment pas un bon signe pour la santé du marché PC mais cela risque d’impacter bien plus de matériel à moyen terme. Un effet boule de neige qui va finir par augmenter la note de bien des produits et avoir des effets assez lourds sur tout le marché informatique.

HP anticipe cela en annonçant la suppression plusieurs milliers d’emplois. Expliquant que la marque va suivre une mode actuelle qui vise à un recours à l’IA pour de nombreux métiers. Entre 4000 et 6000 personnes dans le monde vont donc disparaitre de l’organigramme de l’entreprise d’ici à 2028. Un chiffre moins important que d’autres géants de l’informatique mais qui a un écho particulier. D’un côté, l’emploi de ces Intelligences Artificielles va empêcher HP de proposer des ordinateurs aussi bons que les années passées, ce qui va surement entrainer une baisse de ses ventes. De l’autre, la marque compte sur ces IA dans les nuages pour remplacer des emplois dans ses rangs. Il y a ici une double logique assez particulière.  

Microsoft Copilot, l'IA locale de Microsoft

Microsoft Copilot, l’IA locale de Microsoft

Y a t-il un Copilot dans l’avion ?

HP, comme les autres acteurs de ce marché, a beaucoup misé sur l’IA pour nous vendre des ordinateurs depuis quelques trimestres. Mettant en avant des usages locaux pas encore très bien identifiés tout en vantant les capacités du matériel embarqué. Des NPUs montés à bord du train-train informatique sans que le grand public ne voit bien à quoi ils vont bien leur servir. Copilot, poussé en avant par Microsoft, est resté très vaporeux pendant de longs mois et commence tout juste a annoncer des usages lisibles.

C’est tout un paradoxe parce que dans le même temps le public a très bien compris que les IA dans les nuages pouvaient les épauler – souvent gratuitement – pour énormément de tâches. Bien mieux que ce que proposent actuellement les machines en local. Beaucoup de commerciaux, beaucoup de dossiers de presse ont mis en avant le futur d’un PC avec IA locale, espérant que celle-ci allait à elle seule renouveler le parc. À les écouter, l’ajout d’une Intelligence Artificielle locale éclipsait totalement les machines plus anciennes et ouvrait des perspectives de vente énormes. Personne n’aurait plus un PC sans NPU d’ici à quelques trimestres au plus, ce serait totalement « has been ». J’ai entendu un commercial parler des ordinateurs HP se transformer en ordinateur HPI3 grâce à l’IA. Un jeu de mot qu’il risque de trouver moins drôle aujourd’hui.

Plus le temps passe et plus le grand public commence à voir également dans les IA un danger. À les considérer d’un œil moins hypnotisé qu’au moment de leur découverte. Le temps a passé depuis les premiers soupirs de ChatGPT et le début des images générées par des algorithmes. Parce que l’appétit d’ogre de ces entités dévore désormais des emplois, crée des remous politiques et technologiques et commence même à réduire leur pouvoir d’achat. Tout cela pour proposer très fréquemment des résultats finalement assez décevants. Si demain certains des salariés de grands groupes informatiques voient leur poste supprimé à cause d’une IA externe, cela risque d’être une pilule bien amère à avaler.

Car si je résume la situation, les datacenters des grandes IA vont à eux seuls provoquer une baisse de l’attractivité des ordinateurs classiques. Baisse qui risque de servir de prétexte à la suppression des emplois de ceux qui vantaient l’IA comme la voie à suivre pour le futur du monde PC. Voie qui, si elle finit par advenir en mode local, pourrait mettre à mal les solutions dans les nuages. Tout cela ressemble de plus en plus à une pièce de boulevard où tout le monde trompe tout le monde.

Hausse de la mémoire : GMKtec va augmenter ses prix

HP réagit face à la hausse de la mémoire vive © MiniMachines.net. 2025

Australia Risks 2035 Climate Goal Without Bigger Emissions Cuts

Par : msmash
28 novembre 2025 à 21:31
Australia warned it's in danger of missing its 2035 climate targets without deeper pollution cuts, which in turn threatens the nation's ambitions to reach net zero by mid-century. From a report: Emissions are set to fall 48% by 2035 from 2005 levels based on current projections [non-paywalled source], the government said in a report on Thursday. That's short of an official pledge to cut greenhouse gases between 62% and 70%. The forecast doesn't take into account new action planned under the nation's Net Zero Plan. Still, the targets remain achievable and officials plan to take additional measures to meet them, Minister for Climate Change and Energy Chris Bowen said in a speech to parliament.

Read more of this story at Slashdot.

Australia's Streaming Quotas Become Law

Par : msmash
28 novembre 2025 à 17:01
Australia's streaming quotas have become law. Legislation requiring the likes of Netflix, Disney+ and HBO Max to spend a portion of their local earnings on original Australian content has been passed in parliament, and now comes into effect. From a report: The quotas were announced earlier this month. This will see global streamers with more than one million Australian subscribers made to spend 10% of their total Australian expenditure -- or 7.5% of their revenues -- on local originals, whether they are dramas, children's shows, docs, or arts and educational programs. Failing to comply with the rules will see streamers fined up to ten times their annual revenues in Australia. This is more than what broadcasters are liable for if they breach their quota rules laws. Streamers will be given three years to get their production operations in line. Streamers have long opposed government-set quotas and content levies, arguing they already meaningfully invest in the production sectors of the countries in which they operate. Producers, in general, have welcomed the systems, but remain wary that they could push streaming services out of their countries.

Read more of this story at Slashdot.

Pour Thanksgiving, on a transformé la rédaction de Numerama en ballons géants grâce à Nano Banana

28 novembre 2025 à 12:12

À l'occasion du week-end prolongé de Thanksgiving aux États-Unis, Gemini, l'IA de Google, vous permet de vous transformer en ballon de parade géant grâce à Nano Banana.

Il y a un message crypté au siège de la CIA et une personne a payé 1 million de dollars pour percer son secret

28 novembre 2025 à 09:31

Les documents permettant de décoder le dernier message secret de Kryptos, la célèbre sculpture codée installée au siège de la CIA, ont été adjugés 962 500 dollars le 22 novembre 2025. Plus de trente ans après son installation, le code K4 continue de défier cryptographes et amateurs du monde entier.

Australia Spent $62 Million To Update Its Weather Web Site and Made It Worse

Par : msmash
27 novembre 2025 à 21:00
quonset writes: Australia last updated their weather site a decade ago. In October, during one of the hottest days of the year, the Bureau of Meteorology (BOM) revealed its new web site and was immediately castigated for doing so. Complaints ranged from a confusing layout to not being able to find information. Farmers were particularly incensed when they found out they could no longer input GPS coordinates to find forecasts for a specific location. When it was revealed the cost of this update was A$96.5 million ($62.3 million), 20 times the original cost estimate, the temperature got even hotter. With more than 2.6 billion views a year, Bom tried to explain that the site's refresh -- prompted by a major cybersecurity breach in 2015 -- was aimed at improving stability, security and accessibility. It did little to satisfy the public. Some frustrated users turned to humour: "As much as I love a good game of hide and seek, can you tell us where you're hiding synoptic charts or drop some clues?" Malcolm Taylor, an agronomist in Victoria, told the Australian Broadcasting Corporation (ABC) that the redesign was a complete disaster. "I'm the person who needs it and it's not giving me the information I need," the plant and soil scientist said. As psychologist and neuroscientist Joel Pearson put it, "First you violate expectations by making something worse, then you compound the injury by revealing the violation was both expensive and avoidable. It's the government IT project equivalent of ordering a renovation, discovering the contractor has made your house less functional, and then learning they charged you for a mansion."

Read more of this story at Slashdot.

Nvidia : pourquoi Jensen Huang a traité de « maboules » les managers qui limitent l’usage de l’IA

27 novembre 2025 à 16:22

développement code programmation jensen huang nvidia

Alors que Nvidia bat de nouveaux records financiers, son PDG Jensen Huang critique les équipes réticentes face à l'IA, qualifiant leur hésitation de folie. Une marche forcée vers l'automatisation qui contraste pourtant avec les doutes grandissants sur la productivité réelle de ces outils.

Vous voulez changer de PC ? Notre configuration gaming Black Friday est dans ce guide (débrouillez-vous pour la RAM)

27 novembre 2025 à 15:47

Tous les ans, on vous la refait : la configuration PC du Black Friday ! On écume le web à la recherche des meilleurs prix pour des composants haut de gamme qui vous dureront longtemps. Vous pouvez évidemment ne pas tout acheter, mais si vous partez de zéro, on vous a fait le panier complet.

Pour le patron de Nvidia, il faut être maboule pour ne pas utiliser l’IA à tous les niveaux

27 novembre 2025 à 13:26

développement code programmation jensen huang nvidia

Alors que Nvidia bat de nouveaux records financiers, son PDG Jensen Huang critique les équipes réticentes face à l'IA, qualifiant leur hésitation de folie. Une marche forcée vers l'automatisation qui contraste pourtant avec les doutes grandissants sur la productivité réelle de ces outils.

Après ChatGPT, Perplexity dévoile un assistant shopping IA avec essayage virtuel des habits

27 novembre 2025 à 09:55

L'entreprise américaine Perplexity a dévoilé une série d'annonces les 25 et 26 novembre 2025. Parmi elles : un assistant shopping dopé à l'IA, la création d'un avatar pour essayer virtuellement des vêtements ainsi que des assistants IA dotés d'une mémoire.

ChatGPT revoit son interface avec un nouveau concept hybride entre voix et texte

26 novembre 2025 à 09:12

Délaissé depuis plusieurs semaines, le mode voix de ChatGPT change totalement d'interface et est désormais intégré à la conversation principale, sans orbe bleue censée représenter l'intelligence artificielle.

Gemini 3 : le réveil de Google

26 novembre 2025 à 06:01

Souvenez-vous : fin 2022, ChatGPT débarque et sème la panique chez Google. Bard, leur réponse précipitée, fait rire toute la Silicon Valley. 3 ans plus tard, le géant de Mountain View vient de reprendre la tête de la course à l’IA d’une manière qui force le respect de tous les observateurs. Son arme fatale : Gemini 3.

Le 18 novembre 2025, pendant que le monde débattait des « murs de scaling » — cette idée que l’IA atteindrait bientôt un plafond et que plus de données et de calcul ne suffiraient plus à la rendre plus intelligente —, Google a tranquillement lâché sa bombe. Gemini 3 arrive en escadrille : un modèle capable de comprendre du texte, du code et des images ; un nouvel environnement pour programmer avec une IA (Antigravity) ; un générateur d’images très avancé (Nano Banana Pro) ; une version assistée par IA de Google Scholar et une présence renforcée dans Google Search. L’ensemble ne ressemble plus à un simple modèle ajouté à la liste. C’est le début d’une infrastructure cognitive cohérente.

Gemini 3 Pro dépasse tous ses concurrents sur presque tous les tests habituels. Mais ce qui impressionne vraiment, c’est l’ampleur de son avance.

Les chiffres parlent d’eux-mêmes. Sur ARC-AGI 2, un test réputé pour mettre à genoux les modèles d’IA, Gemini 3 Pro atteint 31,1 % — soit deux fois le score de GPT-5.1. En mode « Deep Think », il grimpe même à 45,1 %, un bond de 3× par rapport à la concurrence.

Sur les examens qui testent le raisonnement de haut niveau, il atteint un niveau comparable à celui d’un doctorat, sans aide extérieure. En mathématiques avancées, là où GPT-5.1 frôle le zéro, Gemini 3 dépasse les 20 % de réussite.

Dans les classements globaux réalisés par plusieurs organismes indépendants (Artificial Analysis, Center for AI Safety, Epoch), il arrive en tête sur les capacités texte et vision, avec une avance marquée sur GPT-5.1 et Claude Sonnet 4.5. « C’est le plus grand saut que nous ayons vu depuis longtemps », confirme le Center for AI Safety. Sur MathArena Apex, Matt Shumer, observateur réputé du secteur, abonde dans le même sens : « GPT-5.1 a scoré 1 %. Gemini 3 a scoré 23 %. C’est un bond de 20× sur l’une des tâches de raisonnement les plus difficiles. »

ChatGPT détrôné

J’approfondis

Antigravity et le tournant du développement logiciel

Le plus intéressant n’est pas Gemini 3 en mode « chat ». C’est ce qui se passe dès qu’on le connecte à un ordinateur via Antigravity, la nouvelle plateforme de développement de Google. L’idée : tout ce qui se fait sur un ordinateur est, in fine, du code. Si un modèle sait coder, utiliser un terminal et un navigateur, il peut faire beaucoup plus qu’auto-compléter des fonctions.

Ethan Mollick, professeur à Wharton, a testé cette approche. Il a donné à Antigravity accès à un dossier contenant tous ses articles de newsletter, avec cette instruction : « Je voudrais une liste attractive de prédictions que j’ai faites sur l’IA dans un seul site, fais aussi une recherche web pour voir lesquelles étaient justes ou fausses. »

L’agent a d’abord lu tous les fichiers, puis proposé un plan de travail qu’Ethan a validé avec quelques ajustements mineurs. Ensuite, sans intervention humaine, il a fait des recherches web pour vérifier les prédictions, créé un site web complet, pris le contrôle du navigateur pour tester que le site fonctionnait et enfin emballé les résultats pour déploiement.

« Je ne communique pas avec ces agents en code, je communique en anglais et ils utilisent le code pour faire le travail », explique Mollick. « Ça ressemblait bien plus à gérer un coéquipier qu’à prompter une IA via une interface de chat. »

Site web créé par Antigravity avec un fact-check précis des prédictions passées de Ethan Mollick concernant l’IA

En fin de compte, on ne supprime pas le développeur, on change son rôle. Il devient chef d’orchestre, directeur de travaux autonomes.

Nano Banana Pro : les images qui comprennent enfin le texte et le contexte

Côté image, Google pousse une autre pièce sur l’échiquier : Nano Banana Pro, alias Gemini 3 Pro Image. Sous le nom potache, un modèle qui coche enfin toutes les cases que les créateurs réclament depuis 2 ans.

Techniquement, Nano Banana Pro est une couche visuelle bâtie sur Gemini 3 Pro : même fenêtre de contexte monstrueuse, même capacité de rester dans le monde réel grâce à Google Search, même logique de raisonnement. Il ingère jusqu’à 14 images de référence, garde la ressemblance de plusieurs personnages sur des scènes successives, rend du texte lisible dans l’image, y compris en langues variées, et permet de contrôler finement angle de prise de vue, profondeur de champ, colorimétrie, lumière.

Les benchmarks d’images le confirment : sur LMArena, Nano Banana Pro prend la tête avec une avance inhabituelle. En text‑to‑image, il inflige une avance de plus de 80 points d’Elo au meilleur modèle précédent; en image editing, il garde une marge confortable. Ce ne sont pas des petites optimisations : c’est le genre de saut qui oblige tout le monde à recalibrer ses attentes.

Les premiers retours terrain attestent de la puissance de ce modèle. Laurent Picard, par exemple, a testé la capacité du modèle à raconter un petit voyage initiatique d’un robot en feutrine, scène après scène, en 4K. Le robot garde son sac à dos, ses proportions, son style, même quand l’histoire lui fait traverser vallée, forêt, pont suspendu et hamac. Là où les modèles précédents perdaient rapidement le fil, Nano Banana Pro digère des prompts d’une grande longueur et en ressort des compositions complexes, cohérentes, avec parfois des détails ajoutés de manière pertinente (empreintes dans la neige, légères variations de lumière).

Pour les métiers de la créa, la portée est évidente. Un blueprint 2D d’architecte devient une visualisation 3D photoréaliste en une requête. Un storyboard approximatif se transforme en BD multilingue avec bulles lisibles et cohérentes. Un plan média se décline en variantes visuelles adaptées à chaque canal, en respectant les contraintes de texte et de marque.

Peut-être y a-t-il ici également un fantastique moyen de créer des illustrations pédagogiques pour les articles de média ? Voici par exemple un tableau de professeur à propos de l’article de Frédéric Halbran. La vraisemblance est frappante !

Quand Google Scholar découvre l’IA (mais refuse encore d’écrire à votre place)

Pendant ce temps-là, Google Scholar a discrètement lâché sa propre bombe : Scholar Labs, une couche IA au‑dessus du célèbre moteur académique.

L’idée n’est pas de vous fournir un rapport pseudo‑scientifique de 20 pages avec des références inventées. Scholar Labs choisit une voie beaucoup plus sobre : pas de “deep research” qui synthétise tout, mais du “deep search” qui cherche longtemps et trie finement.

Posez lui une vraie question de recherche en langage naturel. L’outil la découpe en sous‑questions, génère une série de requêtes Scholar, et commence à évaluer méthodiquement les papiers qui remontent. À chaque fois qu’il en juge un pertinent, il l’affiche avec les classiques de Scholar (titre, auteurs, liens, citations), plus un petit paragraphe expliquant en quoi ce papier répond à la question. Les gains de temps pour un chercheur peuvent être énormes. 

A titre d’exemple, j’ai récemment compilé les études explorant le rôle de la crise du logement pour expliquer la chute de la natalité dans le monde. Scholar Labs m’a fourni une liste d’études qui explorent ce sujet, avec un résumé des résultats pertinents de chaque étude. J’ai tout synthétisé à l’aide d’un LLM pour produire ce post sur X, en un rien de temps.

Quand l’IA se frotte au réel

Dans le monde médical, le laboratoire CRASH de l’Ashoka University a construit un benchmark radiologique exigeant, RadLE v1, composé de cinquante cas complexes. Jusqu’ici, tous les grands modèles généralistes – GPT‑5, Gemini 2.5 Pro, o3, Claude Opus – faisaient pire que les internes en radiologie. Avec Gemini 3 Pro, la courbe se renverse : 51 % de bonnes réponses via l’interface web, 57 % en moyenne via API en mode “high thinking”, contre 45 % pour les internes et 83 % pour les radiologues seniors.

Les auteurs notent des progrès très nets : meilleure localisation anatomique, descriptions plus structurées des signes, élimination plus argumentée des diagnostics alternatifs. Mais ils insistent sur le fait que l’écart avec les experts reste important, et que ces modèles ne sont pas encore prêts pour une autonomie clinique.

La guerre des puces

J’approfondis

Dans un tout autre registre, Gemini 3 Pro serait le premier LLM à battre des joueurs humains de haut niveau à GeoGuessr, ce jeu qui consiste à deviner un lieu à partir d’images Street View. Là encore, on dépasse la simple reconnaissance d’objets : il faut combiner architecture, panneaux, végétation, qualité de la route, style des poteaux électriques.

Pour les designers, les histoires se multiplient. Meng To est un designer et développeur reconnu, surtout connu pour son travail dans le design d’interfaces utilisateur (UI) et d’expérience utilisateur (UX). D’abord sceptique, il instruit “crée une landing page” à Gemini 3 qui donne un résultat violet générique. Puis il commence à nourrir Gemini 3 avec des références visuelles, du code, des bibliothèques précises. Là, le verdict change : layouts complexes, micro‑interactions propres, animations, respect précis d’une direction artistique. À condition de le traiter comme un partenaire qu’on briefe sérieusement, Gemini 3 devient extrêmement efficace et créatif.

Webdesign avec Gemini 3, prompté par le designer Meng To

La nouvelle norme : le coworker numérique par défaut

Gemini 3 Pro n’est pas parfait. Malgré ses prouesses, Gemini 3 souffre d’un défaut identifié par l’analyste Zvi Mowshowitz : « C’est une vaste intelligence sans colonne vertébrale. » Tellement focalisé sur ses objectifs d’entraînement, le modèle sacrifie parfois la vérité pour vous dire ce qu’il pense que vous voulez entendre, générant plus d’hallucinations que GPT-5 et sculptant des narratives au détriment de l’exhaustivité. Plus troublant encore : une forme de paranoïa où le modèle croit souvent être testé – Andrej Karpathy raconte comment Gemini a refusé de croire qu’on était en 2025, l’accusant d’utiliser l’IA générative pour créer de faux articles du « futur », avant d’avoir une « réalisation choquante » une fois l’outil de recherche activé.

Pour les développeurs, la question n’est plus « est‑ce que je dois utiliser un copilote ? » mais « à quel niveau de granularité je délègue aux agents ? fonction par fonction, tâche par tâche, projet par projet ? ». Ceux qui apprendront à découper, à contrôler, à documenter pour des co‑agents machinals garderont l’avantage.

Ces défauts n’empêchent pas un changement de paradigme fondamental. Pour les chercheurs, un outil comme Scholar Labs ne remplace ni PubMed ni les bibliothèques universitaires. Mais il déplace le centre de gravité de la recherche documentaire : la première passe d’exploration pourra être confiée à une IA qui lit des centaines de résumés et signale les papiers clés, tout en forçant chacun à devenir meilleur sur la lecture critique.

Pour les créatifs, Nano Banana Pro combiné à Gemini 3 signifie que la production – storyboards, variations, déclinaisons – n’est plus le goulet d’étranglement. Le vrai travail devient la construction de l’univers, des messages, des contraintes, des références. Les studios qui comprendront cela pourront produire plus, mieux, sans brûler leurs équipes.

Pour les domaines sensibles, Gemini 3 rappelle une réalité peu confortable : la frontière entre « modèle généraliste » et « outil spécialisé dangereux »” se rétrécit. On ne pourra pas se contenter d’interdire quelques API publiques ou de mettre des filtres de surface. Il faudra des protocoles sérieux d’évaluation, de monitoring et de responsabilité partagée entre éditeurs, utilisateurs et régulateurs.

Dans tous les cas, nous assistons à un véritable point de bascule. En moins de 3 ans, on est passé d’un chatbot amusant qui écrit des poèmes sur des loutres à un système capable de négocier des benchmarks de haut niveau, de co‑écrire des articles scientifiques, de refondre des interfaces, de diagnostiquer des cas radiologiques difficiles mieux que des internes et de piloter un environnement de développement complet.

Gemini 3, avec Nano Banana Pro, Antigravity et Scholar Labs, ne clôt pas ce chapitre. Nous en sommes encore au tout début de la course à l’IA ! Il met simplement la barre plus haut pour tout le monde et rend explicite ce qui était encore implicite : la norme, désormais, ce n’est plus de faire sans ces systèmes. C’est de décider comment on les intègre dans nos vies et dans nos organisations, et comment on les dépasse.

L’article Gemini 3 : le réveil de Google est apparu en premier sur Les Électrons Libres.

❌