Vue lecture

Google autorise les sites web à refuser explicitement les résumés IA

Merci, mais non merci
Google autorise les sites web à refuser explicitement les résumés IA

Depuis un peu plus de deux ans, Google affiche ses AI Overviews tout en haut d’une recherche web, autrement dit un résumé des résultats généré par IA. Ils ne tombent pas du ciel : les informations qu’ils contiennent proviennent de sites web qui vont finalement avoir la possibilité explicite d’exclure leurs contenus du moissonnage effectué par le moteur de recherche. Trop peu, trop tard ?

Les AI Overviews, visibles aux États-Unis depuis leur lancement en mai 2024, sont maintenant présents dans une centaine de pays (la France est toujours exclue). Ces résumés ont été complétés un an plus tard par l’AI Mode, qui tente de concurrencer directement les moteurs de recherche IA comme Perplexity ou ChatGPT.

Google demande enfin la permission d’aspirer le web

Durant la dernière édition de la Google I/O, le géant américain en a remis une couche avec une avalanche de nouveautés IA pour son moteur de recherche – offrant au passage au mode « No AI » de DuckDuckGo un joli coup de pouce. Aussi incroyable que cela puisse paraitre, il existe des internautes qui apprécient peu le forcing IA de Google. C’est le cas aussi pour plusieurs éditeurs de sites web, qui refusent obstinément que leurs contenus soient collectés sans autorisation ni rémunération pour se transformer en données d’entraînement.

Exemple d’AI Overview.

Il existe des mécanismes qui empêchent les robots de scraping de moissonner les contenus du web ouvert. Le fichier robots.txt est le plus commun, il permet à un site de refuser l’accès à certaines de ses pages pour l’indexation web et la collecte IA. Voilà pour la théorie, mais en pratique rien n’empêche un bot mal élevé d’ignorer ces consignes et de parcourir l’intégralité d’un site. Perplexity est régulièrement pointé du doigt à ce sujet.

Google a commencé à déployer un nouvel outil qui va permettre aux éditeurs web de décider, depuis la Search Console, si leurs sites peuvent apparaitre dans les résumés générés par IA. C’est un changement de taille, le groupe ayant plutôt cherché à flouter la frontière entre l’indexation et le scraping. Il promet la main sur le cœur que cela n’aura aucun impact sur l’indexation traditionnelle. En activant ce bouton depuis la console de recherche, un site ne recevra « ni trafic ni impressions provenant de nos fonctionnalités d’IA générative », martèle Google. Est-ce pour autant un drame ?

Google affirme régulièrement que les résumés IA dans les résultats de recherche ne font pas diminuer le trafic des sites d’où les informations sont extraites. Une étude du Pew Research Center, publiée en juillet dernier, affirmait le contraire. L’entreprise s’était d’ailleurs pris les pieds dans le tapis en évoquant un web ouvert en « déclin rapide » en raison du marché publicitaire chamboulé par l’IA.

La mise en place de ce bouton n’a rien d’un geste désintéressé ou d’une branche d’olivier lancé aux éditeurs, car sinon pourquoi avoir attendu deux ans ? C’est simplement le résultat d’une obligation réglementaire imposée par la CMA, l’autorité de la concurrence britannique. « Pour la première fois au monde, les éditeurs disposeront d’outils leur permettant d’empêcher l’utilisation de leurs contenus par les fonctionnalités d’IA de la recherche Google », se réjouit le régulateur.

Ce dernier ajoute que les éditeurs seront ainsi « mieux armés pour négocier des accords de licence avec Google, notamment dans le secteur de la presse ». L’intention est louable, mais rien n’empêchera Google d’utiliser les contenus provenant d’autres sites web plus conciliants pour générer ses résumés IA.

  •  

La justice européenne tranche : la Marketplace de Meta n’est plus un contrôleur d’accès

Une petite annonce qui coûte cher à Bruxelles
La justice européenne tranche : la Marketplace de Meta n’est plus un contrôleur d’accès

Revers pour la Commission européenne et le règlement sur les marchés numériques (DMA). La Cour de justice de l’UE a en effet jugé que Meta n’était pas un contrôleur d’accès pour la Marketplace de Facebook. En revanche, l’institution confirme le statut du géant des réseaux sociaux pour Messenger.

Le 5 septembre 2023, la Commission européenne désignait les contrôleurs d’accès au titre du DMA, un club très fermé qui oblige les membres à respecter des règles contraignantes sur l’ouverture à la concurrence. Plusieurs critères ont été mis en place pour recevoir son rond de serviette : au moins 45 millions d’utilisateurs actifs par mois dans l’UE et au moins 10 000 utilisateurs professionnels par an dans l’UE au cours des trois derniers exercices ; réaliser un chiffre d’affaires d’au moins 7,5 milliards d’euros durant les trois derniers exercices.

Au même titre qu’Alphabet, Amazon, Apple, ByteDance et Microsoft, Meta a donc été désigné contrôleur d’accès. Six de ses activités étaient considérées comme des services de plateforme essentiels : Facebook, Instagram, WhatsApp, Messenger, Meta Ads et Marketplace.

« Étaient », car en avril 2025 la Commission déterminait que la plateforme de petites annonces en ligne ne devait plus faire partie des services essentiels contrôlés par le DMA. Meta avait demandé un réexamen de son service d’intermédiation en ligne en mars 2024, un pari gagnant : le régulateur européen a constaté que Marketplace comptait moins de 10 000 entreprises utilisatrices en 2024.

Des éléments « hypothétiques et incomplets »

Meta avait également introduit un recours auprès de la justice européenne pour annuler la décision prise par la Commission en septembre 2023 de qualifier Messenger et Marketplace comme points d’accès majeurs du DMA. L’entreprise a obtenu partiellement raison : la Cour de justice de l’UE annule la désignation de Meta comme contrôleur d’accès en ce qui concerne la Marketplace (PDF). En revanche, le groupe américain conserve ce statut pour Messenger.

La CJUE juge que la Commission a commis « une erreur de droit » : elle avait considéré qu’elle pouvait se fonder uniquement sur des données concernant les trois dernières années ayant précédé la désignation, sans tenir compte de modifications intervenues fin juillet 2023. Meta avait en effet limité le nombre d’annonces pouvant être publiées par utilisateur, ce qui entraînait la disparition du critère de Bruxelles pour identifier les entreprises utilisatrices.

Le tribunal a aussi constaté que la décision de la Commission était « insuffisamment motivée » : elle n’a en effet exposé « aucune analyse concrète de ces modifications », ni expliqué en quoi elles remettaient en cause ou confirmaient la qualification de Marketplace comme service d’intermédiation en ligne. « Les éléments invoqués dans la décision à cet égard demeurent notamment hypothétiques et incomplets », assène l’institution.

La Commission européenne se consolera en observant que la désignation de Messenger comme point d’accès majeur du DMA a été confirmée par la justice. Les arguments avancés par Meta n’étaient pas suffisamment étayés pour remettre en cause la qualification du service. L’entreprise peut toujours faire appel de cette décision.

La Marketplace de Facebook a fait l’objet d’une lourde sanction en novembre 2024 : la Commission avait infligé à Meta une amende de 798 millions d’euros pour pratiques abusives. Cette affaire n’avait cependant rien à voir avec le DMA, Meta ayant été condamnée pour infraction aux règles de l’Union européenne en matière de pratiques anticoncurrentielles. En avril 2025, l’entreprise a en revanche bien été sanctionnée pour violation du DMA, à hauteur de 500 millions d’euros, en l’occurrence sur le dossier des abonnements payants.

  •  

Le décret présidentiel sur l’IA de Donald Trump a été édulcoré

L'industrie IA garde les clés
Le décret présidentiel sur l’IA de Donald Trump a été édulcoré

Donald Trump a finalement signé l’executive order sur l’intelligence artificielle. Le président américain devait apposer son paraphe sur une précédente version du texte, plus contraignante, il y a deux semaines. Mais au dernier moment, l’industrie a réclamé et obtenu des changements importants dans la mouture finale.

Ce n’est pas une bulle du pape, mais pas loin. Dans l’executive order (EO) signé ce mardi 2 juin, Donald Trump rappelle les mesures déjà mises en œuvre depuis le début de son second mandat, dont « [la suppression des] contraintes bureaucratiques que l’administration précédente avait imposées aux développeurs et aux chercheurs américains ». Surtout, l’EO liste une série de mécanismes visant à amplifier le mouvement pour « promouvoir l’innovation et la sécurité de l’IA ».

Report de dernière minute

Mais voilà, ce décret présidentiel aurait déjà dû être paraphé le 21 mai, et tout semblait prêt pour que ce soit le cas. Mais David Sacks, l’ancien « tsar » de l’IA nommé par Donald Trump, a arraché un délai de dernière minute, comme l’explique Politico.

L’ancien EO mettait en place un mécanisme volontaire de supervision pour les entreprises IA : certains modèles avancés auraient pu être soumis à un examen par plusieurs agences fédérales jusqu’à 90 jours avant leur publication. L’administration Trump avait un temps imaginé d’imposer ce dispositif aux entreprises, avant de revenir à une position moins tranchée. La perspective n’en inquiétait pas moins une partie de l’industrie, qui voyait dans ce mécanisme les prémices d’un contrôle gouvernemental plus poussé sur les modèles les plus puissants.

La mesure a notamment été imaginée suite aux craintes d’un modèle comme Mythos sur ses capacités d’attaque envers les infrastructures critiques. David Sacks, porte-voix de l’industrie en sa qualité d’associé fondateur du fonds de capital-risque Craft Ventures, aurait expliqué à Trump que les entreprises n’avaient pas besoin d’une mesure coercitive : elles coopèrent déjà volontairement. Autre argument : un examen des modèles par le gouvernement ralentirait la marche de l’IA, ce qui nuirait aux États-Unis dans sa course contre la Chine.

La signature a donc été reportée et avec elle, une bonne partie du (faible) mordant initial du décret présidentiel. La mouture finale renforce l’idée que le gouvernement fédéral n’impose pas de licence obligatoire, pas d’autorisation avant lancement, pas de « permis » pour publier un modèle. Un cadre est mis en place pour les développeurs volontaires, dans lequel ils peuvent fournir un accès anticipé à leurs modèles 30 jours maximum avant leur mise à disposition.

Le texte ordonne la création, sous les 30 jours, d’un centre de coordination de la cybersécurité liée à l’IA, en collaboration — là aussi volontaire — avec des entreprises du secteur et les opérateurs des infrastructures critiques. Il regroupera plusieurs activités aujourd’hui dispersées entre plusieurs agences du gouvernement pour détecter des vulnérabilités logicielles, mesurer les niveaux de risque de ces failles, coordonner la réponse et la diffusion des correctifs. Il s’agit d’éviter que chacun, dans le privé comme dans le public, fasse sa tambouille dans son coin. C’est louable, mais le caractère non contraignant de ce centre risque d’en diluer la force de frappe.

Un coup pour rien ?

Le décret demande également à plusieurs agences, dont la NSA et le Trésor, de mettre au point dans les 60 jours un processus d’évaluation pour déterminer les modèles IA considérés comme suffisamment puissants pour présenter un risque particulier. Les critères de ce processus resteront secrets, pour éviter que des acteurs malveillants ne connaissent les capacités qui intéressent les autorités.

L’EO ne le précise pas, mais les agences pourraient par exemple mesurer la capacité d’un modèle à découvrir des vulnérabilités zero-day, à écrire du code malveillant, à automatiser des campagnes de piratage, ou à contourner des systèmes de sécurité. Le dernier mot reviendra à la NSA, l’agence du renseignement états-unien. Le NIST, souvent considéré comme plus neutre et technique, est écarté de la décision finale.

L’EO exige aussi du ministère de la Justice de poursuivre les personnes utilisant l’IA pour pirater des systèmes, voler des données ou commettre des infractions informatiques. Si l’architecture générale entre les deux versions du texte est similaire, la version finale adoucit fortement les aspects les plus contraignants pour l’industrie, en insistant notamment sur le caractère volontaire de certaines mesures. Et surtout, elle exclut tout système de licence ou d’autorisation préalable.

  •  

Snapdragon C : premier coup d’œil sous le capot de la puce pour PC Windows à 300 dollars

Windows 11 au régime sec
Snapdragon C : premier coup d’œil sous le capot de la puce pour PC Windows à 300 dollars

Qualcomm a fait résonner les tambours et les trompettes pour annoncer la Snapdragon C, nouvelle puce qui va équiper des PC portables à partir de 300 dollars. L’entreprise n’est pas entrée dans les détails, mais Acer a quelques réponses.

Crise de la mémoire aidant, les constructeurs PC misent beaucoup sur les machines très haut de gamme, comme cela devrait être le cas du Surface Laptop Ultra de Microsoft équipé du nouveau « superchip » RTX Spark de NVIDIA. Il n’y en a cependant pas que pour le premium hors de prix. À l’autre bout du spectre tarifaire, Qualcomm positionne la Snapdragon C pour des PC sous Windows on Arm à partir de 300 petits dollars.

Au-delà de l’effet d’annonce, Qualcomm s’est fait très discret sur les composants et les capacités de cette nouvelle plateforme silicium. Si les premiers portables dotés de la Snapdragon C feront leur apparition dans le courant de l’année, on peut déjà avoir une idée de ce qui attendra les utilisateurs au budget serré.

Un PC Snapdragon C sous cloche

Sur son stand du Computex, Acer présente le premier portable équipé de cette fameuse puce. L’Aspire Go 15 (AG15-Q31P) est visible, uniquement sous cloche. Plusieurs médias ont cependant obtenu un accès privilégié à l’ordinateur. Pas suffisamment pour réaliser des benchmarks, mais assez pour se faire une meilleure idée de la machine.

Ce modèle peut ainsi embarquer « jusqu’à » 8 Go de mémoire vive LPDDR5X et 512 Go de stockage SSD, indique ainsi PC Mag. Pas vraiment de surprise côté stockage, sachant que le MacBook Neo — cible principale de Qualcomm ici — débute à 256 Go. L’enveloppe de RAM interroge en revanche : la formulation laisse entendre que des PC Snapdragon C pourraient tourner avec moins de 8 Go.

Une gageure avec un Windows 11 qui n’est pas spécialement connu pour sa sobriété. Officiellement, le système d’exploitation exige un minimum de 4 Go de RAM pour l’installation, ce qui ne veut pas dire que l’OS fonctionnera de manière satisfaisante avec si peu de mémoire. Jusqu’à présent, les PC fonctionnant sous Windows 11 sur Arm avec une puce Qualcomm (Snapdragon X) bénéficient d’un minimum de 16 Go de mémoire ; ce qui est, au passage, un des critères pour prétendre au statut de Copilot+.

Étrangement, le clavier de l’Aspire Go 15 intègre une touche Copilot, bien que la Snapdragon C n’ait pas été conçue pour prendre en charge toutes les fonctions d’IA en local de Microsoft. La puce embarque néanmoins son propre NPU, mais le composant n’offrira pas les 40 TOPS de base. La présence de cette touche est donc étonnante, à moins que l’éditeur de Windows ait revu ses prétentions à la baisse. Ou pousse tout simplement à une uniformisation des claviers Windows.

Des cœurs de smartphones

Qualcomm a précisé à Tom’s Hardware que le CPU de la Snapdragon C intégrait bien des cœurs Kryo « custom », une architecture déjà utilisée sur ses plateformes mobiles et sur plusieurs générations de puces PC Arm. Ce n’est pas une grande surprise : après tout, le MacBook Neo tourne avec une puce d’iPhone, en l’occurrence l’A18 Pro (6 cœurs CPU).

Image : Tom’s Hardware

Les 8 cœurs de la Snapdragon C affichent une fréquence d’horloge de 1,67 GHz en idle, avec une fréquence de base de 3,01 GHz selon le gestionnaire des tâches. Bizarrement, la puce est appelée Snapdragon 8c Gen 3.

Ce modèle n’existe pas officiellement, mais Qualcomm a bel et bien lancé une plateforme Snapdragon 8cx Gen 3 fin 2021. Il semble qu’il y ait eu un pataquès ici, l’entreprise ayant indiqué à nos confrères que ce n’était pas le nom de la puce.

Dans la série des Snapdragon 8, c’est de toute façon le bazar au niveau des références… Il y a aussi eu pour rappel un Snapdragon 8c en 2019 (avec huit cœurs Kryo 490) dont le but était de « redonner vie aux PC grand public », mais rien depuis sous cette dénomination.

Image : Tom’s Hardware

Châssis en plastique recyclé avec… un ventilateur

Toujours au chapitre des découvertes, la Snapdragon C de ce portable annonce 512 Ko de cache L1, 1,5 Mo de cache L2, 2 Mo de cache L3, soit moins que ce que l’on peut trouver dans des puces 8cx. Il pourrait là aussi s’agir d’une erreur ou de données provisoires. Le circuit graphique affiché est un Adreno 8c gen 3 (peut-être un nom temporaire) avec 1 Mo de mémoire dédiée et 3,9 Go de mémoire partagée.

Pour le reste, l’Aspire Go 15 propose un écran de 16,5 pouces (1 920 × 1 080) avec un ratio 16:9, une batterie d’une capacité de 53 Wh (Qualcomm promet une autonomie d’une journée), deux ports USB-C, un port USB-A, une sortie HDMI 1.4, un port jack, une webcam 1080p avec un cache, ainsi que la prise en charge du Wi-Fi 6E.

Le châssis est en plastique recyclé. Selon Tom’s Hardware, le portable « dispose d’un refroidissement actif avec un ventilateur niché sous les bouches d’extraction au bas de la machine ». C’est un point décevant, d’autant que le MacBook Neo est passif et qu’il existe aussi des portables sous Windows avec de (tout) petits CPU en version fanless.

En dehors d’Acer, HP et Lenovo vont également proposer des PC « à partir de » 300 dollars avec la puce Snapdragon C.

  •  

Pour contrer le scraping des IA, Strava verrouille les accès à son API

Un abonnement pour accéder aux précieuses données de Strava
Pour contrer le scraping des IA, Strava verrouille les accès à son API

Strava fait la police au sein de son écosystème. La plateforme de suivi de sports d’endurance, qui fait aussi office de réseau social pour sportifs, serre la vis de l’accès à ses API pour reprendre le contrôle de ses données et de son infrastructure.

Les robots d’IA qui moissonnent internet à la recherche de données d’entraînement pour leurs modèles ont cette fâcheuse tendance à ignorer les règles habituelles du web, à l’instar du fichier robots.txt censé leur indiquer les pages qu’ils peuvent consulter, et celles qui leur sont interdites. Les labos IA sont régulièrement accusés de n’en faire qu’à leur tête et de siphonner les contenus sans respect des règles de base, à l’image de Perplexity.

Payer pour un accès

Strava, qui fournit un grand volume de données aux développeurs via une API, fait partie des fournisseurs de contenus touchés par ces pratiques agressives. Les acteurs de l’IA « détournent » l’interface de programmation du service, accuse l’entreprise, tandis que les outils de vibe-coding « génèrent des applications qui sollicitent massivement l’API ». Au détriment des usages standards des développeurs (Strava en dénombre désormais 241 000, contre 185 000 l’an dernier).

« Les candidatures à notre programme développeur ont augmenté de 448 % depuis le début de l’année, certains intermédiaires API ont enfreint nos conditions d’utilisation, et les tentatives de scraping ont dégradé les performances de la plateforme pour l’ensemble des utilisateurs. Les abus répétés que nous avons identifiés nous ont conduits à suspendre et à revoir notre processus d’évaluation des candidatures. »

Face à cette mutation du paysage technologique, Strava s’estime forcé à appliquer des changements dans son programme développeur. Jusqu’à présent, certaines informations étaient visibles sans compte développeur : les profils publics, certaines données de clubs sportifs et communautaires. Il faudra désormais une authentification. Par ailleurs, l’accès à l’API via la formule Standard nécessite désormais la souscription à l’abonnement Strava (9,99 euros par mois) pour les nouveaux inscrits ; les développeurs actifs sans abonnement auront 90 jours à partir du 30 juin pour se mettre en règle.

Et ça n’est pas tout. Le 1er septembre, Strava abandonnera des points d’accès API historiques qui permettent de récupérer certains types d’informations, sur les clubs par exemple. Au-delà de l’abonnement obligatoire, c’est probablement le point qui inquiète le plus les développeurs, il existe des apps tierces qui s’appuient en effet sur ces données. « Le niveau d’engagement de la communauté ne justifie plus les ressources nécessaires à la maintenance [de ces accès] », rétorque l’entreprise.

Il ne s’agit pas pour autant de fermer complètement les portes aux développeurs qui exploitent les données de Strava pour leurs applications. Contrairement à Reddit, dont le prix des accès à sa propre API a fini par réduire à peau de chagrin le nombre d’apps tierces, Strava cherche un point d’équilibre. « Nous voulons que les utilisateurs aient le sentiment de garder la maîtrise de leurs données et qu’ils aient confiance dans la façon dont nous les sécurisons. Mais nous souhaitons également que l’écosystème de développeurs continue de prospérer et de grandir », déclare à TechCrunch le directeur général, Michael Martin.

Strava va également adopter MCP (Model Context Protocol), un standard qui permet aux assistants IA et aux apps d’accéder à des données de façon structurée. La plateforme cherche à mieux contrôler les données auxquelles elle donne l’accès, et surtout la manière dont elles sont utilisées.

Ce serrage de boulon n’intervient pas au hasard. Strava a en effet déposé un dossier d’introduction en bourse début février. Il s’agit de montrer aux investisseurs que l’entreprise protège ses précieuses données. Exactement comme l’avait fait Reddit en 2024, avant sa propre IPO. Après avoir bouché les trous dans son API, la plateforme a signé un accord à 60 millions de dollars avec Google pour encadrer l’utilisation par ce dernier des données de ses utilisateurs.

  •  

☕️ Qwant sera le moteur de recherche par défaut des députés européens



Les députés européens accrocs à la recherche Google vont devoir se faire une raison. Le Parlement européen change de moteur par défaut : à partir de ce jeudi, les résultats d’une recherche en ligne proviendront de Qwant, le moteur de recherche français « axé sur la protection de la vie privée, conçu pour éviter le suivi des utilisateurs et la collecte de données personnelles », explique l’e-mail envoyé ce mardi aux parlementaires.

Selon le courriel, révélé par Euractiv et Politico, les raisons de ce changement sont simples : l’engagement déjà pris par le Parlement en faveur de la souveraineté numérique et la protection des données personnelles. Qu’on se rassure, les députés internautes pourront toujours changer le moteur de recherche par défaut, et pourquoi pas choisir Google.

Qwant s’est longtemps appuyé sur son partenaire Bing — détenu par Microsoft — pour ses résultats web. Le moteur français s’est associé à l’allemand Ecosia fin 2024 en vue de développer un index de recherche européen. De son petit nom Staan, il alimente désormais une partie des résultats du moteur, à côté de plusieurs autres sources.

Ce changement est un symbole important, mais ce n’est que ça. Euractiv rappelle en effet que les députés européens utilisent toujours beaucoup de solutions américaines, celles de Microsoft et de Google en particulier. En novembre dernier, des parlementaires avaient demandé à la présidente Roberta Metsola de basculer plusieurs services en ligne vers des fournisseurs européens. « Avec suffisamment de volonté politique », écrivaient-ils, « cette institution sera affranchie du risque de dépendance aux technologies étrangères d’ici à la fin du mandat ».

En février, le Parlement bloquait aussi l’accès aux outils d’IA générative sur les appareils fournis aux députés et à leurs équipes, pour des raisons de sécurité et de protection des données.

  •  
❌