Vue normale

Reçu — 22 décembre 2025 Next - Articles gratuits

Epstein Files : la confusion dans la publication de milliers de documents

22 décembre 2025 à 16:35
What's the point?
Epstein Files : la confusion dans la publication de milliers de documents

L’administration de Donald Trump a publié, comme l’y obligeait une loi votée récemment, des milliers de documents émanant de l’affaire Epstein. Mais tout n’y est pas, pointent notamment certaines victimes du pédocriminel.

Ce vendredi 19 décembre, le département de la Justice (DOJ) états-unien devait, selon l’Epstein Files Transparency Act, « publier (dans un format consultable et téléchargeable) tous les dossiers, documents, communications et éléments d’enquête non classifiés en [sa] possession qui se rapportent à l’enquête et aux poursuites judiciaires concernant Jeffrey Epstein ».

Le jour J, le DOJ a bien livré un outil permettant de naviguer dans près de 4 000 documents mis en ligne, même si Donald Trump s’est montré ces derniers mois plus hésitant sur le sujet, étant lui aussi accusé d’avoir été dans le réseau du pédocriminel décédé en prison en 2019. Comme le décrit Wired, les documents publiés en fin de semaine dernière sont un mélange hétéroclite de photos, de notes manuscrites et d’autres documents qui ont servi à l’enquête sur le pédocriminel. L’outil est moins ergonomique que Jmail, cette boîte mail remplie des correspondances de Jeffrey Epstein, créée par deux informaticiens pour mieux naviguer dans les emails qui circulaient déjà.

Quelques documents et des photos de personnalités déjà impliquées

Il permet néanmoins de trouver des documents du dossier, comme l’explique The Guardian, cette note [PDF] du FBI détaillant les instructions que donnait Jeffrey Epstein pour obtenir des femmes mineures. Y figurent aussi des documents nommant des personnalités dont les noms étaient déjà sortis. Ainsi, ce document [PDF] qui parle de Bill « Clinton, Prince Andrew et Richard Branson », ou des photos montrant des personnes connues (Mick Jagger, Michael Jackson ou encore David Copperfield aux côtés de Jeffrey Epstein ou de sa complice Ghislaine Maxwell).

Rappelons que ces documents ne sont pas forcément des preuves que toutes ces personnes ont eu connaissance ou sont impliquées dans le système de pédocriminalité mis en place.

Des photos de Bill Clinton, une de Donald Trump supprimée puis réintégrée

La sphère républicaine et MAGA (Make America Great Again) a cependant souligné nombre de photos où l’on voit Bill Clinton aux côtés de Jeffrey Epstein, dont notamment l’une d’entre elles où il apparait dans un jacuzzi à côté d’une personne dont le visage est volontairement caché par un carré noir. Bill Clinton a nié auparavant avoir été au courant des crimes commis par Jeffrey Epstein. Selon le Boston Globe, un porte-parole de Bill Clinton a accusé l’administration d’avoir publié ces photos de l’ancien président pour détourner l’attention.

De fait, l’attachée de presse de la Maison-Blanche, Abigail Jackson, a insisté par exemple, sur X, sur une photo de Bill Clinton avec Michael Jackson, la présentant comme une « photo de Bill Clinton avec son bras autour de Michael Jackson, et des personnes dont l’identité a été dissimulée ». Pourtant, cette photo n’a rien à voir avec l’affaire, comme l’ont souligné des utilisateurs de X dans les notes de la communauté. Elle est disponible sur Getty Images depuis 2010 sans que les enfants de Michael Jackson et Diana Ross soient cachés.

Donald Trump figure sur au moins une photo [PDF] du dossier. Elle représente un meuble exposant diverses autres photos sur lesquelles apparait Jeffrey Epstein accompagné d’autres personnalités. Le visage du dirigeant actuel des États-Unis apparait sur l’une d’entre elles qui se situe dans le tiroir ouvert du meuble. Ici aussi, ça n’est pas la preuve de la connaissance de crime. Comme l’explique Ici Canada, plusieurs photos (dont celle-ci) ont été supprimées du dossier public samedi.

Finalement, le DOJ a republié la photo en question dimanche, affirmant sur X l’avoir retirée « afin de la soumettre à un examen plus approfondi ». « Après examen, il a été déterminé qu’il n’y avait aucune preuve que des victimes d’Epstein figuraient sur la photographie, et celle-ci a été republiée sans aucune modification ni expurgation », a ajouté l’administration états-unienne.

Pas grand-chose de neuf selon la presse américaine

Selon une lettre du procureur général adjoint Todd Blanche obtenue par Fox News, plus de 1 200 victimes et leurs familles ont été découvertes au cours de cet examen exhaustif. « Sous la direction du président Donald J. Trump et de la procureure générale Pam Bondi, cette divulgation sans précédent souligne notre engagement à respecter la loi, à faire preuve de transparence et à protéger les victimes », affirme le document.

Mais, pour Associated Press, la publication de ces documents n’apporte pas grand chose de neuf. « Les documents les plus révélateurs publiés jusqu’à présent montrent que les procureurs fédéraux disposaient en 2007 d’éléments solides contre Epstein, mais ne l’ont jamais inculpé », explique l’agence de presse. Le New York Times pointe notamment l’existence d’une plainte pour pédopornographie datant de 1996 et que le FBI a ignorée.

Des documents biffés qui n’apportent pas d’information supplémentaire

Dans le dossier figure aussi une liste de 254 masseuses. Mais le fichier [PDF] est illisible puisque tous les noms sont cachés, le document portant une notice expliquant « expurgé afin de protéger les informations relatives aux victimes potentielles ».

D’autres documents apparaissent largement biffés. Ainsi, des internautes ont remarqué qu’un des documents [PDF] dont certaines parties étaient cachées avait déjà été publié [PDF] auparavant par l’administration, montrant le nom de Donald Trump accompagné de celui de Bill Clinton :

Depuis vendredi, le DOJ essaye de se dépatouiller, sur X, des accusations de censure. « Des expurgations ont été apportées à ces documents lorsqu’ils ont été déposés dans le cadre des affaires judiciaires respectives à l’époque. Nous avons reproduit les documents tels qu’ils se trouvaient en notre possession », expliquait l’administration sur X dimanche.

« On nous laisse tomber », explique une victime

« Nous avons découvert que les documents les plus importants ont disparu », affirmait de son côté le représentant du Parti démocrate, Ro Khanna, vendredi à CNN. « Ils ont fait l’objet de caviardages excessifs, et la question centrale que les Américains veulent connaître – qui sont les autres hommes riches et puissants de l’île qui violent ces jeunes filles ou qui couvrent ces faits – n’a pas trouvé de réponse ». Pour la députée démocrate Alexandria Ocasio-Cortez, ces caviardages protègent « une bande de violeurs et de pédophiles parce qu’ils ont de l’argent, du pouvoir et des relations » et elle demande la démission de la procureure générale Pam Bondi.

De leur côté, les victimes expriment aussi leur frustration. « Ils confirment tout ce que nous avons dit au sujet de la corruption et des retards dans la justice », déplore Jess Michaels, l’une des premières victimes connues de Jeffrey Epstein citée par le New York Times. « Que protègent-ils ? La dissimulation continue ». « Si tout est censuré, où est la transparence ? », interroge Marijke Chartouni, qui accuse Epstein de l’avoir agressée sexuellement lorsqu’elle avait 20 ans. « Énormément de photos sont hors de propos », explique Marina Larcerda, qui a témoigné en 2019 d’abus sexuels lorsqu’elle avait 14 ans. « On nous laisse tomber. Nous attendions ce jour-là pour attaquer en justice d’autres hommes qui ont été protégés ».

[Offert] Ibou : comment le moteur de recherche « made in France » veut indexer le web

22 décembre 2025 à 13:05
Y aura-t-il des ads ibou ?
[Offert] Ibou : comment le moteur de recherche « made in France » veut indexer le web

Est-il possible de créer aujourd’hui un moteur de recherche sans faire partie des plus grosses entreprises du secteur ? Pour explorer ce thème, nous nous sommes entretenus avec Sylvain Peyronnet, PDG de Babbar.

Pour les fêtes de fin d’année, Next vous offre cet article initialement paru le 24 septembre 2025 et réservé aux abonnés. Pour lire les prochains entretiens dès leur publication, abonnez-vous !


Depuis quelques semaines, Next a repéré sur les réseaux sociaux un nouveau projet français de moteur de recherche (conversationnel, cette fois) porté par l’entreprise Babbar : Ibou. Connaissant un autre projet de moteur de recherche dont les résultats se sont trouvés datés et limités, nous étions curieux de savoir s’il était possible d’en monter un avec un index correct, à jour et qui pourrait profiter des nouvelles technologies comme les LLM pour améliorer son fonctionnement.

Nous avons interrogé Sylvain Peyronnet, PDG de Babbar. Son entreprise est spécialisée dans les outils permettant aux spécialistes du SEO d’améliorer leurs stratégies. Lui est un ancien enseignant-chercheur en intelligence artificielle, mais aussi l’ancien responsable scientifique de Qwant, parti en 2019.

>> Qu’est-ce qu’il y a derrière ce nom d’Ibou à l’apparence très française ?

C’est un projet de moteur de recherche de l’entreprise Babbar. Celle-ci fait, depuis que j’ai quitté Qwant et qu’on l’a montée, des outils qui font tourner en arrière-plan un moteur recherche, pour comprendre ce que fait Google et fournir de la data aux gens qui font du référencement web. Pour différentes raisons, nous avons décidé de pivoter. Nous avons commencé à créer un moteur de recherche conversationnel depuis quelques mois. Et nous l’avons annoncé quasiment dès qu’on a commencé le travail.

Ibou, même si on joue beaucoup avec des logos liés à l’oiseau parce qu’on est en France, ça n’a rien à voir : c’est un mot d’égyptien ancien qui veut dire « les cœurs », car, dans l’Égypte ancienne, le cœur était le siège du raisonnement et de la mémoire.

>> Qu’est-ce qui vous a amenés à imaginer ce projet ?

En travaillant dans le secteur du moteur de recherche depuis longtemps, nous nous sommes rendu compte de plusieurs choses.

Déjà, jusqu’au paradigme conversationnel, les moteurs n’étaient pas vraiment faits pour de la recherche d’information, mais pour de la recherche documentaire : ils renvoyaient des pages web. Pourtant, quand les gens tapent une requête dans un moteur, la plupart du temps, ils s’en fichent un peu. Ce qu’ils attendent, c’est une réponse qui les satisfait et qui leur permet de réaliser les tâches qu’ils veulent réaliser.

« L’émergence des LLM a permis de faire percoler des informations humaines dans des objets mathématiques »

Ensuite, pour faire un bon moteur, le nerf de la guerre était d’avoir beaucoup de données utilisateurs pour comprendre l’être humain et affiner ce que faisaient les algorithmes et qui n’était jamais parfait. Et pour parfaire les résultats d’un moteur, il fallait beaucoup de comportements humains.

L’émergence des LLM, et surtout des LLM alignés, a permis de faire percoler des informations humaines dans des objets mathématiques, les modèles. Maintenant, une partie des choses qui pouvaient être faites grâce à la data humaine peut être faite grâce aux modèles qui existent. Bien sûr, ceux-ci ont été fabriqués avec de la data humaine. Mais, comme c’est à l’intérieur du modèle et que c’est pas très cher de faire tourner des modèles, une partie de la difficulté, et notamment de la barrière à l’entrée, de la création d’un moteur a disparu, parce que le modèle a incorporé cette connaissance des humains.

C’est pour ça qu’on a décidé de se lancer aujourd’hui. En réalité, n’importe quelle équipe de personnes qui sont un peu douées en algorithmique peut faire des moteurs de bonne manière.

>> L’idée est donc de faire un moteur de recherche conversationnel sur quels types de contenus ? Textuels, images, audio ?

Notre moteur a vocation, à terme, à mettre en avant l’information. Et donc la multimodalité fait partie du pack, puisqu’en réalité, l’information n’est pas que textuelle, qu’image, etc. Mais il faut être raisonnable : au début, on ne va avoir que textes et images. Pour la vidéo, ce n’est pas un problème algorithmique, mais nous n’avons juste pas les moyens. Ça arrivera plus tard si on arrive à montrer qu’on est capables d’avoir des résultats de bonne qualité sur textes et images.

Mais nous avons une vision un peu différente des autres de ce que doit être un moteur de recherche, et une vision plus ouverte du web que ce que proposent la plupart des plateformes actuelles. Notamment, nous voulons être un moteur qui répond à l’utilisateur, mais pas comme un LLM classique comme ChatGPT ou autres, avec un texte qui explicite absolument tout. Cela génère souvent une mauvaise qualité de réponse.

« On veut aussi garantir un pluralisme »

Indépendamment des hallucinations ou des mensonges, en réalité, les gens veulent souvent accéder à une source. La bonne réponse, de notre point de vue, est l’explication de pourquoi il faut aller lire une source. Nous voulons nous interposer à un niveau intermédiaire avec toutes les modalités qui permettent d’expliquer, les images, les cartes, etc.

On pense aussi qu’il ne faut pas prendre les gens pour des abrutis. Actuellement, les moteurs ont des biais terribles et ne présentent qu’une seule partie de l’information. On veut aussi garantir un pluralisme. L’actualité est traitée par chaque média depuis son point de vue, et c’est compréhensible, chaque média a sa ligne éditoriale particulière. Mais un moteur de recherche peut tout à fait mettre en avant la diversité de point de vue.

>> Ça fait penser aux vieilles approches de portail d’informations comme Yahoo ou autre. Vous en êtes-vous inspirés ?

Peut-être de façon involontaire : ça correspond à l’image du web qu’on a dans l’équipe, qui est plus composée de vieux barbus que de startupers. Mais la technologie permet de faire des choses beaucoup plus subtiles que ce qu’on faisait avant. Nous allons avoir une verticale qui va se rapprocher fortement d’un portail : Ibou Explorer, un équivalent de Google Discover, mais de qualité. Ici, toutes les sources seront directement présentées dans leur diversité, avec une personnalisation. On sera là plus proche d’une idée de portail, comme ceux de Yahoo, etc. J’espère qu’on va réussir à faire un meilleur travail.

Par contre, sur la partie moteur, il y a une partie de curation. Il va falloir trouver le bon équilibre et savoir où la curation s’arrête : on ne veut pas prendre le pas sur la réflexion de l’humain.

>> Concernant la curation, il y a aussi celle des contenus diffusant des informations volontairement fausses et des contenus générés par IA. Ibou va-t-il prendre en compte ces problématiques ?

Ce sont deux sujets sur lesquels nous travaillons. Le premier, la véracité de l’information, est le plus simple. Nous expliquons dans notre manifeste que nous voulons donner des informations de qualité. La qualité, pour nous, étant la correction de l’information et son utilité. Pour l’utilité, c’est assez clair : à tel type de personne, est-ce que l’information va lui servir pour réaliser sa tâche ?

La correction est de savoir si une chose est vraie ou fausse, sachant qu’il y a toute une gradation et qu’à un moment donné, une chose peut n’être ni vraie ni fausse (une opinion, par exemple). Il y a une vraie difficulté technique à faire ça. Nous avons prévu un processus pour qu’une chose abusivement fausse ne puisse pas passer, avec quelques erreurs de temps en temps. Mais sur l’actualité, il est parfois difficile de repérer le mensonge. La grosse partie de ce qui est de la propagande, qui est de la manipulation, se repère plus sur la qualité intrinsèque des contenus que par rapport à l’information elle-même et sa véracité.

Par rapport aux contenus IA, dans notre prototype Ibou Explorer, ce qui compte, ce n’est pas que le contenu soit généré par IA ou pas, mais s’il a un niveau tel qu’il aurait pu être écrit par un être humain. Nous allons donc plutôt qualifier si un contenu qui s’annonce journalistique s’appuie réellement sur les sources qu’un journaliste aurait utilisées, par exemple. On essaye de vérifier quel est le type de personne qui a écrit (en s’appuyant sur le niveau de langage, le type d’écriture, si la personne a écrit des articles dans des médias de confiance, etc). C’est des choses qu’on arrive à faire et qu’on peut utiliser.

Pour Ibou Explorer, c’est d’autant plus facile à faire qu’on est sur un nombre de sites qui est beaucoup plus petit. Il est donc beaucoup plus facile de comprendre quelles sont les sources de qualité et les autres. Sur le search à très grande échelle, il faut que nous industrialisions ce processus, ce qui coûte très très cher. Nous essayons en ce moment d’en réduire les coûts.

>> Mais il est difficile, pour le public, de comprendre quels paramètres permettront de discriminer…

C’est la vraie problématique. Nous voulons être transparents algorithmiquement. Nous allons donc communiquer certaines choses. Nous faisons des analyses sur le vocabulaire utilisé, on le compare au vocabulaire utilisé sur d’autres sites web, etc. Par exemple, pour le Monde, nous listons les contenus qu’il publie et statistiquement leurs caractéristiques. Ça crée ensuite des empreintes pour des classifieurs qui permettent de facilement repérer si des contenus sont susceptibles d’être les mêmes, s’en approchent, etc. C’est par des artifices statistiques que nous allons faire les choses, c’est le seul moyen d’automatiser.

Bien sûr, nous savons qu’il y a toujours moyen, en travaillant vraiment à publier des choses qui ressemblent à de bons articles. L’avantage, c’est que les gens qui font de la fake news publient en masse et ne travaillent pas bien un article unitairement, et il est donc possible de les repérer.

Les jugements humains d’invalidation, notamment pour la partie Ibou Explorer, ne viendront qu’a posteriori.

Mais il y a des mécanismes algorithmiques en plus sur lesquels nous ne pouvons pas être transparents, sinon les gens pourraient savoir comment passer outre. Par contre, nous allons mettre en place une interface, un peu comme la Google Search Console, où les gens pourront demander pourquoi telle ou telle page n’est pas dans Ibou. Et nous donnerons la qualification que nous en faisons (« il n’est pas de qualité pour telle ou telle raison », par exemple), sans pour autant expliquer comment nous l’avons fait.

Nous avons un système, par exemple, qui donne la probabilité qu’un contenu soit écrit par un humain, une IA ou un humain assisté d’une IA. Bien sûr, ça se trompe : il y a souvent des contenus écrits par des humains qui sont détectés comme générés par des IA parce que les humains ont mal écrit. On se trompe davantage dans ce sens, car il y a assez peu de gens qui font de bons contenus IA. Nous donnerons aussi un outil qui analysera le texte et qui donnera notre conclusion.

>> Ciblez-vous l’indexation du web francophone, anglophone ou carrément tout le web ?

Aujourd’hui, nous crawlons tout le web, même si nous avons priorisé le francophone et quelques langues des pays limitrophes à la France. Nous ferons ensuite toutes les langues qu’on peut faire : pour des raisons algorithmiques, certaines langues (indépendamment des marchés) sont difficiles, comme les langues asiatiques ou le finlandais. Le russe, nous ne l’indexons pas. Même dans Babbar, nous ne le crawlons plus, en ce moment : ça ne sert à rien puisqu’il n’y a plus de marché.

Nous n’avons pas vocation à nous limiter à notre marché domestique. Mais on va mettre une priorité sur les contenus européens, car notre public sera probablement européen, mais ça ne veut pas dire qu’on ne traitera pas les autres langues. On va simplement favoriser des contenus susceptibles d’être cherchés par nos utilisateurs.

>> Concernant la souveraineté, quelle est votre position ? Où seront installés vos serveurs ?

Je n’aime pas cet axe de la souveraineté qui est utilisé par beaucoup de mes camarades. Nous sommes plus souverains que quiconque. Nous avons des machines qui nous appartiennent en propre, physiquement. Nous les maintenons avec nos équipes en France et elles sont à Marcoussis dans le 91.

Nous n’utilisons pas de solution de cloud : nos modèles tourneront « on premise », ne serait-ce que pour des raisons économiques et écologiques. Ça n’a aucun sens d’utiliser du cloud, surtout aux États-Unis, pour faire ça. Nos données sont stockées en France. Enfin, pour garantir notre service, nous avons des machines que nous administrons chez deux opérateurs : OVH (en France et aux Pays-Bas) et Scaleway (en France). Nos capitaux sont tous français. Mais je dis plutôt « made in France » plutôt que « souverain ». Pour nous, ça coule de source, puisqu’on vit et on travaille ici.

>> Quelles ressources en temps et en argent sont nécessaires pour crawler le web maintenant et le sauvegarder ?

Beaucoup moins qu’avant. Moins pour nous que pour d’autres, mais ça demande quand même beaucoup de ressources. Crawler le web, ce n’est pas ce qui va demander le plus de ressources, mais c’est le stocker et l’indexer ensuite. Aujourd’hui, le crawler historique à l’origine de la technologie mise en place pour Babbar tourne sur six à huit serveurs et doit nous coûter pas plus de 15 000 euros par mois pour crawler quatre milliards de pages par jour.

Ce qui coûte très cher, c’est le stockage. Mais avec une infrastructure qui coûte à la louche un million d’euros, on a une infrastructure qui se situe dans les 15 premiers crawlers mondiaux et qui est largement capable de scrawler un index qui peut servir toute l’Europe. On a créé une énorme base de données.

Mais un moteur de recherche, c’est aussi des millions d’utilisateurs et les infrastructures de services coutent cher aussi. Il faut donc faire « scaler » le service, ce qui est uniquement proportionnel au nombre d’utilisateurs.

Tout ça, ce sont quelques millions d’euros maintenant, là où c’étaient des dizaines de millions il y a quelques années.

>> Quelle est modèle économique du projet Ibou ?

C’est le même que tout le monde. Il ne sera pas mis en avant dans un premier temps, mais ce sera un modèle lié à de la monétisation. C’est un modèle B2C, avec monétisation B2C standard et un peu de publicité, un peu d’affiliation, des fiches entreprises… Le nerf de la guerre, pour financer les opérations, ce sera essentiellement d’avoir du trafic. Comme Google, Bing, etc. Pour l’affiliation, la logique ne sera pas d’avoir un deal exclusif avec un programme d’affiliation en particulier, mais de faire des deals avec plusieurs programmes.

« Quelqu’un qui fait 20 ou 30 millions d’euros par an en France peut faire un moteur de recherche très rentable »

Nous débutons et on sait que ça coute cher d’entretenir un moteur, il faut quelques millions par an, mais ça ne coute pas le prix auquel voudraient nous faire croire les GAFAM. Il n’y a pas besoin de faire 10 milliards de bénéfices pour faire tourner un moteur de recherche. Quelqu’un qui fait 20 ou 30 millions d’euros par an en France peut faire un moteur de recherche très rentable.

>> Est-ce que vous assurerez à vos utilisateurs que leurs données seront protégées ?

Ayant travaillé chez Qwant, je ne sais pas qui est capable de donner une telle garantie. Je pense que c’est littéralement impossible. La donnée utilisateur que nous allons garder qui pourra intéresser le plus le RGPD, ce sera la donnée de personnalisation du Ibou Explorer, à travers un compte utilisateur et le consentement pour l’utiliser.

Mais elle ne sera pas utilisée par les algorithmes de pub, car ceux-ci n’en ont finalement pas besoin. Ils ont besoin juste de savoir ce sur quoi ils s’affichent. Et quand une page s’affiche, maintenant avec les LLM, c’est extrêmement simple de comprendre le contexte de la page. Avec des éléments de contexte suffisant, on peut faire de la pub qui est aussi performante que celle qui utilise l’information utilisateur. Donc pour la pub que nous opérerons nous-mêmes, il n’y aura pas de données utilisateur conservées et utilisées. Après quand on envoie quelqu’un chez un tiers, on ignore ce qui s’y passe.

>> Donc pas de système de traqueurs dans le modèle économique de Ibou ?

Non. Déjà, ce n’est pas notre vision. Et je pense que si on fait ça, on devient un aspirateur de données et on ne fait plus le même moteur. Si on devait faire ça, actuellement, on ferait plus un réseau social.

>> Le copyright et les droits voisins sont des questions sensibles quand on parle de moteur de recherche avec IA générative. Comment envisagez-vous la question ?

Nous envisageons la question verticale par verticale. Sur la partie Ibou Explorer, qui est la plus touchy (80 % des contenus viennent de médias), nous n’allons pas faire de résumé IA. Nous ne voulons pas nous approprier les contenus. Nous ne faisons que du renvoi de trafic vers les tiers, avec un mécanisme d’opt-out et des accords partenariaux.

Sur la partie search, il y aura aussi un mécanisme d’opt-out, car il y a des problématiques qu’on ne pourra jamais résoudre. Pour la partie présentation de l’information, nous voulons systématiquement renvoyer vers les sources. Par exemple, si quelqu’un demande « est-ce qu’il faut un visa pour aller dans tel pays ? », notre système va répondre « oui » ou « non », mais ne va pas donner plus d’informations. Il va, par exemple, répondre « Oui et tout est expliqué sur ce site » et c’est seulement si la personne demande d’aller plus loin sans passer par le site qu’on va donner plus d’informations. Nous voulons renvoyer au maximum vers les sources elles-mêmes.

Nous réfléchissons encore à un mécanisme pour reverser une partie des revenus associés aux réponses qui contiennent cette source, mais nous n’avons aucune idée encore de ce qu’on voudrait faire.

« La connaissance, c’est du ressort du moteur de recherche et des sources, pas du LLM »

>> Concernant la possibilité de régurgitation de contenus copyrightés, comment gérerez-vous ?

C’est un problème qui n’existera pas. Venant de l’IA, nous faisons partie des gens qui pensent que les LLM ne sont absolument pas autre chose qu’un outil d’écriture. Nous n’utiliserons pas d’information contenue dans le LLM. Ça change d’ailleurs tout pour nous, parce que nous n’avons pas besoin d’utiliser un LLM de très grande dimension comme ceux d’OpenAI ou à 500 milliards de paramètres. Ça n’a aucun intérêt de s’en servir, car s’ils ont autant de paramètres, c’est pour pouvoir s’en servir sur des questions qui nécessitent de la connaissance. C’est une profonde erreur.

La connaissance, c’est du ressort du moteur de recherche et des sources, pas du LLM. De tous les mastodontes qui existent devant nous, le seul qui est sur une approche à peu près similaire à la nôtre, c’est Perplexity. Mais ChatGPT et les autres font une profonde erreur : ils ne pourront jamais faire des bons outils de recherche, car ils sont persuadés que le LLM peut contenir du savoir et de l’information, ce qui n’est pas vrai. Ils n’ont pas été créés pour ça et on croit qu’ils en contiennent, car ils sont capables de broder un discours sur des bribes d’information qu’ils ont vues. Ce qui n’est pas du tout la même chose que d’avoir de l’information.

Tant qu’on ne va pas au-delà des transformers, la question est réglée par le fait qu’en réalité on a un moteur de recherche avec un index proche de ce qui se faisait avant, mais qui peut être facilement interfacé avec un LLM, qui lui va se contenter d’écrire les réponses. Chacun son rôle : le LLM comprend la langue, le moteur connaît l’information. Le LLM est un documentaliste qui sait utiliser un moteur de recherche et qui peut nous renvoyer vers les contenus pertinents.

C’est aussi le seul moyen de contrôler la véracité d’une information. Sinon, quand on fait confiance à un LLM pour donner une information, il y a toujours 5 à 10 % de taux d’erreur automatiquement.

>> Pourra-t-on utiliser les opérateurs de recherche comme site:, intitle: ou fileformat: ?

Le moteur grand public d’Ibou ne le permettra pas car c’est un moteur conversationnel et que nous n’indexons pas à proprement parler les pages web, mais les informations les plus importantes et une référence à la page. Ainsi, toute une partie des opérateurs devient inopérante, car on peut indexer le titre parce qu’on pense que c’est du contenu important sans pour autant stocker que c’est le titre.

Il y a aussi une API sur l’index qui existe et qu’on utilise pour faire le moteur. Ce n’est pas exclu qu’on permette à d’autres de pouvoir y accéder.

>> Pourquoi, maintenant, pensez-vous que c’est possible d’indexer le web alors que Qwant, pour lequel vous avez travaillé, a essuyé des problèmes pour le faire à l’époque ?

Dans Babbar, on indexe et on crawle déjà beaucoup plus que ce qui est nécessaire pour faire un moteur de recherche, car on vend de la data aux référenceurs. On doit vendre aussi de la data que les moteurs ne prennent pas en compte pour aider les SEO à comprendre pourquoi ils arrivent à se positionner et pourquoi ils n’y arrivent pas.

« Faire un index qui classe les bonnes pages dans les premières, c’est ça qui est difficile »

À Babbar, on a un index qui était de 2 000 milliards de pages, mais qui a beaucoup diminué pour lancer Ibou : on est maintenant à 1 400 milliards de pages sur la partie Babbar. Et même si ce n’est pas tout à fait les mêmes index puisqu’un moteur a besoin de plus de données mais sur moins de pages, on est sur des choses très similaires. Et faire un index, ce n’est pas un problème : on a déjà un index complet qui tourne avec des résultats de recherche. Mais même si on pense qu’on est déjà meilleurs que d’autres ne l’ont été précédemment, pour l’instant, on estime que notre projet n’est pas encore au niveau et on ne veut pas créer une mauvaise image alors qu’on est encore en train de travailler.

La seule vraie difficulté qu’il y avait avant, ce n’était pas la partie index – que nous avons résolue dans Babbar depuis longtemps –, mais qu’il fallait de la data utilisateur pour faire les choses. Faire un index qui contient les bonnes pages, ce n’est pas difficile, faire un index qui classe les bonnes pages dans les premières, c’est ça qui est difficile. Ce sont les fonctions de ranking.

Depuis 2005, ces fonctions n’étaient bonnes que s’il y avait une data utilisateur qui permettait de compenser tous les problèmes que les algorithmes ne sont pas capables d’arbitrer. C’est ce qu’on a vu dans le procès de Google : l’utilisation massive de la data comportementale des utilisateurs au niveau du moteur, c’est ça qui fait la qualité du moteur. Et Google est le plus fort, parce qu’il a beaucoup plus de données que Bing par exemple. Mais avec les LLM, il n’y a plus besoin de cette data pour faire quelque chose de bien, parce que le LLM peut simuler l’humain en grande partie et suffisamment bien pour faire les dernières étapes de tris.

Une fois que les algorithmes ont bien travaillé, il reste des scories : peut-être 10, 20 ou 30 % de l’index sont en tête et ne devraient pas, et c’est le LLM qui en enlève une grosse partie. Et en plus, quand on fait la synthèse des réponses, le LLM prenant plusieurs sources simultanément réussit à donner une réponse qui est bien meilleure que si on prenait chaque source indépendamment les unes des autres, en faisant comme l’être humain qui va lire plusieurs contenus pour faire sa propre opinion.

Pour en revenir à la question, cette dernière étape, qui était plus une étape de coût, est beaucoup plus facile à faire et la barrière de la data massive a complètement disparu.

>> Quelle est l’articulation entre Babbar et Ibou ?

C’est la même boite, les mêmes personnes. Nous espérons que tout va bien se passer pour nous, avec peut-être de l’aide de l’extérieur on ne sait pas encore, et qu’on va pouvoir recruter cette année. Par contre, ce sont des infrastructures techniques séparées parce que ce sont des outils qui n’ont pas du tout le même objectif. Donc algorithmiquement, c’est assez différent pour qu’il n’y ait aucun intérêt pour nous à ce que ce soient les mêmes plateformes.

Le crawler de Babbar est un crawler SEO, le crawler d’Ibou sera un moteur de recherche. Nous n’avons pas vocation à être autorisés à crawler de la même manière tous les sites selon le métier. Si on avait un crawler IA, ce serait encore une autre plateforme, car on ne peut pas mélanger les genres et que, pour être respectueux des gens, c’est ce qu’il faut faire. On veut aussi séparer parce que, aujourd’hui, notre activité est largement soutenue par notre activité SEO, mais on se doute qu’à un moment donné se posera la question de savoir si les deux activités doivent rester côte à côte ou pas.

>> Quand Ibou sera disponible ?

Pas avant un an. Pour les premières verticales, comme la partie Ibou Explorer (ndlr : l’équivalent de Google Discover), ça devrait arriver début 2026.

Reçu — 19 décembre 2025 Next - Articles gratuits

☕️ La justice ordonne le blocage de WatchPeopleDie par les principaux FAI français

19 décembre 2025 à 14:15

Suite à une demande de l’Arcom faite en novembre dernier, la justice a ordonné aux principaux fournisseurs d’accès internet Orange, Free, Free Mobile, SFR, SFR Fibre et Bouygues Télécom de bloquer le site montrant des vidéos horribles de personnes en train de mourir dans diverses situations.

L’Informé avait révélé le signalement par l’autorité administrative au tribunal judiciaire de Paris, expliquant que « la ligne éditoriale de la plateforme est entièrement dédiée à publication de contenus illicites, violents et attentatoires à la dignité humaine ».

Le tribunal a pris sa décision ce jeudi 18 décembre, selon l’AFP qui a pu consulter le jugement. Le tribunal demande aux FAI de « mettre en œuvre, ou de faire mettre en œuvre, toutes mesures les plus adaptées et les plus efficaces propres à empêcher l’accès, à partir du territoire français et par leurs abonnés situés sur ce territoire » au site et ses miroirs sous quinze jours.

Comme l’expliquait L’Informé, l’Arcom s’appuyait sur l’article 6 - 3 de la loi sur la confiance dans l’économie numérique (LCEN), selon lequel « le président du tribunal judiciaire, statuant selon la procédure accélérée au fond, peut prescrire à toute personne susceptible d’y contribuer toutes les mesures propres à prévenir un dommage ou à faire cesser un dommage occasionné par le contenu d’un service de communication au public en ligne ».

Dans son ordonnance, que notre confrère Marc Rees a partagée sur LinkedIn, la juridiction relève que ce site, « non seulement n’est porteur d’aucune information, opinion ou idée (…) mais est à l’inverse entièrement dédié à la diffusion d’images extrêmement violentes, attentatoires à la dignité humaine et susceptibles de toucher et choquer un jeune public et d’avoir sur lui une influence néfaste ».

Non content de ne pas avoir de mentions légales, Watchpeopledie n’a en outre « jamais répondu aux demandes de retrait présentées par les autorités françaises », en particulier l’office anti-cybercriminalité de la direction générale de la police nationale (OFAC), relève Marc Rees.

Il souligne que le blocage du site « devra perdurer tant que durera la diffusion des contenus illicites », mais qu’il pourra être levé en cas de « cessation du dommage, disparition du site ou de désactivation du nom de domaine ».

☕️ TikTok US : accord bouclé

19 décembre 2025 à 08:48

Un mémo interne à TikTok, qu’Axios a pu consulter, confirme que ByteDance et le gouvernement états-unien sont bien arrivés à un accord, comme l’avait annoncé la publication d’un executive order de Donald Trump en septembre dernier.

Selon ce texte envoyé par le CEO Shou Chew aux salariés, l’accord sera signé le 22 janvier et une coentreprise basée aux États-Unis sera créée.

TikTok

Les entreprises américaines Oracle et Silver Lake et l’émiratie MGX auront chacune 15 % de cette coentreprise.

De son côté, ByteDance devrait détenir 19,9 % de la nouvelle entité et 30,1 % seraient possédés par diverses filiales de l’entreprise chinoise.

Ainsi, comme l’explique le Financial Times, cela laisserait à ByteDance le contrôle direct de ses activités commerciales principales aux États-Unis. Selon le journal économique britannique, le mémo interne indique, par contre, que le « conseil d’administration [sera] composé de sept membres, majoritairement américains ».

D’après le mémo, la coentreprise « fonctionnera comme une entité indépendante ayant autorité sur la protection des données, la sécurité des algorithmes, la modération des contenus et l’intégrité logicielle aux États-Unis, tandis que les entités américaines de TikTok Global géreront l’interopérabilité des produits à l’échelle mondiale et certaines activités commerciales, notamment le commerce électronique, la publicité et le marketing ».

L’accord devrait valoriser TikTok US aux alentours de 14 milliards de dollars, selon une source d’Axios.

Reçu — 18 décembre 2025 Next - Articles gratuits

noyb accuse TikTok de récupérer des données venant de Grindr à propos de ses utilisateurs

18 décembre 2025 à 10:33
TikTok tact
noyb accuse TikTok de récupérer des données venant de Grindr à propos de ses utilisateurs

L’association de Max Schrems vient de déposer deux plaintes contre TikTok devant l’autorité de protection autrichienne. Elle accuse notamment le réseau social de récupérer des données de ses utilisateurs venant d’applications extérieures comme Grindr en passant par AppsFlyer, une entreprise de revente de données israélienne.

TikTok accumulerait des données de ses utilisateurs venant d’autres applications et sites. Accompagnant un utilisateur de l’application, noyb a porté plainte, devant l’autorité de protection de données de son pays, la DSB, en accusant TikTok de stocker certaines données qu’il n’a remplies que dans l’application Grindr.

Dans sa plainte [PDF] dans laquelle elle attaque aussi Grindr et l’entreprise israélienne AppsFlyer, l’association autrichienne explique qu’en voulant télécharger les données le concernant stockées par TikTok, l’utilisateur en question a remarqué que l’archive contenait une référence à des données d’activité en dehors de TikTok, alors que la politique de confidentialité ne donne aucune information concernant le stockage de ce genre de données.

Voulant aller plus loin, il a bataillé avec les services de TikTok pour obtenir plus d’informations. Finalement, après plusieurs échanges, l’entreprise lui a fourni deux tableaux contenant des informations sur des données venant d’ailleurs, sans pour autant transmettre les données en question. La plainte explique que ces tableaux contiennent « par exemple […] des informations sur les autres applications utilisées par le plaignant (telles que Grindr), les actions entreprises par le plaignant dans d’autres applications (telles que l’ouverture de l’application ou l’ajout d’un produit au panier), ou si un événement dit de conversion a eu lieu (c’est-à-dire si un utilisateur a effectué l’action souhaitée après l’affichage d’une publicité sur TikTok) ». La plainte insiste sur le fait que les données récoltées sont aussi visibles sur l’application Grindr utilisée par le plaignant.

Grindr et le data broker AppsFlyer aussi visés

Les avocats de noyb et du plaignant accusent donc TikTok d’avoir enfreint le RGPD, et notamment l’article 5(1)(c) qui impose que les données personnelles collectées soit « adéquates, pertinentes et limitées à ce qui est nécessaire au regard des finalités pour lesquelles elles sont traitées ». Mais ils pointent aussi le fait que l’entreprise, en récupérant des données hors TikTok, l’a fait sans aucune base légale. Enfin, ils appuient sur le fait que certaines données venaient de Grindr et concernaient l’orientation sexuelle du plaignant, données particulièrement encadrées par l’article 9 du RGPD.

Pour récupérer ces données, la plainte affirme que « selon les informations fournies, TikTok a probablement obtenu ces informations auprès du courtier en données en ligne « AppsFlyer » ». Cette entreprise israélienne est aussi formellement visée par la plainte de noyb. Elle y est accusée d’avoir transféré à TikTok illégalement les données personnelles de l’utilisateur. Ici aussi la plainte insiste sur le fait que des données protégées par l’article 9 du RGPD sont concernées.

Si les avocats de l’association ne donnent pas d’éléments de preuve dans le document, ils y affirment qu’ « il est factuellement clair que Grindr a partagé les données d’activité du plaignant avec (au moins une) tierce partie (« AppsFlyer »), qui a ensuite partagé ces données (directement ou indirectement) avec TikTok ». Ceci sans que l’utilisateur ne donne son consentement et sans s’appuyer sur aucune autre base légale.

La récupération de données venant de Grindr, « qu’un exemple parmi les plus extrêmes  »

« À l’instar de nombreux de ses homologues américains, TikTok collecte de plus en plus de données provenant d’autres applications et sources », commente Kleanthi Sardeli, avocate spécialisée dans la protection des données chez noyb, dans un communiqué publié sur le site de l’association. « Cela permet à l’application chinoise d’obtenir une image complète de l’activité en ligne des utilisateurs. Le fait que les données provenant d’une autre application aient révélé l’orientation sexuelle et la vie sexuelle de cet utilisateur n’est qu’un exemple parmi les plus extrêmes », ajoute-t-elle.

La deuxième plainte [PDF] de noyb ne concerne que TikTok et découle, de fait, de la première. L’association accuse le réseau social de ne pas partager avec ses utilisateurs toutes les données qu’elle agrège sur eux dans la fonctionnalité de récupération de données personnelles alors que son outil affirme le contraire. Elle lui reproche aussi un manque d’information sur les données partagées à cette occasion.

Next a contacté les trois entreprises dans la matinée. Elles n’avaient pas fourni de réponse à l’heure de publier cet article. Nous actualiserons cette actualité le cas échéant.

Reçu — 16 décembre 2025 Next - Articles gratuits

☕️ Une licence collective pour l’utilisation d’images dans les articles scientifiques

16 décembre 2025 à 15:10

Les chercheurs et chercheuses qui travaillent sur des images peuvent dès à présent les inclure dans les articles en open access en se posant moins de questions.

Le ministère de la Recherche a mis en place une « licence collective étendue » qui facilite l’utilisation d’images dans les publications en accès ouvert, explique-t-il.

Cette licence est issue d’une convention passée avec les organismes de gestion collective des droits d’auteur : ADAGP (Société des auteurs dans les arts graphiques et plastiques), SAIF (Société des Auteurs des arts visuels et de l’Image Fixe), Scam (Société civile des auteurs multimédia).

« Cette mesure bénéficie particulièrement aux disciplines où l’image est un objet d’étude essentiel, comme l’Archéologie, la Géographie, l’Histoire, l’Histoire de l’Art ou encore la Sociologie. Elle s’applique également aux Sciences, Technologies et en Médecine, lorsque les images utilisées ne sont pas produites en laboratoire », explique le ministère.

Jusqu’à récemment une telle chose n’était pas possible, mais l’article 28 de la loi de programmation de la recherche de 2020 prévoit que le gouvernement puisse prendre des ordonnances pour modifier le Code de la propriété intellectuelle « aux fins de permettre l’octroi de licences collectives ayant un effet étendu ». Une ordonnance a ensuite été prise en 2021.

Les chercheurs, notamment ceux en sciences humaines et sociales qui travaillent sur des images, devaient effectuer des « démarches complexes image par image : identification des ayants droit, demandes d’autorisation, contractualisation et paiement », explique le ministère. Désormais, ils devront seulement signaler l’image utilisée à l’aide d’un formulaire.

Pour cette licence, le ministère explique assurer « un paiement forfaitaire aux ayants droit » sans donner d’information sur le montant et les diverses conditions de la convention.

Reçu — 15 décembre 2025 Next - Articles gratuits

Législation sur l’IA : Donald Trump tente de préempter le sujet au détriment des États US

15 décembre 2025 à 15:31
One state beyond
Législation sur l’IA : Donald Trump tente de préempter le sujet au détriment des États US

Plusieurs États américains sont en pleine réflexion pour légiférer sur l’IA ou même, comme la Californie, ont déjà voté une loi sur le sujet. La semaine dernière, Donald Trump a signé un décret qui prétend créer un cadre réglementaire fédéral qui prévaudrait sur les lois des États, suivant ainsi les volontés de l’industrie du secteur. La légalité de ce texte est contestée.

Donald Trump veut reprendre la main sur le volet législatif encadrant l’industrie de l’intelligence artificielle aux États-Unis. Dans un décret publié jeudi 11 décembre, le dirigeant des États-Unis assure « garantir un cadre politique national pour l’intelligence artificielle ».

« Il s’agit d’un décret qui ordonne à certains services de votre administration de prendre des mesures décisives pour garantir que l’IA puisse fonctionner dans un cadre national unique dans ce pays, plutôt que d’être soumise à une réglementation au niveau des États qui pourrait potentiellement paralyser le secteur », a affirmé à CNN le conseiller à la Maison Blanche, Will Scharf.

Le fédéral avant l’étatique, concernant l’IA

Dans son texte, Donald Trump insiste : « Mon administration doit agir avec le Congrès pour garantir l’existence d’une norme nationale peu contraignante, et non pas 50 normes étatiques discordantes », ajoutant que « le cadre qui en résulte doit interdire les lois étatiques qui entrent en conflit avec la politique énoncée dans le présent décret. Ce cadre doit également garantir la protection des enfants, empêcher la censure, respecter les droits d’auteur et préserver les communautés ».

Donald Trump vise ici les velléités des cinquante États qui forment son pays de légiférer localement. De fait, comme l’explique le média public NPR, des dizaines d’États ont déjà pris des décisions pour encadrer l’industrie de l’intelligence artificielle et ses conséquences. Ainsi, comme le recense la NCSL (une association non partisane de fonctionnaires composée de législateurs en exercice), « au cours de la session législative de 2025, les 50 États, Porto Rico, les Îles Vierges et Washington, D.C., ont présenté des projets de loi sur ce sujet cette année. Trente-huit États ont adopté ou promulgué une centaine de mesures cette année ».

David Sacks, membre de la « PayPal Mafia » et financeur de Palantir devenu son conseiller IA, affirmait sur X que « cette ordonnance ne signifie pas que l’administration contestera toutes les lois des États relatives à l’IA. Loin de là ». Mais il ajoutait tout de suite après que « l’accent est mis sur les lois étatiques excessives et contraignantes ».

Une demande du secteur et notamment d’OpenAI

Les entreprises étatsuniennes du secteur ont plusieurs fois plaidé en faveur d’une harmonisation des textes au niveau fédéral. Ainsi, OpenAI a, par exemple, envoyé une lettre ouverte au gouverneur californien Gavin Newsom en août dernier pour critiquer la nouvelle loi de l’État sur l’intelligence artificielle et son encadrement. « Les États-Unis sont confrontés à un choix de plus en plus urgent en matière d’IA : établir des normes nationales claires ou risquer un patchwork de réglementations étatiques », affirmait l’entreprise dans le billet de blog qui accompagnait la lettre.

Elle y faisait aussi une comparaison hasardeuse avec l’industrie spatiale dans les années 1960 : « imaginez à quel point il aurait été difficile de remporter la course à l’espace si les industries aérospatiales et technologiques californiennes avaient été empêtrées dans des réglementations étatiques entravant l’innovation dans le domaine des transistors ».

Une contestation possible devant les tribunaux

Mais les capacités législatives du décret pris par Donald Trump pourraient être remises en question. Selon NPR, « il est presque certain que ce décret sera contesté devant les tribunaux, et les chercheurs spécialisés dans les politiques technologiques affirment que l’administration Trump ne peut pas restreindre la réglementation des États de cette manière sans que le Congrès n’adopte une loi ».

Cette volonté de préemption du sujet par le niveau fédéral est critiquée par diverses associations concernées. « Empêcher les États d’adopter leurs propres mesures de protection en matière d’IA porte atteinte à leur droit fondamental de mettre en place des garde-fous suffisants pour protéger leurs résidents », estime Julie Scelfo, l’avocate de l’association Mothers Against Media Addiction, citée par la BBC.

Avec ce décret, « Donald Trump fait tout son possible pour prendre soin de ses amis et donateurs des grandes entreprises technologiques », affirme de son côté Robert Weissman, coprésident de Public Citizen. « Cette récompense accordée aux grandes entreprises technologiques est une invitation honteuse à un comportement irresponsable de la part des plus grandes entreprises mondiales et un mépris total des principes fédéralistes que Trump et MAGA prétendent vénérer », ajoute-t-il. Pour lui, « la bonne nouvelle, c’est que ce décret présidentiel n’est que du vent. Le président ne peut pas passer outre unilatéralement la législation des États ».

La DGSI renouvelle encore son contrat avec Palantir

15 décembre 2025 à 12:46
Pierre de vision ou Panopticon ?
La DGSI renouvelle encore son contrat avec Palantir

La DGSI vient de signer avec Palantir pour renouveler son contrat relatif à ce que le milieu appelle un « outil de traitement des données hétérogènes » (OTDH). Cette solution a été mise en place après les attentats du 13 novembre 2015. Elle est renouvelée régulièrement tout en étant présentée comme « transitoire » par les services français qui n’ont visiblement pas trouvé adéquates les alternatives développées en France.

Dans un communiqué de presse, Palantir a confirmé lundi le renouvellement « pour trois ans de son contrat avec la DGSI, l’agence française de renseignement intérieur, prolongeant ainsi un partenariat qui dure depuis près d’une décennie ».

L’information avait été annoncée dans Les Échos ce dimanche 14 décembre. Le DG de Palantir France, Pierre Lucotte, se disait heureux de « pouvoir continuer à accompagner dans les prochaines années les renseignements français sur leurs missions critiques incluant le contre-terrorisme, mais pas uniquement ». L’entreprise expliquait à nos confrères que ce contrat avec la DGSI était renouvelé pour les trois prochaines années, après près de dix ans d’existence.

En effet, juste après les attentats du 13 novembre 2015, le service français signait en 2016 son premier contrat avec l’entreprise fondée par Peter Thiel, Joe Lonsdale, Stephen Cohen et Alex Karp. Maintenant, l’agence française scrute aussi les données sur les réseaux pour surveiller les ingérences étrangères ou les menaces concernant la cybersécurité.

Rappelons qu’en parallèle, Palantir a profité à fond du retour de Donald Trump au pouvoir et a notamment accentué son rôle dans la gestion des données des différentes agences fédérales états-uniennes. L’entreprise s’est aussi très bien positionnée parmi d’autres acteurs comme Oracle pour construire l’infrastructure numérique envisagée à Gaza.

Son cofondateur, Peter Thiel, mêle de plus en plus le religieux à ces considérations techno-politiques en transformant les volontés de régulation dans le secteur en supposée fin du monde, faisant des références à l’Antéchrist. Alex Karp, de son côté, a récemment affirmé que les entreprises d’informatique les plus importantes sont celles dont les produits « renforcent la supériorité évidente et innée de l’Occident » et « apportent violence et mort à nos ennemis ».

Un choix « transitoire » très durable et toujours un manque d’alternatives françaises

Le choix de la solution de Palantir par la DGSI ne serait que « transitoire » en attendant une offre française solide. C’était déjà ce que disait le service français en 2019, lors du premier renouvellement du contrat. À l’époque, Thales, Sopra Steria et Dassault Systèmes étaient évoqués comme candidats potentiels.

Depuis, c’était plutôt ChapsVision qui s’était mis sur les rangs. En 2022, l’entreprise française rachetait Deveryware, spécialiste de l’interception légale et de la géolocalisation qui travaillait pour les ministères de l’Intérieur et de la Justice. L’année dernière, elle annonçait une levée de fonds de 85 millions d’euros pour financer l’acquisition de la start-up Sinequa et se montrait confiante sur ses capacités à remplacer Palantir. Mais la DGSI a finalement choisi de ne pas basculer vers cette solution française et de rester liée à l’entreprise états-unienne.

Palantir à l’assaut du monde

Alors que Palantir renforce donc sa position en France, l’entreprise s’étend aussi dans d’autres administrations. Ainsi, comme nous l’évoquions, l’OTAN s’est offert un système d’IA militaire signé Palantir en avril dernier. Mais l’entreprise d’Alex Karp vise aussi d’autres pays d’Europe.

Le ministre de la Défense belge, Theo Francken, vient d’exprimer son souhait d’utiliser ses logiciels : « Si l’Otan et la plupart des pays européens signent des contrats avec cette firme, je ne vois pas où est le problème. Au cours des prochaines années, nous allons construire en Belgique trois centres de données pour un demi-milliard d’euros. Pour être sécurisés, ils doivent pouvoir être débranchés d’internet. Palantir est capable de construire cela », affirme-t-il au média L’Echo.

De leur côté, les autorités suisses, courtisées par Palantir, ne se sont pas laissé séduire. Comme le journal Le Temps l’explique, l’entreprise a été écartée d’un appel d’offres de l’armée suisse en 2020 et est revenue à la charge en 2024, « en s’adressant directement au chef de l’armée Thomas Süssli ». Un rapport de l’armée rendu public [PDF] par Republik a de nouveau fermé la porte.

En France, les liens d’une porte-parole du PS, Julie Martinez, avec l’entreprise (elle y était déléguée mondiale à la Protection des Données) avaient soulevé des questions. Elle a finalement quitté récemment ces deux postes, comme l’expliquait fin novembre Libération. Elle s’est officiellement retirée pour se consacrer aux prochaines municipales à Clichy-la-Garenne en tant que tête de liste le PS.

☕️ X : La géolocalisation des comptes attaquée devant la CNIL

15 décembre 2025 à 08:30

En novembre, le réseau social X a affiché une nouvelle information sur le profil de ses utilisateurs : leur géolocalisation. Si elle a semé le doute à propos de l’origine de certains comptes influents, certains utilisateurs se plaignent de la divulgation d’informations qui serait contraire au RGPD.

Ainsi, comme le rapporte l’Informé, l’avocat Jérémy Roche a adressé une plainte à la CNIL. « Cette divulgation est effectuée sans consentement préalable, sans information claire et préalable, et par défaut sans possibilité de refus initial », affirme-t-il dans le document envoyé à l’autorité que notre confrère, Marc Rees, a pu consulter.

Selon l’avocat, le traitement de la géolocalisation de l’utilisateur par X serait illicite puisqu’il ne s’appuierait pas sur une des bases légales d’autorisation de traitement des données.

X n’a pas explicitement demandé le consentement de ses utilisateurs avant de mettre en place cette fonctionnalité. Si le réseau social pourrait plaider l’intérêt légitime, celui-ci doit être étudié en balance avec les droits des utilisateurs de la plateforme qui doivent être protégés. Or l’avocat met en avant « le risque pour un utilisateur d’être repéré lorsqu’il est en vacances dans un pays étranger ». Enfin, si X s’appuie sur la base légale du contrat, Jérémy Roche considère que la fonctionnalité « ne fait pas partie de la prestation contractuelle fondamentale » puisque le réseau social a fonctionné sans pendant des années.

Puisque le siège social européen de X est situé en Irlande, la CNIL devrait transmettre cette plainte à la Data Protection Commission du pays.

Reçu — 12 décembre 2025 Next - Articles gratuits

☕️ Plusieurs associations féministes s’insurgent de leur invisibilisation par Meta

12 décembre 2025 à 15:50

Dans une tribune publiée dans le Nouvel Obs, des associations féministes comme le Planning familial tirent la sonnette d’alarme : « sur les réseaux sociaux, nos contenus disparaissent des fils d’actualité, étouffés par des algorithmes opaques, et nos combats sont relégués au rang de « sujets sensibles » indésirables par Meta ».

De vieux ciseaux posés sur une surface en bois
Ciseaux par Ivan Radic, licence Creative Commons By

Elles font le même constat que celui fait sur Next la semaine dernière par l’UNICEF France, la Fondation des femmes, et plusieurs ONG. « 28 % de nos publications ont été rejetées », nous expliquait la directrice Marketing et Développement de l’Unicef France, Marie-Charlotte Brun.

« Aujourd’hui, Meta veut nous faire taire », affirment dans la tribune les associations féministes. « Ses algorithmes, déjà peu enclins à promouvoir les contenus politiques, ciblent désormais [depuis le début du mois d’octobre] spécifiquement les messages féministes. Des comptes sont  » shadow bannés » (invisibilisés sans avertissement), des publications effacées des fils d’actualité, et des mots-clés féministes sont systématiquement pénalisés ».

Comme nous l’expliquions, Meta affirme que ce sont des « conséquences imprévues » du nouveau règlement de l’UE sur la transparence et le ciblage de la publicité à caractère politique (TTPA) entré en application le 10 octobre dernier.

Mais le Guardian rapporte aujourd’hui le même genre de problèmes rencontrés par une cinquantaine d’associations à travers le monde (dont certaines au Brésil ou aux Philippines par exemple), dont des lignes d’assistance téléphonique sur l’avortement.

☕️ Le ministère de l’Intérieur victime d’une cyberattaque

12 décembre 2025 à 13:36

Le soir du jeudi 11 décembre, le ministère de l’Intérieur confirmait à BFMTV avoir découvert l’existence « d’activités suspectes visant ses serveurs de messagerie ». L’Agence nationale de la sécurité des systèmes d’information (ANSSI) a été prévenue et est venue épauler la place Beauvau.

Ce matin, au micro de RTL, Laurent Nuñez a confirmé qu’ « il y a eu effectivement une attaque informatique » ciblant « les messageries » du ministère dans la nuit du jeudi 11 au vendredi 12 décembre.

Le ministre parle d’ « un assaillant qui a pu pénétrer sur un certain nombre de fichiers » (sic), sans préciser si des fichiers auraient été téléchargés. « On a mis en place les procédures habituelles », affirme-t-il.

« On n’a pas de trace de compromission grave, on investigue à la fois au niveau judiciaire et on a renforcé notre niveau de sécurité. Notamment, les modalités d’accès au système d’information de tous nos agents ont été durcies », ajoute Laurent Nuñez.

Le ministre n’a pas précisé s’il s’agissait de serveurs d’emails, de serveurs de messagerie instantanée type Tchap ou d’un autre genre de messagerie.

Réseaux sociaux avant 15 ans : Macron veut une loi en 2026, Reddit attaque en Australie

12 décembre 2025 à 11:10
Laisse pas trainer ton fils
Réseaux sociaux avant 15 ans : Macron veut une loi en 2026, Reddit attaque en Australie

Emmanuel Macron a réinsisté ce mercredi 10 décembre sur sa volonté que la France adopte une loi pour interdire les réseaux sociaux avant 15 ou 16 ans avant son départ de l’Élysée. En parallèle, Reddit attaque la loi mise en place en Australie qui impose cette limitation, montrant que le milieu est prêt à bloquer toute loi qui ne serait pas suffisamment solide.

Emmanuel Macron veut faire savoir qu’il a vraiment envie que les réseaux sociaux soient interdits aux mineurs de moins de 15 ou 16 ans. Lors d’une nouvelle étape, à Saint-Malo cette fois, de son tour de France organisé en collaboration avec la presse quotidienne régionale, le président français a de nouveau insisté sur sa volonté d’« imposer à tous les réseaux sociaux la vérification de l’âge » et de les interdire en dessous de « 15 ou 16 ans ».

Le mois dernier, Emmanuel Macron avait déjà fait part de sa volonté d’interdire les écrans aux enfants de moins de trois ans, de minimiser l’exposition avant six ans et d’imposer une majorité numérique à 15 ans. Selon lui, « toutes nos études montrent que nos enfants, ados, sont de plus en plus perturbés par ces réseaux sociaux ».

Un projet de loi présenté en janvier 2026

« L’objectif, c’est de déposer un texte de loi du gouvernement en début d’année prochaine » a affirmé Emmanuel Macron, pour que cette loi soit votée « avant la fin de [son] mandat ». De fait, le chef de l’État reprend à son compte le calendrier déjà programmé par le parti Renaissance. Gabriel Attal a indiqué sur RTL la semaine dernière que la proposition de loi sur le sujet émanant de son parti sera débattue le 19 janvier 2026.

La députée Renaissance Laure Miller a déposé le mardi 18 novembre 2025 cette proposition de loi « visant à protéger les mineurs des risques auxquels les expose l’utilisation des réseaux sociaux », suite notamment au rapport de la commission d’enquête de l’Assemblée nationale sur les effets psychologiques de TikTok sur les mineurs.

Le texte de Laure Miller propose notamment que « les fournisseurs de services de réseaux sociaux en ligne exerçant leur activité en France refusent l’inscription à leurs services des mineurs de quinze ans ». Et il ajoute qu’ils devront suspendre « également, dans les meilleurs délais, les comptes déjà créés et détenus par des mineurs de quinze ans ». Comme nous l’évoquions fin novembre, il prévoit aussi d’étendre aux lycées l’interdiction de l’utilisation des téléphones portables.

Retour à une loi française après avoir tenté de passer par l’Europe

C’est un sujet qui n’est pas nouveau. En mai dernier, Clara Chappaz, l’alors ministre déléguée chargée du Numérique, espérait « rallier une coalition, avec l’Espagne, la Grèce et maintenant l’Irlande, pour convaincre la Commission européenne » d’aller plus loin que les obligations déjà imposées par le règlement sur les services numériques. Mais les députés Renaissance et le président de la République semblent abandonner l’idée d’une loi européenne et se replient sur une interdiction à l’échelle française.

Pour Emmanuel Macron, néanmoins, « le consensus est en train de se forger » sur la question. Il a ainsi rappelé que « l’Australie vient de le faire ».

Une loi en vigueur en Australie depuis mercredi

En effet, l’Australie a adopté en novembre 2024 l’une des restrictions les plus strictes du monde en interdisant les réseaux sociaux au moins de 16 ans. Celle-ci est entrée en vigueur ce mercredi 10 décembre. Facebook, Instagram, YouTube, TikTok, Snapchat, Reddit, Kick, Twitch, Thread et X sont tous concernés.

La semaine dernière, YouTube a affirmé que cette loi « ne garantira pas la sécurité des adolescents sur Internet ». L’entreprise argue que « comme la loi sur l’âge minimum pour utiliser les réseaux sociaux oblige les enfants à utiliser YouTube sans compte, elle supprime les contrôles parentaux et les filtres de sécurité mis en place pour les protéger, ce qui ne rendra pas les enfants plus en sécurité sur notre plateforme ». Pourtant, la plateforme bloque déjà l’accès sans compte à certaines vidéos.

Reddit attaque

Mais ce jeudi 12 décembre, c’est Reddit qui a passé la vitesse supérieure face à cette loi australienne en l’attaquant devant la Haute Cour d’Australie. Le réseau social argumente dans sa plainte [PDF] en affirmant qu’il ne peut être considéré comme une plateforme de réseau social réservée à certains âges, catégorie encadrée par une loi australienne votée en 2021.

Mais elle remet aussi directement en cause cette nouvelle loi en affirmant qu’elle enfreint celle sur la liberté de communication politique prévue dans le pays et qui défend la possibilité, pour les électeurs, d’être bien informés. Or, selon la plainte, « les opinions politiques des enfants influencent les choix électoraux de nombreux électeurs actuels, notamment leurs parents et leurs enseignants, ainsi que d’autres personnes intéressées par les opinions de ceux qui atteindront bientôt l’âge de la maturité ». Ainsi, pour Reddit, « empêcher les enfants d’exprimer leurs opinions politiques pèse directement sur la communication politique en Australie ».

Enfin, le réseau social affirme que « dans le cours normal des choses, les citoyens australiens âgés de moins de 16 ans deviendront électeurs d’ici quelques années, voire quelques mois. Les choix que feront ces citoyens seront influencés par la communication politique à laquelle ils seront exposés avant l’âge de 18 ans ».

Il n’est pas sûr que la Haute Cour australienne soit convaincue par ces arguments. Mais cette première attaque contre une loi de ce genre montre que, si les législateurs sont de plus en plus convaincus que les réseaux sociaux doivent être interdits aux moins de 15 ou 16 ans, ceux-ci n’hésiteront pas à utiliser toutes les lois sur la liberté d’expression pour annuler de nouvelles mesures.

☕️ OpenAI lance GPT-5.2 pour contrer le succès du nouveau Gemini de Google

12 décembre 2025 à 08:12

OpenAI a annoncé ce jeudi 11 décembre la sortie de son nouveau modèle GPT-5.2. L’entreprise a avancé ce lancement pour faire face à la concurrence du pionnier des modèles de langage qui revient dans la course : Google.

En effet, il y a 10 jours, le Wall Street Journal a obtenu un mémo envoyé par Sam Altman en interne poussant ses salariés en « code rouge » pour augmenter la qualité de ChatGPT quitte à retarder d’autres produits. Selon le journal économique américain, le CEO d’OpenAI s’inquiétait de la pression de la concurrence et notamment de Google qui a lancé son Gemini 3 Pro il y a un peu moins d’un mois. Celui-ci a rencontré un certain succès auprès des utilisateurs d’IA générative, rebattant les cartes sur le marché.

Flock

Dans un point presse, Fidji Simo, la responsable applications et numéro 2 d’OpenAI, a néanmoins nié que ce lancement de GPT-5.2 était le résultat de ce « code rouge », tout en admettant qu’il a pu aider, explique Wired.

Le modèle est dès à présent disponible en trois versions : GPT‑5.2 Instant, Thinking et Pro. Comme on peut s’y attendre, OpenAI les présente comme ses meilleurs modèles, en s’appuyant sur des benchmarks.

Si, sans surprise, l’entreprise affirme que « GPT‑5.2 Thinking hallucine moins que GPT‑5.1 Thinking », le modèle d’OpenAI génère donc toujours des fausses informations.

Elle clame de nouveau que « l’un de nos espoirs concernant l’IA est qu’elle accélère la recherche scientifique au bénéfice du plus grand nombre » et que ses nouveaux modèles sont les « meilleurs au monde pour aider les scientifiques et accélérer leurs travaux ».

Cette fois, l’entreprise veut rassurer les utilisateurs de ses anciens modèles en expliquant n’avoir « actuellement aucun projet de suppression de GPT‑5.1, GPT‑5 ou GPT‑4.1 dans l’API ». Le déploiement est en cours et commence par les formules payantes (Plus, Pro, Business, Enterprise).

Reçu — 11 décembre 2025 Next - Articles gratuits

La surveillance géolocalisée de l’ICE détourne les femmes enceintes des soins médicaux

11 décembre 2025 à 16:32
Smart ?
La surveillance géolocalisée de l’ICE détourne les femmes enceintes des soins médicaux

Aux États-Unis, les femmes enceintes sans-papiers peuvent être obligées de porter des montres connectées spéciales qui les surveillent en permanence. Certains personnels hospitaliers constatent, avec la massification des poursuites, que des patientes ont peur de les enlever lorsqu’une intervention le nécessite.

Dans le Colorado, des femmes enceintes ayant besoin de soins médicaux urgents ont peur quand le personnel médical des urgences veut leur enlever le dispositif de surveillance qui leur est imposé.

Le Guardian raconte qu’en septembre dernier, une femme enceinte de neuf mois est entrée dans les urgences obstétriques d’un hôpital du Colorado munie d’une montre connectée qu’elle ne voulait surtout pas enlever. Les médecins ont diagnostiqué qu’une césarienne était nécessaire pour que l’accouchement se passe le mieux possible. Mais pour faire cette césarienne, ils ont besoin d’utiliser un outil de cautérisation qui nécessite que la patiente enlève tout bijou ou objet métallique.

Une smartwatch très particulière

Le problème était que la montre connectée n’était pas commune. En effet, le Service de l’immigration et des douanes des États-Unis (ICE) avait imposé à cette femme de porter en permanence une montre VeriWatch de l’entreprise Bi Inc.

Celle-ci permet aux autorités de surveiller en permanence la personne qui la porte. Elle a d’autres fonctionnalités comme la vérification que la personne est encore en vie ou la reconnaissance faciale du porteur à des fins de contrôle.

Elle ne peut pas être retirée facilement mais elle n’est pas accompagnée non plus d’information concernant la sécurité de son port lors d’intervention médicale comme celle évoquée plus haut. De plus, l’ICE ne fournit aux hôpitaux états-uniens aucune information pour la contacter pour savoir quoi faire. Lorsque le personnel hospitalier a expliqué à la femme enceinte qu’il allait sans doute falloir couper le bracelet, elle a paniqué.

En arrivant à l’hôpital, elle avait aussi peur car la batterie était faible. Elle avait besoin de la recharger pour ne pas que les services d’immigration croient qu’elle essayait de se cacher. La notice de la montre, sur le site du fabricant [PDF], indique que la batterie a une durée de vie de 16 heures, avec une possibilité d’aller jusqu’à 32 heures si on utilise la batterie externe adaptée.

Finalement, selon le Guardian, la montre a été enlevée et la femme est repartie avec son bébé sans que l’ICE ne vienne à l’hôpital. Mais le personnel signale que c’est la troisième femme enceinte qui arrive avec ce dispositif de surveillance en quelques mois.

La massification de programmes « plus humains » que l’incarcération

De fait, le système carcéral du pays est saturé depuis longtemps et ce dispositif de surveillance n’est pas nouveau aux États-Unis. En effet, depuis 2004, comme l’explique le média Jezebel, un programme d’ « alternatives à la détention » existe, option « plus humaine » pour les personnes menacées d’expulsion considérées comme « à moindre risque ».

Pour la plupart, l’alternative consiste à mettre en place un bracelet électronique, comme cela existe en France. Depuis 2009, l’ICE n’utilise plus ce genre de bracelet pour les femmes enceintes à cause d’un taux de complication élevé et a penché pour ces montres connectées en 2023.

Mais, depuis son retour la tête des États-Unis, Donald Trump a intensifié la politique de traque massive de personnes étrangères qui ne peuvent pas prouver leur droit d’y résider, et se prépare à muscler encore le budget de l’ICE. Cette politique augmente mécaniquement le nombre de personnes concernées par les dispositifs de coercition mis en place par le système judiciaire étasunien.

Et, même si le taux de complication est moins élevé avec les montres qu’avec les bracelets, leur usage massif se double d’une absence d’information en cas de problème et de la peur des personnes concernées, qui amènent les personnels hospitaliers à constater des problèmes.

« Elle était en larmes à ce sujet. Elle avait cette peur profonde que l’ICE vienne à l’hôpital et lui enlève son bébé », explique l’un d’entre eux au Guardian, en parlant de la femme enceinte en question.

Dans sa guerre contre l’inclusivité, Trump abandonne la police de caractères Calibri

11 décembre 2025 à 11:00
Police de la police
Dans sa guerre contre l’inclusivité, Trump abandonne la police de caractères Calibri

L’administration Biden avait fait de Calibri la police de caractères officielle du gouvernement étatsunien pour des raisons de lisibilité et d’inclusivité. Opposé à toute mesure en ce sens, l’actuel secrétaire d’État, Marco Rubio, remet en place le Times New Roman.

Marco Rubio, le secrétaire d’État américain, a ordonné aux diplomates de son pays de ne plus utiliser la police de caractère Calibri et de repasser au Times New Roman.

Selon le New York Times, le mémo envoyé par le responsable des Affaires étrangères du pays indique : « Retour à la tradition : police Times New Roman 14 points obligatoire pour tous les documents du département ».

Annulation d’une décision de l’administration Biden pour plus d’inclusivité

Il annule, de fait, une décision prise sous Joe Biden qui avait changé la police de caractère officiellement utilisée par la diplomatie étatsunienne en 2023 pour Calibri, une police sans empattement (serif en anglais).

Créée par Microsoft en 2004, elle avait été jugée plus accessible pour les lecteurs en situation de handicap, notamment les personnes malvoyantes ou dyslexiques, par l’administration fédérale précédente. Comme l’écrivait TechCrunch à l’époque, Microsoft avait pris cette décision de remplacer le Times New Roman par Calibri dès 2007 pour sa police par défaut.

Marco Rubio a affirmé, selon le New York Times, que ce changement « ne figurait pas parmi les cas les plus illégaux, immoraux, radicaux ou inutiles » des politiques de diversité, équité, inclusion et accessibilité de son pays. Mais, selon lui, ce changement de police de caractères était un échec car les « cas de correction de documents pour des raisons d’accessibilité » n’ont pas diminué. Et il estime que « le passage à Calibri n’a rien apporté d’autre que la dégradation de la correspondance officielle du département ».

Dans un article sur l’accessibilité des polices de caractères publié sur Medium en 2020, Gareth Ford Williams, alors responsable de l’expérience utilisateur et de l’accessibilité à la BBC, expliquait : « Pour les enfants ou les adultes qui apprennent à lire ou qui ont des difficultés en lecture, les formes moins complexes des polices sans empattement peuvent faciliter la reconnaissance des caractères. Les polices avec empattement offrent une lisibilité plus fluide aux lecteurs avancés grâce à la forme plus claire des lettres ».

Tradition, formalité et cérémonial

Pour le retour au Times New Roman, le secrétaire d’État met en avant une perception des polices avec empattement « comme évoquant la tradition, la formalité et le cérémonial ».

Cette modification dans les usages officiels de l’administration états-unienne marque symboliquement un nouveau coup contre les politiques de diversité, d’équité et d’inclusion mises en place auparavant aux États-Unis. Dès février dernier, l’administration Trump interdisait à plusieurs agences d’utiliser certains mots comme « racisme », « biais », « genre » ou « sexualité ». Elle a ensuite imposé aux entreprises qui travaillent avec elle, comme SAP, d’abandonner ce genre de politiques. Récemment, la fondation Python a refusé une subvention de 1,5 million de dollars car les conditions assorties mentionnaient l’interdiction de toute politique DEI.

Reçu — 10 décembre 2025 Next - Articles gratuits

USA : 5 ans d’historique de réseaux sociaux pour passer en tant que touriste français ?

10 décembre 2025 à 13:32
Vos réseaux, s'il vous plaît ?
USA : 5 ans d’historique de réseaux sociaux pour passer en tant que touriste français ?

Les États-Unis restreignent de plus en plus le passage de leur frontière en obligeant le partage avec les autorités d’informations personnelles comme l’historique des réseaux sociaux. Les services des douanes américains envisagent de conditionner l’entrée de ressortissants de pays qui n’ont pas besoin de visa pour des séjours de tourisme ou pour affaires de moins de 90 jours au partage, entre autres, de 5 ans d’historique de réseaux sociaux.

La restriction des conditions d’accès au sol états-unien s’amplifie depuis le retour de Donald Trump au pouvoir. Dès avril, on apprenait que les autorités traquaient les propos des étudiants étrangers pour révoquer leurs visas.

Le Service des douanes et de la protection des frontières des États-Unis (U.S. Customs and Border Protection, CBP) envisage maintenant de demander systématiquement 5 ans d’historique de réseaux sociaux aux visiteurs touristiques ou pour affaires de ressortissants de pays comme le Royaume-Uni, la France ou la Norvège qui n’ont pas besoin de visa.

Un ajout envisagé dans un formulaire pour éviter la demande de visa

Le New York Times a en effet repéré cette proposition [PDF] faite par le service états-unien des douanes. Elle est ouverte pour 60 jours à des commentaires publics et doit ensuite être approuvée par le Bureau de la gestion et du budget de la Maison-Blanche.

Cela concerne de fait toutes les personnes visitant les États-Unis éligibles au programme d’exemption de visa (« Visa waiver »). Celui-ci, mis en place en 1986, permet à des ressortissants de 42 pays (dont la France) de « voyager aux États-Unis pour affaires ou pour le tourisme pour des séjours d’une durée maximale de 90 jours sans visa ».

Ici, la CBP propose d’inclure dans le formulaire du portail de Visa waiver l’obligation de fournir les identifiants utilisés sur leurs réseaux sociaux au cours des cinq dernières années, comme c’est déjà le cas pour les demandeurs de visa depuis 2016. L’objectif serait notamment de « distinguer les personnes qui suscitent des inquiétudes supplémentaires de celles dont les informations confirment leur admissibilité au voyage », précise la FAQ de l’Electronic System for Travel Authorization (ESTA).

D’autres données à « forte valeur ajoutée » pourront être collectées ensuite « lorsque c’est possible », comme les numéros de téléphones (personnels, professionnels ainsi que ceux des membres de sa famille : parents, conjoint, frères et sœurs, enfants) des cinq dernières années, les adresses emails (personnelles et professionnelles) des dix dernières années, les adresses IP et métadonnées des photos soumises par voie électronique, les données biométriques (visage, empreinte digitale, ADN et iris), ainsi que les noms, adresses, dates et lieux de naissance des membres de la famille.

Aggravation des atteintes aux libertés civiles

Selon le cabinet d’avocats Fragomen, si les modifications sont approuvées par le Bureau de la gestion et du budget, la CBP « peut mettre en œuvre les changements par étapes au cours des semaines et des mois à venir ».

Citée par le New York Times, l’avocate de l’Electronic Frontier Foundation, Sophia Cope, estime que ce changement « aggraverait les atteintes aux libertés civiles ». Elle ajoute que « cette mesure ne s’est pas avérée efficace pour trouver des terroristes et autres malfaiteurs mais elle a restreint la liberté d’expression et porté atteinte à la vie privée de voyageurs innocents, ainsi qu’à celle de leur famille, de leurs amis et de leurs collègues américains ».

Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés

10 décembre 2025 à 09:58
Ethique en toc
Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés

Plusieurs recherches incluant l’entrainement de réseaux de neurones font l’objet d’une attention particulière, parfois plusieurs années après leur publication. En cause l’utilisation d’une base de données de photos posant des problèmes éthiques concernant le consentement des enfants ayant des troubles autistiques concernés. L’éditeur Springer Nature est en train de rétracter des dizaines d’articles scientifiques.

Des dizaines d’articles scientifiques sont actuellement scrutés, notamment par l’éditeur scientifique Springer Nature, pour une éventuelle rétractation. Certains, comme cette meta analyse sur les approches utilisant le deep learning pour prédire l’autisme publiée en 2024, ont déjà fait l’objet d’une rétractation récemment.

Des travaux scientifiques qui soulèvent des questions éthiques

Les chercheurs et éditeurs auraient pu commencer par interroger le bien-fondé de mettre en place une reconnaissance de traits autistiques sur le visage d’enfants en utilisant le deep learning. La littérature scientifique montre que ces questions n’ont pas arrêté nombre de chercheurs.

Mais une nouvelle question éthique apparait, mise au grand jour par The Transmitter. Ce média spécialisé en neurosciences vient de découvrir que plusieurs dizaines d’articles scientifiques sur le sujet s’appuient, en fait, sur une base de données de visages d’enfants créée en 2019 par Gerald Piosenka, un ingénieur à la retraite. Celui-ci l’avait mise en ligne sur la plateforme Kaggle rachetée en 2017 par Google, qui permet à la communauté des machine learning et deep learning de partager des données, codes, modèles, etc.

L’utilisation d’une base de données créée sans le consentement des enfants

Cette base de données contient plus de 2 900 photos d’enfants, dont la moitié est étiquetée en tant qu’autistes. Comme l’a repéré The Transmitter, Gerald Piosenka explique dans un commentaire posté en 2022 que Kaggle a supprimé la base de données parce qu’elle ne respectait pas ses conditions d’utilisation. Mais l’ingénieur l’a remis rapidement en ligne via Google Drive.

Dans la description de la base, Gerald Piosenka explique la manière dont il a procédé pour la créer : « J’ai cherché partout une base de données contenant des images faciales d’enfants autistes. À ma connaissance, il n’en existe aucune. J’ai donc dû développer cette base de données à partir de recherches sur Internet. J’ai principalement trouvé ces images sur des sites web consacrés à l’autisme. En général, j’ai dû télécharger une image particulière, qui était souvent une photo de groupe, puis recadrer manuellement l’image pour ne garder que le visage de l’enfant ».

Questionné par un utilisateur de Kaggle sur l’exclusion de certaines photos pour des questions de vie privée et sur l’obtention du consentement, Gerald Piosenka a répondu que « toutes les images ont été recueillies à partir de sites Web accessibles au public et de recherches Google. Aucune restriction en matière de confidentialité n’a été violée » et a justifié sa démarche en affirmant que sa motivation était « altruiste » et qu’ « en matière d’éthique, comment peut-on être plus éthique que d’essayer de favoriser le dépistage précoce et le traitement de l’autisme chez les enfants » sans prendre en compte le signalement sur le besoin de consentement.

Près de 40 articles scientifiques sont étudiés par Springer Nature pour une éventuelle rétractation selon un des conseillers en intégrité de la recherche de l’éditeur interrogé par The Transmitter. Le média a, de son côté, recensé au moins 90 articles (publiés aussi par d’autres éditeurs comme Wiley, IEEE, Elsevier, MDPI ou encore Cell Press) qui citent une version de la base de données.

Reçu — 9 décembre 2025 Next - Articles gratuits

☕️ Bruxelles soupçonne Google de pratiques anticoncurrentielles concernant l’IA

9 décembre 2025 à 14:33

La Commission européenne a ouvert une enquête sur les pratiques de Google sur le marché de l’IA qui pourraient être considérées comme anticoncurrentielles.

Dans un communiqué publié sur son site, elle explique que « l’enquête examinera notamment si Google fausse la concurrence en imposant des conditions générales abusives aux éditeurs et aux créateurs de contenu, ou en s’octroyant un accès privilégié à ce contenu, désavantageant ainsi les développeurs de modèles d’IA concurrents ».

Sont notamment concernés les résumés d’AI Overviews (accessibles dans de nombreux pays, notamment européens, mais pas en France) et l’utilisation des vidéos postées sur YouTube.

La Commission pointe le fait que Google se sert de contenus publiés sur le web pour son service AI Overviews et pour le mode IA de son moteur de recherche « sans rémunération appropriée pour les éditeurs et sans leur offrir la possibilité de refuser une telle utilisation de leurs contenus ». Elle explique qu’elle va enquêter pour déterminer dans quelle mesure ces outils de Google s’appuient sur ces contenus.

En juillet dernier, le réseau nommé « Alliance internationale des éditeurs indépendants » portait plainte devant la Commission contre Google pour ces mêmes raisons.

Mais la Commission va aussi chercher à savoir si Google utilise les vidéos uploadées par les utilisateurs de YouTube pour entrainer ses modèles d’IA sans leur consentement et sans compensation.

« Google ne rémunère pas les créateurs de contenu YouTube pour leur contenu et ne leur permet pas non plus de télécharger leur contenu sur YouTube sans autoriser Google à utiliser ces données. Parallèlement, les développeurs concurrents de modèles d’IA sont empêchés par les politiques de YouTube d’utiliser le contenu YouTube pour entraîner leurs propres modèles d’IA », affirme l’institution.

« Si elles sont avérées, les pratiques faisant l’objet de l’enquête pourraient enfreindre les règles de concurrence de l’UE qui interdisent l’abus de position dominante », prévient Bruxelles.

« Une société libre et démocratique repose sur la diversité des médias, le libre accès à l’information et un paysage créatif dynamique. Ces valeurs sont au cœur de notre identité européenne », affirme Teresa Ribera, commissaire européenne à la Concurrence. « L’IA apporte des innovations remarquables et de nombreux avantages aux citoyens et aux entreprises à travers l’Europe, mais ces progrès ne peuvent se faire au détriment des principes qui sont au cœur de nos sociétés », ajoute-t-elle.

Se prononçant sur la plainte des éditeurs, Google affirmait à Reuters que celle-ci « risque d’étouffer l’innovation dans un marché plus concurrentiel que jamais ». C’est toujours la même excuse servie par les géants américains quand il s’agit de régulation européenne.

« Google a rompu le pacte qui sous-tend l’Internet. L’accord prévoyait que les sites web seraient indexés, récupérés et affichés lorsqu’ils étaient pertinents par rapport à une requête. Tout le monde avait sa chance », proclame de son côté Tim Cowen, l’avocat des éditeurs, à l’agence de presse. « Aujourd’hui, Google donne la priorité à son IA Gemini et ajoute l’insulte à l’injure en exploitant le contenu des sites web pour entraîner Gemini. Gemini est le jumeau maléfique de Search », ajoute-t-il.

États-Unis : procès contre les pressions sur Apple pour enlever ICEBlock de l’App Store

9 décembre 2025 à 13:00
La pomme pressée
États-Unis : procès contre les pressions sur Apple pour enlever ICEBlock de l’App Store

Le créateur de ICEBlock attaque en justice l’administration Trump. Il l’accuse d’avoir mis la pression sur Apple pour supprimer de l’App Store l’application qui permet de signaler la présence de l’ICE, les services d’immigration étatsuniens qui font des interventions musclées dans le pays. Au point que l’entreprise de Tim Cook s’est exécutée.

Il y a deux mois, Apple et Google retiraient plusieurs applications collaboratives permettant de signaler la présence des agents de l’Immigration and Customs Enforcement (ICE) dans les quartiers des villes américaines. Joshua Aaron, le développeur d’ICEBlock, la plus connue d’entre elles mais seulement développée pour iOS, vient de déposer une plainte contre les pressions de l’administration Trump sur Apple pour enlever son application de l’App Store.

Une pression assumée par l’administration Trump à la TV

Il avait déjà affiché sa confiance dans ses capacités de défendre son application en justice en expliquant qu’il disposait « d’une équipe juridique formidable, et il serait absurde qu’ils essaient de faire quoi que ce soit pour mettre fin à cette affaire ». Mais Apple avait finalement cédé et supprimé l’application de l’App Store, en affirmant l’avoir fait « sur la base des informations que nous avons reçues des forces de l’ordre ».

De son côté, l’administration Trump avait clamé victoire. « Nous avons contacté Apple aujourd’hui pour leur demander de retirer l’application ICEBlock de leur App Store, et Apple l’a fait », affirmait la procureure générale des États-Unis, Pam Bondi, à Fox Business.

Dans sa plainte [PDF] relevée par Gizmodo, c’est notamment cette affirmation qui est visée par Joshua Aaron. « Avec cet aveu, la procureure général Bondi a clairement indiqué que le gouvernement américain avait utilisé son pouvoir réglementaire pour contraindre une plateforme privée à supprimer une expression protégée par le premier amendement », affirme le document.

Apple a cédé pour la première fois face à une demande de suppression de l’App Store du gouvernement américain

Les avocats de Joshua Aaron écrivent qu’il « a développé ICEBlock en réponse à la campagne sans précédent menée par l’administration Trump pour arrêter, détenir et expulser les immigrants ». Et ils ajoutent qu’il « craignait que les propos incendiaires de Trump sur l’immigration ne conduisent à une application agressive et aveugle des lois sur l’immigration, exposant les immigrants et les citoyens à la violence et à des violations flagrantes de leurs libertés civiles. Aaron avait raison ».

« Pour la première fois en près de cinquante ans d’existence, Apple a supprimé une application américaine à la demande du gouvernement américain », souligne la plainte.

Le document ne se focalise pas seulement sur la pression mise sur Apple. Les avocats de Joshua Aaron attaquent aussi des menaces directes de Pam Bondi mais aussi du directeur par intérim de l’ICE Todd Lyons et d’un des hommes de la Maison-Blanche, Tom Homan. « Ces menaces visaient à dissuader Aaron et d’autres personnes de s’engager dans des activités d’expression — en particulier le partage d’informations sur les actions des forces de l’ordre observables publiquement — et à dissuader les entreprises technologiques et les institutions journalistiques de soutenir, d’amplifier ou de faciliter ce type de discours », estiment-ils.

Reçu — 8 décembre 2025 Next - Articles gratuits

☕️ OpenAI désactive une fonctionnalité qui permettait de faire la publicité d’une application

8 décembre 2025 à 08:47

Le responsable de la R&D à OpenAI, Mark Chen, a finalement annoncé que son entreprise a désactivé l’affichage de messages publicitaires pour des applications sur les comptes payants de ChatGPT, a repéré TechCrunch.

La semaine dernière, des utilisateurs (avec des comptes payants Pro ou Plus) ont repéré des messages publicitaires sous les réponses que leur générait le chatbot d’OpenAI. On pouvait y voir, par exemple, un message promouvant l’application des magasins Target :

L’entreprise a d’abord refusé d’y voir quelque problème que ce soit. « Ce n’est pas une publicité », affirmait Daniel McAuley, responsable Données chez OpenAI. « Depuis le DevDay, nous avons lancé des applications provenant de certains de nos partenaires pilotes, notamment Target, et nous avons travaillé à rendre le mécanisme de découverte des applications plus organique au sein de ChatGPT. Notre objectif est que les applications améliorent l’expérience utilisateur lorsqu’elles sont pertinentes pour une conversation, et nous y travaillons encore. Tout le monde peut créer des applications à l’aide du SDK, et nous prévoyons d’ouvrir bientôt les soumissions et le répertoire d’applications », ajoutait-il.

De la même manière, Nick Turley, Vice-président d’OpenAI responsable de ChatGPT, affirmait encore samedi : « Je constate beaucoup de confusion au sujet des rumeurs concernant les publicités dans ChatGPT. Il n’existe aucun test en direct pour les publicités : toutes les captures d’écran que vous avez vues ne sont soit pas réelles, soit ne concernent pas des publicités. »

Fin novembre, des utilisateurs avaient déjà remarqué que des références à des fonctionnalités de publicité étaient incluses dans une version beta de l’application Android de ChatGPT.

❌