Vue normale

Reçu — 17 avril 2026 Actualités numériques

UE : la Commission a copié/collé les lobbys pour cacher les données sur les datacenters

17 avril 2026 à 15:05
Discrétion assistée par la loi
UE : la Commission a copié/collé les lobbys pour cacher les données sur les datacenters

En 2024, Microsoft et le lobby bruxellois de la tech DigitalEurope ont obtenu que les données de consommation des datacenters de plus de 500 kW récoltées par la Commission européenne ne soient pas rendues publiques. Le consortium Investigate Europe montre que les amendements au texte européen réglementant ces informations sont des reprises quasiment mot pour mot des propositions qu’ils ont faites.

Il y a trois ans, en 2023, l’Union européenne a voulu réviser sa législation sur l’efficacité énergétique et introduire une obligation d’information sur la consommation des data centers qui dépassent les 500 kW de puissance. Mais Microsoft et le lobby bruxellois de la tech DigitalEurope ont réussi à faire intégrer à la Commission des amendements quasiment copiés/collés interdisant toute publication de ces données par l’Europe et ses États membres, a découvert le consortium journalistique Investigate Europe.

Les données sur la consommation des data centers font l’objet d’intenses débats sur leur impact environnemental. Dans leurs rapports environnementaux maison, les grandes entreprises de la tech font leurs arrangements (plus ou moins importants), rendant impossible leur interprétation. Les projets de création de data centers font de plus en plus face à des résistances, mais il est difficile d’objectiver le débat avec le peu d’informations sur la réalité du terrain de ces installations.

Dans ce sens, la volonté exprimée par une première version du texte de révision aurait pu grandement aider l’information du public sur le sujet. En effet, le texte prévoyait un inventaire des informations sur les data centers de plus de 500 kW situés en Europe comportant au moins leur localisation et des indicateurs de performance sur la consommation d’énergie, la valorisation de la chaleur résiduelle, la consommation d’eau et l’utilisation d’énergies renouvelables. Et, selon cette première version, la Commission devait rendre publique cette base de données sous forme agrégée.

Ensuite, comme le prévoit le processus, la Commission a recueilli les commentaires des parties concernées et notamment des différents lobbys. Ainsi, Microsoft [PDF] et le lobby DigitalEurope (dont les membres sont par exemple Meta, CapGemini, Microsoft, NVIDIA ou encore Google) [PDF] ont tous deux proposé un amendement pour classifier les informations concernant les data centers.

Des propositions d’amendements adoptées mot pour mot

Et, dans l’article 5 du texte final, ces amendements ont été adoptés quasiment mot pour mot. Ainsi, le texte prévoit, comme le demandaient Microsoft et DigitalEurope, que « les informations relatives aux centres de données, qui sont soumises au droit de l’Union et au droit national en matière de protection des secrets d’affaires et de confidentialité, ne doivent pas être rendues publiques. L’article 12, paragraphe 3, exige en outre que la base de données européenne soit accessible au public sous forme agrégée. Il est donc nécessaire de veiller à ce que les indicateurs clés de performance et les autres informations communiquées à la base de données européenne restent confidentiels ».

A aussi été ajouté que « la Commission et les États membres concernés préservent la confidentialité de toutes les informations et de tous les indicateurs clés de performance relatifs aux centres de données individuels qui sont communiqués à la base de données conformément à l’article 3. Ces informations sont considérées comme des informations confidentielles touchant aux intérêts commerciaux des exploitants et des propriétaires de centres de données », comme le demandaient les entreprises de la tech mot pour mot ou presque.

Nos confrères expliquent que les États membres de l’Union européenne ont aussi été vivement encouragés par la Commission à refuser toute demande d’accès à ces informations dans un email envoyé début 2025 [PDF].

Selon le chercheur en droit de l’environnement de l’université d’Opole, Jerzy Jendrośka, consulté par Investigate Europe, cette clause de confidentialité pourrait violer les règles de transparence édictées par la Convention d’Aarhus. « En vingt ans, je ne me souviens pas d’un cas similaire », explique-t-il, « Cela ne semble manifestement pas conforme à la convention ».

UE : la Commission a copié/collé les lobbys pour cacher les données sur les datacenters

17 avril 2026 à 15:05
Discrétion assistée par la loi
UE : la Commission a copié/collé les lobbys pour cacher les données sur les datacenters

En 2024, Microsoft et le lobby bruxellois de la tech DigitalEurope ont obtenu que les données de consommation des datacenters de plus de 500 kW récoltées par la Commission européenne ne soient pas rendues publiques. Le consortium Investigate Europe montre que les amendements au texte européen réglementant ces informations sont des reprises quasiment mot pour mot des propositions qu’ils ont faites.

Il y a trois ans, en 2023, l’Union européenne a voulu réviser sa législation sur l’efficacité énergétique et introduire une obligation d’information sur la consommation des data centers qui dépassent les 500 kW de puissance. Mais Microsoft et le lobby bruxellois de la tech DigitalEurope ont réussi à faire intégrer à la Commission des amendements quasiment copiés/collés interdisant toute publication de ces données par l’Europe et ses États membres, a découvert le consortium journalistique Investigate Europe.

Les données sur la consommation des data centers font l’objet d’intenses débats sur leur impact environnemental. Dans leurs rapports environnementaux maison, les grandes entreprises de la tech font leurs arrangements (plus ou moins importants), rendant impossible leur interprétation. Les projets de création de data centers font de plus en plus face à des résistances, mais il est difficile d’objectiver le débat avec le peu d’informations sur la réalité du terrain de ces installations.

Dans ce sens, la volonté exprimée par une première version du texte de révision aurait pu grandement aider l’information du public sur le sujet. En effet, le texte prévoyait un inventaire des informations sur les data centers de plus de 500 kW situés en Europe comportant au moins leur localisation et des indicateurs de performance sur la consommation d’énergie, la valorisation de la chaleur résiduelle, la consommation d’eau et l’utilisation d’énergies renouvelables. Et, selon cette première version, la Commission devait rendre publique cette base de données sous forme agrégée.

Ensuite, comme le prévoit le processus, la Commission a recueilli les commentaires des parties concernées et notamment des différents lobbys. Ainsi, Microsoft [PDF] et le lobby DigitalEurope (dont les membres sont par exemple Meta, CapGemini, Microsoft, NVIDIA ou encore Google) [PDF] ont tous deux proposé un amendement pour classifier les informations concernant les data centers.

Des propositions d’amendements adoptées mot pour mot

Et, dans l’article 5 du texte final, ces amendements ont été adoptés quasiment mot pour mot. Ainsi, le texte prévoit, comme le demandaient Microsoft et DigitalEurope, que « les informations relatives aux centres de données, qui sont soumises au droit de l’Union et au droit national en matière de protection des secrets d’affaires et de confidentialité, ne doivent pas être rendues publiques. L’article 12, paragraphe 3, exige en outre que la base de données européenne soit accessible au public sous forme agrégée. Il est donc nécessaire de veiller à ce que les indicateurs clés de performance et les autres informations communiquées à la base de données européenne restent confidentiels ».

A aussi été ajouté que « la Commission et les États membres concernés préservent la confidentialité de toutes les informations et de tous les indicateurs clés de performance relatifs aux centres de données individuels qui sont communiqués à la base de données conformément à l’article 3. Ces informations sont considérées comme des informations confidentielles touchant aux intérêts commerciaux des exploitants et des propriétaires de centres de données », comme le demandaient les entreprises de la tech mot pour mot ou presque.

Nos confrères expliquent que les États membres de l’Union européenne ont aussi été vivement encouragés par la Commission à refuser toute demande d’accès à ces informations dans un email envoyé début 2025 [PDF].

Selon le chercheur en droit de l’environnement de l’université d’Opole, Jerzy Jendrośka, consulté par Investigate Europe, cette clause de confidentialité pourrait violer les règles de transparence édictées par la Convention d’Aarhus. « En vingt ans, je ne me souviens pas d’un cas similaire », explique-t-il, « Cela ne semble manifestement pas conforme à la convention ».

OpenAI récupère le prénom de Rosalind Franklin pour son modèle spécialisé en biologie

17 avril 2026 à 11:38
Dans son ADN
OpenAI récupère le prénom de Rosalind Franklin pour son modèle spécialisé en biologie

Avec GPT‑Rosalind, OpenAI veut encore affirmer que ses outils peuvent être utiles aux chercheurs mais surtout aux industries pharmaceutiques et biomédicales. L’entreprise de Sam Altman utilise aussi le prénom d’une chercheuse, Rosalind Franklin, dont le travail a été pillé par ses confrères qui ont eu le prix Nobel qu’elle n’a pas obtenu.

Alors qu’OpenAI vient de mettre à jour Codex pour poser la fondation de sa « superapp », l’entreprise de Sam Altman veut afficher son potentiel dans les industries pharmaceutique, médicale et biochimique en présentant un nouveau modèle : GPT‑Rosalind.

Depuis quelque temps déjà, OpenAI veut absolument nous faire croire que ses modèles d’IA générative ont le niveau d’un chercheur. En novembre dernier, l’entreprise publiait une compilation de témoignages de chercheurs qu’elle avait édités sous forme d’un article scientifique pour vanter les mérites de GPT-5. À l’époque, OpenAI mettait en avant la résolution de problèmes mathématiques… qui avaient déjà été résolus par des humains, revendiquant donc des découvertes effectuées par d’autres.

Le créateur de ChatGPT assure désormais que son nouveau modèle peut améliorer le « workflow » des biologistes, biochimistes et bioinformaticiens pour « explorer davantage de possibilités, à mettre en évidence des liens qui auraient pu passer inaperçus et à formuler plus rapidement de meilleures hypothèses ».

« À terme, ces systèmes pourraient aider les organismes du secteur des sciences de la vie à réaliser des avancées qui seraient impossibles autrement, avec un taux de réussite bien plus élevé », promet l’entreprise sans pour autant expliquer comment.

L’instrumentalisation du prénom de Rosalind Franklin

Pour nommer ce modèle fine-tuné pour les biologistes, OpenAI utilise le prénom de Rosalind Franklin, qui avait co-découvert la structure hélicoïdale de l’ADN. « Ce modèle porte le nom de Rosalind Franklin, dont les recherches rigoureuses ont contribué à élucider la structure de l’ADN et ont jeté les bases de la biologie moléculaire moderne », affirme l’entreprise.

Cette biologiste n’avait pas reçu le prix Nobel pour cette découverte, contrairement à James Dewey Watson, Francis Crick et Maurice Wilkins, alors qu’on sait maintenant que ses travaux ont été cruciaux et que Watson et Crick les ont utilisés sans la créditer correctement.

Plusieurs chercheurs font remarquer l’ironie qu’une entreprise, dont l’entrainement des modèles s’appuie massivement sur les travaux des autres sans les citer, rende hommage à une chercheuse qui a longtemps été invisibilisée.

On peut aussi ajouter que, contrairement aux habitudes, par exemple avec Watson chez IBM, l’entreprise n’utilise pas le nom de Rosalind Franklin mais seulement son prénom. Mais ce n’est pas le premier « hommage » de la sorte que l’entreprise met en avant : rappelons-nous de son utilisation du style du réalisateur anti-IA Hayao Miyazaki pour la promotion de ses modèles.

Des collaborations avec des acteurs majeurs du domaine

Concernant son utilisation, GPT‑Rosalind doit, selon OpenAI, permettre aux chercheurs en biologie de faire de l’analyse de données, ou encore de pouvoir fouiller dans la littérature scientifique existante pour construire de nouvelles expériences scientifiques. Mais l’entreprise n’explique pas quelles données elle a utilisées pour affiner son modèle.

La recherche étant, par défaut, en perpétuelle évolution, le modèle en lui-même ne suffira pas à avoir un outil adapté à l’état de l’art et l’utilisation du RAG (Retrieval-augmented generation) et d’autres techniques seront sans doute nécessaires. Néanmoins, OpenAI affiche travailler avec des entreprises du secteur comme Novo Nordisk, Thermo Fischer ou Moderna pour intégrer son modèle dans leurs processus de recherche.

OpenAI met en avant des benchmarks qui, bien sûr, affichent GPT‑Rosalind au top dans son domaine, comparé à Gemini 3.1 pro, Grok 4.2 et à ses autres modèles. Mais pour BixBench, le seul pour lequel la startup donne des chiffres, la performance ne semble pas si exceptionnelle comparée à celle d’un GPT5.4 non spécialisé :

Pour accéder au modèle, les entreprises et organisations qui le voudraient doivent faire une demande via un formulaire. OpenAI met par contre en avant des plugins pour la recherche en bio avec Codex accessibles sur son GitHub.

OpenAI récupère le prénom de Rosalind Franklin pour son modèle spécialisé en biologie

17 avril 2026 à 11:38
Dans son ADN
OpenAI récupère le prénom de Rosalind Franklin pour son modèle spécialisé en biologie

Avec GPT‑Rosalind, OpenAI veut encore affirmer que ses outils peuvent être utiles aux chercheurs mais surtout aux industries pharmaceutiques et biomédicales. L’entreprise de Sam Altman utilise aussi le prénom d’une chercheuse, Rosalind Franklin, dont le travail a été pillé par ses confrères qui ont eu le prix Nobel qu’elle n’a pas obtenu.

Alors qu’OpenAI vient de mettre à jour Codex pour poser la fondation de sa « superapp », l’entreprise de Sam Altman veut afficher son potentiel dans les industries pharmaceutique, médicale et biochimique en présentant un nouveau modèle : GPT‑Rosalind.

Depuis quelque temps déjà, OpenAI veut absolument nous faire croire que ses modèles d’IA générative ont le niveau d’un chercheur. En novembre dernier, l’entreprise publiait une compilation de témoignages de chercheurs qu’elle avait édités sous forme d’un article scientifique pour vanter les mérites de GPT-5. À l’époque, OpenAI mettait en avant la résolution de problèmes mathématiques… qui avaient déjà été résolus par des humains, revendiquant donc des découvertes effectuées par d’autres.

Le créateur de ChatGPT assure désormais que son nouveau modèle peut améliorer le « workflow » des biologistes, biochimistes et bioinformaticiens pour « explorer davantage de possibilités, à mettre en évidence des liens qui auraient pu passer inaperçus et à formuler plus rapidement de meilleures hypothèses ».

« À terme, ces systèmes pourraient aider les organismes du secteur des sciences de la vie à réaliser des avancées qui seraient impossibles autrement, avec un taux de réussite bien plus élevé », promet l’entreprise sans pour autant expliquer comment.

L’instrumentalisation du prénom de Rosalind Franklin

Pour nommer ce modèle fine-tuné pour les biologistes, OpenAI utilise le prénom de Rosalind Franklin, qui avait co-découvert la structure hélicoïdale de l’ADN. « Ce modèle porte le nom de Rosalind Franklin, dont les recherches rigoureuses ont contribué à élucider la structure de l’ADN et ont jeté les bases de la biologie moléculaire moderne », affirme l’entreprise.

Cette biologiste n’avait pas reçu le prix Nobel pour cette découverte, contrairement à James Dewey Watson, Francis Crick et Maurice Wilkins, alors qu’on sait maintenant que ses travaux ont été cruciaux et que Watson et Crick les ont utilisés sans la créditer correctement.

Plusieurs chercheurs font remarquer l’ironie qu’une entreprise, dont l’entrainement des modèles s’appuie massivement sur les travaux des autres sans les citer, rende hommage à une chercheuse qui a longtemps été invisibilisée.

On peut aussi ajouter que, contrairement aux habitudes, par exemple avec Watson chez IBM, l’entreprise n’utilise pas le nom de Rosalind Franklin mais seulement son prénom. Mais ce n’est pas le premier « hommage » de la sorte que l’entreprise met en avant : rappelons-nous de son utilisation du style du réalisateur anti-IA Hayao Miyazaki pour la promotion de ses modèles.

Des collaborations avec des acteurs majeurs du domaine

Concernant son utilisation, GPT‑Rosalind doit, selon OpenAI, permettre aux chercheurs en biologie de faire de l’analyse de données, ou encore de pouvoir fouiller dans la littérature scientifique existante pour construire de nouvelles expériences scientifiques. Mais l’entreprise n’explique pas quelles données elle a utilisées pour affiner son modèle.

La recherche étant, par défaut, en perpétuelle évolution, le modèle en lui-même ne suffira pas à avoir un outil adapté à l’état de l’art et l’utilisation du RAG (Retrieval-augmented generation) et d’autres techniques seront sans doute nécessaires. Néanmoins, OpenAI affiche travailler avec des entreprises du secteur comme Novo Nordisk, Thermo Fischer ou Moderna pour intégrer son modèle dans leurs processus de recherche.

OpenAI met en avant des benchmarks qui, bien sûr, affichent GPT‑Rosalind au top dans son domaine, comparé à Gemini 3.1 pro, Grok 4.2 et à ses autres modèles. Mais pour BixBench, le seul pour lequel la startup donne des chiffres, la performance ne semble pas si exceptionnelle comparée à celle d’un GPT5.4 non spécialisé :

Pour accéder au modèle, les entreprises et organisations qui le voudraient doivent faire une demande via un formulaire. OpenAI met par contre en avant des plugins pour la recherche en bio avec Codex accessibles sur son GitHub.

☕️ Zorin OS 18.1 est disponible, recommandant encore plus d’apps alternatives

17 avril 2026 à 08:31


Comme la dernière version majeure de Zorin OS, la version 18.1 qui vient de sortir propose un environnement fait pour séduire les utilisateurs de Windows 10 qui se demandent par quoi remplacer l’ancien système.

L’équipe de la distribution explique notamment dans un billet que la version 18.1 permet, avec son système de support des applications Windows en surcouche de Wine, d’installer plus de 240 logiciels édités pour le système d’exploitation de Microsoft tout en proposant des alternatives.

Cette nouvelle version de Zorin améliore encore un peu l’interface avec la possibilité d’afficher les fenêtres en mosaïque ou encore une meilleure intégration des alphabets de droite à gauche utilisés par l’arabe, l’hébreu ou l’ourdou. Zorin OS intègre aussi la version 26.2 de LibreOffice dont l’équipe met en avant la meilleure compatibilité avec les formats de documents de Microsoft Office/365.

Sous le capot, Zorin OS 18.1 utilise la version 6.17 du noyau de Linux, comme la dernière version 25.10 d’Ubuntu.

☕️ Zorin OS 18.1 est disponible, recommandant encore plus d’apps alternatives

17 avril 2026 à 08:31


Comme la dernière version majeure de Zorin OS, la version 18.1 qui vient de sortir propose un environnement fait pour séduire les utilisateurs de Windows 10 qui se demandent par quoi remplacer l’ancien système.

L’équipe de la distribution explique notamment dans un billet que la version 18.1 permet, avec son système de support des applications Windows en surcouche de Wine, d’installer plus de 240 logiciels édités pour le système d’exploitation de Microsoft tout en proposant des alternatives.

Cette nouvelle version de Zorin améliore encore un peu l’interface avec la possibilité d’afficher les fenêtres en mosaïque ou encore une meilleure intégration des alphabets de droite à gauche utilisés par l’arabe, l’hébreu ou l’ourdou. Zorin OS intègre aussi la version 26.2 de LibreOffice dont l’équipe met en avant la meilleure compatibilité avec les formats de documents de Microsoft Office/365.

Sous le capot, Zorin OS 18.1 utilise la version 6.17 du noyau de Linux, comme la dernière version 25.10 d’Ubuntu.

Reçu — 27 mars 2026 Actualités numériques

OpenAI met en pause pour une durée indéterminée la sortie de sa version adulte de ChatGPT

27 mars 2026 à 15:50
Le business contre la « règle 34 »
OpenAI met en pause pour une durée indéterminée la sortie de sa version adulte de ChatGPT

Faisant face à une opposition interne depuis des mois et à un besoin de montrer que son entreprise peut proposer des outils utiles dans l’environnement professionnel, Sam Altman semble (non sans mal) accepter d’abandonner l’idée de mettre en place une version pornographique de ChatGPT.

Suivant les velléités d’Elon Musk avec son IA Grok de permettre aux utilisateurs de générer des images et des textes pornographiques, en octobre dernier, Sam Altman affirmait vouloir « traiter les utilisateurs adultes comme des adultes » en leur créant un mode particulier une fois que leur âge était vérifié.

Mais le monde des adultes ramènerait le CEO d’OpenAI vers le « serious business ». Comme l’explique le Financial Times quelques jours après que l’entreprise a annoncé l’abandon de Sora 2, OpenAI a suspendu « pour une durée indéterminée » son projet de lancement de la version pornographique de son chatbot pour se concentrer sur ses autres projets. La version « adulte » de ChatGPT avait déjà été reportée au début du mois. L’entreprise affirmait toujours croire au projet mais « il faudra plus de temps pour acquérir l’expérience nécessaire », ajoutait-elle à l’époque.

Des investisseurs peu motivés par le projet

Les voix de certains investisseurs se seraient jointes aux critiques émises en interne sur le projet. En effet, celui-ci était déjà critiqué par des salariés mais aussi par un comité d’experts furieux et unanimement opposé, créé le jour même où Sam Altman avait exprimé sa volonté de créer ce mode « adulte ».

L’entreprise a affirmé au journal économique britannique qu’elle voulait finalement d’abord mener des recherches à long terme sur les effets des conversations à caractère sexuel explicite et l’attachement affectif avant de prendre une décision sur le lancement de cette version de son chatbot, ajoutant qu’il n’y avait pour l’instant pas de « preuve empirique » sur la question.

Mais, selon des sources du Financial Times, certains investisseurs étaient inquiets à la fois des risques liés à ce genre d’outil et du peu de potentiel de croissance qu’il pouvait apporter à l’entreprise.

Des risques de faux positifs sur l’estimation de l’âge des mineurs

Concernant les risques, ce n’était pas seulement lié à de potentielles polémiques et attaques en justice sur la gestion de tel ou tel contenu problématique, comme ce qu’on a pu voir avec les deepfakes générés par Grok visant à dénuder des femmes, parfois mineures. Mais comme nous l’expliquions, l’entreprise a aussi du mal à proposer un outil de prédiction d’âge maison qui ne laisse aucun enfant passer la barrière. Ainsi, il classait encore récemment à tort 12 % des mineurs comme des adultes.

Ces décisions sont prises une semaine après que le Wall Street Journal affirme qu’OpenAI allait réduire ses projets parallèles pour se concentrer sur son cœur de métier. Le journal économique américain expliquait que l’entreprise de Sam Altman était sous la pression d’Anthropic qui s’est imposée comme la startup rivale qui propose des solutions pratiques et novatrices dans le cadre du travail, comme Claude Code ou Cowork.

« Nous ne pouvons pas laisser passer cette occasion parce que nous sommes distraits par des activités secondaires », affirmait la responsable des applications d’OpenAI, Fidji Simo, à son équipe récemment selon Business Insider, ajoutant que l’entreprise devait absolument améliorer sa productivité dans le secteur professionnel, puis dans le secteur grand public.

OpenAI met en pause pour une durée indéterminée la sortie de sa version adulte de ChatGPT

27 mars 2026 à 15:50
Le business contre la « règle 34 »
OpenAI met en pause pour une durée indéterminée la sortie de sa version adulte de ChatGPT

Faisant face à une opposition interne depuis des mois et à un besoin de montrer que son entreprise peut proposer des outils utiles dans l’environnement professionnel, Sam Altman semble (non sans mal) accepter d’abandonner l’idée de mettre en place une version pornographique de ChatGPT.

Suivant les velléités d’Elon Musk avec son IA Grok de permettre aux utilisateurs de générer des images et des textes pornographiques, en octobre dernier, Sam Altman affirmait vouloir « traiter les utilisateurs adultes comme des adultes » en leur créant un mode particulier une fois que leur âge était vérifié.

Mais le monde des adultes ramènerait le CEO d’OpenAI vers le « serious business ». Comme l’explique le Financial Times quelques jours après que l’entreprise a annoncé l’abandon de Sora 2, OpenAI a suspendu « pour une durée indéterminée » son projet de lancement de la version pornographique de son chatbot pour se concentrer sur ses autres projets. La version « adulte » de ChatGPT avait déjà été reportée au début du mois. L’entreprise affirmait toujours croire au projet mais « il faudra plus de temps pour acquérir l’expérience nécessaire », ajoutait-elle à l’époque.

Des investisseurs peu motivés par le projet

Les voix de certains investisseurs se seraient jointes aux critiques émises en interne sur le projet. En effet, celui-ci était déjà critiqué par des salariés mais aussi par un comité d’experts furieux et unanimement opposé, créé le jour même où Sam Altman avait exprimé sa volonté de créer ce mode « adulte ».

L’entreprise a affirmé au journal économique britannique qu’elle voulait finalement d’abord mener des recherches à long terme sur les effets des conversations à caractère sexuel explicite et l’attachement affectif avant de prendre une décision sur le lancement de cette version de son chatbot, ajoutant qu’il n’y avait pour l’instant pas de « preuve empirique » sur la question.

Mais, selon des sources du Financial Times, certains investisseurs étaient inquiets à la fois des risques liés à ce genre d’outil et du peu de potentiel de croissance qu’il pouvait apporter à l’entreprise.

Des risques de faux positifs sur l’estimation de l’âge des mineurs

Concernant les risques, ce n’était pas seulement lié à de potentielles polémiques et attaques en justice sur la gestion de tel ou tel contenu problématique, comme ce qu’on a pu voir avec les deepfakes générés par Grok visant à dénuder des femmes, parfois mineures. Mais comme nous l’expliquions, l’entreprise a aussi du mal à proposer un outil de prédiction d’âge maison qui ne laisse aucun enfant passer la barrière. Ainsi, il classait encore récemment à tort 12 % des mineurs comme des adultes.

Ces décisions sont prises une semaine après que le Wall Street Journal affirme qu’OpenAI allait réduire ses projets parallèles pour se concentrer sur son cœur de métier. Le journal économique américain expliquait que l’entreprise de Sam Altman était sous la pression d’Anthropic qui s’est imposée comme la startup rivale qui propose des solutions pratiques et novatrices dans le cadre du travail, comme Claude Code ou Cowork.

« Nous ne pouvons pas laisser passer cette occasion parce que nous sommes distraits par des activités secondaires », affirmait la responsable des applications d’OpenAI, Fidji Simo, à son équipe récemment selon Business Insider, ajoutant que l’entreprise devait absolument améliorer sa productivité dans le secteur professionnel, puis dans le secteur grand public.

La Wikipedia anglophone interdit l’édition assistée par modèles de langage

27 mars 2026 à 14:48
IA pas d'arrangement
La Wikipedia anglophone interdit l’édition assistée par modèles de langage

La version anglophone de l’encyclopédie participative a décidé d’interdire l’utilisation de l’IA générative pour la plupart des modifications de ses pages. Wikipédia en allemand a aussi récemment restreint cette utilisation.

« Les textes générés par des grands modèles de langage (LLM) tels que ChatGPT, Gemini, DeepSeek, etc. enfreignent souvent plusieurs des principes fondamentaux de Wikipédia », explique maintenant une page de la version anglophone de l’encyclopédie consacrée à la rédaction d’articles à l’aide de grands modèles de langage.

Deux petites exceptions pour l’usage de l’IA générative dans la Wikipédia anglophone

Les éditeurs ont donc décidé que, désormais, « l’utilisation des grands modèles de langage (LLM) pour générer ou réécrire le contenu d’articles est interdite » (toujours concernant la version anglophone). Même si peu de personnes ont participé au vote (46), une large majorité (44) a voté en faveur de cette nouvelle règle quand seulement deux personnes s’y sont opposées, comme on peut le lire dans le résumé des discussions.

Le texte ajoute quand même deux exceptions pour lesquelles les utilisateurs de la Wikipédia anglophone peuvent utiliser des outils intégrant des LLM.

Ainsi, la règle permet cette utilisation aux éditeurs pour « obtenir des suggestions de corrections de fond concernant leurs propres textes ». L’intégration de ces suggestions doit néanmoins se faire « après vérification humaine », et « à condition que le LLM n’ajoute pas de contenu de son propre chef ».

La Wikipédia anglophone accepte aussi l’utilisation de ces outils pour traduire des pages d’autres versions linguistiques de l’encyclopédie, à condition de suivre les règles récemment mises en place à ce sujet. En effet, les « hallucinations » venues de traductions par IA avaient déjà fait bouger les lignes à ce sujet.

Une utilisation difficile à objectiver et un déni toujours possible

Un dernier paragraphe concède que certains utilisateurs peuvent avoir un style d’écriture qui se rapproche de celui d’une IA générative. Ainsi, le texte demande à ce que les éventuelles sanctions prises au nom de l’utilisation de modèles de langage s’appuient plus sur l’infraction des principes fondamentaux de Wikipédia que sur l’éventuelle signature stylistique et linguistique d’un texte.

Mais l’une des éditrices ayant voté en faveur de cette règle exprime quand même la crainte que son adoption soit vaine : « Je crains tout de même un peu que l’approche que nous adoptons dans ces directives n’encourage le mensonge (surtout compte tenu de la réserve selon laquelle, si le texte est de bonne qualité, la directive ou la politique ne sera pas appliquée, alors à quoi bon ?) et qu’il soit difficile de les faire respecter correctement ».

Une interdiction d’usages jugée utile par certains

Pour l’une des personnes qui s’y est opposée, la formulation proposée ne fait pas la distinction entre l’utilisation des LLM pour générer du « slop » et « un processus de travail beaucoup plus restreint, dans lequel un éditeur expérimenté identifie les sources, définit le cadre de la tâche, vérifie le résultat par rapport aux sources et assume l’entière responsabilité de ce qui est publié ».

« Mettre tout cela dans le même panier n’aide personne », ajoute celle pour qui « « l’utilisation des LLM pour générer ou réécrire le contenu d’articles est interdite » : c’est tout simplement trop radical ».

Dans les discussions avant vote, un autre utilisateur expliquait en quoi, pour lui, les LLM pouvaient être utiles dans l’édition de Wikipédia : « une utilisation que j’ai trouvée utile consiste à importer le fichier PDF d’une source que je viens de lire dans le LLM en lui donnant la consigne suivante : « génère une référence au format Wikipédia pour ce document. Si des informations bibliographiques manquent, effectue une recherche sur Internet pour les trouver et fournis-moi les liens vers les sources où tu as trouvé ces informations manquantes afin que je puisse vérifier leur exactitude » ».

Mais, comme l’explique une des personnes en faveur de l’interdiction, le besoin de « remédier au déséquilibre flagrant entre l’effort nécessaire pour générer du contenu IA slop et celui requis pour le nettoyer » l’a emporté.

Les Wikipédia germanophone et francophone avancent aussi sur le sujet

L’utilisation des outils s’appuyant sur les LLM n’agite pas que la communauté anglophone. Comme nous l’expliquions l’année dernière, la communauté francophone a déjà adopté, à l’époque, un texte de recommandation sur l’usage de l’IA générative.

Le résumé de ce texte affirme que « l’intelligence artificielle générative (IAg) n’apporte aucune garantie sur la fiabilité, la libre réutilisation et la vérifiabilité du contenu. Son utilisation est donc vivement déconseillée ».

Jules*, l’un des administrateurs de Wikipédia en français, affirme cependant sur Bluesky qu’ « en pratique, les blocages pour mésusage de l’IA générative se multiplient » et il ajoute qu’« il est probable qu’une nouvelle itération [de la recommandation] survienne dans les prochains mois ».

Il pointe aussi qu’en février dernier, la Wikipédia germanophone s’est dotée « d’une recommandation stricte sur l’IA générative », dixit la newsletter francophone du projet.

Elle indique : « Wikipédia est un projet dont le contenu est documenté et rédigé par des humains pour des humains. L’utilisation de l’intelligence artificielle générative dans le cadre de l’élaboration de contenus pour Wikipédia est donc fondamentalement indésirable, à quelques exceptions près, qui sont énumérées ci-dessous ».

Sont ainsi autorisés le recours à la traduction automatique, qui fonctionne avec le support de l’IA, l’utilisation d’outils basés sur l’IA pour la détection des erreurs (mais, contrairement aux robots de Wikipédia, toute modification doit être validée par un humain), ainsi que la recherche avec l’aide de l’IA.

La Wikipedia anglophone interdit l’édition assistée par modèles de langage

27 mars 2026 à 14:48
IA pas d'arrangement
La Wikipedia anglophone interdit l’édition assistée par modèles de langage

La version anglophone de l’encyclopédie participative a décidé d’interdire l’utilisation de l’IA générative pour la plupart des modifications de ses pages. Wikipédia en allemand a aussi récemment restreint cette utilisation.

« Les textes générés par des grands modèles de langage (LLM) tels que ChatGPT, Gemini, DeepSeek, etc. enfreignent souvent plusieurs des principes fondamentaux de Wikipédia », explique maintenant une page de la version anglophone de l’encyclopédie consacrée à la rédaction d’articles à l’aide de grands modèles de langage.

Deux petites exceptions pour l’usage de l’IA générative dans la Wikipédia anglophone

Les éditeurs ont donc décidé que, désormais, « l’utilisation des grands modèles de langage (LLM) pour générer ou réécrire le contenu d’articles est interdite » (toujours concernant la version anglophone). Même si peu de personnes ont participé au vote (46), une large majorité (44) a voté en faveur de cette nouvelle règle quand seulement deux personnes s’y sont opposées, comme on peut le lire dans le résumé des discussions.

Le texte ajoute quand même deux exceptions pour lesquelles les utilisateurs de la Wikipédia anglophone peuvent utiliser des outils intégrant des LLM.

Ainsi, la règle permet cette utilisation aux éditeurs pour « obtenir des suggestions de corrections de fond concernant leurs propres textes ». L’intégration de ces suggestions doit néanmoins se faire « après vérification humaine », et « à condition que le LLM n’ajoute pas de contenu de son propre chef ».

La Wikipédia anglophone accepte aussi l’utilisation de ces outils pour traduire des pages d’autres versions linguistiques de l’encyclopédie, à condition de suivre les règles récemment mises en place à ce sujet. En effet, les « hallucinations » venues de traductions par IA avaient déjà fait bouger les lignes à ce sujet.

Une utilisation difficile à objectiver et un déni toujours possible

Un dernier paragraphe concède que certains utilisateurs peuvent avoir un style d’écriture qui se rapproche de celui d’une IA générative. Ainsi, le texte demande à ce que les éventuelles sanctions prises au nom de l’utilisation de modèles de langage s’appuient plus sur l’infraction des principes fondamentaux de Wikipédia que sur l’éventuelle signature stylistique et linguistique d’un texte.

Mais l’une des éditrices ayant voté en faveur de cette règle exprime quand même la crainte que son adoption soit vaine : « Je crains tout de même un peu que l’approche que nous adoptons dans ces directives n’encourage le mensonge (surtout compte tenu de la réserve selon laquelle, si le texte est de bonne qualité, la directive ou la politique ne sera pas appliquée, alors à quoi bon ?) et qu’il soit difficile de les faire respecter correctement ».

Une interdiction d’usages jugée utile par certains

Pour l’une des personnes qui s’y est opposée, la formulation proposée ne fait pas la distinction entre l’utilisation des LLM pour générer du « slop » et « un processus de travail beaucoup plus restreint, dans lequel un éditeur expérimenté identifie les sources, définit le cadre de la tâche, vérifie le résultat par rapport aux sources et assume l’entière responsabilité de ce qui est publié ».

« Mettre tout cela dans le même panier n’aide personne », ajoute celle pour qui « « l’utilisation des LLM pour générer ou réécrire le contenu d’articles est interdite » : c’est tout simplement trop radical ».

Dans les discussions avant vote, un autre utilisateur expliquait en quoi, pour lui, les LLM pouvaient être utiles dans l’édition de Wikipédia : « une utilisation que j’ai trouvée utile consiste à importer le fichier PDF d’une source que je viens de lire dans le LLM en lui donnant la consigne suivante : « génère une référence au format Wikipédia pour ce document. Si des informations bibliographiques manquent, effectue une recherche sur Internet pour les trouver et fournis-moi les liens vers les sources où tu as trouvé ces informations manquantes afin que je puisse vérifier leur exactitude » ».

Mais, comme l’explique une des personnes en faveur de l’interdiction, le besoin de « remédier au déséquilibre flagrant entre l’effort nécessaire pour générer du contenu IA slop et celui requis pour le nettoyer » l’a emporté.

Les Wikipédia germanophone et francophone avancent aussi sur le sujet

L’utilisation des outils s’appuyant sur les LLM n’agite pas que la communauté anglophone. Comme nous l’expliquions l’année dernière, la communauté francophone a déjà adopté, à l’époque, un texte de recommandation sur l’usage de l’IA générative.

Le résumé de ce texte affirme que « l’intelligence artificielle générative (IAg) n’apporte aucune garantie sur la fiabilité, la libre réutilisation et la vérifiabilité du contenu. Son utilisation est donc vivement déconseillée ».

Jules*, l’un des administrateurs de Wikipédia en français, affirme cependant sur Bluesky qu’ « en pratique, les blocages pour mésusage de l’IA générative se multiplient » et il ajoute qu’« il est probable qu’une nouvelle itération [de la recommandation] survienne dans les prochains mois ».

Il pointe aussi qu’en février dernier, la Wikipédia germanophone s’est dotée « d’une recommandation stricte sur l’IA générative », dixit la newsletter francophone du projet.

Elle indique : « Wikipédia est un projet dont le contenu est documenté et rédigé par des humains pour des humains. L’utilisation de l’intelligence artificielle générative dans le cadre de l’élaboration de contenus pour Wikipédia est donc fondamentalement indésirable, à quelques exceptions près, qui sont énumérées ci-dessous ».

Sont ainsi autorisés le recours à la traduction automatique, qui fonctionne avec le support de l’IA, l’utilisation d’outils basés sur l’IA pour la détection des erreurs (mais, contrairement aux robots de Wikipédia, toute modification doit être validée par un humain), ainsi que la recherche avec l’aide de l’IA.

TurboQuant veut réduire grandement les besoins en mémoire des IA génératives… et ça marche

27 mars 2026 à 10:39
On en revient toujours à Shannon
TurboQuant veut réduire grandement les besoins en mémoire des IA génératives… et ça marche

Des chercheurs de Google ont publié un ensemble d’algorithmes de quantification, nommé TurboQuant. Ils permettent une compression massive réduisant l’utilisation de la mémoire, notamment pour l’IA générative, alors que le prix de la RAM est dans toutes les têtes.

Le nombre de paramètres et la taille de la fenêtre contextuelle des modèles de langage (LLM) prennent une place de plus en plus importante dans leur utilisation, notamment pour traiter des quantités énormes de documents et leur permettre d’augmenter leur acuité. Mais son utilisation intensive demande une quantité importante de mémoire. L’optimisation de la compression de ces informations devient primordiale.

On vous explique le nerf de la guerre : la quantification

La quantification vectorielle est une technique déjà utilisée pour cette compression. Mais jusqu’ici, celle-ci créait au fur et à mesure un « surcoût de mémoire ». Google a annoncé ce mardi 24 mars que ses chercheurs avaient justement mis en place une série d’algorithmes de quantification qui « répond de manière optimale » à ce problème.

De fait, ils avaient mis en ligne leur article sur la plateforme de prépublication scientifique arXiv dès le 28 avril 2025 et celui-ci était passé assez inaperçu. Dans leurs billets, les chercheurs de Google expliquent que leur article a été accepté pour présentation à la conférence scientifique ICLR qui se déroulera du 23 avril au 27 avril 2026 à Rio.


Il reste 80% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

Reçu — 26 mars 2026 Actualités numériques

☕️ Le Conseil de Trump sur les sciences et technologies rempli de CEO de la tech

26 mars 2026 à 14:07


Plus d’un an après son investiture et après avoir maintes fois attaqué les agences scientifiques de son pays, Donald Trump a nommé les membres de son Comité présidentiel des conseillers en science et technologie (President’s Council of Advisors on Science and Technology PCAST).

Ce comité est présidé, comme annoncé en janvier 2025, par Michael Kratsios (conseiller de Donald Trump depuis son premier mandat) et l’investisseur David Sacks (PayPal, Facebook, Uber, SpaceX, Palantir…).

Illustration : Flock

S’ajoutent à la liste, les noms de :

  • Marc Andreessen (fondateur de Netscape)
  • Sergey Brin (cofondateur de Google)
  • Safra Catz (CEO d’Oracle)
  • Michael Dell (fondateur de Dell)
  • Jacob DeWitte (fondateur d’Oklo)
  • Fred Ehrsam (co-fondateur de Coinbase et Paradigm)
  • Larry Ellison (co-fondateur d’Oracle)
  • David Friedberg (financier)
  • Jensen Huang (CEO de NVIDIA)
  • John Martinis (responsable du Google Quantum AI Lab et prix Nobel de physique 2025)
  • Bob Mumgaard (CEO de Commonwealth Fusion Systems)
  • Lisa Su (CEO d’AMD)
  • Mark Zuckerberg (CEO de Meta)

Si une bonne partie de ces personnalités ont fait des études longues, et parfois dans des universités prestigieuses, ArsTechnica pointe le fait qu’aucun n’est actuellement chercheur.

De fait, ce comité a été créé en 2001 sous George W. Bush et n’a pas une importance primordiale dans la gestion de la politique de la recherche aux États-Unis. Mais cette longue liste de responsables de la tech états-unienne marque en creux le manque de chercheuses et chercheurs sur tous les autres sujets que peuvent couvrir les différentes disciplines scientifiques.

☕️ Le Conseil de Trump sur les sciences et technologies rempli de CEO de la tech

26 mars 2026 à 14:07


Plus d’un an après son investiture et après avoir maintes fois attaqué les agences scientifiques de son pays, Donald Trump a nommé les membres de son Comité présidentiel des conseillers en science et technologie (President’s Council of Advisors on Science and Technology PCAST).

Ce comité est présidé, comme annoncé en janvier 2025, par Michael Kratsios (conseiller de Donald Trump depuis son premier mandat) et l’investisseur David Sacks (PayPal, Facebook, Uber, SpaceX, Palantir…).

Illustration : Flock

S’ajoutent à la liste, les noms de :

  • Marc Andreessen (fondateur de Netscape)
  • Sergey Brin (cofondateur de Google)
  • Safra Catz (CEO d’Oracle)
  • Michael Dell (fondateur de Dell)
  • Jacob DeWitte (fondateur d’Oklo)
  • Fred Ehrsam (co-fondateur de Coinbase et Paradigm)
  • Larry Ellison (co-fondateur d’Oracle)
  • David Friedberg (financier)
  • Jensen Huang (CEO de NVIDIA)
  • John Martinis (responsable du Google Quantum AI Lab et prix Nobel de physique 2025)
  • Bob Mumgaard (CEO de Commonwealth Fusion Systems)
  • Lisa Su (CEO d’AMD)
  • Mark Zuckerberg (CEO de Meta)

Si une bonne partie de ces personnalités ont fait des études longues, et parfois dans des universités prestigieuses, ArsTechnica pointe le fait qu’aucun n’est actuellement chercheur.

De fait, ce comité a été créé en 2001 sous George W. Bush et n’a pas une importance primordiale dans la gestion de la politique de la recherche aux États-Unis. Mais cette longue liste de responsables de la tech états-unienne marque en creux le manque de chercheuses et chercheurs sur tous les autres sujets que peuvent couvrir les différentes disciplines scientifiques.

Meta et YouTube jugés responsables des troubles psychiques d’une mineure

26 mars 2026 à 10:50
Addiction by design
Meta et YouTube jugés responsables des troubles psychiques d’une mineure

Le procès opposant Kaley G. M. et sa mère à Google et Meta se termine sur une condamnation des deux entreprises à quelques millions d’euros chacune. Le montant est moins élevé que d’autres affaires médiatiques concernant les GAFAM, mais cette décision pourrait faire jurisprudence dans de nombreux cas similaires, si elle est confirmée en appel.

Meta et YouTube ont mis en place des fonctionnalités conçues pour créer une dépendance à leurs réseaux sociaux et plateformes de vidéos, et celles-ci ont entraîné des troubles de santé mentale sur une jeune utilisatrice, a conclu le jury de la Cour supérieure de justice de Los Angeles.

Le procès opposait depuis un mois et demi Kaley G. M, une plaignante âgée actuellement de 20 ans accompagnée par sa mère, à Google et Meta.

Le jugement inclut des dommages-intérêts de 4,2 millions de dollars à verser par Meta et 1,8 million par YouTube. Kaley G. M les accusait d’avoir provoqué et entretenu son addiction à leur service alors qu’elle était mineure. Elle avait pu créer son compte Instagram à l’âge de 9 ans alors que l’application ne demandait pas encore la date de naissance de l’utilisateur à l’inscription.

« Je pense généralement qu’il existe un groupe de personnes, potentiellement assez important, qui mentent sur leur âge afin d’utiliser nos services », avait affirmé Mark Zuckerberg alors qu’il était pressé de justifier la politique de Meta relative aux préados au cours du procès.

L’avocat de Kaley G. M, Mark Lanier a montré que Meta a enterré une recherche menée en interne sur les conséquences de ses produits sur les adolescents qui ne lui convenait pas.

Le New York Times explique que, lors du procès, l’avocat a insisté sur les fonctionnalités de défilement infini, d’algorithmes de recommandation et de vidéos en autoplay, qui seraient conçues pour capter notamment les jeunes utilisateurs, et qu’ils utilisent Instagram, YouTube et autres plateformes de manière compulsive.

La jeune femme avait expliqué qu’elle était tous les jours sur les réseaux sociaux. « Je ne peux tout simplement pas m’en passer », répondait-elle à la question « Pourquoi n’arrêtez-vous pas ? ».

Son avocat avait insisté sur la politique interne de Meta pour attirer les ados, citant un document interne à l’entreprise datant de 2018 affirmant que « si nous voulons vraiment gagner auprès des adolescents, nous devons les attirer dès leur préadolescence ».

Si Meta et Google sont les deux seules entreprises à être condamnées, Snap et TikTok étaient aussi initialement visées. Mais celles-ci ont préféré négocier un accord confidentiel leur évitant que soient déballées au grand public des informations internes sur leur politique vis-à-vis des jeunes utilisateurs.

Le verdict de ce procès arrive juste après que l’entreprise de Mark Zuckerberg a été condamnée à 375 millions de dollars d’amende pour le déploiement d’outils dangereux pour la santé mentale des mineurs.

Si la somme versée ici à Kaley G. M est très inférieure à cette amende, cette décision pourrait faire tache d’huile. En effet, près de 2 500 autres procès attendent les quatre entreprises de réseaux sociaux aux États-Unis, selon le média spécialisé Courthouse News. Et le verdict pourrait faire jurisprudence si la décision est confirmée en appel.

Car les deux entreprises ont déjà planifié de faire appel, selon Reuters. « Cette affaire repose sur une mauvaise compréhension de YouTube, qui est une plateforme de streaming conçue de manière responsable, et non un réseau social », assure au New York Times le porte-parole de Google.

Les deux entreprises avaient mis en avant le fait que les poursuites étaient irrecevables selon l’article 230 du Communications Decency Act, qui protège les plateformes de la responsabilité des contenus publiés par leurs utilisateurs. Mais, comme l’explique Reuters, les juges avaient rejeté cet argument et avaient permis la poursuite de l’instruction. Il sera cependant sans doute réutilisé par les avocats de Google et Meta en appel.

À Courthouse News, l’une des jurées a affirmé : « Nous voulions que [Meta et Google] comprennent que cela n’était pas acceptable ». Mais, selon elle, le jury craignait de « remettre la totalité de la somme à une seule personne », avant d’ajouter : « Nous avons pensé que si cette somme pouvait être versée petit à petit, pour être dépensée à bon escient et durer longtemps, nous aurions probablement fixé un montant plus élevé. »

Meta et YouTube jugés responsables des troubles psychiques d’une mineure

26 mars 2026 à 10:50
Addiction by design
Meta et YouTube jugés responsables des troubles psychiques d’une mineure

Le procès opposant Kaley G. M. et sa mère à Google et Meta se termine sur une condamnation des deux entreprises à quelques millions d’euros chacune. Le montant est moins élevé que d’autres affaires médiatiques concernant les GAFAM, mais cette décision pourrait faire jurisprudence dans de nombreux cas similaires, si elle est confirmée en appel.

Meta et YouTube ont mis en place des fonctionnalités conçues pour créer une dépendance à leurs réseaux sociaux et plateformes de vidéos, et celles-ci ont entraîné des troubles de santé mentale sur une jeune utilisatrice, a conclu le jury de la Cour supérieure de justice de Los Angeles.

Le procès opposait depuis un mois et demi Kaley G. M, une plaignante âgée actuellement de 20 ans accompagnée par sa mère, à Google et Meta.

Le jugement inclut des dommages-intérêts de 4,2 millions de dollars à verser par Meta et 1,8 million par YouTube. Kaley G. M les accusait d’avoir provoqué et entretenu son addiction à leur service alors qu’elle était mineure. Elle avait pu créer son compte Instagram à l’âge de 9 ans alors que l’application ne demandait pas encore la date de naissance de l’utilisateur à l’inscription.

« Je pense généralement qu’il existe un groupe de personnes, potentiellement assez important, qui mentent sur leur âge afin d’utiliser nos services », avait affirmé Mark Zuckerberg alors qu’il était pressé de justifier la politique de Meta relative aux préados au cours du procès.

L’avocat de Kaley G. M, Mark Lanier a montré que Meta a enterré une recherche menée en interne sur les conséquences de ses produits sur les adolescents qui ne lui convenait pas.

Le New York Times explique que, lors du procès, l’avocat a insisté sur les fonctionnalités de défilement infini, d’algorithmes de recommandation et de vidéos en autoplay, qui seraient conçues pour capter notamment les jeunes utilisateurs, et qu’ils utilisent Instagram, YouTube et autres plateformes de manière compulsive.

La jeune femme avait expliqué qu’elle était tous les jours sur les réseaux sociaux. « Je ne peux tout simplement pas m’en passer », répondait-elle à la question « Pourquoi n’arrêtez-vous pas ? ».

Son avocat avait insisté sur la politique interne de Meta pour attirer les ados, citant un document interne à l’entreprise datant de 2018 affirmant que « si nous voulons vraiment gagner auprès des adolescents, nous devons les attirer dès leur préadolescence ».

Si Meta et Google sont les deux seules entreprises à être condamnées, Snap et TikTok étaient aussi initialement visées. Mais celles-ci ont préféré négocier un accord confidentiel leur évitant que soient déballées au grand public des informations internes sur leur politique vis-à-vis des jeunes utilisateurs.

Le verdict de ce procès arrive juste après que l’entreprise de Mark Zuckerberg a été condamnée à 375 millions de dollars d’amende pour le déploiement d’outils dangereux pour la santé mentale des mineurs.

Si la somme versée ici à Kaley G. M est très inférieure à cette amende, cette décision pourrait faire tache d’huile. En effet, près de 2 500 autres procès attendent les quatre entreprises de réseaux sociaux aux États-Unis, selon le média spécialisé Courthouse News. Et le verdict pourrait faire jurisprudence si la décision est confirmée en appel.

Car les deux entreprises ont déjà planifié de faire appel, selon Reuters. « Cette affaire repose sur une mauvaise compréhension de YouTube, qui est une plateforme de streaming conçue de manière responsable, et non un réseau social », assure au New York Times le porte-parole de Google.

Les deux entreprises avaient mis en avant le fait que les poursuites étaient irrecevables selon l’article 230 du Communications Decency Act, qui protège les plateformes de la responsabilité des contenus publiés par leurs utilisateurs. Mais, comme l’explique Reuters, les juges avaient rejeté cet argument et avaient permis la poursuite de l’instruction. Il sera cependant sans doute réutilisé par les avocats de Google et Meta en appel.

À Courthouse News, l’une des jurées a affirmé : « Nous voulions que [Meta et Google] comprennent que cela n’était pas acceptable ». Mais, selon elle, le jury craignait de « remettre la totalité de la somme à une seule personne », avant d’ajouter : « Nous avons pensé que si cette somme pouvait être versée petit à petit, pour être dépensée à bon escient et durer longtemps, nous aurions probablement fixé un montant plus élevé. »

Reçu — 24 mars 2026 Actualités numériques

Palantir s’étend encore au Pentagone et dans le système britannique

24 mars 2026 à 16:22
Des data à gogo !
Palantir s’étend encore au Pentagone et dans le système britannique

Le Pentagone a décidé de mettre au cœur de sa stratégie militaire le système Maven de Palantir. En parallèle, l’entreprise dirigée par Alex Karp a décroché un contrat avec l’autorité financière britannique lui donnant accès à des données très sensibles concernant le pays.

Le département étatsunien de la Défense (ou de la Guerre, selon la nouvelle appellation trumpiste) a décidé d’accélérer l’introduction dans son processus décisionnel de la solution logicielle Maven de Palantir.

Le secrétaire adjoint de la Défense des États-Unis, Steve Feinberg, a officialisé dans un mémo interne qu’a pu consulter Reuters que le système Maven devient un programme officiel du Pentagone, ce qui garantit à Palantir l’utilisation à long terme de sa technologie au sein de l’armée américaine.

Investissement massif de l’armée américaine dans l’IA et dans les solutions de Palantir en particulier

Comme nous l’expliquions l’année dernière, ce logiciel est déjà utilisé par le Pentagone, l’armée israélienne et par l’OTAN depuis l’année dernière. Ce programme utilise des données massivement agrégées pour alimenter la prise de décision sur les terrains d’opérations et notamment la reconnaissance automatique de véhicules ou de cibles observées par des drones ou des satellites.

Steve Feinberg affirme dans son mémo que Maven fournira aux combattants américains « les outils les plus récents nécessaires pour détecter, dissuader et dominer [leurs] adversaires dans tous les domaines ».

« Il est impératif que nous investissions dès maintenant et de manière ciblée pour renforcer l’intégration de l’IA au sein de la Force interarmées et faire de la prise de décision fondée sur l’IA la pierre angulaire de notre stratégie », y affirme-t-il encore.

Cette décision renforce encore la position de Palantir au sein du système de décision militaire étatsunien et dans l’administration américaine en général. Comme nous l’expliquions déjà en août dernier, Palantir a profité à fond de l’élection de Donald Trump.

Cette intégration de Maven se met en place alors que le budget prévu pour « l’autonomie et les systèmes autonomes » au sein du département de la Défense par l’administration Trump est de 13,4 milliards de dollars, dont 9,4 milliards pour les drones, 1,7 milliard pour les systèmes maritimes autonomes, 210 millions pour les véhicules terrestres, 7,34 millions pour les capacités sous-marines et 1,2 milliard de dollars pour les logiciels de supervision de l’IA chargés de sous-tendre le fonctionnement de ces différents systèmes.

Analyser la criminalité financière britannique et accès aux données sensibles

En parallèle, Palantir a obtenu un contrat avec la Financial Conduct Authority (FCA) pour analyser, sur une période d’essai, ses données et l’aider dans sa lutte contre la criminalité financière, dont la fraude, le blanchiment d’argent et les délits d’initiés. Le Guardian explique que l’entreprise d’Alex Karp doit toucher 30 000 livres sterling (34 670 euros) par semaine pour cet essai.

Si le montant peut paraitre comme un enjeu beaucoup plus faible que le contrat avec le Pentagone, certains membres du parlement britannique ont soulevé des questions de souveraineté. « Des entreprises comme Palantir n’ont pas leur place au sein des systèmes gouvernementaux britanniques lorsqu’elles sont étroitement impliquées dans les guerres illégales du président Trump » affirme ainsi l’écologiste Siân Berry, qui a appelé le gouvernement à « intervenir immédiatement et à protéger notre sécurité nationale et économique en bloquant l’attribution de ce contrat ».

Questionné sur le fait que le Royaume-Uni devienne « dangereusement dépendant » des entreprises américaines et notamment de Palantir, le premier ministre travailliste Keir Starmer a répondu : « Je ne pense pas que nous soyons trop dépendants ».

L’immersion de Palantir dans le système britannique ne se résume pourtant pas à cet essai. Elle a déjà remporté un contrat auprès du NHS, le système de santé britannique, en 2023. Celui-ci est encore décrié au Royaume-Uni. « Il existe un risque qu’un gouvernement actuel ou futur utilise la plateforme de données fédérées système de planification (FDP) gérée par Palantir pour commettre des abus de pouvoir fondés sur les données, d’une manière qui serait impossible avec les systèmes de données actuels du NHS », expliquait le 12 mars dernier l’ONG britannique Medact.

Le Guardian expliquait récemment que Scotland Yard utilise aussi des logiciels de Palantir pour surveiller le comportement de son personnel.

En France, rappelons que la DGSI a renouvelé encore son contrat avec l’entreprise d’Alex Karp en décembre dernier.

Palantir s’étend encore au Pentagone et dans le système britannique

24 mars 2026 à 16:22
Des data à gogo !
Palantir s’étend encore au Pentagone et dans le système britannique

Le Pentagone a décidé de mettre au cœur de sa stratégie militaire le système Maven de Palantir. En parallèle, l’entreprise dirigée par Alex Karp a décroché un contrat avec l’autorité financière britannique lui donnant accès à des données très sensibles concernant le pays.

Le département étatsunien de la Défense (ou de la Guerre, selon la nouvelle appellation trumpiste) a décidé d’accélérer l’introduction dans son processus décisionnel de la solution logicielle Maven de Palantir.

Le secrétaire adjoint de la Défense des États-Unis, Steve Feinberg, a officialisé dans un mémo interne qu’a pu consulter Reuters que le système Maven devient un programme officiel du Pentagone, ce qui garantit à Palantir l’utilisation à long terme de sa technologie au sein de l’armée américaine.

Investissement massif de l’armée américaine dans l’IA et dans les solutions de Palantir en particulier

Comme nous l’expliquions l’année dernière, ce logiciel est déjà utilisé par le Pentagone, l’armée israélienne et par l’OTAN depuis l’année dernière. Ce programme utilise des données massivement agrégées pour alimenter la prise de décision sur les terrains d’opérations et notamment la reconnaissance automatique de véhicules ou de cibles observées par des drones ou des satellites.

Steve Feinberg affirme dans son mémo que Maven fournira aux combattants américains « les outils les plus récents nécessaires pour détecter, dissuader et dominer [leurs] adversaires dans tous les domaines ».

« Il est impératif que nous investissions dès maintenant et de manière ciblée pour renforcer l’intégration de l’IA au sein de la Force interarmées et faire de la prise de décision fondée sur l’IA la pierre angulaire de notre stratégie », y affirme-t-il encore.

Cette décision renforce encore la position de Palantir au sein du système de décision militaire étatsunien et dans l’administration américaine en général. Comme nous l’expliquions déjà en août dernier, Palantir a profité à fond de l’élection de Donald Trump.

Cette intégration de Maven se met en place alors que le budget prévu pour « l’autonomie et les systèmes autonomes » au sein du département de la Défense par l’administration Trump est de 13,4 milliards de dollars, dont 9,4 milliards pour les drones, 1,7 milliard pour les systèmes maritimes autonomes, 210 millions pour les véhicules terrestres, 7,34 millions pour les capacités sous-marines et 1,2 milliard de dollars pour les logiciels de supervision de l’IA chargés de sous-tendre le fonctionnement de ces différents systèmes.

Analyser la criminalité financière britannique et accès aux données sensibles

En parallèle, Palantir a obtenu un contrat avec la Financial Conduct Authority (FCA) pour analyser, sur une période d’essai, ses données et l’aider dans sa lutte contre la criminalité financière, dont la fraude, le blanchiment d’argent et les délits d’initiés. Le Guardian explique que l’entreprise d’Alex Karp doit toucher 30 000 livres sterling (34 670 euros) par semaine pour cet essai.

Si le montant peut paraitre comme un enjeu beaucoup plus faible que le contrat avec le Pentagone, certains membres du parlement britannique ont soulevé des questions de souveraineté. « Des entreprises comme Palantir n’ont pas leur place au sein des systèmes gouvernementaux britanniques lorsqu’elles sont étroitement impliquées dans les guerres illégales du président Trump » affirme ainsi l’écologiste Siân Berry, qui a appelé le gouvernement à « intervenir immédiatement et à protéger notre sécurité nationale et économique en bloquant l’attribution de ce contrat ».

Questionné sur le fait que le Royaume-Uni devienne « dangereusement dépendant » des entreprises américaines et notamment de Palantir, le premier ministre travailliste Keir Starmer a répondu : « Je ne pense pas que nous soyons trop dépendants ».

L’immersion de Palantir dans le système britannique ne se résume pourtant pas à cet essai. Elle a déjà remporté un contrat auprès du NHS, le système de santé britannique, en 2023. Celui-ci est encore décrié au Royaume-Uni. « Il existe un risque qu’un gouvernement actuel ou futur utilise la plateforme de données fédérées système de planification (FDP) gérée par Palantir pour commettre des abus de pouvoir fondés sur les données, d’une manière qui serait impossible avec les systèmes de données actuels du NHS », expliquait le 12 mars dernier l’ONG britannique Medact.

Le Guardian expliquait récemment que Scotland Yard utilise aussi des logiciels de Palantir pour surveiller le comportement de son personnel.

En France, rappelons que la DGSI a renouvelé encore son contrat avec l’entreprise d’Alex Karp en décembre dernier.

Piratage : l’Arcom revendique le blocage de plus de 15 000 noms de domaine depuis 2022

24 mars 2026 à 13:22
Sisyphe
Piratage : l’Arcom revendique le blocage de plus de 15 000 noms de domaine depuis 2022

La liste des sites bloqués à la demande de l’Arcom s’allonge de jour en jour depuis que l’autorité a mis en place la possibilité pour les chaînes de signaler de nouvelles adresses. Elle se concentre notamment sur les sites sportifs à la demande des chaînes, alors que, dans ses chiffres, la pratique du live streaming est moins importante que d’autres comme le streaming ou le téléchargement de films ou de séries.

Fraîche de la fusion entre le CSA et l’Hadopi, en 2022, l’Arcom mettait en place un formulaire pour signaler les miroirs à bloquer concernant le streaming illicite de compétitions sportives. Trois ans après, l’autorité se targue d’avoir fait bloquer près de 15 200 sites.

Une augmentation significative des blocages en 2025

L’Arcom a publié, ce lundi 23 mars, un bilan de sa lutte contre le piratage des contenus culturels et sportifs [PDF]. L’autorité y met notamment en avant l’intensification de ce nombre de noms de domaines bloqués à sa demande. Ainsi, alors que le chiffre concernant le blocage de sites sportifs était de 772 en 2022, l’autorité revendique près de 6 500 noms de domaines bloqués à sa demande en 2025 :

Ce chiffre serait notamment dû à une prise en main plus importante des ayants droit du secteur de son outil puisque l’autorité affiche que leurs demandes ont augmentées significativement en 2024. Ainsi, l’autorité peut leur montrer que, lorsqu’ils s’en emparent, le dispositif semble fonctionner.

Ce lundi 23 mars, avait lieu le forum de l’Association pour la Protection des Programmes Sportifs (APPS), le lobby regroupant des chaînes comme beIN SPORTS, Canal+ ou Eurosport, mais aussi des fédérations sportives comme la Ligue de Football Professionnel, la Ligue Nationale de Handball, la Ligue Nationale de Rugby ou encore la Fédération Française de Tennis.

Devant ce parterre, le président de l’Arcom, Martin Ajdari affirme que « le premier constat, c’est que la lutte contre le piratage, ça fonctionne : depuis que la mission confiée à l’Arcom a été étendue en 2021, elle est devenue à la fois beaucoup plus efficace, mais aussi plus consensuelle ». Et le responsable de l’autorité d’affirmer une baisse « de 70 % depuis 2021 » du live-streaming notamment utilisé pour le piratage sportif, avec, selon lui, un nombre de visites mensuelles sur ce genre de sites par habitant en France de 20 % inférieur à la moyenne dans l’UE.

Dans son bilan, l’Arcom veut montrer qu’elle prend en considération les différents acteurs et rappelle que depuis juin 2024, elle fait aussi des demandes de blocage aux fournisseurs de DNS alternatifs (Google, Cloudflare, Quad9, Comodo, Whalebone et NextDNS sont dans son viseur) et depuis juin 2025 aux fournisseurs commerciaux de VPN (NordVPN, ExpressVPN, CyberGhost, SurfShark et ProtonVPN sont cités) :

Le représentant de l’autorité affiche la capacité de celle-ci à « s’adapter aux évolutions du marché : d’abord, par l’action sur les intermédiaires, y compris les nouveaux acteurs : en 2025, nous avons notifié 1 800 moteurs de recherche, mais également 5 300 services de DNS alternatifs, et, nouveauté en 2025, près de 600 services de VPN. Ensuite, celle des nouveaux modèles de piratage : en 2026, sur les 6500 notifications, 4 000 concernent des services d’IPTV ».

Une concentration sur le piratage de contenus sportifs

Depuis quelque temps, la lutte contre le piratage en ligne de l’Arcom semble répondre essentiellement à ce lobby alors que, d’après les propres chiffres de l’Arcom, le live streaming et l’IPTV ne sont pas les pratiques de piratage illicite les plus courantes en France. Ainsi, toujours selon le bilan de l’Arcom, le streaming et le téléchargement représentent 79 % de ces pratiques alors que le live streaming n’en représente que 12 % comme l’IPTV.

Quand on regarde la courbe de ces pratiques sur le long terme, on remarque que, si le live streaming a eu un frémissement en 2021, il n’a jamais vraiment décollé. Toujours selon les chiffres de l’Arcom, la progression de l’IPTV existe mais cette pratique resterait marginale.

Alors que les institutions semblent se concentrer sur ces pratiques à la demande des acteurs du secteur sportif, on peut constater une inflexion de la baisse des pratiques de streaming et de téléchargement illicites d’autres contenus (films ou séries notamment) depuis 2022.

Mais la seule action de l’Arcom ne semble pas encore satisfaire la LFP qui s’est félicitée la semaine dernière de la sanction, par le parquet d’Arras, d’une vingtaine d’utilisateurs de boîtiers IPTV permettant d’accéder gratuitement aux chaines payantes.

L’Arcom a aussi indiqué à l’AFP qu’elle prévoyait de demander le blocage du site pornographique xGroovy car il n’aurait pas mis en place de contrôle d’âge pour ses utilisateurs, ce qui lui permettrait d’augmenter son utilisation chez les plus jeunes.

Interrogé par Le Figaro, Martin Ajdari expliquait que la fréquentation des mineurs des sites pornos les plus connus aurait baissé d’environ 40% entre août et novembre 2025. Mais, « manifestement, il y a un phénomène de report » sur des sites comme xGroovy qui serait « assez utilisé » alors qu’il n’a pas d’adresse postale dans l’Union européenne ni d’actionnariat identifié par l’autorité. « XGroovy est le site pornographique sur lequel les mineurs passent actuellement le plus de temps, mais il représente à peine 10% de celui qu’ils passaient sur Pornhub », assure-t-il à nos confrères.

Piratage : l’Arcom revendique le blocage de plus de 15 000 noms de domaine depuis 2022

24 mars 2026 à 13:22
Sisyphe
Piratage : l’Arcom revendique le blocage de plus de 15 000 noms de domaine depuis 2022

La liste des sites bloqués à la demande de l’Arcom s’allonge de jour en jour depuis que l’autorité a mis en place la possibilité pour les chaînes de signaler de nouvelles adresses. Elle se concentre notamment sur les sites sportifs à la demande des chaînes, alors que, dans ses chiffres, la pratique du live streaming est moins importante que d’autres comme le streaming ou le téléchargement de films ou de séries.

Fraîche de la fusion entre le CSA et l’Hadopi, en 2022, l’Arcom mettait en place un formulaire pour signaler les miroirs à bloquer concernant le streaming illicite de compétitions sportives. Trois ans après, l’autorité se targue d’avoir fait bloquer près de 15 200 sites.

Une augmentation significative des blocages en 2025

L’Arcom a publié, ce lundi 23 mars, un bilan de sa lutte contre le piratage des contenus culturels et sportifs [PDF]. L’autorité y met notamment en avant l’intensification de ce nombre de noms de domaines bloqués à sa demande. Ainsi, alors que le chiffre concernant le blocage de sites sportifs était de 772 en 2022, l’autorité revendique près de 6 500 noms de domaines bloqués à sa demande en 2025 :

Ce chiffre serait notamment dû à une prise en main plus importante des ayants droit du secteur de son outil puisque l’autorité affiche que leurs demandes ont augmentées significativement en 2024. Ainsi, l’autorité peut leur montrer que, lorsqu’ils s’en emparent, le dispositif semble fonctionner.

Ce lundi 23 mars, avait lieu le forum de l’Association pour la Protection des Programmes Sportifs (APPS), le lobby regroupant des chaînes comme beIN SPORTS, Canal+ ou Eurosport, mais aussi des fédérations sportives comme la Ligue de Football Professionnel, la Ligue Nationale de Handball, la Ligue Nationale de Rugby ou encore la Fédération Française de Tennis.

Devant ce parterre, le président de l’Arcom, Martin Ajdari affirme que « le premier constat, c’est que la lutte contre le piratage, ça fonctionne : depuis que la mission confiée à l’Arcom a été étendue en 2021, elle est devenue à la fois beaucoup plus efficace, mais aussi plus consensuelle ». Et le responsable de l’autorité d’affirmer une baisse « de 70 % depuis 2021 » du live-streaming notamment utilisé pour le piratage sportif, avec, selon lui, un nombre de visites mensuelles sur ce genre de sites par habitant en France de 20 % inférieur à la moyenne dans l’UE.

Dans son bilan, l’Arcom veut montrer qu’elle prend en considération les différents acteurs et rappelle que depuis juin 2024, elle fait aussi des demandes de blocage aux fournisseurs de DNS alternatifs (Google, Cloudflare, Quad9, Comodo, Whalebone et NextDNS sont dans son viseur) et depuis juin 2025 aux fournisseurs commerciaux de VPN (NordVPN, ExpressVPN, CyberGhost, SurfShark et ProtonVPN sont cités) :

Le représentant de l’autorité affiche la capacité de celle-ci à « s’adapter aux évolutions du marché : d’abord, par l’action sur les intermédiaires, y compris les nouveaux acteurs : en 2025, nous avons notifié 1 800 moteurs de recherche, mais également 5 300 services de DNS alternatifs, et, nouveauté en 2025, près de 600 services de VPN. Ensuite, celle des nouveaux modèles de piratage : en 2026, sur les 6500 notifications, 4 000 concernent des services d’IPTV ».

Une concentration sur le piratage de contenus sportifs

Depuis quelque temps, la lutte contre le piratage en ligne de l’Arcom semble répondre essentiellement à ce lobby alors que, d’après les propres chiffres de l’Arcom, le live streaming et l’IPTV ne sont pas les pratiques de piratage illicite les plus courantes en France. Ainsi, toujours selon le bilan de l’Arcom, le streaming et le téléchargement représentent 79 % de ces pratiques alors que le live streaming n’en représente que 12 % comme l’IPTV.

Quand on regarde la courbe de ces pratiques sur le long terme, on remarque que, si le live streaming a eu un frémissement en 2021, il n’a jamais vraiment décollé. Toujours selon les chiffres de l’Arcom, la progression de l’IPTV existe mais cette pratique resterait marginale.

Alors que les institutions semblent se concentrer sur ces pratiques à la demande des acteurs du secteur sportif, on peut constater une inflexion de la baisse des pratiques de streaming et de téléchargement illicites d’autres contenus (films ou séries notamment) depuis 2022.

Mais la seule action de l’Arcom ne semble pas encore satisfaire la LFP qui s’est félicitée la semaine dernière de la sanction, par le parquet d’Arras, d’une vingtaine d’utilisateurs de boîtiers IPTV permettant d’accéder gratuitement aux chaines payantes.

L’Arcom a aussi indiqué à l’AFP qu’elle prévoyait de demander le blocage du site pornographique xGroovy car il n’aurait pas mis en place de contrôle d’âge pour ses utilisateurs, ce qui lui permettrait d’augmenter son utilisation chez les plus jeunes.

Interrogé par Le Figaro, Martin Ajdari expliquait que la fréquentation des mineurs des sites pornos les plus connus aurait baissé d’environ 40% entre août et novembre 2025. Mais, « manifestement, il y a un phénomène de report » sur des sites comme xGroovy qui serait « assez utilisé » alors qu’il n’a pas d’adresse postale dans l’Union européenne ni d’actionnariat identifié par l’autorité. « XGroovy est le site pornographique sur lequel les mineurs passent actuellement le plus de temps, mais il représente à peine 10% de celui qu’ils passaient sur Pornhub », assure-t-il à nos confrères.

Reçu — 23 mars 2026 Actualités numériques

La plateforme de preprints arXiv devient une structure indépendante à but non lucratif

23 mars 2026 à 16:17
Archive aux pieds solides
La plateforme de preprints arXiv devient une structure indépendante à but non lucratif

Après 35 ans au sein du laboratoire de Los Alamos puis de l’université Cornell, la plateforme de preprint s’institutionnalise pour diversifier ses sources budgétaires mais aussi avoir une organisation des ressources humaines plus claires.

Fini la dépendance totale à l’université Cornell : arXiv prévoit de devenir une structure à part entière avec son CEO, son propre budget et son indépendance officielle à partir de juillet 2026.

C’est via une petite annonce pour le poste de CEO que des chercheurs ont repéré le changement. Il y a une dizaine de jours, le mathématicien de l’université d’Édimbourg, John Baez a remarqué sur Mastodon l’annonce de l’ouverture du poste le 11 mai prochain.

Le texte explique qu’ « après des décennies de collaboration fructueuse avec l’université Cornell, et grâce au soutien de la Fondation Simons, arXiv s’établit désormais comme une organisation indépendante à but non lucratif, marquant ainsi une nouvelle étape dans son histoire de 35 ans en tant que pionnier de la science en libre accès ».

Depuis 1991 et de simples échanges par mails à la banalisation au-delà du domaine académique

Effectivement, c’est en 1991 qu’est né le serveur pionnier de la prépublication scientifique, et même un peu avant. L’astrophysicienne Joanne Cohn a déjà raconté qu’elle a petit à petit mis en place un système d’échange de fichiers TeX de preprints par emails à partir de l’automne 1989. Mais c’est elle qui centralisait tous les échanges.

Finalement, à l’été 1991, son collègue Paul Ginsparg lui a proposé d’automatiser le fonctionnement avec quelques scripts et a commencé le serveur de preprint arXiv au sein du fameux laboratoire américain de Los Alamos. 10 ans après, Paul Ginsparg changeait de laboratoire pour rejoindre l’université de Cornell, avec arXiv dans ses bagages.

Mais 35 ans après sa création, arXiv n’est plus un petit serveur qui permet à quelques chercheurs de s’échanger les prépublications pour une prochaine conférence. Comme le dit l’annonce pour la recherche d’un nouveau CEO, 27 personnes travaillent actuellement sur le projet et son budget annuel est d’environ 6 millions de dollars par an.

Une bonne partie de la recherche en physique, mathématiques, informatique, ingénierie électrique et des systèmes et bien d’autres disciplines est déposée sur les serveurs d’arXiv avant d’être éventuellement publiée dans une revue scientifique ou présentée lors d’une conférence.

En parallèle, des outils comme les modèles de langage ont été notamment entrainés sur ces articles qui représentent des données de très haute qualité.

Diversification des donateurs et besoin d’une structure de direction

Interrogé par Science, Greg Morrisett, le responsable du Centre de recherche Cornell Tech qui s’occupe actuellement du serveur, explique que la modification de statut va permettre de lever « davantage de fonds auprès d’un éventail plus large de donateurs afin de financer les ressources humaines et les technologies nécessaires pour prendre en charge le nombre croissant de prépublications sur le site, qui devrait dépasser les 300 000 cette année ». Jusque-là, arXiv était surtout financé par Cornell et par la fondation Simons.

« Son indépendance permettra à arXiv de suivre tous les aspects de son évolution, de moderniser son infrastructure, d’élargir la couverture thématique et de renforcer ses liens avec les acteurs internationaux », est-il précisé dans l’annonce.

Greg Morrisett explique aussi qu’au sein de Cornell, le serveur de preprint est aussi en concurrence budgétaire avec d’autres projets : « Lorsque nous avons discuté [du serveur de prépublications] avec certaines organisations, celles-ci craignaient que Cornell n’exerce une influence trop importante. Elles redoutaient un peu de verser un chèque à l’université Cornell en espérant que celui-ci finisse dans les caisses d’arXiv. »

« Une certaine structure est nécessaire pour assurer une fonction de direction. Comme l’ont mentionné d’autres intervenants, la configuration « 501c3 [le texte qui encadre les structures non lucratives aux États-Unis] + CEO » est courante chez nous, et étant donné que nous travaillons avec un centre géographique à New York, un CEO peut accomplir beaucoup de choses, non seulement au sein d’arXiv, mais aussi à l’extérieur », explique aussi Deyan Ginev, un ingénieur qui travaille pour le projet en réponse au post de John Baez.

Le mathématicien relevait aussi le salaire pour ce poste de CEO qui « devrait se situer autour de 300 000 $ ». Rappelons que, Sudip S Parikh, le CEO de la structure à but non lucratif American Association For The Advancement Of Science (AAAS), qui édite la revue scientifique Science, émarge, lui, à plus de trois fois plus avec 983 185 dollars en 2024.

❌