Vue normale

Reçu aujourd’hui — 17 juillet 2025Actualités numériques

News Publishers Take Paywall-Blocker 12ft.io Offline

Par :BeauHD
17 juillet 2025 à 21:00
The Verge's Emma Roth reports: The News/Media Alliance, a trade association behind major news publishers, announced that it has "successfully secured" the removal of 12ft.io, a website that helped users bypass paywalls online. The trade association says 12ft.io's webhost took down the site on July 14th "following the News/Media Alliance's efforts." 12ft.io -- or 12 Foot Ladder -- also allowed users to view webpages without ads, trackers, or pop-ups by disguising a user's browser as a web crawler, giving them unfettered access to a webpage's contents. Software engineer Thomas Millar says he created the site when he realized "8 of the top 10 links on Google were paywalled" when doing research during the pandemic. [...] In its announcement, News/Media Alliance says 12ft.io "offered illegal circumvention technology" that allowed users to access copyrighted content without paying for it. The organization adds that it will take "similar actions" against other sites that let users get around paywalls. The News Media Alliance recently called Google's AI Mode "theft." (Like many chatbots, Google's AI Mode eliminates the need to visit a website, starving publishers of the pageviews they need to be compensated for their work.) "Publishers commit significant resources to creating the best and most informative content for consumers, and illegal tools like 12ft.io undermine their ability to financially support that work through subscriptions and ad revenue," News/Media Alliance president and CEO Danielle Coffey said in the press release. "Taking down paywall bypassers is an essential part of ensuring we have a healthy and sustainable information ecosystem."

Read more of this story at Slashdot.

Meta Investors, Mark Zuckerberg Reach Settlement To End $8 Billion Trial Over Facebook Privacy Litigation

Par :BeauHD
17 juillet 2025 à 20:20
An anonymous reader quotes a report from NBC News: Mark Zuckerberg and current and former directors and officers of Meta Platforms agreed on Thursday to settle claims seeking $8 billion for the damage they allegedly caused the company by allowing repeated violations of Facebook users' privacy, a lawyer for the shareholders told a Delaware judge on Thursday. The parties did not disclose details of the settlement and defense lawyers did not address the judge, Kathaleen McCormick of the Delaware Court of Chancery. McCormick adjourned the trial just as it was to enter its second day and she congratulated the parties. The plaintiffs' lawyer, Sam Closic, said the agreement just came together quickly. Billionaire venture capitalist Marc Andreessen, who is a defendant in the trial and a Meta director, was scheduled to testify on Thursday. Shareholders of Meta sued Zuckerberg, Andreessen and other former company officials including former Chief Operating Officer Sheryl Sandberg in hopes of holding them liable for billions of dollars in fines and legal costs the company paid in recent years. The Federal Trade Commission fined Facebook $5 billion in 2019 after finding that it failed to comply with a 2012 agreement with the regulator to protect users' data. The shareholders wanted the 11 defendants to use their personal wealth to reimburse the company. The defendants denied the allegations, which they called "extreme claims." "This settlement may bring relief to the parties involved, but it's a missed opportunity for public accountability," said Jason Kint, the head of Digital Content Next, a trade group for content providers. "Facebook has successfully remade the 'Cambridge Analytica' scandal about a few bad actors rather than an unraveling of its entire business model of surveillance capitalism and the reciprocal, unbridled sharing of personal data. That reckoning is now left unresolved."

Read more of this story at Slashdot.

Robinhood CEO Says Majority of Company's New Code Written by AI

Par :msmash
17 juillet 2025 à 19:25
Robinhood CEO Vlad Tenev has said that the majority of his company's new code is written by AI, with "close to 100%" of engineers using AI code editors. Speaking on the 20VC podcast, Tenev estimated around 50% of new code at the trading platform is AI-generated. Tenev said the 50% figure is imprecise due to advanced "agentic" code editors that have made it difficult to distinguish human-written from AI-generated code. The company has progressed from GitHub Copilot to Cursor and now Windsurf, where "nearly all of the code is written by AI," he said. Tenev estimated only a "minority" of new code at Robinhood is written by humans.

Read more of this story at Slashdot.

Le processeur de NVIDIA et MediaTek repoussé à courant 2026 ?

Mais que se passe-t-il du côté de NVIDIA et MediaTek ? Leur processeur élaboré en commun a beaucoup fait parler de lui avant de peu à peu ne quasiment plus donner de signes de vie... Fin 2024, les rumeurs commençaient à affirmer que NVIDIA avait l'intention de se lancer sur le marché des CPU Arm, et...

Mozilla Ships WebGPU in Firefox 141, Catching Up To Chrome's 2023 Launch

Par :msmash
17 juillet 2025 à 18:45
Mozilla will ship WebGPU support in Firefox 141 when the browser launches July 22, bringing graphics processing capabilities that Chrome users have had since 2023. The initial release supports Windows only, with Mac, Linux, and Android planned for the coming months. WebGPU provides web content direct access to graphics processors for high-performance computation and rendering in games and complex 3D applications. Chrome gained WebGPU support with version 113 in 2023, while Safari 26 is expected to add the feature this fall. Firefox's implementation uses the WGPU Rust crate, which translates web requests into native commands for Direct3D 12, Metal, or Vulkan.

Read more of this story at Slashdot.

Britain's Bankrupt Universities Are Hunting For Cheaper Models

Par :msmash
17 juillet 2025 à 18:08
British universities face mounting financial pressures with four in ten institutions running deficits, according to the Office for Students regulator. Half have closed courses to save money, while Durham and Newcastle each shed 200 staff members. Lancaster's cost-saving plan could eliminate one in five academic positions. The crisis, writes Economist, stems from frozen tuition fees for English students, which will rise by only a few percent in August for the first time in eight years.

Read more of this story at Slashdot.

OpenAI Debuts AI Agent That Controls Browsers To Automate Shopping, Presentations

Par :msmash
17 juillet 2025 à 17:26
OpenAI launched ChatGPT agent Thursday, an AI tool that can complete multi-step tasks including online shopping, creating PowerPoint presentations, and generating spreadsheets. The agent combines capabilities from two existing OpenAI services: Operator, which can browse and interact with websites like a human, and Deep Research, which handles complex online research tasks. The tool runs on a new AI model developed specifically for agent capabilities and can perform tasks such as planning meals and ordering ingredients online, booking restaurant reservations, and creating slide decks based on competitor analysis. In demonstrations, the agent successfully browsed Etsy for vintage lamps under $200 with free shipping and automatically added items to a shopping cart. ChatGPT agent is immediately available to Pro, Plus, and Team subscribers, with Enterprise and Education users gaining access later this summer. The tool requires user permission before making purchases or performing "irreversible" actions like sending emails. The startup, however, has cautioned that the agent "is far from perfect" and can take several minutes to complete tasks.

Read more of this story at Slashdot.

Viper PV593 : Patriot adopte le SM2508 pour son nouveau SSD PCIe 5.0 haut de gamme

Les SSD PCIe 5.0 de la gamme Viper et signés Patriot sont pour l'instant encore assez peu communs dans nos contrées, mais vous pourriez tout de même être amenés à les y rencontrer. Le fabricant avait fait son entrée sur ce segment officiellement et concrètement en février 2024 avec le Viper PV553. T...

[Bon plan] PNY GeForce RTX 4060 Ti 16Go à 354,99€

C'est un Bon plan peut-être un peu clivant que nous publions là, mais il en faut pour tous les gouts et si certains ne le trouveront peut-être pas à leur convenance, d'autres pourraient au contraire y trouver l'offre parfaite pour eux. En soi, voir une GeForce RTX 4060 Ti 16 Go à seulement 354,99 €...

'Sony is Still Stubborn About the Size of Its Cameras'

Par :msmash
17 juillet 2025 à 16:41
Sony removed the tiltable screen from its new RX1R III full-frame compact camera to maintain similar dimensions to the previous model, despite adding numerous new features and charging $5,100 for the device, The Verge reports. The company increased the camera's size by only 2.5mm in height and 15.5mm in depth while incorporating the high-resolution sensor from the A7R V, Sony's latest autofocus tracking system, a longer-lasting battery, and a proper electronic viewfinder. Sony integrated the top dials and hot shoe into the body for a sleeker appearance. The camera's compact design prevents the inclusion of lens or sensor-based image stabilization. The Verge points out that Leica also added a tilt screen to its Q3 model after users requested the feature, despite the design compromise required.

Read more of this story at Slashdot.

Bon Plan : du lourd avec Civilization VI chez EGS !

17 juillet 2025 à 15:15

A la recherche d'un passe-temps particulièrement chronophage ? Bonne nouvelle, le jeu offert en cette fin de semaine par Epic Games Store est Civilization VI. En édition Platinum, soit avec des extensions et DLC. De suite, ça calme un peu ! Et pour les fans, il y a d'autres DLC à récupérer moyennant finance. C'est ici. Comment, les détails de cette édition déjà bien complète ? - Civilization VI - Pack scénario Vikings - Civilization VI - Pack Pologne (scénario et civilisation) - Civilization VI - Pack Australie (civilisation et scénario) - Civilization VI - Pack Perse et Macédoine (civilisations et scénarios) - Civilization VI - Pack Nubie (civilisations et scénarios) - Civilization VI - Pack Khmers et Indonésie (civilisations et scénarios) - Civilization VI : Extension « Rise and Fall » - Civilization VI : Extension « Gathering Storm » […]

Lire la suite

Judge Allows Nationwide Class Action Against Anthropic Over Alleged Piracy of 7 Million Books For AI Training

Par :msmash
17 juillet 2025 à 16:02
A California federal judge has ruled that three authors suing Anthropic for copyright infringement can represent writers nationwide whose books the AI startup allegedly pirated to train its Claude chatbot. U.S. District Judge William Alsup said the authors can bring a class action on behalf of all U.S. writers whose works Anthropic allegedly downloaded from pirate libraries LibGen and PiLiMi to create a repository of millions of books in 2021 and 2022. Alsup said Anthropic may have illegally downloaded as many as 7 million books from the pirate websites, which could make it liable for billions of dollars in damages if the authors' case succeeds.

Read more of this story at Slashdot.

Cancer Death Rates Fall One-Third in US Since 1990s as Prevention Efforts Take Hold

Par :msmash
17 juillet 2025 à 15:21
Cancer death rates in the U.S. have fallen by approximately one-third since the 1990s when adjusted for age, according to data cited in a new analysis of global cancer trends. The decline represents a steady, year-over-year reduction that began in the early 1990s and continues across developed countries. Prevention efforts have contributed substantially to the decline. Reduced smoking rates in wealthy nations prevented more than 3 million cancer deaths since 1975 in America alone. Britain's HPV vaccination program, launched in 2008 for teenage girls, produced a 90% reduction in cervical cancer rates among women in their 20s within 15 years. Treatment advances have transformed outcomes for specific cancers. Childhood leukemia, once virtually fatal, now has a five-year survival rate above 90%. Researchers have identified inexpensive drugs with cancer-prevention properties, including aspirin, which cuts bowel cancer risk in half for patients with Lynch syndrome. Future progress faces obstacles, however, including high treatment costs and planned cuts to the National Cancer Institute under the Trump administration. China overtook America as the primary source of cancer research in 2025.

Read more of this story at Slashdot.

Cerballiance va exploiter les données d’une partie de ses patients dans un entrepôt

17 juillet 2025 à 15:00
Choix binaire pour du tertiaire
Cerballiance va exploiter les données d’une partie de ses patients dans un entrepôt

Cerballiance, entreprise disposant de plus de 700 laboratoires d’analyses en France, a annoncé la constitution d’un entrepôt de données de santé (EDS). Au-delà des buts poursuivis, cette étape pose des questions légitimes sur la confidentialité des données.

Les entrepôts de données de santé existent depuis des années en France. Selon les chiffres fournis par le ministère de la Santé, on en comptait une centaine au 1er janvier 2025. Leurs objectifs sont toujours les mêmes : rassembler une vaste quantité de données « à des fins de pilotage (gestion, contrôle et administration de l’activité) et de recherches, d’études, d’évaluations dans le domaine de la santé ».

Aussi, l’annonce de Cerballiance pourrait sembler n’être qu’un EDS de plus dans la liste des entrepôts officiels et autorisés par la CNIL. La Commission fournit d’ailleurs un référentiel pour la création de ces structures. Pour obtenir l’autorisation d’ouvrir l’EDS, « l’organisme responsable de ce traitement est tenu de documenter sa conformité au RGPD et au référentiel dans son registre des activités de traitement ».

À quoi doit servir cet entrepôt de données ?

L’EDS annoncé par Cerballiance ne concerne pas l’ensemble des clients. Dans la longue annonce de l’entreprise, on peut ainsi lire que seuls 24 laboratoires sont concernés. Bien que Cerballiance ne le précise pas, il pourrait s’agir d’un début, même si une montée en puissance nécessiterait une nouvelle autorisation de la CNIL. La société indique que l’EDS reprendra les données précédemment générées depuis le 1er janvier 2023 et y ajoutera toutes celles collectées à compter du 1er septembre prochain.

Les objectifs de l’EDS de Cerballiance se répartissent en deux catégories. D’abord, pour « améliorer la santé de chacun », via la compréhension qu’impliquent les traitements envisagés : statistiques plus fiables que dans le cadre d’essais cliniques traditionnels, recherches sur des données à grande échelle, etc. Cette mission, de type service public, doit faciliter le suivi et la surveillance épidémiologique pour les autorités de santé. L’EDS doit également profiter à des organismes de recherche publics, comme l’Institut Pasteur, l’INSERM ou encore les étudiants en thèse de médecine.

Sur le site de Cerballiance, on trouve plusieurs exemples de projets de recherches. On peut y voir que les responsables de traitement sont potentiellement nombreux.

Des intérêts privés

Il y a ensuite une composante privée. Cerballiance cite plusieurs exemples : « Des fournisseurs de kits de diagnostic souhaitant en améliorer les performances, des industriels du médicament devant surveiller l’efficacité d’un traitement au sein de la population générale ou encore une start-up développant un nouveau marqueur de diagnostic pour l’endométriose ».

L’exploitation des données doit ainsi faire avancer la recherche et les pratiques médicales ou à tout le moins permettre des études de faisabilité sur ces recherches. Cerballiance ajoute à l’exploitation privée une dimension de « meilleure connaissance » des patients, pour proposer des « tests les plus adaptés à leurs besoins ». Sur ce point, l’entreprise évoque seulement la production d’indicateurs pour le pilotage stratégique de l’activité des laboratoires.

De manière générale, ces objectifs sont classiques dans le contexte des EDS. La constitution de l’entrepôt européen EMC2, sous l’égide du Health Data Hub français, en abordait par exemple plusieurs, dont l’efficacité des traitements à des fins de pilotage, à destination notamment de l’agence européenne du médicament.

Les données concernées

Selon Cerballiance, les données seront de deux types. D’abord, les informations directement identifiantes : nom, prénom, adresse postale, date de naissance et les coordonnées de contact (essentiellement e-mail et numéro de téléphone). Ce sont, en d’autres termes, les informations administratives.

Seul un petit nombre de personnes strictement habilitées est censé pouvoir y accéder. Selon Cerballiance, il faut avoir une habilitation de niveau administrateur ou être un chercheur interne, à des fins de pré-screening (repérage des patients pouvant correspondre à la cible d’une étude) ou de prise de contact (nous y reviendrons).

Viennent ensuite les données de santé proprement dites. Elles sont pseudonymisées uniquement et ne sont, en tant que telles, pas directement identifiables (nous y reviendrons également). C’est le cœur sensible de l’entrepôt, puisque ces informations renvoient directement au parcours médical des personnes : examens de biologie médicale, antécédents, données cliniques diverses, informations sur les traitements, voire régime alimentaire dans certains cas. Elles sont à la fois couvertes par le secret médical et considérées comme « sensibles » par le RGPD.

Les données concernées, telles qu’on peut les voir dans la décision de la CNIL du 18 mars 2024

Dualité du système

Si la communication de Cerballiance parait claire et détaillée, elle témoigne également d’une certaine dualité. Cet EDS reste avant tout le projet d’une entreprise privée qui, si elle compte contribuer à la santé publique, a également ses propres objectifs.

La principale pierre d’achoppement réside dans la sécurité des données et leur confidentialité. Cerballiance indique par exemple que les informations sont stockées en Europe. Elle ne donne cependant aucun autre précision, les patients pouvant témoigner un intérêt pour le pays où sont stockées leurs données.

Et alors que ce stockage devrait assurer la résistance aux lois étrangères à portée extraterritoriale (en premier lieu celles des États-Unis), Cerballiance indique que les données peuvent « faire l’objet d’un accès à distance depuis un tel pays dans des cas très limités, notamment dans le cadre de prestations de maintenance de l’EDS réalisées par l’un de nos sous-traitants ». L’entreprise ajoute que cet accès se fait depuis « des pays reconnus par la Commission européenne comme assurant un niveau de protection équivalent à celui du RGPD ». Or, c’est officiellement le cas des États-Unis à travers le Data Privacy Framework. Une situation complexe, que le retour de Donald Trump a rendu encore plus opaque.

À titre d’information, le site de Cerballiance est hébergé chez Amazon Web Services, mais l’espace client est confié à Atos.

Opt-out uniquement

Puisque l’on parle de données, les choix faits par Cerballiance sur la confidentialité peuvent également faire hausser quelques sourcils. Les données de santé ne sont ainsi que pseudonymisées, et non anonymisées. En outre, puisque l’entreprise évoque explicitement la possibilité de contacter la patientèle, le faisceau pointe vers un mécanisme pensé dès le départ pour la ré-identification.

Cependant, il y a deux « bons points » à noter. D’une part, les chercheurs accédant aux données ne verront que leurs versions pseudonymisées. D’autre part, ces accès se font au moyen de « bulles informatiques sécurisées » et les données ne sont jamais extraites de l’entrepôt. Dans le cas contraire, selon Cerballiance, les informations seraient obligatoirement anonymisées. Dans ce contexte, il faut rappeler que l’entreprise avait été victime d’une fuite de données par l’intermédiaire de « son prestataire informatique ».

Enfin, Cerballiance contacte actuellement les personnes concernées par son EDS (a priori tous les patients passés au cours des deux dernières années dans les 24 laboratoires visés), mais l’acceptation est automatique. Un opt-out (via ce formulaire) qui suppose que la patientèle verra l’information et aura le temps de s’opposer au traitement si elle le souhaite, puisqu’il reste moins d’un mois et demi. De même, il n’est rien précisé sur le contrôle que l’on pourra exercer lors du partage avec des acteurs privés, pas plus que sur la période rétroactive démarrant au 1er janvier 2023.

Nous avons contacté Cerballiance, qui n’a pas encore répondu. Nous mettrons à jour cet article avec les réponses obtenues.

Scale AI licencie 14 % de ses équipes juste après l’investissement de Meta

17 juillet 2025 à 14:09
Passage à l'échelle
Scale AI licencie 14 % de ses équipes juste après l’investissement de Meta

Alors que Meta vient de racheter 49 % des parts de Scale AI et de débaucher son fondateur, cet acteur phare du marché de l’annotation de données licencie 14 % de ses effectifs.

Mark Zuckerberg a jeté toutes ses forces dans la bataille de l’IA. Après avoir passé plusieurs semaines à débaucher des scientifiques et ingénieurs en vue dans le secteur, le patron de Meta vient d’annoncer des investissements de l’ordre de « centaines de milliards de dollars » dans des centres de données et des supercalculateurs dédiés à l’IA.

Ces déploiements de capitaux sont loin de profiter aux travailleurs du clic qui œuvrent à l’entraînement des systèmes d’IA, en revanche. Pour preuve, Meta a beau avoir dépensé plus de 14 milliards de dollars pour racheter 49 % des parts de Scale AI et débauché son fondateur Alexandr Wang, cet acteur phare de l’annotation de données annonce licencier 200 personnes et cesser de travailler avec 500 sous-traitants.

« Rationaliser » un « excès de bureaucratie »

Son porte-parole explique que la décision doit permettre de « rationaliser [leurs] activités liées aux données pour [les] aider à évoluer plus rapidement ». La société prévoit par ailleurs d’embaucher dans d’autres domaines, dont la vente aux entreprises et aux gouvernements.

D’après un mémo obtenu par Bloomberg, le PDG par interim de l’entreprise, Jason Droege, aurait expliqué aux équipes de Scale AI que son activité d’annotation de données auraient embauché trop de gens trop rapidement au fil des années passées, ce qui aurait créé une « bureaucratie excessive et une confusion inutile sur les missions des équipes ».

Le quasi-rachat de Meta a aussi participé à la décision, dans la mesure où il a été suivi par la suspension de certains de ses contrats les plus importants, avec des acteurs comme OpenAI et Google (Alphabet).

La décision ne se fera pas sans toucher des personnes aux conditions de travail déjà complexes. La chaîne de production de l’IA est en effet constituée de trois couches principales, pour reprendre les explications du sociologue Antonio Casilli : les géants détenteurs de données, les acteurs intermédiaires comme Scale AI, qui répartissent les travaux, et la « grande masse des travailleurs », quelquefois seuls chez eux, quelquefois réunis en petits groupes ou entreprises de taille plus modeste. Or, avant les licenciements, Scale AI comptait 1 400 employés et des milliers de ces sous-traitants, partout sur la planète, d’après CNBC.

Un leader de l’annotation à bas coût

Fondée en 2016 par un Alexandr Wang âgé seulement, à l’époque, de 19 ans, Scale AI s’est, en l’occurrence, spécialisée dès le départ dans l’offre de services d’annotations de données et d’entraînement de système d’IA de qualité, à bas coût.

Comme le raconte la journaliste Karen Hao dans son ouvrage Empire of AI, l’entreprise est parvenue à déployer ce modèle en allant cherchant ses travailleurs du clic dans d’anciennes colonies britanniques – le Kenya, les Philippines –, mais aussi en découvrant, à la faveur de la crise économique vénézuelienne, comment convaincre quantité de personnes éduquées à travailler pour sa plateforme.

« Cette expérience est devenue leur méthode classique d’intervention, qu’ils ont réutilisée ailleurs, explique-t-elle à Next. Quand la pandémie a frappé, Scale AI s’est tourné vers tous les pays où les économies se sont retrouvées en souffrance, et où de nombreux travailleurs très qualifiés devenaient disponibles pour des salaires bas, faute de trouver d’autres emplois ».

Une fois qu’une masse critique de travailleurs est atteinte, Scale AI tend à réduire les salaires proposés pour chaque tâche, ou à placer les personnes en compétition les unes contre les autres.

Si d’autres entreprises ont tenté de proposer de meilleures conditions de travail, des périodes de tensions budgétaires comme celle provoquée par la pandémie ont poussé leur clientèle vers des sociétés proposant des tarifs plus faibles, comme Scale AI.

Un secteur en pleine reconfiguration

Au Kenya comme au Népal ou ailleurs, de nombreux employés ont mécaniquement dû se tourner vers la société cofondée par Alexandr Wang, ce qui a permis à cette dernière d’engranger 870 millions de dollars de chiffre d’affaires en 2024, d’après Bloomberg.

Si la société s’est placée en leader de cette étape de la chaine de production des systèmes d’IA, elle doit néanmoins composer avec une concurrence active d’entreprises variées, parmi lesquelles Turing, Invisible Technologies, Labelbox, ou même Uber.

Surtout, son PDG par intérim indique qu’un axe de travail consistera à tenter de reconquérir « les clients qui ont ralenti leur travail avec nous ». Jason Droege indique par ailleurs que des personnes seront embauchées pour créer des applications d’IA personnalisées pour les besoins de la nouvelle clientèle privée et publique que Scale AI prévoit d’approcher.

Cerballiance va exploiter les données d’une partie de ses patients dans un entrepôt

17 juillet 2025 à 15:00
Choix binaire pour du tertiaire
Cerballiance va exploiter les données d’une partie de ses patients dans un entrepôt

Cerballiance, entreprise disposant de plus de 700 laboratoires d’analyses en France, a annoncé la constitution d’un entrepôt de données de santé (EDS). Au-delà des buts poursuivis, cette étape pose des questions légitimes sur la confidentialité des données.

Les entrepôts de données de santé existent depuis des années en France. Selon les chiffres fournis par le ministère de la Santé, on en comptait une centaine au 1er janvier 2025. Leurs objectifs sont toujours les mêmes : rassembler une vaste quantité de données « à des fins de pilotage (gestion, contrôle et administration de l’activité) et de recherches, d’études, d’évaluations dans le domaine de la santé ».

Aussi, l’annonce de Cerballiance pourrait sembler n’être qu’un EDS de plus dans la liste des entrepôts officiels et autorisés par la CNIL. La Commission fournit d’ailleurs un référentiel pour la création de ces structures. Pour obtenir l’autorisation d’ouvrir l’EDS, « l’organisme responsable de ce traitement est tenu de documenter sa conformité au RGPD et au référentiel dans son registre des activités de traitement ».

À quoi doit servir cet entrepôt de données ?

L’EDS annoncé par Cerballiance ne concerne pas l’ensemble des clients. Dans la longue annonce de l’entreprise, on peut ainsi lire que seuls 24 laboratoires sont concernés. Bien que Cerballiance ne le précise pas, il pourrait s’agir d’un début, même si une montée en puissance nécessiterait une nouvelle autorisation de la CNIL. La société indique que l’EDS reprendra les données précédemment générées depuis le 1er janvier 2023 et y ajoutera toutes celles collectées à compter du 1er septembre prochain.

Les objectifs de l’EDS de Cerballiance se répartissent en deux catégories. D’abord, pour « améliorer la santé de chacun », via la compréhension qu’impliquent les traitements envisagés : statistiques plus fiables que dans le cadre d’essais cliniques traditionnels, recherches sur des données à grande échelle, etc. Cette mission, de type service public, doit faciliter le suivi et la surveillance épidémiologique pour les autorités de santé. L’EDS doit également profiter à des organismes de recherche publics, comme l’Institut Pasteur, l’INSERM ou encore les étudiants en thèse de médecine.

Sur le site de Cerballiance, on trouve plusieurs exemples de projets de recherches. On peut y voir que les responsables de traitement sont potentiellement nombreux.

Des intérêts privés

Il y a ensuite une composante privée. Cerballiance cite plusieurs exemples : « Des fournisseurs de kits de diagnostic souhaitant en améliorer les performances, des industriels du médicament devant surveiller l’efficacité d’un traitement au sein de la population générale ou encore une start-up développant un nouveau marqueur de diagnostic pour l’endométriose ».

L’exploitation des données doit ainsi faire avancer la recherche et les pratiques médicales ou à tout le moins permettre des études de faisabilité sur ces recherches. Cerballiance ajoute à l’exploitation privée une dimension de « meilleure connaissance » des patients, pour proposer des « tests les plus adaptés à leurs besoins ». Sur ce point, l’entreprise évoque seulement la production d’indicateurs pour le pilotage stratégique de l’activité des laboratoires.

De manière générale, ces objectifs sont classiques dans le contexte des EDS. La constitution de l’entrepôt européen EMC2, sous l’égide du Health Data Hub français, en abordait par exemple plusieurs, dont l’efficacité des traitements à des fins de pilotage, à destination notamment de l’agence européenne du médicament.

Les données concernées

Selon Cerballiance, les données seront de deux types. D’abord, les informations directement identifiantes : nom, prénom, adresse postale, date de naissance et les coordonnées de contact (essentiellement e-mail et numéro de téléphone). Ce sont, en d’autres termes, les informations administratives.

Seul un petit nombre de personnes strictement habilitées est censé pouvoir y accéder. Selon Cerballiance, il faut avoir une habilitation de niveau administrateur ou être un chercheur interne, à des fins de pré-screening (repérage des patients pouvant correspondre à la cible d’une étude) ou de prise de contact (nous y reviendrons).

Viennent ensuite les données de santé proprement dites. Elles sont pseudonymisées uniquement et ne sont, en tant que telles, pas directement identifiables (nous y reviendrons également). C’est le cœur sensible de l’entrepôt, puisque ces informations renvoient directement au parcours médical des personnes : examens de biologie médicale, antécédents, données cliniques diverses, informations sur les traitements, voire régime alimentaire dans certains cas. Elles sont à la fois couvertes par le secret médical et considérées comme « sensibles » par le RGPD.

Les données concernées, telles qu’on peut les voir dans la décision de la CNIL du 18 mars 2024

Dualité du système

Si la communication de Cerballiance parait claire et détaillée, elle témoigne également d’une certaine dualité. Cet EDS reste avant tout le projet d’une entreprise privée qui, si elle compte contribuer à la santé publique, a également ses propres objectifs.

La principale pierre d’achoppement réside dans la sécurité des données et leur confidentialité. Cerballiance indique par exemple que les informations sont stockées en Europe. Elle ne donne cependant aucun autre précision, les patients pouvant témoigner un intérêt pour le pays où sont stockées leurs données.

Et alors que ce stockage devrait assurer la résistance aux lois étrangères à portée extraterritoriale (en premier lieu celles des États-Unis), Cerballiance indique que les données peuvent « faire l’objet d’un accès à distance depuis un tel pays dans des cas très limités, notamment dans le cadre de prestations de maintenance de l’EDS réalisées par l’un de nos sous-traitants ». L’entreprise ajoute que cet accès se fait depuis « des pays reconnus par la Commission européenne comme assurant un niveau de protection équivalent à celui du RGPD ». Or, c’est officiellement le cas des États-Unis à travers le Data Privacy Framework. Une situation complexe, que le retour de Donald Trump a rendu encore plus opaque.

À titre d’information, le site de Cerballiance est hébergé chez Amazon Web Services, mais l’espace client est confié à Atos.

Opt-out uniquement

Puisque l’on parle de données, les choix faits par Cerballiance sur la confidentialité peuvent également faire hausser quelques sourcils. Les données de santé ne sont ainsi que pseudonymisées, et non anonymisées. En outre, puisque l’entreprise évoque explicitement la possibilité de contacter la patientèle, le faisceau pointe vers un mécanisme pensé dès le départ pour la ré-identification.

Cependant, il y a deux « bons points » à noter. D’une part, les chercheurs accédant aux données ne verront que leurs versions pseudonymisées. D’autre part, ces accès se font au moyen de « bulles informatiques sécurisées » et les données ne sont jamais extraites de l’entrepôt. Dans le cas contraire, selon Cerballiance, les informations seraient obligatoirement anonymisées. Dans ce contexte, il faut rappeler que l’entreprise avait été victime d’une fuite de données par l’intermédiaire de « son prestataire informatique ».

Enfin, Cerballiance contacte actuellement les personnes concernées par son EDS (a priori tous les patients passés au cours des deux dernières années dans les 24 laboratoires visés), mais l’acceptation est automatique. Un opt-out (via ce formulaire) qui suppose que la patientèle verra l’information et aura le temps de s’opposer au traitement si elle le souhaite, puisqu’il reste moins d’un mois et demi. De même, il n’est rien précisé sur le contrôle que l’on pourra exercer lors du partage avec des acteurs privés, pas plus que sur la période rétroactive démarrant au 1er janvier 2023.

Nous avons contacté Cerballiance, qui n’a pas encore répondu. Nous mettrons à jour cet article avec les réponses obtenues.

Scale AI licencie 14 % de ses équipes juste après l’investissement de Meta

17 juillet 2025 à 14:09
Passage à l'échelle
Scale AI licencie 14 % de ses équipes juste après l’investissement de Meta

Alors que Meta vient de racheter 49 % des parts de Scale AI et de débaucher son fondateur, cet acteur phare du marché de l’annotation de données licencie 14 % de ses effectifs.

Mark Zuckerberg a jeté toutes ses forces dans la bataille de l’IA. Après avoir passé plusieurs semaines à débaucher des scientifiques et ingénieurs en vue dans le secteur, le patron de Meta vient d’annoncer des investissements de l’ordre de « centaines de milliards de dollars » dans des centres de données et des supercalculateurs dédiés à l’IA.

Ces déploiements de capitaux sont loin de profiter aux travailleurs du clic qui œuvrent à l’entraînement des systèmes d’IA, en revanche. Pour preuve, Meta a beau avoir dépensé plus de 14 milliards de dollars pour racheter 49 % des parts de Scale AI et débauché son fondateur Alexandr Wang, cet acteur phare de l’annotation de données annonce licencier 200 personnes et cesser de travailler avec 500 sous-traitants.

« Rationaliser » un « excès de bureaucratie »

Son porte-parole explique que la décision doit permettre de « rationaliser [leurs] activités liées aux données pour [les] aider à évoluer plus rapidement ». La société prévoit par ailleurs d’embaucher dans d’autres domaines, dont la vente aux entreprises et aux gouvernements.

D’après un mémo obtenu par Bloomberg, le PDG par interim de l’entreprise, Jason Droege, aurait expliqué aux équipes de Scale AI que son activité d’annotation de données auraient embauché trop de gens trop rapidement au fil des années passées, ce qui aurait créé une « bureaucratie excessive et une confusion inutile sur les missions des équipes ».

Le quasi-rachat de Meta a aussi participé à la décision, dans la mesure où il a été suivi par la suspension de certains de ses contrats les plus importants, avec des acteurs comme OpenAI et Google (Alphabet).

La décision ne se fera pas sans toucher des personnes aux conditions de travail déjà complexes. La chaîne de production de l’IA est en effet constituée de trois couches principales, pour reprendre les explications du sociologue Antonio Casilli : les géants détenteurs de données, les acteurs intermédiaires comme Scale AI, qui répartissent les travaux, et la « grande masse des travailleurs », quelquefois seuls chez eux, quelquefois réunis en petits groupes ou entreprises de taille plus modeste. Or, avant les licenciements, Scale AI comptait 1 400 employés et des milliers de ces sous-traitants, partout sur la planète, d’après CNBC.

Un leader de l’annotation à bas coût

Fondée en 2016 par un Alexandr Wang âgé seulement, à l’époque, de 19 ans, Scale AI s’est, en l’occurrence, spécialisée dès le départ dans l’offre de services d’annotations de données et d’entraînement de système d’IA de qualité, à bas coût.

Comme le raconte la journaliste Karen Hao dans son ouvrage Empire of AI, l’entreprise est parvenue à déployer ce modèle en allant cherchant ses travailleurs du clic dans d’anciennes colonies britanniques – le Kenya, les Philippines –, mais aussi en découvrant, à la faveur de la crise économique vénézuelienne, comment convaincre quantité de personnes éduquées à travailler pour sa plateforme.

« Cette expérience est devenue leur méthode classique d’intervention, qu’ils ont réutilisée ailleurs, explique-t-elle à Next. Quand la pandémie a frappé, Scale AI s’est tourné vers tous les pays où les économies se sont retrouvées en souffrance, et où de nombreux travailleurs très qualifiés devenaient disponibles pour des salaires bas, faute de trouver d’autres emplois ».

Une fois qu’une masse critique de travailleurs est atteinte, Scale AI tend à réduire les salaires proposés pour chaque tâche, ou à placer les personnes en compétition les unes contre les autres.

Si d’autres entreprises ont tenté de proposer de meilleures conditions de travail, des périodes de tensions budgétaires comme celle provoquée par la pandémie ont poussé leur clientèle vers des sociétés proposant des tarifs plus faibles, comme Scale AI.

Un secteur en pleine reconfiguration

Au Kenya comme au Népal ou ailleurs, de nombreux employés ont mécaniquement dû se tourner vers la société cofondée par Alexandr Wang, ce qui a permis à cette dernière d’engranger 870 millions de dollars de chiffre d’affaires en 2024, d’après Bloomberg.

Si la société s’est placée en leader de cette étape de la chaine de production des systèmes d’IA, elle doit néanmoins composer avec une concurrence active d’entreprises variées, parmi lesquelles Turing, Invisible Technologies, Labelbox, ou même Uber.

Surtout, son PDG par intérim indique qu’un axe de travail consistera à tenter de reconquérir « les clients qui ont ralenti leur travail avec nous ». Jason Droege indique par ailleurs que des personnes seront embauchées pour créer des applications d’IA personnalisées pour les besoins de la nouvelle clientèle privée et publique que Scale AI prévoit d’approcher.

❌