Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés

10 décembre 2025 à 09:58

Ethique en toc

Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés

Plusieurs recherches incluant l’entrainement de réseaux de neurones font l’objet d’une attention particulière, parfois plusieurs années après leur publication. En cause l’utilisation d’une base de données de photos posant des problèmes éthiques concernant le consentement des enfants ayant des troubles autistiques concernés. L’éditeur Springer Nature est en train de rétracter des dizaines d’articles scientifiques.

Des dizaines d’articles scientifiques sont actuellement scrutés, notamment par l’éditeur scientifique Springer Nature, pour une éventuelle rétraction. Certains, comme cette meta analyse sur les approches utilisant le deep learning pour prédire l’autisme publiée en 2024, ont déjà fait l’objet d’une rétractation récemment.

Des travaux scientifiques qui soulèvent des questions éthiques

Les chercheurs et éditeurs auraient pu commencer par interroger le bien-fondé de mettre en place une reconnaissance de traits autistiques sur le visage d’enfants en utilisant le deep learning. La littérature scientifique montre que ces questions n’ont pas arrêté nombre de chercheurs.

Mais une nouvelle question éthique apparait, mise au grand jour par The Transmitter. Ce média spécialisé en neurosciences vient de découvrir que plusieurs dizaines d’articles scientifiques sur le sujet s’appuient, en fait, sur une base de données de visages d’enfants créée en 2019 par Gerald Piosenka, un ingénieur à la retraite. Celui-ci l’avait mise en ligne sur la plateforme Kaggle rachetée en 2017 par Google, qui permet à la communauté des machine learning et deep learning de partager des données, codes, modèles, etc.

L’utilisation d’une base de données créée sans le consentement des enfants

Cette base de données contient plus de 2 900 photos d’enfants, dont la moitié est étiquetée en tant qu’autistes. Comme l’a repéré The Transmitter, Gerald Piosenka explique dans un commentaire posté en 2022 que Kaggle a supprimé la base de données parce qu’elle ne respectait pas ses conditions d’utilisation. Mais l’ingénieur l’a remis rapidement en ligne via Google Drive.

Dans la description de la base, Gerald Piosenka explique la manière dont il a procédé pour la créer : « J’ai cherché partout une base de données contenant des images faciales d’enfants autistes. À ma connaissance, il n’en existe aucune. J’ai donc dû développer cette base de données à partir de recherches sur Internet. J’ai principalement trouvé ces images sur des sites web consacrés à l’autisme. En général, j’ai dû télécharger une image particulière, qui était souvent une photo de groupe, puis recadrer manuellement l’image pour ne garder que le visage de l’enfant ».

Questionné par un utilisateur de Kaggle sur l’exclusion de certaines photos pour des questions de vie privée et sur l’obtention du consentement, Gerald Piosenka a répondu que « toutes les images ont été recueillies à partir de sites Web accessibles au public et de recherches Google. Aucune restriction en matière de confidentialité n’a été violée » et a justifié sa démarche en affirmant que sa motivation était « altruiste » et qu’ « en matière d’éthique, comment peut-on être plus éthique que d’essayer de favoriser le dépistage précoce et le traitement de l’autisme chez les enfants » sans prendre en compte le signalement sur le besoin de consentement.

Près de 40 articles scientifiques sont étudiés par Springer Nature pour une éventuelle rétractation selon un des conseillers en intégrité de la recherche de l’éditeur interrogé par The Transmitter. Le média a, de son côté, recensé au moins 90 articles (publiés aussi par d’autres éditeurs comme Wiley, IEEE, Elsevier, MDPI ou encore Cell Press) qui citent une version de la base de données.

Deep learning sur des photos d’enfants autistes : des articles scientifiques rétractés

Next.ink

Par :Martin Clavey

10 décembre 2025 à 09:58

Ethique en toc

Plusieurs recherches incluant l’entrainement de réseaux de neurones font l’objet d’une attention particulière, parfois plusieurs années après leur publication. En cause l’utilisation d’une base de données de photos posant des problèmes éthiques concernant le consentement des enfants ayant des troubles autistiques concernés. L’éditeur Springer Nature est en train de rétracter des dizaines d’articles scientifiques.

Des dizaines d’articles scientifiques sont actuellement scrutés, notamment par l’éditeur scientifique Springer Nature, pour une éventuelle rétraction. Certains, comme cette meta analyse sur les approches utilisant le deep learning pour prédire l’autisme publiée en 2024, ont déjà fait l’objet d’une rétractation récemment.

Des travaux scientifiques qui soulèvent des questions éthiques

Les chercheurs et éditeurs auraient pu commencer par interroger le bien-fondé de mettre en place une reconnaissance de traits autistiques sur le visage d’enfants en utilisant le deep learning. La littérature scientifique montre que ces questions n’ont pas arrêté nombre de chercheurs.

Mais une nouvelle question éthique apparait, mise au grand jour par The Transmitter. Ce média spécialisé en neurosciences vient de découvrir que plusieurs dizaines d’articles scientifiques sur le sujet s’appuient, en fait, sur une base de données de visages d’enfants créée en 2019 par Gerald Piosenka, un ingénieur à la retraite. Celui-ci l’avait mise en ligne sur la plateforme Kaggle rachetée en 2017 par Google, qui permet à la communauté des machine learning et deep learning de partager des données, codes, modèles, etc.

L’utilisation d’une base de données créée sans le consentement des enfants

Cette base de données contient plus de 2 900 photos d’enfants, dont la moitié est étiquetée en tant qu’autistes. Comme l’a repéré The Transmitter, Gerald Piosenka explique dans un commentaire posté en 2022 que Kaggle a supprimé la base de données parce qu’elle ne respectait pas ses conditions d’utilisation. Mais l’ingénieur l’a remis rapidement en ligne via Google Drive.

Dans la description de la base, Gerald Piosenka explique la manière dont il a procédé pour la créer : « J’ai cherché partout une base de données contenant des images faciales d’enfants autistes. À ma connaissance, il n’en existe aucune. J’ai donc dû développer cette base de données à partir de recherches sur Internet. J’ai principalement trouvé ces images sur des sites web consacrés à l’autisme. En général, j’ai dû télécharger une image particulière, qui était souvent une photo de groupe, puis recadrer manuellement l’image pour ne garder que le visage de l’enfant ».

Questionné par un utilisateur de Kaggle sur l’exclusion de certaines photos pour des questions de vie privée et sur l’obtention du consentement, Gerald Piosenka a répondu que « toutes les images ont été recueillies à partir de sites Web accessibles au public et de recherches Google. Aucune restriction en matière de confidentialité n’a été violée » et a justifié sa démarche en affirmant que sa motivation était « altruiste » et qu’ « en matière d’éthique, comment peut-on être plus éthique que d’essayer de favoriser le dépistage précoce et le traitement de l’autisme chez les enfants » sans prendre en compte le signalement sur le besoin de consentement.

Près de 40 articles scientifiques sont étudiés par Springer Nature pour une éventuelle rétractation selon un des conseillers en intégrité de la recherche de l’éditeur interrogé par The Transmitter. Le média a, de son côté, recensé au moins 90 articles (publiés aussi par d’autres éditeurs comme Wiley, IEEE, Elsevier, MDPI ou encore Cell Press) qui citent une version de la base de données.

☕️ Bruxelles soupçonne Google de pratiques anticoncurrentielles concernant l’IA

Next - Articles gratuits

Par :Martin Clavey

9 décembre 2025 à 14:33

La Commission européenne a ouvert une enquête sur les pratiques de Google sur le marché de l’IA qui pourraient être considérées comme anticoncurrentielles.

Dans un communiqué publié sur son site, elle explique que « l’enquête examinera notamment si Google fausse la concurrence en imposant des conditions générales abusives aux éditeurs et aux créateurs de contenu, ou en s’octroyant un accès privilégié à ce contenu, désavantageant ainsi les développeurs de modèles d’IA concurrents ».

Sont notamment concernés les résumés d’AI Overviews (accessibles dans de nombreux pays, notamment européens, mais pas en France) et l’utilisation des vidéos postées sur YouTube.

La Commission pointe le fait que Google se sert de contenus publiés sur le web pour son service AI Overviews et pour le mode IA de son moteur de recherche « sans rémunération appropriée pour les éditeurs et sans leur offrir la possibilité de refuser une telle utilisation de leurs contenus ». Elle explique qu’elle va enquêter pour déterminer dans quelle mesure ces outils de Google s’appuient sur ces contenus.

En juillet dernier, le réseau nommé « Alliance internationale des éditeurs indépendants » portait plainte devant la Commission contre Google pour ces mêmes raisons.

Mais la Commission va aussi chercher à savoir si Google utilise les vidéos uploadées par les utilisateurs de YouTube pour entrainer ses modèles d’IA sans leur consentement et sans compensation.

« Google ne rémunère pas les créateurs de contenu YouTube pour leur contenu et ne leur permet pas non plus de télécharger leur contenu sur YouTube sans autoriser Google à utiliser ces données. Parallèlement, les développeurs concurrents de modèles d’IA sont empêchés par les politiques de YouTube d’utiliser le contenu YouTube pour entraîner leurs propres modèles d’IA », affirme l’institution.

« Si elles sont avérées, les pratiques faisant l’objet de l’enquête pourraient enfreindre les règles de concurrence de l’UE qui interdisent l’abus de position dominante », prévient Bruxelles.

« Une société libre et démocratique repose sur la diversité des médias, le libre accès à l’information et un paysage créatif dynamique. Ces valeurs sont au cœur de notre identité européenne », affirme Teresa Ribera, commissaire européenne à la Concurrence. « L’IA apporte des innovations remarquables et de nombreux avantages aux citoyens et aux entreprises à travers l’Europe, mais ces progrès ne peuvent se faire au détriment des principes qui sont au cœur de nos sociétés », ajoute-t-elle.

Se prononçant sur la plainte des éditeurs, Google affirmait à Reuters que celle-ci « risque d’étouffer l’innovation dans un marché plus concurrentiel que jamais ». C’est toujours la même excuse servie par les géants américains quand il s’agit de régulation européenne.

« Google a rompu le pacte qui sous-tend l’Internet. L’accord prévoyait que les sites web seraient indexés, récupérés et affichés lorsqu’ils étaient pertinents par rapport à une requête. Tout le monde avait sa chance », proclame de son côté Tim Cowen, l’avocat des éditeurs, à l’agence de presse. « Aujourd’hui, Google donne la priorité à son IA Gemini et ajoute l’insulte à l’injure en exploitant le contenu des sites web pour entraîner Gemini. Gemini est le jumeau maléfique de Search », ajoute-t-il.

☕️ Bruxelles soupçonne Google de pratiques anticoncurrentielles concernant l’IA

Next.ink

Par :Martin Clavey

9 décembre 2025 à 14:33

La Commission européenne a ouvert une enquête sur les pratiques de Google sur le marché de l’IA qui pourraient être considérées comme anticoncurrentielles.

Dans un communiqué publié sur son site, elle explique que « l’enquête examinera notamment si Google fausse la concurrence en imposant des conditions générales abusives aux éditeurs et aux créateurs de contenu, ou en s’octroyant un accès privilégié à ce contenu, désavantageant ainsi les développeurs de modèles d’IA concurrents ».