Quand les dictionnaires Harper Collins me prennent pour un jambon

Harper Collins c’est un acteur majeur de l’édition, un mastodonte du secteur. Comme beaucoup de monde j’ai croisé leurs ouvrages pendant ma scolarité et j’ai toujours un de leur dictionnaire dans ma bibliothèque. Le 13 octobre, un représentant de la maison d’édition me contacte par email.
Leur proposition est la suivante. Je partage l’entièreté du contenu de Minimachines avec eux gratuitement pour qu’ils puissent l’ajouter à leur « corpus » de texte. Un méli-mélo qu’ils présentent comme « 4.5 milliards de mots anglais venant de livres, de magazines, de journaux, de sites internet et de données orales retranscrites ». Je ne vois pas trop ce que vient faire un contenu, ma foi, très spécialisé, dans ce corpus. L’éditeur produit des dictionnaires en français à destination des anglophones. Il serait sans doute ravis de retrouver des extraits de Minimachines pour illustrer leurs exemples.

La carotte Harper Collins
Pour motiver mon accord, l’email met en avant que leurs dictionnaires pourraient illustrer certains mots grâce à des passages de Minimachines. C’est clairement flatteur. On s’imagine entrer dans un dictionnaire qui prendrait exemple sur une de vos formules. Dans une idée de partage des données et d’éducation. Minimachines est totalement gratuit et partage déjà librement son contenu, ce qui ne veut pas dire qu’il n’y a pas un droit d’auteur dessus. Tout un chacun peut lire les billets du site, mais personne n’a le droit de les reproduire sans mon accord. Il est impossible pour un magazine de copier-coller mon contenu dans leurs pages sans mon autorisation. Leur demande a donc du sens.

Mais plus loin, on peut lire dans leurs conditions de cession de droits que les auteurs des textes utilisés pour illustrer des mots ne sont pas cités. Une phrase laconique remerciant des auteurs externes étant utilisée à la place. Aucune source n’étant spécifiquement citée, cette session de droits se fait de manière absolument anonyme. C’est râpé pour la carotte.
Le bâton Harper Collins
Pourquoi donc ? Pourquoi Harper Collins voudrait enrichir leur corpus de descriptions d’ordinateurs, de billets datés et de guides sur l’installation ou l’exploitation de tel ou tel logiciel ? Cela n’a pas de sens. L’éditeur indique que cela participera à des recherches linguistiques innovantes, recherches à la base de leur travail de lexicographes. J’en doute tout de même un peu pour ce qui est du contenu trouvé ici.

Tout cela n’a donc aucun sens jusqu’au moment où l’on croise une petite phrase sibylline. « Nous pouvons également autoriser d’autres organisations à utiliser les données du corpus pour leurs propres recherches. » puis « Quand cela génère des revenus commerciaux, nous reversons une petite partie des droits d’auteur aux sources originales du corpus. » Vous voyez venir le gros coup de bâton ?
Blanchiment de données numériques
En gros, Harper Collins n’en a rien à foutre du contenu de Minimachines, ils ne vont pas illustrer un traitre mot avec mes élucubrations sur les ordinateurs ou les chaises ergonomiques. Par contre, l’éditeur aimerait sans doute bien rajouter les 11 300 billets du blog dans sa base de données. Pour en faire quoi ? Vous avez déjà surement votre petite idée. Probablement pour revendre le tout légalement aux appétits d’ogres d’IA en manque de légitimité. Je ne serais pas surpris que Harper Collins ne joue ici que le rôle de blanchisseur de données déjà happées par des algorithmes qui veulent pouvoir éviter des procès dans le futur.

Le site indique d’ailleurs clairement qu’il est possible de retirer ses contenus une fois cédés au dictionnaire et même de les retirer de leur Corpus au bout d’un délai de trois mois. Par contre, une fois revendus à des tiers, impossible de revenir en arrière. Si votre contenu part alimenter une IA légalement au travers de l’excuse lexicographique, impossible de revenir en arrière.

En novembre, on apprenait que l’éditeur proposait à ses auteurs de partager leurs anciens livres avec l’IA de Microsoft. En proposant jusqu’à 2500$ par bouquin, ce que certains auteurs avaient dénoncé comme une manœuvre « abominable ».
Donc, NON, Harper Collins, je ne vous autorise en rien à ajouter mon contenu à votre corpus. Allez bien vous faire cuire le cul.
Quand les dictionnaires Harper Collins me prennent pour un jambon © MiniMachines.net. 2025





















































































