☕️ Le cofondateur de Mistral a participé à l’entrainement du modèle Llama de Meta sur LibGen
Médiapart souligne, dans un article publié ce lundi 22 décembre, la participation de Guillaume Lample, cofondateur de Mistral AI, dans l’utilisation de la librairie clandestine Libgen pour entrainer les modèles de Meta en 2022.
En janvier dernier, à l’occasion du procès opposant notamment l’auteur de science-fiction Richard Kadrey à Meta, des documents internes à l’entreprise confirmaient les soupçons de l’utilisation des livres stockés par Libgen pour entrainer les modèles Llama de Meta. Certains montraient d’ailleurs que le CEO Mark Zuckerberg avait donné son accord.

L’enquête de Médiapart s’appuie sur des documents sortis un peu plus tard lors du procès. Ceux-ci montrent que Guillaume Lample, alors employé chez Meta, a participé activement aux discussions pour pousser les chercheurs de l’entreprise à utiliser allègrement la bibliothèque clandestine comme source d’entrainement pour les modèles. Alors que l’utilisation de LibGen ne fait pas consensus, Guillaume Lample aurait affirmé que « tout le monde utilise LibGen ».
Dans une autre conversation, une autre salariée lui a demandé si le service légal de Meta avait confirmé la possibilité d’utiliser les archives de LibGen ou si « on n’est pas juste en train d’essayer de ne pas trop poser de question ». Guillaume Lample répond qu’il n’a pas posé de question et que « c’est ce qu’OpenAI fait avec GPT3, ce que Google fait avec Palm, ce que DeepMind fait avec Chinchilla, donc on va le faire aussi ».
Guillaume Lample est maintenant responsable scientifique de Mistral AI, après avoir co-fondé l’entreprise d’IA générative française. Mistral AI, Meta et Guillaume Lample n’ont pas répondu aux diverses relances de Médiapart.














