La Free Software Foundation révèle que les données d'entraînement d'Anthropic comprenaient le livre protégé par le droit d'auteur « Free as in Freedom : Richard Stallman's Crusade for Free Software »La Free Software Foundation (FSF) a confirmé que les ensembles de données d'entraînement d'Anthropic comprenaient son ouvrage protégé par le droit d'auteur intitulé « Free as in Freedom : Richard Stallman's Crusade for Free Software ». Cette révélation intervient dans le cadre d'un recours collectif, Bartz c. Anthropic, dans lequel il est allégué qu'Anthropic a illégalement utilisé des documents provenant des bases de données Library Genesis et Pirate Library Mirror pour entraîner ses grands modèles de langage (LLM). Bien que le tribunal ait jugé l'utilisation des livres équitable, la FSF demande aux développeurs d'intelligence artificielle (IA) qui entraînent leurs modèles à l'aide d'énormes ensembles de données téléchargés sur Internet de fournir les LLM à leurs utilisateurs en toute liberté, à titre de compensation.
Anthropic PBC est une entreprise américaine spécialisée dans l'IA dont le siège social est situé à San Francisco. Elle a développé une famille de grands modèles de langage (LLM) baptisée Claude. Anthropic est une société d'intérêt public qui mène des activités de recherche et de développement en IA afin « d'étudier leurs propriétés de sécurité à la pointe de la technologie » et d'utiliser ces recherches pour déployer des modèles sûrs destinés au grand public.
Pour rappel, en juillet 2025, un juge fédéral de Californie a autorisé trois auteurs (Andrea Bartz, Charles Graeber et Kirk Wallace Johnson) à mener une action collective nationale contre la start-up Anthropic, accusée d'avoir téléchargé illégalement des millions d'ouvrages provenant des bibliothèques pirates LibGen et PiLiMi afin d'entraîner son assistant IA, Claude. Le juge William Alsup a estimé que ces auteurs pouvaient représenter l’ensemble des écrivains américains dont les œuvres auraient été utilisées par Anthropic sans autorisation. Selon la plainte, entre 2021 et 2022, Anthropic aurait constitué un vaste référentiel de près de 7 millions de livres téléchargés illégalement dans le but d'entraîner son IA.
La Free Software Foundation (FSF) est une organisation à but non lucratif de type 501(c)(3) fondée par Richard Stallman le 4 octobre 1985. L'organisation soutient le mouvement du logiciel libre et privilégie les logiciels distribués sous des conditions de copyleft (« partage à l'identique »), comme c'est le cas avec sa propre Licence publique générale GNU. La FSF a été constituée à Boston, où elle a également son siège.
Richard Matthew Stallman, également connu sous ses initiales, rms, est un militant américain du mouvement pour le logiciel libre et un programmeur. Il milite pour que les logiciels soient distribués de manière à ce que leurs utilisateurs aient la liberté de les utiliser, de les étudier, de les distribuer et de les modifier. Les logiciels qui garantissent ces libertés sont appelés « logiciels libres ». Stallman a lancé le projet GNU, fondé la Free Software Foundation (FSF) en octobre 1985, développé le compilateur GNU C et GNU Emacs, et rédigé toutes les versions de la licence publique générale GNU. Le livre intitulé « Free as in Freedom : Richard Stallman's Crusade for Free Software » (« Libre comme Liberté : la croisade de Richard Stallman pour les logiciels libres »), publié en 2002, est consacré à la vie de Richard Stallman.
Le 13 mars dernier, la FSF a publié sur son site un communiqué indiquant qu'elle avait reçu une notification concernant un accord à l'amiable dans le cadre du procès pour violation du droit d'auteur opposant Bartz à Anthropic. Ce procès porte sur l'utilisation de bases de données de livres piratés pour entraîner de grands modèles de langage. Selon Krzysztof Siewicz, responsable des licences et de la conformité à la FSF, l'organisation engage rarement des poursuites en matière de droits d'auteur, mais lorsqu'elle le fait, son objectif est de défendre la liberté des utilisateurs plutôt que d'obtenir des dommages-intérêts.
Le communiqué de la FSF est présenté ci-dessous : «
La Free Software Foundation (FSF), comme beaucoup d’autres, a reçu une notification concernant un accord à l’amiable dans le cadre du procès pour violation du droit d’auteur Bartz c. Anthropic. Il s’agit d’un recours collectif alléguant qu’Anthropic a violé le droit d’auteur en téléchargeant des œuvres issues des ensembles de données Library Genesis et Pirate Library Mirror dans le but d’entraîner des grands modèles de langage (LLM). Selon cette notification, le tribunal de district a jugé que l'utilisation des livres pour entraîner des LLM relevait du fair use, mais a renvoyé au procès la question de savoir si leur téléchargement à cette fin était légal. Apparemment, les parties ont convenu de conclure un accord à l'amiable plutôt que d'attendre le procès et elles contactent actuellement les détenteurs potentiels de droits d'auteur pour leur proposer une compensation financière en lieu et place d'éventuels dommages-intérêts.
La FSF détient les droits d'auteur de nombreux programmes du projet GNU, ainsi que de plusieurs ouvrages. Nous publions toutes les œuvres dont nous détenons les droits d'auteur sous des licences libres (au sens de liberté). Parmi les œuvres dont nous détenons les droits d'auteur figure « Free as in freedom : Richard Stallman's crusade for free software » de Sam Williams, qui figurait dans les ensembles de données utilisés par Anthropic comme données d'entraînement pour ses modèles de langage (LLM). Cet ouvrage a été publié par O'Reilly et par la FSF sous la licence GNU Free Documentation License (GNU FDL). Il s'agit d'une licence libre autorisant l'utilisation de l'œuvre à toutes fins sans contrepartie financière.
Il va sans dire que la bonne chose à faire est de protéger la liberté informatique : partager l'intégralité des données d'entraînement avec chaque utilisateur du LLM, ainsi que le modèle complet, les paramètres de configuration de l'entraînement et le code source des logiciels associés. C'est pourquoi nous exhortons Anthropic et les autres développeurs de LLM qui entraînent leurs modèles à l'aide d'énormes ensembles de données téléchargés sur Internet à fournir ces LLM à leurs utilisateurs en toute liberté. Nous sommes une petite organisation aux ressources limitées et nous devons choisir nos combats, mais si la FSF devait participer à un procès tel que Bartz c. Anthropic et constater que nos droits d'auteur et notre licence ont été violés, nous demanderions certainement la liberté des utilisateurs à titre de compensation.
»
Cette affaire s’inscrit dans une série de procédures judiciaires opposant les développeurs d’IA aux détenteurs de droits d’auteur. En août 2025, l'entreprise Anthropic a ainsi accepté de régler le recours collectif pour violation du droit d'auteur dans lequel des auteurs accusaient l'entreprise d'avoir entraîné ses modèles d'IA à partir de leurs œuvres sans leur autorisation. La plainte, déposée en août 2024 par les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson, contestait l'utilisation de livres protégés pour entraîner le système Claude.
En juin 2025, le juge fédéral William Alsup avait toutefois jugé que l'apprentissage des modèles d'IA à partir d'œuvres protégées pouvait relever de l'« usage loyal », estimant que cette utilisation était « extrêmement transformative » et donc juridiquement défendable, même si le téléchargement initial de certaines sources pouvait constituer une infraction. Les parties ont ensuite demandé à la cour d'appel du neuvième circuit de suspendre la procédure afin de finaliser un accord de règlement présenté par les avocats des auteurs comme potentiellement bénéfique pour l'ensemble du groupe concerné.
Source : Free Software Foundation
Et vous ?
Quel est votre avis sur le sujet ?
Trouvez-vous cette initiative de la FSF crédible ou pertinente ?Voir aussi :
Anthropic a acheté, découpé et numérisé des millions de livres physiques avant de détruire les originaux, dans le seul but d'entraîner son IA Claude, il a également téléchargé 7 millions de livres piratés
Un juge rejette l'accord à 1,5 milliard de dollars conclu par Anthropic concernant un recours collectif sur les droits d'auteur de près d'un demi-million de livres piratés pour former des chatbots
Anthropic a accepté de verser 1,5 milliard de $ pour régler un procès pour vol d'œuvres protégées par le droit d'auteur afin d'entraîner ses modèles d'IA, le plus important recouvrement de droits d'auteur
Vous avez lu gratuitement 5 971 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
