IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

La Free Software Foundation révèle que les données d'entraînement IA d'Anthropic comprenaient le livre protégé par le droit d'auteur « Free as in Freedom : Richard Stallman's Crusade for Free Software »

Le , par Anthony

12PARTAGES

8  0 
La Free Software Foundation révèle que les données d'entraînement d'Anthropic comprenaient le livre protégé par le droit d'auteur « Free as in Freedom : Richard Stallman's Crusade for Free Software »

La Free Software Foundation (FSF) a confirmé que les ensembles de données d'entraînement d'Anthropic comprenaient son ouvrage protégé par le droit d'auteur intitulé « Free as in Freedom : Richard Stallman's Crusade for Free Software ». Cette révélation intervient dans le cadre d'un recours collectif, Bartz c. Anthropic, dans lequel il est allégué qu'Anthropic a illégalement utilisé des documents provenant des bases de données Library Genesis et Pirate Library Mirror pour entraîner ses grands modèles de langage (LLM). Bien que le tribunal ait jugé l'utilisation des livres équitable, la FSF demande aux développeurs d'intelligence artificielle (IA) qui entraînent leurs modèles à l'aide d'énormes ensembles de données téléchargés sur Internet de fournir les LLM à leurs utilisateurs en toute liberté, à titre de compensation.

Anthropic PBC est une entreprise américaine spécialisée dans l'IA dont le siège social est situé à San Francisco. Elle a développé une famille de grands modèles de langage (LLM) baptisée Claude. Anthropic est une société d'intérêt public qui mène des activités de recherche et de développement en IA afin « d'étudier leurs propriétés de sécurité à la pointe de la technologie » et d'utiliser ces recherches pour déployer des modèles sûrs destinés au grand public.

Pour rappel, en juillet 2025, un juge fédéral de Californie a autorisé trois auteurs (Andrea Bartz, Charles Graeber et Kirk Wallace Johnson) à mener une action collective nationale contre la start-up Anthropic, accusée d'avoir téléchargé illégalement des millions d'ouvrages provenant des bibliothèques pirates LibGen et PiLiMi afin d'entraîner son assistant IA, Claude. Le juge William Alsup a estimé que ces auteurs pouvaient représenter l’ensemble des écrivains américains dont les œuvres auraient été utilisées par Anthropic sans autorisation. Selon la plainte, entre 2021 et 2022, Anthropic aurait constitué un vaste référentiel de près de 7 millions de livres téléchargés illégalement dans le but d'entraîner son IA.

La Free Software Foundation (FSF) est une organisation à but non lucratif de type 501(c)(3) fondée par Richard Stallman le 4 octobre 1985. L'organisation soutient le mouvement du logiciel libre et privilégie les logiciels distribués sous des conditions de copyleft (« partage à l'identique »), comme c'est le cas avec sa propre Licence publique générale GNU. La FSF a été constituée à Boston, où elle a également son siège.


Richard Matthew Stallman, également connu sous ses initiales, rms, est un militant américain du mouvement pour le logiciel libre et un programmeur. Il milite pour que les logiciels soient distribués de manière à ce que leurs utilisateurs aient la liberté de les utiliser, de les étudier, de les distribuer et de les modifier. Les logiciels qui garantissent ces libertés sont appelés « logiciels libres ». Stallman a lancé le projet GNU, fondé la Free Software Foundation (FSF) en octobre 1985, développé le compilateur GNU C et GNU Emacs, et rédigé toutes les versions de la licence publique générale GNU. Le livre intitulé « Free as in Freedom : Richard Stallman's Crusade for Free Software » (« Libre comme Liberté : la croisade de Richard Stallman pour les logiciels libres »), publié en 2002, est consacré à la vie de Richard Stallman.

Le 13 mars dernier, la FSF a publié sur son site un communiqué indiquant qu'elle avait reçu une notification concernant un accord à l'amiable dans le cadre du procès pour violation du droit d'auteur opposant Bartz à Anthropic. Ce procès porte sur l'utilisation de bases de données de livres piratés pour entraîner de grands modèles de langage. Selon Krzysztof Siewicz, responsable des licences et de la conformité à la FSF, l'organisation engage rarement des poursuites en matière de droits d'auteur, mais lorsqu'elle le fait, son objectif est de défendre la liberté des utilisateurs plutôt que d'obtenir des dommages-intérêts.

Le communiqué de la FSF est présenté ci-dessous : «

La Free Software Foundation (FSF), comme beaucoup d’autres, a reçu une notification concernant un accord à l’amiable dans le cadre du procès pour violation du droit d’auteur Bartz c. Anthropic. Il s’agit d’un recours collectif alléguant qu’Anthropic a violé le droit d’auteur en téléchargeant des œuvres issues des ensembles de données Library Genesis et Pirate Library Mirror dans le but d’entraîner des grands modèles de langage (LLM). Selon cette notification, le tribunal de district a jugé que l'utilisation des livres pour entraîner des LLM relevait du fair use, mais a renvoyé au procès la question de savoir si leur téléchargement à cette fin était légal. Apparemment, les parties ont convenu de conclure un accord à l'amiable plutôt que d'attendre le procès et elles contactent actuellement les détenteurs potentiels de droits d'auteur pour leur proposer une compensation financière en lieu et place d'éventuels dommages-intérêts.

La FSF détient les droits d'auteur de nombreux programmes du projet GNU, ainsi que de plusieurs ouvrages. Nous publions toutes les œuvres dont nous détenons les droits d'auteur sous des licences libres (au sens de liberté). Parmi les œuvres dont nous détenons les droits d'auteur figure « Free as in freedom : Richard Stallman's crusade for free software » de Sam Williams, qui figurait dans les ensembles de données utilisés par Anthropic comme données d'entraînement pour ses modèles de langage (LLM). Cet ouvrage a été publié par O'Reilly et par la FSF sous la licence GNU Free Documentation License (GNU FDL). Il s'agit d'une licence libre autorisant l'utilisation de l'œuvre à toutes fins sans contrepartie financière.

Il va sans dire que la bonne chose à faire est de protéger la liberté informatique : partager l'intégralité des données d'entraînement avec chaque utilisateur du LLM, ainsi que le modèle complet, les paramètres de configuration de l'entraînement et le code source des logiciels associés. C'est pourquoi nous exhortons Anthropic et les autres développeurs de LLM qui entraînent leurs modèles à l'aide d'énormes ensembles de données téléchargés sur Internet à fournir ces LLM à leurs utilisateurs en toute liberté. Nous sommes une petite organisation aux ressources limitées et nous devons choisir nos combats, mais si la FSF devait participer à un procès tel que Bartz c. Anthropic et constater que nos droits d'auteur et notre licence ont été violés, nous demanderions certainement la liberté des utilisateurs à titre de compensation.

»

Cette affaire s’inscrit dans une série de procédures judiciaires opposant les développeurs d’IA aux détenteurs de droits d’auteur. En août 2025, l'entreprise Anthropic a ainsi accepté de régler le recours collectif pour violation du droit d'auteur dans lequel des auteurs accusaient l'entreprise d'avoir entraîné ses modèles d'IA à partir de leurs œuvres sans leur autorisation. La plainte, déposée en août 2024 par les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson, contestait l'utilisation de livres protégés pour entraîner le système Claude.

En juin 2025, le juge fédéral William Alsup avait toutefois jugé que l'apprentissage des modèles d'IA à partir d'œuvres protégées pouvait relever de l'« usage loyal », estimant que cette utilisation était « extrêmement transformative » et donc juridiquement défendable, même si le téléchargement initial de certaines sources pouvait constituer une infraction. Les parties ont ensuite demandé à la cour d'appel du neuvième circuit de suspendre la procédure afin de finaliser un accord de règlement présenté par les avocats des auteurs comme potentiellement bénéfique pour l'ensemble du groupe concerné.

Source : Free Software Foundation

Et vous ?

Quel est votre avis sur le sujet ?
Trouvez-vous cette initiative de la FSF crédible ou pertinente ?

Voir aussi :

Anthropic a acheté, découpé et numérisé des millions de livres physiques avant de détruire les originaux, dans le seul but d'entraîner son IA Claude, il a également téléchargé 7 millions de livres piratés

Un juge rejette l'accord à 1,5 milliard de dollars conclu par Anthropic concernant un recours collectif sur les droits d'auteur de près d'un demi-million de livres piratés pour former des chatbots

Anthropic a accepté de verser 1,5 milliard de $ pour régler un procès pour vol d'œuvres protégées par le droit d'auteur afin d'entraîner ses modèles d'IA, le plus important recouvrement de droits d'auteur
Vous avez lu gratuitement 5 971 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 17/03/2026 à 8:40
Le procès pour atteinte au copyright n'est pas mené par Stallman :
Pour rappel, en juillet 2025, un juge fédéral de Californie a autorisé trois auteurs (Andrea Bartz, Charles Graeber et Kirk Wallace Johnson) à mener une action collective nationale contre la start-up Anthropic
Bien que le tribunal ait jugé l'utilisation des livres équitable, la FSF demande aux développeurs d'intelligence artificielle (IA) qui entraînent leurs modèles à l'aide d'énormes ensembles de données téléchargés sur Internet de fournir les LLM à leurs utilisateurs en toute liberté, à titre de compensation.
2  0 
Avatar de OrthodoxWindows
Membre expert https://www.developpez.com
Le 17/03/2026 à 19:25
Citation Envoyé par Access_to_folder Voir le message
Et donc si j'ai bien suivi, le livre piraté non libre de M. Stallman mais diffusé par FSF en licence libre si pas d'usage commercial, la FSF envisagerait la possibilité d'un procès faisant que vu que Anthropic a utilisé d'une licence libre, le LLM d'Anthropic doit devenir libre en tant que dommage de réparation à cette violation de droits et acceptation de fait, par usage en traitement automatisé, d'un bien en licence libre...
Ce qui est logique, car, comme vous l'avez dit vous-même, ce livre est placé en "en licence libre si pas d'usage commercial". Hors Anthropic, en l'utilisant pour un LLM commercial, viole potentiellement cette licence.
Après, le débat de fond porte, comme toujours, sur si pour un LLM, ça va être plus de l'inspiration, ou plus du plagiat. Mais la logique de la FSF se tient si l'on en reste à ce qu'elle demande (le passage des LLM d'Anthropic concernés en non-commercial)
2  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 17/03/2026 à 9:00
Ha oui j'avais pas vu.
0  0 
Avatar de Access_to_folder
Nouveau Candidat au Club https://www.developpez.com
Le 18/03/2026 à 5:24
Tout à fait, surtout par leur raison militante.
Peut être que le Tribunal quant à lui jugera différemment, s'il la FSF s'engage dans la procédure, et accordera plutôt des dommages intérêts pour le préjudice subit ; les jurisprudences actuelles ne reconnaissent pas encore à l'IA un équivalent d'intelligence humaine quant à la compréhension de la licence. Une affaire intéressante à suivre (tentative de report de responsabilité d'un fait humain sur une IA ?).
0  1 
Avatar de Access_to_folder
Nouveau Candidat au Club https://www.developpez.com
Le 17/03/2026 à 9:07
Et donc si j'ai bien suivi, le livre piraté non libre de M. Stallman mais diffusé par FSF en licence libre si pas d'usage commercial, la FSF envisagerait la possibilité d'un procès faisant que vu que Anthropic a utilisé d'une licence libre, le LLM d'Anthropic doit devenir libre en tant que dommage de réparation à cette violation de droits et acceptation de fait, par usage en traitement automatisé, d'un bien en licence libre...
0  2 
Avatar de Access_to_folder
Nouveau Candidat au Club https://www.developpez.com
Le 17/03/2026 à 5:35
Il faudrait être parfois cohérent :

"Piratage logiciel : Richard Stallman affirme que partager n’est pas voler et accuse l’industrie d’avoir transformé l’entraide numérique en faute morale,"
https://www.developpez.net/forums/d2...tager-n-voler/

Violer les droits des autres n'est pas un problème sauf lorsqu'il s'agit des siens...
0  4 
Avatar de Access_to_folder
Nouveau Candidat au Club https://www.developpez.com
Le 17/03/2026 à 8:52
Citation Envoyé par _toma_ Voir le message
Le procès pour atteinte au copyright n'est pas mené par Stallman :
Non mais la revendication d'atteinte à ses droits est faite par sa fondation, la FSF, d'après l'article :

"Nous sommes une petite organisation aux ressources limitées et nous devons choisir nos combats, mais si la FSF devait participer à un procès tel que Bartz c. Anthropic et constater que nos droits d'auteur et notre licence ont été violés, nous demanderions certainement la liberté des utilisateurs à titre de compensation."
0  4