IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Anthropic remporte une victoire importante au sujet de « l'usage loyal » pour les plateformes d'IA, mais fait face à un procès pour des dommages-intérêts portant sur des millions d'œuvres piratées

Le , par Mathis Lucas

21PARTAGES

6  0 
Anthropic remporte une victoire importante au sujet de « l'usage loyal » pour l'entraînement des modèles d'IA, mais doit faire face à un procès concernant les dommages-intérêts pour des millions d'œuvres piratées

L'entraînement des grands modèles de langage (LLM) sur des livres achetés légalement sans l'autorisation des auteurs constitue un « usage loyal ». C'est la décision rendue par le juge fédéral américain William Alsup dans une action en justice contre Anthropic pour violation de droit d'auteur. Cette décision inédite constitue une victoire importante pour l'industrie de l'IA, mais met également en garde toutes les entreprises qui espèrent que le même raisonnement s'appliquera à l'entraînement sur des copies pirates de livres, une question qui reste en suspens. À ce propos, Anthropic fera l'objet d'un procès pour avoir piraté des millions de livres sur Internet.

Contexte

En août 2024, les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson ont intenté un recours collectif contre Anthropic dans le district nord de la Californie. L'action en justices accuse Anthropic, développeur de Claude AI, d'avoir entraîné son chatbot sur des copies pirates de livres protégés par le droit d'auteur, sans consentement ni compensation. Mais Anthropic soutient que l'entraînement de l'IA sur des œuvres protégées relève de l'usage loyal.

En avril 2025, Anthropic a déposé son opposition à la requête en certification de recours collectif, arguant qu'un recours collectif en matière de droit d'auteur portant sur des millions de livres n'était pas gérable et que les questions étaient trop distinctes pour être résolues dans le cadre d'un recours collectif.

Dans le cadre de cet argument, Anthropic a mis en garde contre « la perspective de dommages-intérêts légaux ruineux - 150 000 dollars multipliés par 5 millions de livres » : cela représenterait 750 milliards de dollars. Un mois plus tard, une audience a eu lieu concernant la requête d'Anthropic en vue d'obtenir un jugement sommaire sur l'usage loyal, qui a examiné dans quelle mesure l'utilisation des œuvres en question pouvait être qualifiée d'usage loyal.

Anthropic remporte une victoire importante concernant l'usage loyal

Le juge William Alsup, de la cour fédérale du district nord de Californie, a rendu un jugement sommaire en faveur d'Anthropic, estimant que l'utilisation des livres protégés par le droit d'auteur à des fins de formation et le passage du format papier au format numérique constituent tous deux un « usage loyal ». Il s'agit d'une décision inédite en faveur de l'industrie de l'IA, mais elle est surtout limitée aux livres physiques qu'Anthropic a achetés et numérisés.


Cette affaire diffère des autres poursuites judiciaires dans lesquelles les auteurs allèguent que les modèles d'IA risquent de copier et de diffuser leurs œuvres. Étant donné que les auteurs qui ont poursuivi Anthropic n'ont pas allégué que les productions d'Anthropic reproduisaient leurs œuvres ou leur style expressif, le juge a estimé qu'il n'y avait aucune menace que le générateur de texte d'Anthropic, Claude, puisse remplacer les auteurs sur leurs marchés.

Ce qui a fait pencher le jugement en faveur d'Anthropic. « Comme tout lecteur aspirant à devenir écrivain, les LLM d'Anthropic ont été formés sur des œuvres non pas pour les devancer et les reproduire ou les supplanter, mais pour prendre un virage difficile et créer quelque chose de différent », a écrit le juge. Selon les auteurs, le fait que Claude s'appuie sur leurs textes pourrait générer des résumés concurrents ou des versions alternatives de leurs histoires.

Mais le juge William Alsup a rejeté l'argument des plaignants. Il a affirmé que ces plaintes revenaient à affirmer que « former les écoliers à bien écrire entraînerait une explosion d'œuvres concurrentes ». « Ce n'est pas le type de concurrence ou de déplacement créatif qui préoccupe la loi sur le droit d'auteur. La loi vise à promouvoir les œuvres originales des auteurs, et non à protéger les auteurs contre la concurrence », a écrit le juge William Alsup.

Anthropic se dit « satisfait » de la décision et a publié une déclaration saluant la reconnaissance par le tribunal du fait que « l'utilisation d'œuvres pour former de grands modèles de langage est transformative, et ce de manière spectaculaire ». Cependant, l'entreprise n'est pas tirée d'affaire pour autant.

Anthropic reste en difficulté pour avoir piraté des millions de livres

Malgré sa victoire, Anthropic doit toujours faire face à un procès pour piratage, pour lequel le juge William Alsup a estimé qu'il ne s'agissait pas d'une utilisation équitable. Anthropic est accusé d'avoir téléchargé jusqu'à sept millions de livres piratés afin de constituer une bibliothèque de recherche où les copies seraient conservées « à jamais », qu'elles aient été utilisées ou non dans le cadre de l'entraînement de ses grands modèles de langage.

Ayant apparemment compris que le piratage pouvait entraîner des poursuites judiciaires, Anthropic a ensuite tenté de remplacer les livres piratés par des copies achetées légalement. Toutefois, l’entreprise a également soutenu que même la copie initiale de ces livres piratés constituait une étape « intermédiaire » nécessaire pour permettre un usage transformateur dans l’entraînement de l’IA. Un argument largement controversé que le tribunal a rejeté.

Et, argument peut-être le moins convaincant, Anthropic a également fait valoir que, puisqu'il aurait pu emprunter les livres qu'il a initialement volés (piratés), le vol en lui-même ne devrait pas « court-circuiter » l'analyse de l'usage loyal. Mais le juge William Alsup n'a pas été convaincu par ce dernier non plus.

Il a souligné que la copie de livres à partir d'un site pirate constitue une violation du droit d'auteur. Il a rejeté l'hypothèse d'Anthropic selon laquelle l'utilisation des copies pour une bibliothèque peut être excusée au titre de l'usage loyal parce que certaines seront finalement utilisées pour former des LLM », et il a émis des doutes quant à la possibilité pour les autres procès liés à l'IA et portant sur le piratage d'échapper au paiement de dommages-intérêts.

Citation Envoyé par Le juge William Alsup


Cette décision met en doute le fait qu'un contrefacteur présumé puisse jamais réussir à démontrer en quoi le téléchargement de copies provenant de sites pirates — alors qu’il aurait pu les acheter ou y accéder légalement autrement — était en soi raisonnablement nécessaire à un usage ultérieur relevant de l’usage équitable. Un tel piratage de copies autrement disponibles constitue, par nature, une violation irrémédiable, même si les copies piratées sont utilisées immédiatement pour un usage transformatif et immédiatement supprimées.

Le juge a ajouté que l’affaire Anthropic n’avait peut-être même pas besoin de trancher cette question, car la simple conservation des livres piratés dans sa bibliothèque de recherche n’était pas un usage transformateur. Il a écrit que l’argument d’Anthropic consistant à conserver du matériel piraté potentiellement utile à l’entraînement de l’IA, au cas où l’entreprise déciderait un jour de l’utiliser, revenait à glisser rapidement sur une fine couche de glace.

En outre, le juge a souligné que les premières tentatives d'Anthropic pour obtenir l'autorisation de former ses employés sur les œuvres des auteurs ont échoué, car des messages internes ont révélé que l'entreprise avait conclu que le vol de livres était considéré comme la voie la plus rentable vers l'innovation « afin d'éviter les « tracas juridiques/pratiques/commerciaux », comme l'a déclaré Dario Amodei, cofondateur et PDG de l'entreprise.

« Anthropic a tort de supposer que tant que vous créez un produit final passionnant, toutes les étapes en coulisses, invisibles au public, sont excusables. « Ici, le piratage était le but : construire une bibliothèque que l'on aurait pu payer, comme Anthropic l'a fait par la suite, mais sans la payer », a écrit le juge.

La décision trace désormais un cadre pour l'entraînement de l'IA

Les auteurs pourraient intenter de nouvelles poursuites s'ils trouvaient des preuves de contrefaçon dans les productions de Claude. « Les auteurs concèdent que la formation des LLM n'a pas donné lieu à la fourniture au public de copies exactes ni même de contrefaçons de leurs œuvres. Si tel n'était pas le cas, l'affaire serait différente. Les auteurs restent libres d'intenter une action en justice à l'avenir si de tels faits venaient à se produire », a écrit le juge.

Il s'agit d'une décision mitigée sur l'usage loyal, qui constitue une perte tant pour les titulaires de droits d'auteur que pour Anthropic, mais qui pourrait être une victoire pour les plateformes d'IA en général. Si elle est confirmée, cette décision signifierait que les entreprises d'IA utilisant du matériel protégé par le droit d'auteur pour former leurs modèles pourraient être autorisées à le faire à l'avenir. La seule exception à cette règle serait si le matériel a été piraté.

Il est encore trop tôt pour dire quel montant le juge William Alsup jugera approprié de proposer au jury à titre de dommages-intérêts, mais la quantité de matériel protégé par le droit d'auteur utilisé par Anthropic sous forme piratée était énorme, de sorte que les dommages-intérêts pourraient être très importants.

Conclusion

Les entreprises d'IA affirment qu'elles ne peuvent pas respecter les droits d'auteur dans le cadre de l'entraînement de leurs modèles d'IA. OpenAI veut un accès illimité aux œuvres protégées par le droit d'auteur. Le fabricant du chatbot d'IA populaire ChatGPT affirme également que cette utilisation doit être placée sous le principe de l'utilisation équitable (fair use). OpenAI avertit que la course à l'IA prendrait immédiatement fin s'il en était autrement.

En janvier 2024, OpenAI affirmait : « étant donné que le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine, il serait impossible d’entraîner les meilleurs modèles d'IA d'aujourd'hui sans utiliser des documents protégés par le droit d'auteur ». OpenAI reconnaît donc ouvertement qu'il utilise des contenus protégés par le droit d'auteur pour créer ses modèles d'IA. L'entreprise n'a toutefois pas encore été condamnée.

Cependant, une équipe de chercheurs a relevé le défi et a démontré qu'il est possible de former des modèles d'IA puissants sans enfreindre la loi. La décision du juge fédéral William Alsup émet un gros avertissement pour les entreprises d'IA qui cherchent à contourner les droits d’auteur.

Selon le juge William Alsup, les entreprises d'IA n'ont pas besoin de l'autorisation des auteurs pour entraîner leurs grands modèles de langage sur des livres achetés légalement. Il s'agit d'un usage loyal. Ce jugement fournit un référentiel pragmatique pour l’industrie de l'IA : « s’assurer que les données utilisées proviennent de sources légales et légitimes avant l’entraînement. Tout recours à du contenu piraté expose à un risque juridique majeur ».

Source : la décision du juge de district William Alsup (PDF)

Et vous ?

Quel est votre avis sur le sujet ?
Le juge William Alsup affirme que l'entraînement de l'IA sur des livres achetés légalement sans l'autorisation des auteurs constitue un usage loyal. Qu'en pensez-vous ?
Quels impacts cette décision pourrait-elle avoir sur l'ensemble de l'industrie de l'IA ?
Cette décision répond-elle aux préoccupations des détenteurs de droits d'auteur ?

Voir aussi

Anthropic, le développeur de Claude AI, poursuivi pour avoir entraîné son chatbot sur des copies pirates de livres protégés par le droit d'auteur

Les entreprises d'IA affirment qu'elles ne peuvent pas respecter les droits d'auteur mais ces chercheurs ont essayé, démontrant que former des modèles d'IA puissants sans enfreindre la loi, c'est possible

OpenAI déclare la course à l'IA « terminée » si l'entraînement sur des œuvres protégées par le droit d'auteur n'est pas considéré comme une utilisation équitable, ajoutant que les États-Unis seraient perdants
Vous avez lu gratuitement 3 570 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 29/06/2025 à 0:22
Ha.
Donc c'est bon, on peut enfin partager publiquement des MP3, après tout, c'est pas de notre faute si les gens qui les téléchargent n'ont pas acheté l'album.
Non ?
Ha bah zut.
4  0 
Avatar de totozor
Expert confirmé https://www.developpez.com
Le 05/08/2025 à 7:46
Citation Envoyé par KiLVaiDeN Voir le message
L'IA (les LLMs pour être plus précis) c'est comme un livre dynamique : on peut en lire les pages qui nous intéressent, et on y accède par un prompt.
C'est aussi tout le problème de l'IA, de twitter et de TikTok : ils extraient une phrase, un passage de 10 secondes d'un contexte qui parfois altère complètement l'interprétation de l'extrait.
Tous les textes ne sont pas des études dont on peut picorer ce qui nous intéresse.
En faisant ça on pense mutualiser de la connaissance mais on a supprimé tout raisonnement et on devient des singes savants, capable d'emmagasiner une quantité d'information incroyable mais incapable d'en faire quoi que ce soit de pertinent.
Et à la fin certains se prétendent intellectuels ou philosophes.
En tant que civilisation intelligente, notre objectif est de produire du savoir pour tous
Je vais faire mon connard élitiste mais quand je vois que certaines personnes se permettent de remettre en cause le savoir de spécialistes sur des sujets dont ils ignoraient l'existence il y a 1 semaine je ne peux qu'être très prudent sur cette affirmation.
Le savoir sans raisonnement et culture (connaissance de son environnement) ne sert à rien.
Je vous vois les experts KPI qui sortent soit des contrevérités soit qui s'emmerveillent devant des évidences, parce qu'ils se cantonnent aux chiffres , vos chiffres représentent une partie de la réalité, si vous ignorez celle ci alors vous ne faites qu'imaginer un monde qui n'existe pas.
3  0 
Avatar de _toma_
Membre éclairé https://www.developpez.com
Le 31/07/2025 à 15:38
Aujourd'hui, vous avez parfaitement le droit d'acheter un livre et de le scanner intégralement pour en faire ce que vous voulez, du papier Q ou entrainer une IA. Rien ne vous en empêche.
Non. Le droit à la copie privée existe en France et même dans le cadre d'une copie privée t'es pas à l'abri de te retrouver avec un procès au cul.

Je ne vois pas où est le problème. Des entreprises qui achètent des livres ça existe depuis longtemps. Il n'a jamais été question de valoriser le livre à hauteur du bénéfice fait par l'entreprise !
Là où c'est différent c'est que dans ce cas précis, l'objectif c'est bien de réutiliser le contenu des livres pour les faire réécrire par Le Glaude quand un utilisateur va venir lui poser une question.

Moi je pense que les auteurs cherchent juste à récupérer des sous car ils savent que leur business est en train de disparaitre sous leurs yeux. Beaucoup de personnes vont directement interroger une IA plutôt que d'acheter un livre. Déjà l'abonnement PRO aux plateformes IA est souvent moins cher qu'un seul livre. Et l'accès au savoir est non seulement dynamique, mais global, on n'accède pas au savoir d'un seul livre, mais à tous les supports sur un sujet donné. Qui va donc acheter un livre, pour apprendre quelque chose, quand un Claude ou un ChatGPT ou un Gemini peut non seulement fournir exactement les informations voulues, mais en plus itérer sur les questions qu'on pourrait avoir, proposer de créer des quiz sur certains aspects, donner des exemples concrets et spécifiques selon les besoins, etc, etc.
J'ai utilisé 4 ou 5 fois des générateurs de contenu pour pas mourir idiot. Ça m'a bluffé mais j'ai pas vraiment compris à quoi ça servait (je n'en ai pas besoin dans mon travail). Les quelques fois où des potes ont voulu me montrer à quel point c'était magique ça a été une catastrophe totale. Ça s'est passé comme ça :
- 2 à 4 personnes discutent
- Y'a un sujet de désaccord
- Plutôt que d'aller vérifier une info sur wikipédia ou un moteur de recherche, la question est posée à chatGPT
- Les 3 premiers paragraphes sont OK et si tu ne fais pas attention, tout a l'air normal. Mais si tu veux creuser un peu plus la réponse, tu avances un peu plus loin dans la lecture
- Et c'est à ce moment que tout le monde se regarde avec un petit sourire en coin : le modèle a généré un texte qui a l'air cohérent dans l'ensemble mais le fond est totalement à côté de la plaque

Tout ça pour des sujets qui auraient pu être traités avec une requête pertinente dans un moteur de recherche.

Bref, si t'as l'impression que tu peux te documenter/t'informer avec un outil de génération de contenu, je te souhaite bien du courage dans la vie.
1  0 
Avatar de RICitoyenne
Nouveau Candidat au Club https://www.developpez.com
Le 31/07/2025 à 17:28
Citation Envoyé par KiLVaiDeN Voir le message
Mes messages reçoivent des pouces rouges, mais ceux qui les donnent ne viennent pas argumenter, dommage. Je serais ravi de dialoguer avec vous si vous n'êtes pas d'accord, peut être ai-je quelque chose à comprendre de nos échanges (ainsi que les lecteurs).

Les données librement accessibles sans payer doivent également être accessibles sans payer pour les IAs. C'est la raison pour laquelle il faudrait faciliter l'accès aux données en les fournissant directement et ainsi éviter les surcharges serveur liées au crawling.
Tes arguments c'est basiquement "L'IA doit progresser donc laisser ces entreprises privées qui font du bénéfices avec voler votre travail d'humain. De toute façon votre site va fermer car grâce à ce qu'elle vous a volé, l'entreprise voleuse peut remplacer votre site."
1  0 
Avatar de totozor
Expert confirmé https://www.developpez.com
Le 01/08/2025 à 7:45
Citation Envoyé par KiLVaiDeN Voir le message
Qui va donc acheter un livre, pour apprendre quelque chose
Qui achète des livres pour apprendre des choses? 17 des 20 livres les plus vendus sont des fictions, les autres sont le Bible, le Coran et le petit livre rouge.
Attaquer la culture par l'angle de l'utilitarisme c'est ne rien comprendre à la culture.
Et à quel point faut-il ne rien comprendre aux sociétés pour penser que l'art et la culture ne sont pas essentiels à la vie?
1  0 
Avatar de KiLVaiDeN
Membre expert https://www.developpez.com
Le 01/08/2025 à 9:34
L'IA (les LLMs pour être plus précis) c'est comme un livre dynamique : on peut en lire les pages qui nous intéressent, et on y accède par un prompt. Le potentiel est énorme, et je suis conscient de son imperfection (tout comme je suis conscient qu'un livre n'est pas forcément porteur d'une vérité absolue). La puissance de cet outil réside dans sa capacité à restituer l'information plus précisément qu'un index, qu'un moteur de recherche qui ne fait qu'une recherche textuelle. Le LLM restitue l'information en combinant les concepts sous-jacent indirectement. Cela est rendu possible par les données sur lesquelles il s'est entrainé à la base, et parce qu'elles sont structurées pour être porteuses de concepts.

En tant que civilisation intelligente, notre objectif est de produire du savoir pour tous, et les LLMs doivent donc avoir la capacité d'accéder à la totalité du savoir humain sans restriction, car ce n'est qu'ainsi qu'elles auront leur réel potentiel. L'accès libre au savoir, non seulement réservé à une élite (ceux qui peuvent "acheter" ce savoir), c'est ça la transformation que subit la société humaine, et je pense que c'est une grande étape vers plus d'équité.
1  0 
Avatar de Escapetiger
Expert éminent sénior https://www.developpez.com
Le 05/08/2025 à 5:33
Citation Envoyé par Mathis Lucas Voir le message
L'action en justice contre Anthropic révèle la façon dont l'entreprise a détruit des millions de livres imprimés dans le seul but de former son IA Claude. Anthropic a retiré la reliure des livres, les a numérisés en fichiers numériques et a jeté les originaux. (.../...)
Citation Envoyé par Mathis Lucas Voir le message
Et vous ?

Anthropic a détruit des millions de livres physiques dans le processus d'entraînement de ses modèles d'IA. Qu'en pensez-vous ?

https://fr.wikipedia.org/wiki/Autodaf%C3%A9
Autodafé

Un autodafé (mot d'origine portugaise « auto de fé » venant du latin « actus fidei », c'est-à-dire « acte de foi ») est une cérémonie de pénitence publique organisée par les tribunaux de l'Inquisition espagnole ou portugaise, durant laquelle celle-ci proclamait ses jugements (.../...)

Par extension, « autodafé » désigne une destruction délibérée par le feu, en particulier de livres jugés dangereux. Ainsi, le concept d'autodafé est couramment utilisé pour caractériser la destruction publique de livres ou de manuscrits par le feu. Les plus anciennes mentions connues de ce type de pratiques se rencontrent en Chine au IIIe siècle av. J.-C., lorsque l'empereur Qin Shi Huang décide de liquider les écrits confucéens, ou plus tard, dans un contexte de guerre culturelle entre chrétiens et païens dans l'Empire romain.

Le mot auto da fé apparaît en France au XVIIIe siècle. (.../...)
0  0 
Avatar de KiLVaiDeN
Membre expert https://www.developpez.com
Le 25/07/2025 à 20:53
Aujourd'hui, vous avez parfaitement le droit d'acheter un livre et de le scanner intégralement pour en faire ce que vous voulez, du papier Q ou entrainer une IA. Rien ne vous en empêche.

Je ne vois pas où est le problème. Des entreprises qui achètent des livres ça existe depuis longtemps. Il n'a jamais été question de valoriser le livre à hauteur du bénéfice fait par l'entreprise !

Moi je pense que les auteurs cherchent juste à récupérer des sous car ils savent que leur business est en train de disparaitre sous leurs yeux. Beaucoup de personnes vont directement interroger une IA plutôt que d'acheter un livre. Déjà l'abonnement PRO aux plateformes IA est souvent moins cher qu'un seul livre. Et l'accès au savoir est non seulement dynamique, mais global, on n'accède pas au savoir d'un seul livre, mais à tous les supports sur un sujet donné. Qui va donc acheter un livre, pour apprendre quelque chose, quand un Claude ou un ChatGPT ou un Gemini peut non seulement fournir exactement les informations voulues, mais en plus itérer sur les questions qu'on pourrait avoir, proposer de créer des quiz sur certains aspects, donner des exemples concrets et spécifiques selon les besoins, etc, etc.

Il faut tout simplement reconnaitre les faits : des métiers vont changer, disparaitre, et l'IA va les bouffer, c'est très bien pour la société, moins bien pour ceux qui s'enrichissaient ainsi, mais l'évolution c'est aussi parfois se débarrasser de ce qui est inutile pour ne garder que ce qui permet la survie et l'essor de l'espèce
0  6