IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

L'industrie de l'IA au bord du précipice ? La plus grande action collective en matière de droits d'auteur contre Anthropic pourrait ruiner l'industrie de l'IA
Selon les associations professionnelles

Le , par Stéphane le calme

32PARTAGES

13  0 
Un juge fédéral américain vient de certifier la plus vaste class action jamais intentée pour violation du droit d’auteur contre une entreprise technologique. La cible : Anthropic, créatrice du modèle Claude, accusée d’avoir bâti une partie de son succès sur des données issues d’une massive bibliothèque de livres piratés. Derrière cette affaire se joue un débat fondamental : l’IA peut-elle prospérer sur la base d’une appropriation massive de contenus protégés ? Et si la justice tranche sévèrement, l’impact pourrait être dévastateur non seulement pour Anthropic, mais pour l’ensemble du secteur.

Contexte

En août 2024, les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson ont intenté un recours collectif contre Anthropic dans le district nord de la Californie. L'action en justice accuse Anthropic, développeur de Claude AI, d'avoir entraîné son chatbot sur des copies pirates de livres protégés par le droit d'auteur, sans consentement ni compensation. Mais Anthropic soutient que l'entraînement de l'IA sur des œuvres protégées relève de l'usage loyal.

En avril 2025, Anthropic a déposé son opposition à la requête en certification de recours collectif, arguant qu'un recours collectif en matière de droit d'auteur portant sur des millions de livres n'était pas gérable et que les questions étaient trop distinctes pour être résolues dans le cadre d'un recours collectif.

Dans le cadre de cet argument, Anthropic a mis en garde contre « la perspective de dommages-intérêts légaux ruineux - 150 000 dollars multipliés par 5 millions de livres » : cela représenterait 750 milliards de dollars. Un mois plus tard, une audience a eu lieu concernant la requête d'Anthropic en vue d'obtenir un jugement sommaire sur l'usage loyal, qui a examiné dans quelle mesure l'utilisation des œuvres en question pouvait être qualifiée d'usage loyal.

Le juge William Alsup, de la cour fédérale du district nord de Californie, a rendu un jugement sommaire en faveur d'Anthropic, estimant que l'utilisation des livres protégés par le droit d'auteur à des fins de formation et le passage du format papier au format numérique constituent tous deux un « usage loyal ». Il s'agit d'une décision inédite en faveur de l'industrie de l'IA, mais elle est surtout limitée aux livres physiques qu'Anthropic a achetés et numérisés.

Malgré sa victoire, Anthropic doit toujours faire face à un procès pour piratage, pour lequel le juge William Alsup a estimé qu'il ne s'agissait pas d'une utilisation équitable. Anthropic est accusé d'avoir téléchargé jusqu'à sept millions de livres piratés afin de constituer une bibliothèque de recherche où les copies seraient conservées « à jamais », qu'elles aient été utilisées ou non dans le cadre de l'entraînement de ses grands modèles de langage.

Ayant apparemment compris que le piratage pouvait entraîner des poursuites judiciaires, Anthropic a ensuite tenté de remplacer les livres piratés par des copies achetées légalement. Toutefois, l’entreprise a également soutenu que même la copie initiale de ces livres piratés constituait une étape « intermédiaire » nécessaire pour permettre un usage transformateur dans l’entraînement de l’IA. Un argument largement controversé que le tribunal a rejeté.

Ce qui rend cette affaire explosive, c’est qu’Anthropic n’est probablement pas un cas isolé. Dans les cercles techniques, il est de notoriété publique que de nombreux modèles ont été formés sur des corpus partiellement ou totalement illégaux : bibliothèques pirates, dépôts GitHub sans licence, archives web contenant du contenu protégé…

Si la justice établit un précédent strict, toute l’industrie pourrait se retrouver dans la ligne de mire : OpenAI, Google DeepMind, Meta, Stability AI et bien d’autres. Le procès Anthropic pourrait alors devenir l’équivalent, pour l’IA, de l’affaire Napster dans l’industrie musicale — un moment de rupture imposant de nouvelles règles du jeu.


Anthropic est dans la tourmente

Les groupes industriels du secteur de l'IA exhortent une cour d'appel à bloquer ce qu'ils qualifient de plus grande action collective jamais certifiée en matière de droits d'auteur. Ils ont averti qu'un seul procès intenté par trois auteurs contre Anthropic pour sa formation en IA menace désormais de « ruiner financièrement » l'ensemble du secteur de l'IA si jusqu'à 7 millions de plaignants finissent par se joindre au litige et imposer un règlement.

Il y a quelques jours, Anthropic a déposé une requête en appel contre la certification du recours collectif, exhortant la cour à examiner des questions que le juge du tribunal de district, William Alsup, ne semble pas avoir prises en compte. Selon Anthropic, Alsup n'aurait pas procédé à une « analyse rigoureuse » du recours collectif potentiel et aurait plutôt fondé son jugement sur ses « 50 ans » d'expérience.

Si la cour d'appel rejette la requête, Anthropic estime que l'entreprise émergente pourrait être condamnée. Comme l'a fait valoir Anthropic, elle « risque désormais de devoir payer des centaines de milliards de dollars de dommages-intérêts lors du procès qui se tiendra dans quatre mois », sur la base d'une certification de recours collectif précipitée à une « vitesse fulgurante » qui concerne « jusqu'à sept millions de plaignants potentiels, dont les œuvres couvrent un siècle d'histoire de l'édition », chacun pouvant déclencher une amende de 150 000 dollars.

Un pillage massif au cœur du dossier

L'action collective met en lumière le cœur du problème de l'IA générative : l'entraînement des modèles sur des masses de données non autorisées. Pour atteindre leur niveau de performance actuel, des modèles comme Claude d'Anthropic ou ChatGPT d'OpenAI ont ingéré d'énormes quantités de textes, d'images et de code, dont une grande partie est protégée par le droit d'auteur. Les plaignants dénoncent un pillage massif et systématique de la propriété intellectuelle, qui a permis à ces entreprises de construire des modèles d'une valeur inestimable sans aucune compensation pour les créateurs originaux.

Les documents judiciaires, rendus publics début août, décrivent un procédé d’une ampleur qui donne le vertige. Selon le juge, Anthropic aurait téléchargé 5 millions de livres via la bibliothèque pirate LibGen, et 2 millions supplémentaires via PiLiMi, pour nourrir ses modèles.

Dans le monde du machine learning, les données d’entraînement sont le carburant. Or, au lieu d’acheter du contenu sous licence ou de produire ses propres corpus, Anthropic aurait, selon les plaignants, choisi la voie la moins coûteuse : l’extraction illégale.

Le droit américain permet aux titulaires de droits d’auteur de réclamer jusqu’à 150 000 $ par œuvre contrefaite. Multipliez cela par des millions de livres et on atteint rapidement un montant théorique astronomique, potentiellement létal pour toute entreprise.


Des soutiens de poids

Dans un document déposé jeudi devant le tribunal, la Consumer Technology Association et la Computer and Communications Industry Association ont apporté leur soutien à Anthropic, avertissant la cour d'appel que « la certification erronée de la classe par le tribunal de district » menacerait de causer « un préjudice immense non seulement à une seule entreprise d'IA, mais à l'ensemble du secteur naissant de l'IA et à la compétitivité technologique mondiale des États-Unis ».

Selon ces groupes, autoriser les recours collectifs en matière de droit d'auteur dans les affaires liées à l'entraînement de l'IA conduirait à un avenir où les questions de droit d'auteur resteraient en suspens et où le risque que des plaignants « enhardis » imposent des règlements colossaux refroidirait les investissements dans l'IA.

« Une telle responsabilité potentielle dans cette affaire exerce une pression incroyablement coercitive sur Anthropic pour qu'elle accepte un règlement », ont fait valoir les groupes industriels, concluant que « alors que l'IA générative commence à façonner la trajectoire de l'économie mondiale, l'industrie technologique ne peut pas supporter un litige aussi dévastateur. Les États-Unis sont peut-être actuellement le leader mondial du développement de l'IA, mais cela pourrait changer si les litiges entravent les investissements en imposant des dommages-intérêts excessifs aux entreprises d'IA ».

Les défenseurs représentant les auteurs s'en mêlent et soutiennent... Anthropic

Des groupes industriels se sont joints à Anthropic pour faire valoir que, d'une manière générale, les poursuites en matière de droit d'auteur ne se prêtent pas aux recours collectifs, car chaque auteur doit prouver qu'il est bien le propriétaire de ses œuvres. Et ces groupes n'étaient pas les seuls.

Soutenant également l'appel d'Anthropic, les défenseurs représentant les auteurs, notamment Authors Alliance, Electronic Frontier Foundation, American Library Association, Association of Research Libraries et Public Knowledge, ont souligné que l'affaire Google Books avait montré que prouver la propriété était tout sauf simple.

Dans l'affaire Anthropic, les défenseurs des auteurs ont critiqué Alsup pour avoir essentiellement jugé les 7 millions de livres concernés par le procès sur leur couverture. Le juge n'aurait « pratiquement pas cherché à savoir qui étaient les membres réels », et n'aurait « pas analysé les types de livres inclus dans la catégorie, leurs auteurs, les types de licences susceptibles de s'appliquer à ces œuvres, les intérêts des titulaires de droits ou leur éventuel soutien aux positions des représentants de la catégorie ».

Ignorant « des décennies de recherche, de multiples projets de loi au Congrès et de nombreuses études du Bureau américain du droit d'auteur visant à relever les défis liés à la détermination des droits sur un grand nombre de livres », le tribunal de district semblait s'attendre à ce que les auteurs et les éditeurs puissent facilement « trouver le meilleur moyen d'obtenir réparation » pour les dommages subis....
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 08/09/2025 à 18:28
Oui, c'est une bonne chose, personne n'aime voir son travail être "voler", qui plus est pour en tirer profit...

Mais...

  • qui va récolter cet argent ?
  • qui va le recevoir ? Cela m'étonnerait que les créateurs d'origine s'y retrouvent.
  • qui va décider de cette répartition ? Un livre de 100 pages peut avoir une valeur bien plus grand que toute une série d'autres bouquins.
  • comment va être décidé cette répartition ?
  • comment et qui va "surveiller" cela ?
  • comment "savoir" quel IA a utilisé "quoi" ?
  • ...


Pourquoi faire une "exception" avec l'IA ? L'idée d'admettre qu'il faut régler les choses "une fois le mal fait" est dangereux, il ne faudrait pas pendre avant et juger après... Tous les "créateurs de valeurs" n'ont pas forcément les moyens de se défendre.

Les entreprises qui "exploitent" le travail d'autres devraient "négocier" avec le créateur d'origine avant d'utiliser son œuvre. Ce serait une bonne chose, même pour ces entreprises, qui n'utiliseraient plus tout et n'importe quoi pour alimenter leur IA.

Et si tout cela n'est pas "techniquement" faisable et "ralentirait" le développement de l'IA, alors il faut que ces même entreprises dévoilent comment travaillent leurs IAs, ce qui permettrait à d'autres de développer de "meilleurs IA".

Le "code" d'une IA utilisant des données "volées" devrait automatiquement être rendue public. Ce serait la moindre des choses. Parce qu'actuellement, ces entreprises 'trouvent" normal d'alimenter leur IA avec le travail d'autrui, mais font tout pour "garder secret" comment leur IA fonctionne...

Ce n'est que mon avis, chacun pense ce qu'il veut, bien entendu.

BàV et Peace & Love.
4  0 
Avatar de FlamingoFR
Nouveau Candidat au Club https://www.developpez.com
Le 12/08/2025 à 9:25
Les droits d’auteur, les brevets et les licences fonctionnent, dans la pratique, bien plus souvent comme des armes d’accaparation et d’exclusion : ils servent à bâtir des monopoles, verrouiller des rentes et instaurer la censure… On est donc à des années-lumière du conte de fées où ces dispositifs protégeraient la veuve, l’orphelin et la noble création contre la dureté du monde.
3  1 
Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 13/08/2025 à 9:49


Je pense que l'industrie de l'IA, si elle ne s'écroule pas à cause du droit d'auteur (pour son "entrainement"), devrait s'écrouler pour plagiat, tout simplement. Que l'on trouve normal que l'IA se se forme en pompant le travail des autres, je peux à la limite l'accepter, car finalement, chaque "oeuvre" est "influencée" d'une manière au d'une autre par d'anciennes références.

Lorsque cela est fait par un humain, pour que la nouvelle "oeuvre" soit intéressante, une nouvelle vue et/ou une évolution est impérative.

L'IA (dans l'état actuelle), ne fait que de ressortir une "réponse" basée sur d'anciennes oeuvres, sans ajouter la moindre évolution, elle ne "crée" rien. Ce qu'elle fait lorsqu'on l'utilise s'apparente plus au plagiat.

L'industrie de l'IA a donc 2 gros problèmes. L'utilisation (massive) d'ouvres protégées par le droit d'auteurs, ET la production d'un plagiat. Un auteur humain peut s'appuyer sur le travail d'autruis, mais doit en tout logique citer ses sources, et si il y'a clairement "recopie", il sera condamné pour "plagiat". Il ne devrait pas en être autrement pour l'IA.

Certes, cela permet à certaines personnes de "découvrir" des choses qu'ils n'auraient jamais découvertes par eux-même et pour ces personne, cela est une "nouveauté", pour d'autres, c'est du "connus". Mais est-ce une bonne chose ? La "recherche" est une partie importante d'une création nouvelle. Avec l'IA, cette partie "recherche" disparaît pratiquement.

Si on pousse le raisonnement, l'humain perdra ce qui fait ce qu'il est actuellement, un "explorateur", un "chercheur", un "créateur", un être qui "réfléchit". L'IA pourrait balayer tout cela, et l'homme ne sera plus vraiment un homme, il deviendra incapable d'explorer, de chercher, de créer, de réflèchir.

Je ne suis ni pour ni contre, mais je me défend de l'employer, car son utilisation, si elle permet d'aller "plus vite" (a vérifier sur le long terme, je n'en suis pas certains), rend énormément moins intéressant le "création" de quoi que ce soit.

Dans le domaine du développement, quelle satisfaction peut-on tirer d'une "solution" dont on ne comprend même pas comment elle fonctionne ? Certes, cela peut éventuellement limiter les coûts d'une solution, mais à qui cette diminution des coups profite t'elle ? Certainement à celui qui a créer/copier la solution...

Enfin, ce n'est que mon petit opinion.
BàV et Peace & Love.
2  0 
Avatar de totozor
Expert confirmé https://www.developpez.com
Le 12/08/2025 à 16:00
Un bon exemple de ça est le scandale en ce moment entre Slawn qui revendique une collaboration avec Kaws, ce qui lui permet d'utiliser ces codes.
Kaws qui se scandalise qu'on s'accapare son travail alors que sa signature consiste à détourner (et donc s'accaparer) des figures de la culture pop.
Quand vous trouvez un faille, fermez toujours la porte derrière vous. Un jour vous pourriez être la victime de ce que vous avez fait
1  0 
Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 13/08/2025 à 10:01
Citation Envoyé par FlamingoFR Voir le message
Les droits d’auteur, les brevets et les licences fonctionnent, dans la pratique, bien plus souvent comme des armes d’accaparation et d’exclusion : ils servent à bâtir des monopoles, verrouiller des rentes et instaurer la censure… On est donc à des années-lumière du conte de fées où ces dispositifs protégeraient la veuve, l’orphelin et la noble création contre la dureté du monde.
Les brevets ont en effet été massivement "détournés" pour devenir un cadenas. L'idée de départ, c'était de permettre à un "créateur" de profiter de revenus créer via cette "création".

Ils ne sont plus adapté à notre époque, car en effet ils sont massivement utilisés par des multinationnales qui en déposent 25000 par ans.

Mais imaginez un instant que vous arrivez a créer une nouveauté, après un dur travail, et qu'un autre en profite à votre place ? Je ne pense pas que vous aimeriez cela...

Après, oui, ils ne devraient pas durer trop longtemps, sous peine de bâtir des monopoles, des rentes, vous avez parfaitement raison. Les brevets on été créé à une époque où tout allait moins vite que maintenant. Ils ne sont plus "adaptés" à notre époque, mais cela ne justifie en rien le droit que s'octroit l'industritie de l'IA, qui en plus utilisent elles même ces brevet pour "protéger" la manière de fonctionner de leur IA. Il peuvent copier, mais on ne peut pas les copier, c'est un peu l'hopital qui se faut de la charité, non ?

BàV et Peace & Love.
1  0 
Avatar de fatbob
Membre éclairé https://www.developpez.com
Le 20/08/2025 à 11:06
Citation Envoyé par OuftiBoy Voir le message
...
Mais imaginez un instant que vous arrivez a créer une nouveauté, après un dur travail, et qu'un autre en profite à votre place ? Je ne pense pas que vous aimeriez cela...
...
Cette situation est le résultat d'une organisation économique basée sur l'accaparement généralisé.
Les brevets n'en sont qu'un avatar.
En ce qui me concerne, je n'ai aucun problème avec l'idée que d'autres profitent de mon travail (mais en fait, personne ne devrait en "profiter") sans que ne soit rémunérée la fameuse "propriété intellectuelle" qui est quand même un concept sacrément fumeux si l'on considère qu'aucune innovation ne peut prétendre exister sans prendre ses fondations sur de multiples créations antérieures depuis l'invention de la roue et la maîtrise du feu.
Qui plus est, c'est bien plus souvent l'entreprise qui bénéficie des résultats de ses brevets, pas la personne qui a fait la découverte.
0  0 
Avatar de Denis CADIOT
Membre régulier https://www.developpez.com
Le 20/08/2025 à 21:03
Quand je lis un livre je me nourris du texte, j'apprends. Je n'ai pas le droit de le reproduire à l'identique mais j'ai le droit de reformuler les idées dans un texte original en citant la source.
J'ai acheté les livres ou je les ai emprunté dans une bibliothèque.
C'est bien ce que peut et doit faire à minima une IA, non ?
Le savoir est un bien qui appartient à l'humanité.
A mon avis il faut exiger des IA :
  1. Qu'elles achètent les livres qu'elles scannent,
  2. Qu'elles ne reproduisent pas les textes à l'identique pour éviter le plagiat,
  3. Qu'elles citent toutes les sources dont elles se sont inspirées dans la réponse sous forme d'une liste de références.

Pour une IA avancée avancée cela devrait être faisable.
0  0 
Avatar de axd13720bouille
Nouveau Candidat au Club https://www.developpez.com
Le 09/09/2025 à 22:38
oui normal qu'il l'ai rejeté
0  1