L'entraînement des grands modèles de langage (LLM) sur des livres achetés légalement sans l'autorisation des auteurs constitue un « usage loyal ». C'est la décision rendue par le juge fédéral américain William Alsup dans une action en justice contre Anthropic pour violation de droit d'auteur. Cette décision inédite constitue une victoire importante pour l'industrie de l'IA, mais met également en garde toutes les entreprises qui espèrent que le même raisonnement s'appliquera à l'entraînement sur des copies pirates de livres, une question qui reste en suspens. À ce propos, Anthropic fera l'objet d'un procès pour avoir piraté des millions de livres sur Internet.Contexte
En août 2024, les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson ont intenté un recours collectif contre Anthropic dans le district nord de la Californie. L'action en justices accuse Anthropic, développeur de Claude AI, d'avoir entraîné son chatbot sur des copies pirates de livres protégés par le droit d'auteur, sans consentement ni compensation. Mais Anthropic soutient que l'entraînement de l'IA sur des œuvres protégées relève de l'usage loyal.
En avril 2025, Anthropic a déposé son opposition à la requête en certification de recours collectif, arguant qu'un recours collectif en matière de droit d'auteur portant sur des millions de livres n'était pas gérable et que les questions étaient trop distinctes pour être résolues dans le cadre d'un recours collectif.
Dans le cadre de cet argument, Anthropic a mis en garde contre « la perspective de dommages-intérêts légaux ruineux - 150 000 dollars multipliés par 5 millions de livres » : cela représenterait 750 milliards de dollars. Un mois plus tard, une audience a eu lieu concernant la requête d'Anthropic en vue d'obtenir un jugement sommaire sur l'usage loyal, qui a examiné dans quelle mesure l'utilisation des œuvres en question pouvait être qualifiée d'usage loyal.
Anthropic remporte une victoire importante concernant l'usage loyal
Le juge William Alsup, de la cour fédérale du district nord de Californie, a rendu un jugement sommaire en faveur d'Anthropic, estimant que l'utilisation des livres protégés par le droit d'auteur à des fins de formation et le passage du format papier au format numérique constituent tous deux un « usage loyal ». Il s'agit d'une décision inédite en faveur de l'industrie de l'IA, mais elle est surtout limitée aux livres physiques qu'Anthropic a achetés et numérisés.
Cette affaire diffère des autres poursuites judiciaires dans lesquelles les auteurs allèguent que les modèles d'IA risquent de copier et de diffuser leurs œuvres. Étant donné que les auteurs qui ont poursuivi Anthropic n'ont pas allégué que les productions d'Anthropic reproduisaient leurs œuvres ou leur style expressif, le juge a estimé qu'il n'y avait aucune menace que le générateur de texte d'Anthropic, Claude, puisse remplacer les auteurs sur leurs marchés.
Ce qui a fait pencher le jugement en faveur d'Anthropic. « Comme tout lecteur aspirant à devenir écrivain, les LLM d'Anthropic ont été formés sur des œuvres non pas pour les devancer et les reproduire ou les supplanter, mais pour prendre un virage difficile et créer quelque chose de différent », a écrit le juge. Selon les auteurs, le fait que Claude s'appuie sur leurs textes pourrait générer des résumés concurrents ou des versions alternatives de leurs histoires.
Mais le juge William Alsup a rejeté l'argument des plaignants. Il a affirmé que ces plaintes revenaient à affirmer que « former les écoliers à bien écrire entraînerait une explosion d'œuvres concurrentes ». « Ce n'est pas le type de concurrence ou de déplacement créatif qui préoccupe la loi sur le droit d'auteur. La loi vise à promouvoir les œuvres originales des auteurs, et non à protéger les auteurs contre la concurrence », a écrit le juge William Alsup.
Anthropic se dit « satisfait » de la décision et a publié une déclaration saluant la reconnaissance par le tribunal du fait que « l'utilisation d'œuvres pour former de grands modèles de langage est transformative, et ce de manière spectaculaire ». Cependant, l'entreprise n'est pas tirée d'affaire pour autant.
Anthropic reste en difficulté pour avoir piraté des millions de livres
Malgré sa victoire, Anthropic doit toujours faire face à un procès pour piratage, pour lequel le juge William Alsup a estimé qu'il ne s'agissait pas d'une utilisation équitable. Anthropic est accusé d'avoir téléchargé jusqu'à sept millions de livres piratés afin de constituer une bibliothèque de recherche où les copies seraient conservées « à jamais », qu'elles aient été utilisées ou non dans le cadre de l'entraînement de ses grands modèles de langage.
Ayant apparemment compris que le piratage pouvait entraîner des poursuites judiciaires, Anthropic a ensuite tenté de remplacer les livres piratés par des...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

