Meta affirme que pirater des millions de livres via BitTorrent pour entrainer son IA était du «fair use»

Tentant de légaliser rétroactivement l'un des plus grands vols de propriété intellectuelle de l'histoire

Le 10 mars 2026 à 23:23, par Stéphane le calme

142PARTAGES

Meta affirme que pirater des millions de livres via BitTorrent pour entrainer son IA était du « fair use »,
tentant de légaliser rétroactivement l'un des plus grands vols de propriété intellectuelle de l'histoire de la tech

Accusé d'avoir massivement piraté des œuvres littéraires pour entraîner ses modèles d'IA, Meta tente aujourd'hui de faire valider juridiquement non seulement cet usage, mais aussi la redistribution de ces fichiers via BitTorrent. Une stratégie juridique aussi audacieuse que révélatrice des tensions profondes entre le droit d'auteur et la course aux données dans l'industrie de l'IA.

Pour comprendre l'affaire Kadrey v. Meta, il faut d'abord saisir l'échelle du phénomène. Des preuves soumises au tribunal révèlent que Meta a téléchargé via torrent « au moins 81,7 téraoctets de données à travers plusieurs bibliothèques fantômes via le site Anna's Archive, dont au moins 35,7 téraoctets de Z-Library et LibGen ». Pour donner un ordre de grandeur : selon les estimations, cela représenterait des dizaines de millions de livres, sachant qu'un ebook Kindle pèse en moyenne 2,6 Mo.

Ce n'est pas tout. Selon les plaignants, Meta aurait également téléchargé 80,6 téraoctets supplémentaires directement depuis LibGen. Et les courriels internes dévoilés en audience (et partiellement désormais publics) révèlent que la décision d'utiliser ces bibliothèques illicites n'a pas été prise à la légère, ni dans l'ignorance. Un chercheur senior a déclaré en interne : « Je ne pense pas que nous devrions utiliser du matériel piraté. Je dois vraiment tracer une ligne ici. » Un autre a ajouté : « Utiliser du matériel piraté devrait dépasser notre seuil éthique. »

Plus accablant encore : des documents internes suggèrent que les juristes de Meta auraient conseillé d'abandonner les démarches de licence et d'utiliser exclusivement des œuvres piratées. La raison invoquée : si Meta prenait une licence pour « un seul livre », elle ne pourrait plus invoquer l'argument du « fair use ». Autrement dit, la stratégie juridique aurait dicté la stratégie d'acquisition des données et non l'inverse. Des documents laissent par ailleurs entendre que la décision d'utiliser LibGen serait remontée jusqu'à Mark Zuckerberg lui-même, malgré ses affirmations en sens contraire.

Le procès et la première victoire de Meta

L'affaire a été lancée en 2023. Le procès Kadrey v. Meta a été initié par 13 auteurs, dont Richard Kadrey et Sarah Silverman, qui affirment que Meta a utilisé des exemplaires piratés de leurs livres pour entraîner ses modèles d'IA sans leur permission.

Le droit américain prévoit une exception dite de « fair use » (usage loyal) qui permet, sous certaines conditions, d'utiliser des œuvres protégées sans autorisation. Les quatre critères d'appréciation sont : la finalité et le caractère de l'usage (notamment son caractère transformatif ou commercial), la nature de l'œuvre utilisée, la quantité reproduite, et l'effet sur le marché de l'œuvre originale.

En juin 2025, un tribunal fédéral a estimé que l'utilisation des livres pour entraîner une IA pouvait être considérée comme « transformative », c'est-à-dire qu'il s'agissait d'un usage nouveau ne se substituant pas aux œuvres originales. Tant que l'IA ne restituait pas des passages entiers des livres aux utilisateurs, cet usage pouvait être qualifié de loyal au regard du droit américain. Une victoire pour Meta, certes, mais partielle ; le tribunal a néanmoins tracé une limite : le simple téléchargement et stockage de livres piratés dans une base de données, sans transformation ni usage à finalité nouvelle, n'était pas couvert par le fair use. L'acte de piratage lui-même ne bénéficiait pas de cette exemption.

Le nouveau front : BitTorrent comme vecteur de distribution

C'est sur ce terrain que le procès se poursuit aujourd'hui, et c'est là que Meta a sorti son argument le plus surprenant. Le protocole BitTorrent fonctionne de manière décentralisée : quiconque télécharge un fichier via ce protocole en redistribue simultanément des fragments à d'autres utilisateurs du réseau. Les auteurs maintiennent ainsi que Meta n'a pas seulement téléchargé des livres piratés : elle les a également distribués à d'autres utilisateurs du réseau BitTorrent, ce qui constituerait une violation directe et massive du droit d'auteur.

La réponse de Meta à cette accusation est audacieuse. Selon ses avocats, l'upload automatique inhérent au fonctionnement de BitTorrent ne serait pas une infraction distincte, mais simplement l'accessoire indissociable du téléchargement, lui-même couvert par le fair use d'entraînement. En d'autres termes : puisque le téléchargement est du fair use, et puisque l'upload est inévitable lors d'un téléchargement BitTorrent, l'upload serait lui aussi du fair use.

L'argument est circulaire. Meta a utilisé BitTorrent parce que c'était le moyen le plus efficace d'obtenir les données en masse ; cet usage était nécessaire à l'entraînement du modèle ; l'entraînement a été jugé transformatif ; donc le vecteur de distribution (et par extension la redistribution des œuvres piratées à des tiers) serait lui aussi couvert par le fair use. La société affirme en outre que tout cela a contribué à établir la position dominante des États-Unis dans le domaine de l'IA.

Une manœuvre procédurale contestée

Les avocats des auteurs ne contestent pas seulement l'argument sur le fond : ils dénoncent également la façon dont il a été introduit. Selon eux, Meta a soumis cet argument de fair use à la dernière minute, juste avant l'expiration d'un délai de communication des preuves fixé par le tribunal, et après avoir évité pendant des mois d'évoquer une telle défense en réponse aux questions spécifiques du juge sur les actes d'upload.

Meta a rétorqué que cette défense avait bien été mentionnée dans un document de gestion de l'affaire déposé en décembre 2025. L'entreprise souligne par ailleurs que chaque auteur nommément cité dans le recours collectif a admis ne pas avoir connaissance d'un seul passage de ses livres reproduit dans les sorties du modèle Llama. Sarah Silverman elle-même, interrogée sur ce point, a déclaré que cela « n'avait aucune importance ».

Ce dernier élément est stratégique : si les auteurs eux-mêmes estiment que l'absence de reproduction directe est sans importance, ils admettent implicitement que leur plainte vise le processus d'entraînement en tant que tel, or ce même processus a déjà été jugé comme relevant du fair use.

Les enjeux systémiques du dossier

L'affaire dépasse largement Meta. Elle s'inscrit dans un mouvement juridique plus large impliquant la quasi-totalité des grandes entreprises d'IA. Meta soutient que ses téléchargements par torrent ne constituaient pas un acte séparé et délibéré de distribution, mais simplement une conséquence automatique du protocole de téléchargement. Si ce raisonnement était validé par le juge Vince Chhabria, il créerait un précédent applicable à toutes les entreprises ayant utilisé des bibliothèques fantômes accessibles par torrent, c'est-à-dire potentiellement l'ensemble du secteur.

La décision du juge Chhabria, attendue dans les prochaines semaines, pourrait ainsi déterminer si le recours aux shadow libraries constitue un espace légalement toléré pour l'industrie de l'IA ou si, au contraire, les modalités concrètes d'acquisition des données (et notamment leur redistribution via BitTorrent) constituent un point de responsabilité distinct et non couvert par le fair use.

Ce que l'affaire révèle en creux, c'est aussi une asymétrie fondamentale : un particulier qui aurait téléchargé ne serait-ce que 0,008 % du volume de données piraté par Meta risquerait d'être poursuivi au pénal. Les auteurs eux-mêmes citent ce chiffre dans leurs conclusions, rappelant que des actes de piratage représentant cette fraction infime de ce que Meta aurait piraté ont déjà conduit des juges à saisir le parquet fédéral pour enquête criminelle.

Une industrie sous pression

Meta n'est pas seule dans cette situation. Nvidia a également fait l'objet d'un recours collectif élargi alléguant qu'elle aurait validé l'usage de livres piratés pour entraîner ses modèles. Et selon des documents récents, l'entreprise aurait même cherché à négocier un accès haute vitesse aux archives d'Anna's Archive. OpenAI, Google, Anthropic et d'autres font face à des contentieux similaires, même si les arguments et les juridictions varient.

Dans ce contexte, la thèse du fair use pour l'entraînement des LLM est devenue une ligne de défense sectorielle, presque une position officieuse de l'industrie. Ce qui était il y a deux ans une théorie juridique non testée est en train de se consolider cas par cas. La jurisprudence qui se dessine n'a toutefois pas encore tranché la question du BitTorrent comme vecteur de redistribution... et c'est précisément là que se joue le dernier acte de Kadrey v. Meta.

Sources : Meta, plaignants

Et vous ?

Si le tribunal valide le raisonnement de Meta sur le BitTorrent, cela signifierait-il qu'une entreprise peut pirater impunément tant que l'usage final est jugé transformatif et quelles limites resteraient-il alors opposables aux géants de la tech ?

La distinction entre « télécharger pour entraîner » (fair use validé) et « redistribuer via BitTorrent » (toujours en litige) vous semble-t-elle juridiquement cohérente, ou constitue-t-elle une ligne arbitraire difficile à tenir dans la durée ?

Des courriels internes montrent que des employés de Meta ont exprimé des doutes éthiques et qu'ils ont été ignorés. Cela devrait-il peser dans l'évaluation juridique, ou la bonne foi des entreprises est-elle sans pertinence en droit du copyright ?

À l'heure où les LLM sont entraînés sur des corpus de plus en plus massifs, comment l'industrie pourrait-elle structurer des mécanismes de licence à grande échelle sans que les coûts ne deviennent prohibitifs ?

Vous avez lu gratuitement 7 774 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

Meta affirme que pirater des millions de livres via BitTorrent pour entrainer son IA était du «fair use»

Tentant de légaliser rétroactivement l'un des plus grands vols de propriété intellectuelle de l'histoire

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

Meta affirme que pirater des millions de livres via BitTorrent pour entrainer son IA était du «fair use» Tentant de légaliser rétroactivement l'un des plus grands vols de propriété intellectuelle de l'histoire

Meta affirme que pirater des millions de livres via BitTorrent pour entrainer son IA était du «fair use»

Tentant de légaliser rétroactivement l'un des plus grands vols de propriété intellectuelle de l'histoire