Accusé d'avoir massivement piraté des œuvres littéraires pour entraîner ses modèles d'IA, Meta tente aujourd'hui de faire valider juridiquement non seulement cet usage, mais aussi la redistribution de ces fichiers via BitTorrent. Une stratégie juridique aussi audacieuse que révélatrice des tensions profondes entre le droit d'auteur et la course aux données dans l'industrie de l'IA.Pour comprendre l'affaire Kadrey v. Meta, il faut d'abord saisir l'échelle du phénomène. Des preuves soumises au tribunal révèlent que Meta a téléchargé via torrent « au moins 81,7 téraoctets de données à travers plusieurs bibliothèques fantômes via le site Anna's Archive, dont au moins 35,7 téraoctets de Z-Library et LibGen ». Pour donner un ordre de grandeur : selon les estimations, cela représenterait des dizaines de millions de livres, sachant qu'un ebook Kindle pèse en moyenne 2,6 Mo.
Ce n'est pas tout. Selon les plaignants, Meta aurait également téléchargé 80,6 téraoctets supplémentaires directement depuis LibGen. Et les courriels internes dévoilés en audience (et partiellement désormais publics) révèlent que la décision d'utiliser ces bibliothèques illicites n'a pas été prise à la légère, ni dans l'ignorance. Un chercheur senior a déclaré en interne : « Je ne pense pas que nous devrions utiliser du matériel piraté. Je dois vraiment tracer une ligne ici. » Un autre a ajouté : « Utiliser du matériel piraté devrait dépasser notre seuil éthique. »
Plus accablant encore : des documents internes suggèrent que les juristes de Meta auraient conseillé d'abandonner les démarches de licence et d'utiliser exclusivement des œuvres piratées. La raison invoquée : si Meta prenait une licence pour « un seul livre », elle ne pourrait plus invoquer l'argument du « fair use ». Autrement dit, la stratégie juridique aurait dicté la stratégie d'acquisition des données et non l'inverse. Des documents laissent par ailleurs entendre que la décision d'utiliser LibGen serait remontée jusqu'à Mark Zuckerberg lui-même, malgré ses affirmations en sens contraire.
Le procès et la première victoire de Meta
L'affaire a été lancée en 2023. Le procès Kadrey v. Meta a été initié par 13 auteurs, dont Richard Kadrey et Sarah Silverman, qui affirment que Meta a utilisé des exemplaires piratés de leurs livres pour entraîner ses modèles d'IA sans leur permission.
Le droit américain prévoit une exception dite de « fair use » (usage loyal) qui permet, sous certaines conditions, d'utiliser des œuvres protégées sans autorisation. Les quatre critères d'appréciation sont : la finalité et le caractère de l'usage (notamment son caractère transformatif ou commercial), la nature de l'œuvre utilisée, la quantité reproduite, et l'effet sur le marché de l'œuvre originale.
En juin 2025, un tribunal fédéral a estimé que l'utilisation des livres pour entraîner une IA pouvait être considérée comme « transformative », c'est-à-dire qu'il s'agissait d'un usage nouveau ne se substituant pas aux œuvres originales. Tant que l'IA ne restituait pas des passages entiers des livres aux utilisateurs, cet usage pouvait être qualifié de loyal au regard du droit américain. Une victoire pour Meta, certes, mais partielle ; le tribunal a néanmoins tracé une limite : le simple téléchargement et stockage de livres piratés dans une base de données, sans transformation ni usage à finalité nouvelle, n'était pas couvert par le fair use. L'acte de piratage lui-même ne bénéficiait pas de cette exemption.
Le nouveau front : BitTorrent comme vecteur de distribution
C'est sur ce terrain que le procès se poursuit aujourd'hui, et c'est là que Meta a sorti son argument le plus surprenant. Le protocole BitTorrent fonctionne de manière décentralisée : quiconque télécharge un fichier via ce protocole en redistribue simultanément des fragments à d'autres utilisateurs du réseau. Les auteurs maintiennent ainsi que Meta n'a pas seulement téléchargé des...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.