Quand le patron décide lui-même de voler : Mark Zuckerberg aurait « personnellement autorisé et fermement encouragé » la violation massive des droits d'auteur par Metapour l'entraînement des systèmes d'IA, selon une plainte d'éditeurs
Cinq grands éditeurs et l'auteur Scott Turow ont déposé le 5 mai 2026 une action collective contre Meta et son PDG Mark Zuckerberg devant le tribunal fédéral de Manhattan, accusant le groupe de Menlo Park d'avoir orchestré, au plus haut niveau de sa direction, l'un des plus vastes actes de piraterie de l'histoire de l'édition mondiale, au profit de son modèle d'IA générative Llama.
L'accusation est formulée avec une précision chirurgicale : Mark Zuckerberg aurait « personnellement autorisé et activement encouragé » la violation massive des droits d'auteur commise par Meta pour entraîner ses modèles Llama. Ce n'est pas l'habituelle plainte vague contre une entité corporative. La plainte, déposée le 5 mai devant la Cour fédérale du district Sud de New York par cinq éditeurs (Hachette, Macmillan, McGraw Hill, Elsevier et Cengage) ainsi que par l'auteur Scott Turow, vise nommément le PDG de Meta et en fait le responsable direct d'une stratégie délibérée de pillage intellectuel.
Selon la plainte, Zuckerberg aurait ordonné le téléchargement non autorisé de la quasi-totalité du web par scraping, y compris des contenus accessibles uniquement par abonnement, ainsi que le téléchargement via torrent d'innombrables ouvrages et articles protégés depuis des sites pirates notoires comme LibGen et Anna's Archive. Ce n'est pas de la négligence : c'est, à en croire les plaignants, une décision stratégique prise en connaissance de cause, contre l'avis même de certains ingénieurs de l'entreprise.
Des communications internes versées au dossier montrent que des chercheurs avaient dès octobre 2022 tiré la sonnette d'alarme. L'un d'eux écrivait : « Je ne pense pas que nous devrions utiliser du matériel piraté. Je dois vraiment poser une limite ici. » Un autre ajoutait : « Utiliser du matériel piraté devrait dépasser notre seuil éthique. » Ces objections ont été ignorées. Selon des pièces judiciaires citées par Tom's Hardware, des employés de Meta ont téléchargé par torrent environ 82 téraoctets de matériaux piratés.
Le moment clé : quand Zuckerberg a choisi la piraterie plutôt que la licence
Le récit construit par la plainte est particulièrement accablant parce qu'il ne décrit pas un opportunisme passif, mais une bifurcation stratégique consciente. Après la sortie de Llama 1, Meta avait brièvement envisagé de conclure des accords de licence avec les grands éditeurs, discutant entre janvier et avril 2023 d'un budget de licences de données pouvant atteindre 200 millions de dollars.
Mais début avril 2023, ce processus s'est brusquement interrompu. La question de conclure des accords de licence ou de pirater le matériel protégé a été « remontée » à Zuckerberg. Après avoir transmis la préoccupation, l'équipe de développement commercial de Meta a reçu des instructions verbales pour cesser les efforts visant à acquérir des licences d'exploitation. Un employé de Meta avait lucidement décrit la logique de cette décision : « Si nous prenons une licence pour un seul livre, nous ne pourrons plus nous appuyer sur la stratégie du fair use. »
Ce passage est au cœur de la stratégie juridique des plaignants. Le droit américain du fair use, l'équivalent approximatif de l'exception de citation en droit français, est une défense que les entreprises d'IA ont brandie dans quasi tous les procès de ce type. Mais le fair use ne s'applique généralement pas lorsqu'une entreprise a délibérément renoncé à licencier pour pouvoir continuer à pirater. Les éditeurs cherchent à démontrer que Meta a non seulement commis une infraction, mais qu'elle a choisi l'infraction après avoir pesé l'alternative légale.
Il faut dire que le fair use est structurellement beaucoup plus souple et ouvert à l'interprétation judiciaire que l'exception de citation française, qui est une liste limitative. En effet, l'exception de citation en droit français (article L. 122-5 du Code de la propriété intellectuelle) permet de reproduire de courts extraits d'une œuvre protégée sans autorisation de l'auteur, à condition que trois critères soient réunis : l'indication claire de la source et du nom de l'auteur, un but d'analyse, de critique, d'information ou d'enseignement, et, critère décisif, une longueur brève, proportionnée à l'objectif poursuivi.
C'est là que la comparaison avec le fair use américain s'arrête très vite. L'exception de citation française est beaucoup plus étroite : elle vise des extraits ponctuels insérés dans un discours critique ou pédagogique, pas une reproduction massive à des fins commerciales. Elle n'intègre pas le raisonnement en quatre facteurs du fair use américain, qui permet aux juges de peser le caractère transformatif de l'usage, la nature de l'œuvre, la quantité reproduite et l'impact sur le marché. Ce dernier facteur, l'impact sur le marché, est précisément celui que les éditeurs cherchent à exploiter contre Meta.
En droit français, ingérer des millions d'ouvrages pour entraîner un modèle commercial ne pourrait en aucun cas se glisser sous l'exception de citation : ni la brièveté ni le but ne seraient remplis. La directive européenne sur le droit d'auteur de 2019 (directive DSM) a d'ailleurs créé une exception spécifique pour la fouille de textes et de données (text and data mining), mais elle est conditionnée à ce que les titulaires de droits n'aient pas expressément réservé leurs œuvres, ce que font désormais la plupart des éditeurs.
Ce que Llama a ingurgité
La plainte cite de nombreuses œuvres spécifiquement revendiquées comme ayant été volées par Meta pour alimenter Llama. Scott Turow y voit notamment plusieurs de ses propres romans, dont le thriller juridique Presumed Innocent (1987). Figurent également dans la liste des titres comme The Wild Robot de Peter Brown, The Fifth Season de N.K. Jemisin, ou encore des ouvrages de Douglas Preston et de Lemony Snicket. Mais la portée va bien au-delà de la fiction grand public.
Les maisons d'édition représentées publient des auteurs comme James Patterson, Donna Tartt, l'ancien président Joe Biden, et au moins deux lauréats du prix Pulitzer annoncés en 2026, Yiyun Li et d'autres. Surtout, la plainte couvre tout le spectre de l'édition : littérature, manuels académiques, articles scientifiques et ouvrages de référence. La classe représentée par Turow pourrait potentiellement inclure tous les propriétaires légaux ou bénéficiaires enregistrés de droits d'auteur sur tout ouvrage doté d'un ISBN ou article de journal possédant un DOI ou un ISSN, ce qui représente, théoriquement, une fraction considérable de la production imprimée mondiale du demi-siècle écoulé.
Selon les plaignants, le système d'IA de Meta est désormais capable de générer, à grande vitesse et à grande échelle, des substituts aux œuvres sur lesquelles il a été entraîné : copies verbatim ou quasi-verbatim, chapitres de remplacement pour des manuels académiques, résumés et versions alternatives de romans célèbres, contrefaçons dégradées copiant les éléments créatifs des originaux, et même des sorties adaptées pour imiter le style expressif d'auteurs spécifiques. C'est précisément ce préjudice économique concret, la capacité de Llama à se substituer au marché qu'il a pillé, que les plaignants entendent démontrer pour sortir du piège du fair use.
Le précédent Anthropic et la différence qui change tout
La jurisprudence en matière de droits d'auteur et d'IA est encore balbutiante aux États-Unis, mais deux précédents éclairent l'issue possible de ce litige. En juin 2025, le juge Vincent Chhabria avait rejeté une plainte déposée par treize auteurs, dont Sarah Silverman et Junot Díaz, contre Meta, estimant que les plaignants n'avaient pas suffisamment prouvé le préjudice causé par l'utilisation de leurs œuvres. Une victoire pour Meta, mais une victoire sur la preuve, pas sur le droit.
Dans le même temps, Anthropic a conclu en septembre 2025 un règlement à l'amiable de 1,5 milliard de dollars avec un groupe d'auteurs, dans une affaire où le juge William Alsup avait pourtant estimé que l'utilisation d'œuvres protégées pour entraîner un modèle d'IA était « extrêmement transformatrice » et donc potentiellement protégée par le fair use. Autrement dit : même lorsque l'entraînement lui-même était considéré légal, l'acte d'obtenir les œuvres depuis des sources piratées restait une infraction distincte et punissable. C'est exactement le terrain sur lequel jouent les éditeurs dans leur action contre Meta.
Trois différences structurelles distinguent cette nouvelle plainte de l'affaire Kadrey c. Meta, qui regroupait environ 666 livres d'un petit groupe d'auteurs individuels : le catalogue en jeu, soit l'intégralité de la production de cinq éditeurs couvrant une part substantielle de l'édition mondiale ; la preuve du préjudice de marché, notamment dans les segments académiques et éducatifs dont l'économie est structurellement différente de celle du roman grand public ; et enfin la preuve explicite de la décision délibérée de contourner le marché de la licence.
Meta : la stratégie du bulldozer
Face à ces accusations, Meta a adopté la posture qui lui est coutumière : l'offensive. Dans un communiqué, un porte-parole a déclaré que « l'IA alimente des innovations transformatrices, la productivité et la créativité pour les individus et les entreprises » et que les tribunaux ont « à juste titre » reconnu que l'entraînement de l'IA sur des œuvres protégées peut constituer un fair use. La société a promis de combattre cette action « de manière agressive ».
Ce discours est rodé; c'est mot pour mot ce que Meta dit dans chaque procès du genre depuis deux ans. Mais la dynamique a changé. La plainte cite désormais une suppression délibérée des métadonnées de gestion des droits d'auteur (copyright management information). Selon la plainte, Meta a effacé ces informations des œuvres protégées qu'elle a copiées, dans le but de dissimuler ses sources d'entraînement et de faciliter leur usage non autorisé. Cette suppression constitue en elle-même une infraction distincte au Digital Millennium Copyright Act (DMCA), indépendante de la question du fair use.
Certains observateurs sur Hacker News ont rapidement calculé l'exposition financière potentielle de Meta. En référence au règlement Anthropic évalué à environ 3 000 dollars par livre piraté sur 500 000 œuvres, un commentateur estimait que si Zuckerberg a piraté « des millions » d'œuvres, le règlement potentiel pourrait dépasser 6 milliards de dollars.
La lenteur du droit contre la vitesse du capital
Le calendrier procédural sera long : certification de la classe, requêtes en rejet, plaidoiries pour le jugement sommaire et planification du procès prendront dans l'ordre habituel 18 à 24 mois. Meta peut facilement absorber des années de procédure. Ses investissements en capital pour 2026 sont estimés entre 125 et 145 milliards de dollars; n'importe quel verdict, même massif, représente une fraction de cette mise.
Mais l'enjeu est moins financier que systémique. Ce procès pose une question à laquelle le secteur technologique préférerait ne pas répondre : peut-on légalement construire une industrie de plusieurs milliers de milliards de dollars sur des fondations dont les briques ont été volées à leurs créateurs ? Et si la réponse est non, qui paie et combien ?
L'industrie de l'édition mondiale, longtemps divisée face aux géants de la tech, semble avoir compris qu'une action collective portée par des entités d'envergure industrielle, avec des preuves de décision délibérée au plus niveau, constitue sa meilleure chance d'obtenir une réponse de fond.
Sources : plainte, communiqué officiel de Hachette Book Group, Houston Public Media, article L. 122-5 du Code de la Propriété Intellectuelle, exception de courte citation, le Syndicat national de l'édition (SNE) qui fournit une clause-type d'opt-out à ses membres
Et vous ?
La mise en cause nominative de Zuckerberg change-t-elle fondamentalement la nature de ce litige, ou s'agit-il d'une stratégie rhétorique destinée à rendre le procès plus médiatique et à peser sur d'éventuelles négociations de règlement ?
Le modèle du fair use américain est-il adapté à l'ère de l'IA générative, ou faut-il une législation spécifique, à l'image de ce que l'Union européenne tente de construire avec l'AI Act, pour encadrer l'utilisation des données d'entraînement ?
Si Meta venait à être condamnée pour suppression d'informations de gestion des droits (violation distincte du DMCA), cela pourrait-il créer un précédent contraignant toutes les entreprises d'IA à documenter et conserver la traçabilité de leurs données d'entraînement ?
Les éditeurs académiques et scientifiques (Elsevier, McGraw Hill) ont-ils un dossier structurellement plus solide que les auteurs de fiction, dans la mesure où le préjudice économique sur le marché des manuels et des articles est plus directement démontrable ?Voir aussi :
Meta affirme que pirater des millions de livres via BitTorrent pour entrainer son IA était du « fair use », tentant de légaliser rétroactivement l'un des plus grands vols de propriété intellectuelle de l'histoire
« Les livres piratés utilisés par Meta ne valent rien individuellement », selon Meta AI qui a jugé que 7 millions de livres n'avaient aucune « valeur économique », après avoir formé son IA sur des œuvres protégées
Vous avez lu gratuitement 1 195 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.