IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Des auteurs et éditeurs français poursuivent Meta pour avoir utilisé illégalement leurs œuvres protégées par le droit d'auteur pour entraîner ses modèles d'IA,
Ils accusent Meta de « parasitisme économique »

Le , par Mathis Lucas

48PARTAGES

5  0 
Des auteurs et éditeurs français poursuivent Meta pour avoir utilisé illégalement leurs œuvres protégées par le droit d'auteur pour entraîner ses modèles d'IA
ils accusent Meta de « parasitisme économique »

Meta fait l'objet d'une plainte en France pour avoir utilisé des œuvres protégées par le droit d'auteur pour entraîner ses modèles d'IA. La plainte a été déposée devant le tribunal de Paris par trois associations françaises représentant des auteurs et des éditeurs : le Syndicat national de l'édition (SNE), le Syndicat national des auteurs et compositeurs (SNAC) et la Société des Gens de Lettres (SGDL). Ces associations ont constaté que les modèles de Meta sont capables de produire des répliques très précises des œuvres de leurs membres, dénonçant ainsi le scraping et le vol de leur propriété intellectuelle. Elles accusent Meta de « parasitisme économique ».

Meta poursuivi en France pour violation présumée des lois sur le droit d'auteur

Il s'agit de la première action de ce type intentée contre un géant de la course à l'IA en France. Meta fait l'objet d'un litige similaire aux États-Unis en raison de l'utilisation présumée de matériel protégé sans licence pour entraîner ses grands modèles de langage (LLM), tels que Llama. Aux États-Unis, Meta est accusé d'avoir utilisé des copies piratées de livres pour entraîner ses modèles d'IA, mais l'entreprise nie et dit avoir fait un usage équitable de ces œuvres.

En France, le Syndicat national de l'édition (SNE), le Syndicat national des auteurs et compositeurs (SNAC) et la Société des Gens de Lettres (SGDL) ont poursuivi Meta pour ce qu'ils considèrent comme « une utilisation massive d'œuvres protégées par le droit d'auteur sans autorisation » pour entraîner son IA.


La plainte a été déposée le 12 mars 2025 auprès du tribunal de Paris. « Le Syndicat national de l'édition, qui représente les éditeurs de livres, a établi la présence de nombreuses œuvres de ses membres dans le corpus de données utilisé par Meta », a déclaré le président du SNE, Vincent Montagne dans dans un communiqué incendiaire contre Meta. Vincent Montagne a accusé le géant américain de « non-respect du droit d'auteur et de parasitisme économique ».

Le Syndicat national des auteurs et compositeurs, qui représente 700 écrivains, dramaturges et compositeurs, a déclaré que l'action en justice était nécessaire pour protéger les membres du SNAC contre « une IA qui pille leurs œuvres et leur patrimoine culturel pour se former elle-même ».

Le troisième groupe impliqué dans le procès contre Meta, la Société des Gens de Lettres, représente les auteurs. L'association demande la « suppression complète » des répertoires de données que le leader mondial des réseaux sociaux a créés sans autorisation pour entraîner ses modèles d'IA.

C'est le dernier exemple en date de l'affrontement entre les industries créatives et de l'édition et les entreprises technologiques au sujet des données et du droit d'auteur. Le mois dernier, des musiciens britanniques ont publié un album silencieux pour protester contre les modifications proposées par le gouvernement britannique aux lois sur l'IA. Les créateurs britanniques craignent notamment que ces nouvelles lois n'érodent leur contrôle créatif.

Dans des recommandations récemment soumises à la Maison Blanche, OpenAI affirme que l'utilisation des œuvres protégées par le droit d'auteur pour l'entraînement de l'IA doit être placée sous le principe de l'usage loyal et que la sécurité nationale en dépendait. OpenAI avertit que la course à l'IA prendrait immédiatement fin s'il en était autrement et ajoute que « l'accès illimité aux œuvres protégées par le droit d'auteur est indispensable pour vaincre la Chine ».

Meta a utilisé un ensemble de données de livres piratés pour entraîner son IA

En vertu de la législation sur l'IA de l'Union européenne (EU AI Act), les systèmes d'IA générative doivent respecter la loi sur les droits d'auteur de l'Union des 27 et faire preuve de transparence quant au matériel qu'ils ont utilisé pour l'entraînement. Cette réglementation est entrée en vigueur le 1er aout 2024. En plus des exigences en matière de transparence, elle introduit un certain nombre d'autres exigences visant à atténuer les risques liés aux systèmes d'IA.

Meta a reconnu avoir utilisé une base de données, Books3, contenant les textes intégraux d'environ 200 000 livres, dont certains en français, pour entraîner son modèle Llama. « Nous assistons à un pillage monumental », a déclaré Maia Bensimon, déléguée générale du SNAC, dans un communiqué.

Books3 est un ensemble de données créé pour former des modèles d'IA pour la compréhension et la génération de langage naturel. Il comprend près de 200 000 livres numérisés, allant des classiques aux œuvres contemporaines et totalisant environ 37 Go de textes, principalement issus de sources comme Bibliotik, une bibliothèque en ligne de livres piratés. Books3 a été créé en 2020 par Shawn Presser, chercheur en IA et défenseur de l'open source.

Dans un autre procès intenté aux États-Unis par des auteurs, Meta a admis l'an dernier qu'il a utilisé la base de données jusqu'en 2023, affirmant que l'entraînement à l'IA constituait un usage loyal des livres protégés par le droit d'auteur, un argument que les plaignants rejettent catégoriquement.

Dans la nouvelle affaire déposée devant le tribunal de Paris, les éditeurs et auteurs français n'ont pas communiqué publiquement la valeur estimée du préjudice qu'ils ont subi en raison du comportement de Meta. Mais selon les plaignants, l'IA fait planer une menace sérieuse sur les industries créatives.

L'entreprise de médias et de technologie Thomson Reuters a récemment remporté une bataille juridique contre une société de recherche juridique, aujourd'hui disparue, sur la question de l'usage loyal dans les affaires de droit d'auteur liées à l'IA. Par ailleurs, d'autres affaires impliquant des artistes et des créateurs de contenus visuels, des organismes de presse et d'autres parties sont toujours en cours devant les tribunaux américains.

Meta fait face à des accusations de violation de droit d'auteur aux États-Unis

Les pratiques de Meta et de ses rivaux en matière de collecte de données pour l'entraînement des modèles d'IA font l'objet de nombreuses controverses. L'une des plaintes visant Meta accuse la société d'avoir téléchargé plus de 81,7 To de livres piratés pour entraîner son IA. La plainte allègue que Meta a utilisé des bases de données de livres piratés, notamment celles circulant sur des plateformes comme Library Genesis (LibGen), Z-Library ou encore Bibliotik.

Ces bibliothèques sont largement connues pour héberger des millions d'ouvrages sous copyright en accès gratuit et illégal. Ces ouvrages auraient servi à enrichir LLama (Large Language Model Meta AI), un grand modèle de langage avancé développé par Meta et l'un des plus puissants sur le maché.

L'avocat des plaignants affirme que Meta s'est livré à une autre forme d'infraction au droit d'auteur en diffusant LibGen par torrent et en contribuant ainsi à la diffusion de son contenu. « Si Meta avait acheté les œuvres des plaignants dans une librairie ou les avait empruntées à une bibliothèque et avait entraîné ses modèles LLama sur ces œuvres sans licence, il aurait commis une violation du droit d'auteur », a écrit l'avocat des plaignants dans le dossier.

Les plaignants accusent Meta d'avoir effrontément opté pour le torrenting de dizaines de téraoctets de livres numériques piratés après que les tentatives de téléchargement des livres piratés un par un aient exercé « une pression énorme » sur les réseaux du géant de Menlo Park et progressé très lentement.

Sachant que ce type d'activité est considéré comme une infraction depuis plus de vingt ans, ils allèguent que Meta a pris un risque, espérant apparemment ne pas être détecté alors qu'il luttait pour rattraper son retard dans la course à l'IA et qu'il avait besoin d'un accès plus rapide à de grandes quantités de données.

Pour brouiller les pistes, l'entreprise de médias sociaux se serait écartée des pratiques habituelles et aurait tenté de dissimuler le torrenting en utilisant les AWS (Amazon Web Services). « Dans la plupart des cas, et dans celui-ci également, les utilisateurs qui téléchargent par torrent téléchargent également le même fichier que celui qu'ils téléchargent pour profiter des avantages d'un partage de fichiers plus rapide », ont déclaré les auteurs dans leur plainte.

En février, les auteurs ont déclaré que l'utilisation du torrenting par Meta constitue une infraction. Les plaignants ont expliqué que le leeching de Meta pendant le processus de téléchargement serait une preuve suffisante que le géant des réseaux sociaux a partagé les livres piratés avec d'autres.

Et vous ?

Quel est votre avis sur le sujet ?

Voir aussi

Meta moqué pour avoir invoqué « la défense de Bob Dylan » en faveur du torrenting dans un procès pour violation de droits d'auteur en matière d'IA, Meta se bat pour empêcher la divulgation des preuves

L'AI Act est en place : les systèmes d'IA présentant un « risque inacceptable » sont désormais interdits dans l'UE, mais la Commission accuse des retards dans la définition des règles qui l'encadre

Meta accusée d'avoir téléchargé plus de 81,7 To de livres piratés pour entraîner son IA. Des courriels montrent qu'elle a tenté de le dissimuler en évitant les serveurs de Facebook lors du téléchargement
Vous avez lu gratuitement 10 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de RenarddeFeu
Membre averti https://www.developpez.com
Le 23/04/2025 à 12:09
Ces livres avaient une valeur économique puisqu'ils ont permis d'entraîner l'IA justement.
5  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 23/04/2025 à 18:31
Citation Envoyé par Anthony Voir le message
"Les livres piratés utilisés par Meta ne valent rien individuellement", selon Meta AI qui a jugé que 7 millions de livres n'avaient aucune "valeur économique", après avoir formé son IA sur des œuvres protégées
Si ça passe au niveau d'un verdict, ça va créer un précédant juridique intéressant: "Je n'ai rien à payer pour mon piratage de jeux, votre honneur, parce que les jeux ils étaient nuls!"

2  0