IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Des auteurs et éditeurs français poursuivent Meta pour avoir utilisé illégalement leurs œuvres protégées par le droit d'auteur pour entraîner ses modèles d'IA,
Ils accusent Meta de « parasitisme économique »

Le , par Mathis Lucas

33PARTAGES

5  0 
Meta fait l'objet d'une plainte en France pour avoir utilisé des œuvres protégées par le droit d'auteur pour entraîner ses modèles d'IA. La plainte a été déposée devant le tribunal de Paris par trois associations françaises représentant des auteurs et des éditeurs : le Syndicat national de l'édition (SNE), le Syndicat national des auteurs et compositeurs (SNAC) et la Société des Gens de Lettres (SGDL). Ces associations ont constaté que les modèles de Meta sont capables de produire des répliques très précises des œuvres de leurs membres, dénonçant ainsi le scraping et le vol de leur propriété intellectuelle. Elles accusent Meta de « parasitisme économique ».

Meta poursuivi en France pour violation présumée des lois sur le droit d'auteur

Il s'agit de la première action de ce type intentée contre un géant de la course à l'IA en France. Meta fait l'objet d'un litige similaire aux États-Unis en raison de l'utilisation présumée de matériel protégé sans licence pour entraîner ses grands modèles de langage (LLM), tels que Llama. Aux États-Unis, Meta est accusé d'avoir utilisé des copies piratées de livres pour entraîner ses modèles d'IA, mais l'entreprise nie et dit avoir fait un usage équitable de ces œuvres.

En France, le Syndicat national de l'édition (SNE), le Syndicat national des auteurs et compositeurs (SNAC) et la Société des Gens de Lettres (SGDL) ont poursuivi Meta pour ce qu'ils considèrent comme « une utilisation massive d'œuvres protégées par le droit d'auteur sans autorisation » pour entraîner son IA.


La plainte a été déposée le 12 mars 2025 auprès du tribunal de Paris. « Le Syndicat national de l'édition, qui représente les éditeurs de livres, a établi la présence de nombreuses œuvres de ses membres dans le corpus de données utilisé par Meta », a déclaré le président du SNE, Vincent Montagne dans dans un communiqué incendiaire contre Meta. Vincent Montagne a accusé le géant américain de « non-respect du droit d'auteur et de parasitisme économique ».

Le Syndicat national des auteurs et compositeurs, qui représente 700 écrivains, dramaturges et compositeurs, a déclaré que l'action en justice était nécessaire pour protéger les membres du SNAC contre « une IA qui pille leurs œuvres et leur patrimoine culturel pour se former elle-même ».

Le troisième groupe impliqué dans le procès contre Meta, la Société des Gens de Lettres, représente les auteurs. L'association demande la « suppression complète » des répertoires de données que le leader mondial des réseaux sociaux a créés sans autorisation pour entraîner ses modèles d'IA.

C'est le dernier exemple en date de l'affrontement entre les industries créatives et de l'édition et les entreprises technologiques au sujet des données et du droit d'auteur. Le mois dernier, des musiciens britanniques ont publié un album silencieux pour protester contre les modifications proposées par le gouvernement britannique aux lois sur l'IA. Les créateurs britanniques craignent notamment que ces nouvelles lois n'érodent leur contrôle créatif.

Dans des recommandations récemment soumises à la Maison Blanche, OpenAI affirme que l'utilisation des œuvres protégées par le droit d'auteur pour l'entraînement de l'IA doit être placée sous le principe de l'usage loyal et que la sécurité nationale en dépendait. OpenAI avertit que la course à l'IA prendrait immédiatement fin s'il en était autrement et ajoute que « l'accès illimité aux œuvres protégées par le droit d'auteur est indispensable pour vaincre la Chine ».

Meta a utilisé un ensemble de données de livres piratés pour entraîner son IA

En vertu de la législation sur l'IA de l'Union européenne (EU AI Act), les systèmes d'IA générative doivent respecter la loi sur les droits d'auteur de l'Union des 27 et faire preuve de transparence quant au matériel qu'ils ont utilisé pour l'entraînement. Cette réglementation est entrée en vigueur le 1er aout 2024. En plus des exigences en matière de transparence, elle introduit un certain nombre d'autres exigences visant à atténuer les risques liés aux systèmes d'IA.

Meta a reconnu avoir utilisé une base de données, Books3, contenant les textes intégraux d'environ 200 000 livres, dont certains en français, pour entraîner son modèle Llama. « Nous assistons à un pillage monumental », a déclaré Maia Bensimon, déléguée générale du SNAC, dans un communiqué.

Books3 est un ensemble de données créé pour former des modèles d'IA pour la compréhension et la génération de langage naturel. Il comprend près de 200 000 livres numérisés, allant des classiques aux œuvres contemporaines et totalisant environ 37 Go de textes, principalement issus de sources comme Bibliotik, une bibliothèque en ligne de livres piratés. Books3 a été créé en 2020 par Shawn Presser, chercheur en IA et défenseur de l'open source.

Dans un autre procès intenté aux États-Unis par des auteurs, Meta a admis l'an dernier qu'il a utilisé la base de données jusqu'en 2023, affirmant que l'entraînement à l'IA constituait un usage loyal des livres protégés par le droit d'auteur, un argument que les plaignants rejettent catégoriquement.

Dans la nouvelle affaire déposée devant le tribunal de Paris, les éditeurs et auteurs français n'ont pas communiqué publiquement la valeur estimée du préjudice qu'ils ont subi en raison du comportement de Meta. Mais selon les plaignants, l'IA fait planer une menace sérieuse sur les industries créatives.

L'entreprise de médias et de technologie Thomson Reuters a récemment remporté une bataille juridique contre une société de recherche juridique, aujourd'hui disparue, sur la question de l'usage loyal dans les affaires de droit d'auteur liées à l'IA. Par ailleurs, d'autres affaires impliquant des artistes et des créateurs de contenus visuels, des organismes de presse et d'autres parties sont toujours en cours devant les tribunaux américains.

Meta fait face à des accusations de violation de droit d'auteur aux États-Unis

Les pratiques de Meta et de ses rivaux en matière de collecte de données pour l'entraînement des modèles d'IA font l'objet de nombreuses controverses. L'une des plaintes visant Meta accuse la société d'avoir téléchargé plus de 81,7 To de livres piratés pour entraîner son IA. La plainte allègue que Meta a utilisé des bases de données de livres piratés, notamment celles circulant sur des plateformes comme Library Genesis (LibGen), Z-Library ou encore Bibliotik.

Ces bibliothèques sont largement connues pour héberger des millions d'ouvrages sous copyright en accès gratuit...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de RenarddeFeu
Membre averti https://www.developpez.com
Le 23/04/2025 à 12:09
Ces livres avaient une valeur économique puisqu'ils ont permis d'entraîner l'IA justement.
5  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 23/04/2025 à 18:31
Citation Envoyé par Anthony Voir le message
"Les livres piratés utilisés par Meta ne valent rien individuellement", selon Meta AI qui a jugé que 7 millions de livres n'avaient aucune "valeur économique", après avoir formé son IA sur des œuvres protégées
Si ça passe au niveau d'un verdict, ça va créer un précédant juridique intéressant: "Je n'ai rien à payer pour mon piratage de jeux, votre honneur, parce que les jeux ils étaient nuls!"

2  0