OpenAI perd une bataille clé et cède du terrain face aux auteurs dans les procès pour violation de droit d'auteur liés à l'IA,

Un tribunal lui ordonne de divulguer des communications internes

Le 4 décembre 2025 à 12:04, par Mathis Lucas

192PARTAGES

OpenAI perd une bataille clé et cède du terrain face aux auteurs dans les procès pour violation de droit d'auteur liés à l’IA
un tribunal lui ordonne de divulguer des communications internes

OpenAI a subi un revers majeur dans le cadre d'un litige en cours concernant les droits d'auteur. Un juge fédéral a ordonné à l'entreprise de divulguer ses communications internes relatives à la suppression d'énormes ensembles de données contenant des livres piratés. Cette décision expose OpenAI à des dommages-intérêts potentiels de plusieurs milliards de dollars et représente une victoire importante pour les auteurs et les éditeurs qui poursuivent l'entreprise en justice. OpenAI cherche désespérément à éviter d'expliquer pourquoi il a supprimé ces ensembles de données provenant de livres piratés. L'entreprise conteste la décision du juge et a fait appel.

L'affaire porte sur deux ensembles de données appelés « Books1 » et « Books2 » qu'OpenAI aurait utilisés pour entraîner son chatbot IA ChatGPT. Ces ensembles de données contiendraient des livre provenant de Library Genesis (LibGen), une bibliothèque pirate offrant un accès gratuit à des œuvres protégées par le droit d'auteur. Selon les documents judiciaires OpenAI a supprimé les deux ensembles de données en 2022, avant le lancement de de ChatGPT.

OpenAI affirme que les bibliothèques ont été supprimées « en raison de leur non-utilisation ». Cependant, les auteurs soupçonnent qu'il y a plus que cela. Ils ont remarqué qu'OpenAI semblait faire volte-face en retirant son affirmation selon laquelle la « non-utilisation » était une raison pour les supprimer, puis en affirmant plus tard que toutes les raisons de la suppression, y compris la « non-utilisation », devaient être protégées par le secret professionnel.

Pour les plaignants, il semblait qu'OpenAI faisait rapidement marche arrière après que le tribunal a accédé à leur demande de consultation des messages internes d'OpenAI au sujet de la « non-utilisation ». Le revirement d'OpenAI n'a fait que renforcer la curiosité des auteurs quant à la manière dont OpenAI avait abordé la question de la « non-utilisation », et ils pourraient désormais découvrir toutes les raisons pour lesquelles OpenAI a supprimé les livres.

Le tribunal juge qu'OpenAI a renoncé au secret professionnel

Dans sa décision rendue le 26 novembre 2025, la juge fédérale Ona Wang du district sud de New York, affirme qu'OpenAI avait renoncé à ses revendications en matière de secret professionnel en divulguant de manière sélective les raisons de la suppression des ensembles de données. la juge a ordonné à OpenAI de remettre les documents révélant ses motivations pour supprimer les ensembles de données. L'équipe juridique interne d'OpenAI sera entendue.

Les enjeux sont considérables. Les communications internes d'OpenAI pourraient prouver une violation « délibérée » du droit d'auteur, passible d'une amende pouvant atteindre 150 000 dollars par œuvre. Cela pourrait représenter des milliards de dollars de dommages et intérêts, une facture salée pour OpenAI.

Envoyé par La juge fédérale Ona Wang

OpenAI a renoncé à son privilège en faisant de ses revendications de privilège une cible mouvante. OpenAI a changé plusieurs fois d'avis sur la question de savoir si le « non-usage » en tant que « raison » de la suppression de Books1 et Books2 était un privilège. OpenAI ne peut pas invoquer une « raison » (ce qui implique qu'il ne s'agit pas d'un privilège), puis affirmer par la suite que cette « raison » est un privilège afin d'éviter la divulgation.

« De plus, l'affirmation d'OpenAI selon laquelle toutes les raisons justifiant la suppression des ensembles de données sont confidentielles met à rude épreuve la crédulité », a conclu la juge Ona Wang, ordonnant à OpenAI de produire un large éventail de communications internes potentiellement révélateurs avant le 8 décembre 2025. OpenAI doit également mettre ses avocats internes à disposition du tribunal pour une déposition avant le 19 décembre 2025.

La décision accorde aux auteurs et aux éditeurs l'accès aux communications d'OpenAI concernant la suppression des jeux de données. L'équipe juridique d'OpenAI devra également répondre à des questions concernant les motivations qui l'ont poussée à supprimer ces données. OpenAI a fait appel de cette décision peu après son prononcé, mais une autre demande concernant les communications entre les avocats d'OpenAI et ses clients reste en suspens.

Des milliards en jeu alors que l'infraction délibérée menace

Les implications de la décision du juge Ona Wang vont bien au-delà des litiges habituels en matière de droit d'auteur. Si les communications divulguées révèlent qu'OpenAI a sciemment enfreint le droit d'auteur, la société pourrait être accusée d'infraction délibérée. En vertu de la loi sur le droit d'auteur, « une violation délibérée est passible de dommages-intérêts pouvant atteindre 150 000 dollars par œuvre, contre 750 dollars pour une violation standard ».

Avec des dizaines de millions de livres et d'articles potentiellement concernés, l'exposition financière pourrait atteindre des milliards de dollars. David Schultz, professeur à l'université Hamline, a souligné l'importance d'avoir accès aux communications des avocats. « Découvrir ce que les avocats ont dit ou ce que les clients ont dit aux avocats et vice-versa nous fournit probablement de nombreuses preuves concernant leur état d'esprit », affirme David Schultz.

Il a ajouté que « cette divulgation porterait un coup énorme à la défense d'OpenAI ». Le résultat des manœuvres juridiques désordonnées d'OpenAI : l'entreprise a effectivement ouvert la porte à des informations privilégiées lorsqu'elle a divulgué la raison derrière la suppression de l'ensemble de données.

Cette affaire suit un schéma similaire à celui du règlement conclu par la startup concurrente Anthropic avec des auteurs en août 2024. Anthropic a accepté de verser 1,5 milliard de dollars pour régler un recours collectif après que des auteurs l'ont accusée d'avoir entraîné son modèle de langage Claude sur des livres piratés provenant de la même source, Library Genesis. Anthropic a réfuté ces allégations, mais a finalement accepté un règlement à l'amiable.

Selon les documents judiciaires, Anthropic a invoqué une « pression excessive » pour éviter un procès qui aurait pu lui coûter jusqu'à 1 000 milliards de dollars de dommages et intérêts. Dans le recours actuel contre OpenAI, si le tribunal détermine que l'entreprise a détruit des preuves en prévision d'un litige, les juges pourraient, lors de futurs procès, demander aux jurys de considérer que ces preuves auraient été préjudiciables à la cause de la startup d'IA.

Le recours collectif implique de grands éditeurs et auteurs

Le procès contre OpenAI regroupe plusieurs affaires de violation du droit d'auteur déposées devant différents tribunaux fédéraux. L'Authors Guild, une organisation professionnelle regroupant des écrivains, a déposé la première plainte en septembre 2023, rejointe par 17 auteurs de renom, dont George R.R. Martin, John Grisham, Jonathan Franzen, Jodi Picoult et Elin Hilderbrand. Le groupe défend la liberté d'expression et la protection du droit d'auteur.

Le New York Times a déposé une plainte distincte en décembre 2023, accusant OpenAI d'utiliser ses articles de presse pour former des chatbots sans autorisation. OpenAI a demandé le rejet de la plainte. Mais en octobre 2024, le juge fédéral américain Sidney Stein, qui supervise les affaires regroupées, a statué que les auteurs pouvaient poursuivre leur action en justice, estimant que les résumés générés par ChatGPT enfreignaient leurs droits d'auteur.

Le juge Sidney Stein a estimé que les résumés d'œuvres telles que la série « Game of Thrones » de George Martin sont suffisamment similaires aux livres originaux pour constituer une violation du droit d'auteur. La bataille autour de la divulgation des communications internes d'OpenAI ne représente qu'un aspect des longues procédures préalables au procès. Le revers subi par OpenAI pourrait avoir des grandes implications pour la suite de la procédure.

Les auteurs et les éditeurs ont déjà eu accès à certains messages Slack d'employés discutant de la suppression des ensembles de données en question, mais ils continuent de faire pression pour obtenir une divulgation plus large des communications des avocats d'OpenAI et des processus décisionnels.

Si des preuves montrent qu'OpenAI a détruit des ensembles de données en prévision d'un litige, le tribunal pourrait imposer des sanctions supplémentaires, notamment des pénalités financières ou des limitations des moyens de défense juridiques de l'entreprise. (Pour rappel, selon les documents judiciaires, les deux chercheurs qui ont créé Books1 et Books2 ne sont plus employés par OpenAI. OpenAI a d'abord refusé de révéler l'identité des deux employés.)

Conclusion

OpenAI assure ne pas pouvoir gagner de l'argent sans utiliser gratuitement du matériel protégé par le droit d'auteur. L'entreprise déclare la course à l'IA « terminée » si l'entraînement sur des œuvres protégées par le droit d'auteur n'est pas considéré comme une utilisation équitable. Mais cette pratique menace les moyens de subsistance des auteurs et des créateurs, car OpenAI rechigne à l'idée de payer les propriétaires des œuvres protégées.

La situation crée une atmosphère de conflit avec les auteurs. La décision de la juge Ona Wang marque un tournant majeur dans les litiges autour de l’IA et du droit d’auteur. OpenAI se retrouve exposé à des risques financiers considérables et à un examen plus strict de ses pratiques internes. L'affaire pourrait créer un précédent pour l’ensemble du secteur de l’IA, incitant les entreprises à revoir la manière dont elles collectent et utilisent des contenus protégés.

Pour éviter d'être reconnue coupable de violation délibérée, OpenAI devra démontrer qu'il croyait de bonne foi en l'innocence de son action. L'entreprise fait face à une bataille difficile sur cette question. Pour l'instant, OpenAI continue d'affirmer qu'il n'a pas délibérément enfreint les droits d'auteur.

Source : décision judiciaire (PDF)

Et vous ?

Quel est votre avis sur le sujet ?

Que pensez-vous de la décision du juge dans cette affaire ?

Quelles pourraient être les implications pour l'ensemble de l'industrie de l'IA ?

Voir aussi

OpenAI a supprimé deux jeux de données utilisés pour entraîner illégalement GPT-3, ils contenaient des milliers de livres sous copyright et les employés qui avaient collecté ces données ont disparu

Un juge américain autorise une action collective à l'échelle nationale contre Anthropic pour le piratage présumé de 7 millions de livres téléchargés illégalement à des fins d'entraînement de son IA Claude

OpenAI assure ne pas pouvoir gagner de l'argent sans utiliser gratuitement du matériel protégé par le droit d'auteur et estime que « légalement, la loi sur le droit d'auteur n'interdit pas l'entraînement »

Vous avez lu gratuitement 25 932 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

OpenAI perd une bataille clé et cède du terrain face aux auteurs dans les procès pour violation de droit d'auteur liés à l'IA,

Un tribunal lui ordonne de divulguer des communications internes

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

OpenAI perd une bataille clé et cède du terrain face aux auteurs dans les procès pour violation de droit d'auteur liés à l'IA, Un tribunal lui ordonne de divulguer des communications internes

OpenAI perd une bataille clé et cède du terrain face aux auteurs dans les procès pour violation de droit d'auteur liés à l'IA,

Un tribunal lui ordonne de divulguer des communications internes