OpenAI a subi un revers majeur dans le cadre d'un litige en cours concernant les droits d'auteur. Un juge fédéral a ordonné à l'entreprise de divulguer ses communications internes relatives à la suppression d'énormes ensembles de données contenant des livres piratés. Cette décision expose OpenAI à des dommages-intérêts potentiels de plusieurs milliards de dollars et représente une victoire importante pour les auteurs et les éditeurs qui poursuivent l'entreprise en justice. OpenAI cherche désespérément à éviter d'expliquer pourquoi il a supprimé ces ensembles de données provenant de livres piratés. L'entreprise conteste la décision du juge et a fait appel.L'affaire porte sur deux ensembles de données appelés « Books1 » et « Books2 » qu'OpenAI aurait utilisés pour entraîner son chatbot IA ChatGPT. Ces ensembles de données contiendraient des livre provenant de Library Genesis (LibGen), une bibliothèque pirate offrant un accès gratuit à des œuvres protégées par le droit d'auteur. Selon les documents judiciaires OpenAI a supprimé les deux ensembles de données en 2022, avant le lancement de de ChatGPT.
OpenAI affirme que les bibliothèques ont été supprimées « en raison de leur non-utilisation ». Cependant, les auteurs soupçonnent qu'il y a plus que cela. Ils ont remarqué qu'OpenAI semblait faire volte-face en retirant son affirmation selon laquelle la « non-utilisation » était une raison pour les supprimer, puis en affirmant plus tard que toutes les raisons de la suppression, y compris la « non-utilisation », devaient être protégées par le secret professionnel.
Pour les plaignants, il semblait qu'OpenAI faisait rapidement marche arrière après que le tribunal a accédé à leur demande de consultation des messages internes d'OpenAI au sujet de la « non-utilisation ». Le revirement d'OpenAI n'a fait que renforcer la curiosité des auteurs quant à la manière dont OpenAI avait abordé la question de la « non-utilisation », et ils pourraient désormais découvrir toutes les raisons pour lesquelles OpenAI a supprimé les livres.
Le tribunal juge qu'OpenAI a renoncé au secret professionnel
Dans sa décision rendue le 26 novembre 2025, la juge fédérale Ona Wang du district sud de New York, affirme qu'OpenAI avait renoncé à ses revendications en matière de secret professionnel en divulguant de manière sélective les raisons de la suppression des ensembles de données. la juge a ordonné à OpenAI de remettre les documents révélant ses motivations pour supprimer les ensembles de données. L'équipe juridique interne d'OpenAI sera entendue.
Les enjeux sont considérables. Les communications internes d'OpenAI pourraient prouver une violation « délibérée » du droit d'auteur, passible d'une amende pouvant atteindre 150 000 dollars par œuvre. Cela pourrait représenter des milliards de dollars de dommages et intérêts, une facture salée pour OpenAI.
La décision accorde aux auteurs et aux éditeurs l'accès aux communications d'OpenAI concernant la suppression des jeux de données. L'équipe juridique d'OpenAI devra également répondre à des questions concernant les motivations qui l'ont poussée à supprimer ces données. OpenAI a fait appel de cette décision peu après son prononcé, mais une autre demande concernant les communications entre les avocats d'OpenAI et ses clients reste en suspens.
Des milliards en jeu alors que l'infraction délibérée menace
Les implications de la décision du juge Ona Wang vont bien au-delà des litiges habituels en matière de droit d...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.