Un groupe d'organes de presse, emmené par le New York Times, a assigné OpenAI, le fabricant de ChatGPT, devant un tribunal fédéral mardi, lors d'une audience qui pourrait déterminer si l'entreprise technologique doit affronter les éditeurs dans un procès très médiatisé pour violation du droit d'auteur. Trois procès intentés par des éditeurs contre OpenAI et son bailleur de fonds Microsoft ont été fusionnés en une seule affaire. Le Times, le New York Daily News et le Center for Investigative Reporting mènent chacun des trois procès combinés. D'autres éditeurs, comme Associated Press, News Corp. et Vox Media, ont conclu des accords de partage de contenu avec OpenAI, mais les trois plaignants dans cette affaire prennent le chemin inverse : ils passent à l'offensive. OpenAI aurait accidentellement supprimé des preuves potentielles dans le procès intenté par le New York Times.Lors d'une audience au tribunal mardi, les avocats de Microsoft et OpenAI ont défendu la pratique des entreprises technologiques consistant à « collecter » d'énormes quantités d'articles de presse en ligne pour entraîner les grands modèles de langage utilisés par leurs chatbots, et ont exhorté un juge fédéral à rejeter diverses plaintes pour violation du droit d'auteur déposées par le New York Times, le New York Daily News et d'autres organismes de presse.
En réponse aux allégations des éditeurs selon lesquelles OpenAI et les systèmes d'IA générative de Microsoft ont illégalement copié le contenu de leurs journaux et régurgité ce contenu en réponse aux invites des utilisateurs de chatbots, les avocats des sociétés ont fait valoir que certaines plaintes pour violation des droits d'auteur fondées sur la création et l'utilisation par OpenAI d'ensembles de données d'entraînement pour GPT-2 et GPT-3 devraient être rejetées parce qu'elles sont prescrites, en vertu de la loi sur la prescription en matière de droits d'auteur.
Lors des plaidoiries mardi, Andrew Gass, avocat chez Latham & Watkins, a déclaré que le New York Times avait attendu plus de trois ans après la publication par OpenAI d'articles révélant que l'article figurait parmi les modèles d'entraînement de ChatGPT avant d'intenter une action en justice pour violation des droits d'auteur.
Gass a indiqué que la plainte du Times a été déposée plus de trois ans après la publication par le journal d'un article sur la technologie révolutionnaire d'OpenAI en matière d'IA générative.
OpenAI s'appuie sur la doctrine américaine de « l'usage loyal » pour justifier la collecte
OpenAI a fait valoir que la grande quantité de données utilisées pour entraîner son robot d'intelligence artificielle était protégée par les règles de « l'usage loyal ». Il s'agit d'une doctrine du droit américain qui autorise l'utilisation de matériel protégé par le droit d'auteur à des fins éducatives, de recherche ou de commentaire. Pour satisfaire au critère de l'usage loyal, l'œuvre en question doit avoir transformé l'œuvre protégée en quelque chose de nouveau, et la nouvelle œuvre ne peut pas concurrencer l'originale sur le même marché, entre autres facteurs.
Pour démontrer que leur utilisation du texte est transformatrice, l'équipe juridique d'OpenAI et de Microsoft a expliqué au juge Sidney Stein, nommé par le président Bill Clinton, comment fonctionnent les grands modèles de langage, comme ChatGPT.
Les avocats des deux sociétés ont expliqué que lorsque les modèles d'intelligence artificielle d'OpenAI sont alimentés en données, celles-ci sont ensuite triées en une série de « tokens », des unités qui rendent l'analyse des données plus facile à gérer. À terme, le modèle peut reconnaître des schémas.
Pour OpenAI, c'est le NYT qui a poussé ChatGPT a republier ses articles, après avoir fait de nombreuses requêtes
Néanmoins, l'audience de mardi a porté sur des réclamations accessoires en dehors de la question centrale de savoir si l'utilisation de contenus protégés par le droit d'auteur pour entraîner un modèle d'intelligence artificielle générative constitue un usage loyal en vertu de la loi sur le droit d'auteur.
OpenAI et Microsoft ont déposé des requêtes pour rejeter les plaintes, arguant de multiples défenses, notamment que les éditeurs n'ont pas déclaré que les développeurs d'IA ont contribué à la « violation du droit d'auteur par l'utilisateur final », ou qu'ils ont encouragé les utilisateurs à inciter les produits basés sur la technologie GPT à produire un contenu similaire aux articles des éditeurs.
Joseph Gratz, avocat d'OpenAI, a déclaré que ChatGPT disposait de garde-fous pour empêcher la copie en gros d...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Peut-on réellement faire confiance au code généré par l'IA sans relecture humaine ?