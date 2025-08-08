Dans le cadre de la bataille juridique qui oppose actuellement le New York Times à OpenAI, la société spécialisée dans l'IA a proposé de donner accès à 20 millions de conversations d'utilisateurs issues de sa plateforme ChatGPT dans le cadre d'une procédure de divulgation dans le cadre d'un procès pour violation de droits d'auteur aux enjeux considérables. Le Times, cependant, réclame une divulgation beaucoup plus large (120 millions de conversations) afin de vérifier si le système d'IA a reproduit mot pour mot ses articles protégés par le droit d'auteur. Cette demande souligne la tension entre les droits de propriété intellectuelle et les vastes écosystèmes de données qui alimentent l'IA générative.
Début 2025, un groupe d'organes de presse, emmené par le New York Times, a assigné OpenAI, l'éditeur de ChatGPT, devant un tribunal fédéral, lors d'une audience qui pourrait déterminer si l'entreprise technologique doit affronter les éditeurs dans un procès très médiatisé pour violation du droit d'auteur. Trois procès intentés par des éditeurs contre OpenAI et son bailleur de fonds Microsoft ont été fusionnés en une seule affaire.
Le Times, le New York Daily News et le Center for Investigative Reporting mènent chacun des trois procès combinés. D'autres éditeurs, comme Associated Press, News Corp. et Vox Media, ont conclu des accords de partage de contenu avec OpenAI, mais les trois plaignants dans cette affaire prennent le chemin inverse : ils passent à l'offensive. OpenAI aurait accidentellement supprimé des preuves potentielles dans le procès intenté par le New York Times.
Le procès, intenté par le New York Times fin 2023, accuse OpenAI et son partenaire Microsoft d'avoir utilisé illégalement le contenu du journal pour former ChatGPT, ce qui pourrait coûter des milliards de dollars en dommages et intérêts. Alors que l'affaire progresse devant la cour fédérale américaine, l'accent est désormais mis sur la collecte de preuves, le Times cherchant à obtenir des journaux détaillés afin de quantifier les cas de reproduction directe de ses articles.
Le conflit sur la portée des données et les méthodes d'échantillonnage
OpenAI fait valoir que la remise de 120 millions de conversations constituerait une charge excessive et un « cauchemar en matière de confidentialité », comme le détaille son propre article de blog sur la réponse aux demandes de données, accessible via le site officiel d'OpenAI. L'entreprise propose plutôt un échantillon aléatoire de 20 millions d'interactions, qui, selon elle, représenterait statistiquement les résultats de la plateforme sans compromettre la confidentialité des utilisateurs à grande échelle. Les experts juridiques considèrent qu'il s'agit d'un conflit classique en matière de divulgation, dans lequel les plaignants cherchent à obtenir des données complètes pour étayer leur dossier, tandis que les défendeurs cherchent à limiter leur exposition.
Le Times rétorque qu'un échantillon plus petit pourrait ne pas permettre de saisir des cas rares mais critiques de violation, et insiste pour obtenir un ensemble plus large afin de procéder à une analyse approfondie. Cette pression intervient alors qu'une décision de justice oblige OpenAI à conserver toutes les données des utilisateurs de ChatGPT, y compris les conversations supprimées, soulignant le rôle du pouvoir judiciaire dans l'équilibre entre les besoins en matière de preuve et les réalités opérationnelles.
Le débat a amplifié les inquiétudes concernant la confidentialité des données dans le domaine de l'IA, le PDG d'OpenAI, Sam Altman, avertissant que les conversations des utilisateurs ne bénéficient d'aucune protection juridique et pourraient faire l'objet de poursuites judiciaires. Les utilisateurs partagent souvent des informations personnelles sensibles avec ChatGPT, en supposant qu'elles resteront confidentielles, mais le procès révèle comment ces données pourraient être utilisées comme arme devant les tribunaux.
Les acteurs du secteur craignent que cela ne sape la confiance dans les outils d'IA, ce qui incite à réclamer des mesures de protection des données plus strictes. OpenAI a souligné son engagement en faveur de la confidentialité, déclarant dans ses documents que la conservation indéfinie des données des utilisateurs est contraire à ses politiques, mais l'ordonnance de conservation du tribunal l'oblige à s'y conformer, ce qui pourrait créer un précédent pour de futurs litiges liés à l'IA.
L'affaire qui oppose le New York Times à OpenAI ne se limite plus à une simple question de droit d'auteur. Elle révèle une tension bien plus fondamentale : peut-on sacrifier la vie privée des utilisateurs sur lautel de la justice ? À la suite dune décision de justice favorable au NYT, le journal va pouvoir examiner des journaux de conversation supprimés de ChatGPT, dans le cadre de son action en justice contre OpenAI. Derrière cette victoire judiciaire se cache une réalité beaucoup plus trouble, où les principes de confidentialité, de suppression volontaire des données, et même de légalité internationale, vacillent dangereusement.
Au fur et à mesure que l'affaire évolue, elle pourrait influencer la manière dont les entreprises d'IA traitent les données d'entraînement et les interactions avec les utilisateurs à l'échelle mondiale. La position agressive du Times, qui exige non seulement les conversations, mais aussi des informations sur le fonctionnement interne de ChatGPT, reflète des poursuites similaires contre des entreprises d'IA, annonçant une vague de responsabilisation en matière d'utilisation du contenu.
Si le juge se range du côté d'OpenAI et limite la divulgation, cela pourrait rationaliser la découverte dans les affaires technologiques, mais une décision en faveur du Times pourrait contraindre les développeurs d'IA à revoir leurs pratiques en matière de données, ce qui augmenterait les coûts et la surveillance. Les analystes prédisent que ce litige, détaillé dans les discussions sur Slashdot, façonnera l'avenir de l'IA générative, où l'innovation se heurte aux limites rigides du droit d'auteur.
Les négociations entre les parties se poursuivent, OpenAI faisant appel de certains aspects de l'ordonnance de conservation des données. L'issue pourrait dépendre du témoignage d'experts concernant la validité de l'échantillonnage statistique pour prouver la contrefaçon. En fin de compte, ce procès illustre les difficultés croissantes liées à l'adoption de l'IA, opposant les géants des médias aux innovateurs technologiques dans une lutte pour la valeur des données. Alors que les tribunaux naviguent en terrain inconnu, leurs décisions pourraient redéfinir la confidentialité, la propriété intellectuelle et le déploiement éthique des technologies d'IA pour les années à venir.
