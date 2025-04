L'IA devant les Assises : Un procès pour l'ère algorithmique

La semaine dernière, le juge Sidney Stein du tribunal fédéral de Manhattan a rendu une décision partagée dans l'affaire opposant le New York Times à OpenAI et Microsoft. Tout en rejetant plusieurs demandes des entreprises technologiques visant à écarter des éléments clés de la plainte, il a néanmoins accepté certaines de leurs requêtes limitant partiellement la portée du litige. Parmi les arguments rejetés figuraient ceux concernant la prescription des revendications sur des œuvres de plus de trois ans et la responsabilité indirecte dans les violations alléguées de droits d'auteur.Les demandes relatives à la suppression des informations de copyright sous le régime de la Digital Millennium Copyright Act n'ont été que partiellement satisfaites, laissant ouverte une partie importante du débat juridique. Ce litige s'inscrit dans un contexte plus large où les entreprises d'IA défendent l'idée que leur utilisation de données publiques pour entraîner leurs modèles constitue une utilisation équitable au sens de la loi sur le droit d'auteur. Cette position est farouchement contestée par les détenteurs de contenus, mais la question fondamentale ne trouvera de réponse définitive qu'après une décision judiciaire claire ou une réforme législative.L'affaire, particulièrement scrutée par l'industrie médiatique, pourrait établir un précédent crucial pour les questions de propriété intellectuelle à l'ère de l'intelligence artificielle. La procédure se poursuivra par une phase de découverte, après laquelle les parties soumettront leurs arguments pour un éventuel jugement sommaire. Si cette décision devait être défavorable au Times, le journal aurait la possibilité de faire appel.Cette bataille juridique trouve son origine dans la plainte déposée par le New York Times en décembre 2023, accusant ChatGPT de violer ses droits d'auteur en reproduisant ses articles. OpenAI avait tenté de faire déclarer la plainte irrecevable pour prescription, arguant que le journal aurait dû engager des poursuites dès 2020, sachant que ses articles étaient utilisés pour entraîner l'IA. Pour étayer cette thèse, la société s'était appuyée sur un article du Times lui-même datant de novembre 2020, mentionnant qu'OpenAI analysait des milliards de mots en ligne.Le juge Stein a cependant rejeté cet argument, estimant qu'OpenAI n'avait pas démontré de manière convaincante que le Times aurait dû anticiper, dès 2020, que ChatGPT reproduirait ultérieurement ses articles de manière litigieuse. Dans son raisonnement, le magistrat a souligné que le simple fait qu'un journaliste du Times ait évoqué la formation des modèles d'IA ne signifiait pas que le journal était conscient des potentielles violations qui surviendraient des années plus tard.L'argument complémentaire d'OpenAI, selon lequel l'utilisation des articles du Times serait de "notoriété publique" depuis 2020, a également été écarté. Le juge a relevé que l'entreprise n'avait pas expliqué en quoi ces informations générales auraient dû alerter le Times sur les reproductions spécifiques qui font l'objet de la plainte. Il a particulièrement insisté sur le fait que la plainte portait sur des copies précises d'œuvres protégées, et non sur une utilisation générale des données.Dans le fond, la décision valide la position du Times selon laquelle OpenAI n'a pas apporté la preuve que le journal aurait pu connaître à l'avance le fonctionnement exact de ChatGPT avant son lancement public. Le juge a ainsi rejeté la demande de classement pour prescription, qualifiant d'« homme de paille » l'argument d'OpenAI selon lequel le Times, en tant qu'éditeur expérimenté, aurait dû agir plus rapidement contre des violations qu'il ne pouvait alors connaître.Le magistrat a toutefois laissé une porte ouverte à OpenAI, précisant que l'entreprise pourrait tenter d'établir lors de l'instruction que le Times avait effectivement connaissance des potentielles violations dès 2020. Mais à ce stade préliminaire, un rejet de la plainte lui paraissait prématuré. Cette même logique s'appliquerait à une affaire similaire impliquant le Daily News, selon le juge Stein.Davida Brook, avocate principale représentant le New York Times, a accueilli favorablement cette décision, y voyant une victoire importante pour son client. Dans une déclaration, elle a salué l'analyse minutieuse du juge et confirmé que toutes les revendications en matière de droits d'auteur contre Microsoft et OpenAI seraient maintenues. « Nous nous réjouissons de poursuivre cette action pour le vol à grande échelle de millions d'œuvres protégées du Times », a-t-elle déclaré, marquant ainsi la détermination du journal à aller jusqu'au bout de ce combat judiciaire. Le New York Times a engagé des poursuites judiciaires contre OpenAI et Microsoft , les accusant d'avoir exploité illégalement son contenu protégé. Selon le quotidien, ces géants technologiques se seraient appuyés sur des millions de ses articles pour entraîner leurs systèmes d'intelligence artificielle, causant selon lui un préjudice économique considérable qui se chiffrerait en milliards de dollars.Dans cette affaire portée devant le tribunal fédéral de Manhattan, le New York Times soutient que les chatbots développés par ces entreprises, alimentés par son contenu journalistique, représentent une menace concrète pour la profession journalistique. La plainte dénonce une utilisation massive et non autorisée d'articles protégés pour perfectionner des produits comme ChatGPT et Bing Chat, qui viendraient directement concurrencer le travail des rédactions.Le journal met particulièrement en cause les pratiques des deux entreprises, qu'il accuse d'avoir systématiquement copié son contenu pour développer leurs modèles linguistiques avancés. « Les défendeurs ont délibérément exploité notre investissement journalistique substantiel pour créer des produits concurrents, sans jamais solliciter d'autorisation ni proposer de compensation », peut-on lire dans les documents judiciaires.Cette action en justice souligne le conflit croissant entre les créateurs de contenu original et les développeurs de technologies d'IA. Le Times y voit une appropriation illicite de sa propriété intellectuelle, tandis qu'OpenAI et Microsoft défendent le principe d'utilisation équitable (fair use), estimant que leur approche relève de l'innovation technologique légitime. L'issue de ce procès pourrait établir un précédent important pour l'industrie médiatique à l'ère du numérique.En mars 2023, Microsoft a engagé une contre-offensive juridique en demandant le rejet de plusieurs chefs d'accusation formulés par le New York Times , qualifiant les craintes du journal sur l'impact de l'IA sur le journalisme indépendant de "scénario catastrophiste injustifié". Cette manœuvre procédurale intervient quelques semaines après une démarche similaire d'OpenAI visant à limiter la portée du litige.Dans un contraste frappant avec la position conflictuelle du New York Times, le Financial Times a opté pour la voie de la collaboration en signant un accord de licence avec OpenAI. Ce partenariat stratégique autorise l'utilisation des archives du célèbre quotidien économique britannique pour alimenter les algorithmes d'apprentissage des modèles génératifs d'OpenAI, ces systèmes révolutionnaires capables de reproduire des productions humaines complexes.L'essor fulgurant des technologies d'IA comme GPT s'appuie fondamentalement sur l'ingestion massive de données textuelles, incluant fréquemment des contenus protégés par des droits d'auteur. Cette pratique fait l'objet d'une contestation croissante de la part du New York Times et d'autres éditeurs, qui dénoncent une exploitation systématique de leur propriété intellectuelle sans autorisation ni contrepartie financière.L'affaire prend une tournure plus complexe avec les dernières allégations du Times concernant la disparition suspecte de preuves potentielles. Le journal accuse OpenAI d'avoir involontairement effacé des éléments cruciaux suite à un incident technique, ce qui selon lui entraverait sérieusement la démonstration des violations alléguées et l'obtention d'une réparation équitable.En avril 2024, le New York Times a intensifié son offensive contre OpenAI en révélant des pratiques controversées de collecte de données. Selon une enquête approfondie du journal, la société aurait utilisé illégalement plus d'un million d'heures de vidéos YouTube pour entraîner son modèle GPT-4. Le plus surprenant est que Google, propriétaire de YouTube via Alphabet, aurait fermé les yeux sur ces agissements - probablement parce qu'il emploierait lui-même des méthodes similaires pour ses propres modèles d'IA. Ces pratiques contreviennent non seulement aux conditions d'utilisation de YouTube, mais violent potentiellement les droits d'auteur de millions de créateurs de contenu.L'insatiable appétit des systèmes d'IA en données pose un défi majeur. Ces technologies - qu'il s'agisse de modèles d'apprentissage automatique, d'analyse prédictive ou de capacités de généralisation - reposent entièrement sur la disponibilité de masses colossales d'informations variées. Cette dépendance est telle qu'on compare souvent les données au "carburant" indispensable au développement de l'intelligence artificielle. Si les récentes avancées spectaculaires ont été possibles grâce au pillage systématique des ressources disponibles sur le web, cette manne pourrait bientôt se tarir, menaçant l'avenir même de ces technologies.Des experts sonnent l'alarme : l'industrie de l'IA se dirige droit vers une crise des données. Le New York Times a récemment documenté les méthodes parfois douteuses employées par ces entreprises pour contourner la future pénurie. Ces tactiques, qui flirtent souvent...