La formation des modèles d’IA, tels que ceux développés par OpenAI, nécessite une quantité massive de données. Cependant, Microsoft et OpenAI sont poursuivis par des éditeurs de presse pour l'utilisation de contenus protégés par le droit d'auteur dans l'entraînement de ses modèles d'IA. Des éditeurs de presse de Californie, du Colorado, de l'Illinois, de Floride, du Minnesota et de New York ont déclaré que Microsoft et OpenAI avaient utilisé des millions de leurs articles sans paiement ni autorisation pour développer des modèles d'intelligence artificielle pour ChatGPT et d'autres produits.
Récemment, OpenAI doit faire face à une nouvelle bataille juridique pour les mêmes raisons. Une large coalition de grands organes de presse canadiens, dont le Toronto Star, Metroland Media, Postmedia, The Globe and Mail, The Canadian Press et CBC, poursuit le géant technologique OpenAI, affirmant que l'entreprise utilise illégalement des articles de presse pour former son logiciel d'intelligence artificielle (IA) ChatGPT. C'est la première fois que les principaux éditeurs de presse d'un pays s'unissent pour intenter un procès à OpenAI.
La plainte, déposée devant la Cour supérieure de justice de l'Ontario, demande des dommages-intérêts punitifs, la restitution de tous les bénéfices réalisés par OpenAI grâce à l'utilisation des articles des organismes de presse, ainsi qu'une injonction interdisant à OpenAI d'utiliser les articles en question à l'avenir. Le procès vise à obtenir jusqu'à 20 000 dollars de dommages-intérêts par article utilisé par OpenAI, ce qui pourrait porter la valeur totale du procès à plusieurs milliards de dollars. Selon des rapports, OpenAI serait évaluée à 157 milliards de dollars américains après sa dernière levée de fonds auprès d'investisseurs.
La plainte accuse OpenAI d'avoir utilisé des articles sans le consentement des organismes de presse pour former ChatGPT, un chatbot d'intelligence artificielle générative qui répond aux messages et aux questions des utilisateurs.
"Pour obtenir les quantités importantes de données textuelles nécessaires à l'élaboration de ses modèles GPT, OpenAI "pille" délibérément (c'est-à-dire qu'elle accède et copie) le contenu des sites web des entreprises de médias d'information.... Elle utilise ensuite ce contenu propriétaire pour développer ses modèles GPT, sans consentement ni autorisation", affirme la plainte.
"Le journalisme est d'intérêt public. L'utilisation par OpenAI du journalisme d'autres entreprises à des fins commerciales ne l'est pas. C'est illégal", indique une déclaration commune des organisations de médias, représentées par le cabinet d'avocats Lenczner Slaght. Pour l'instant, aucune des allégations contenues dans la plainte n'a été prouvée devant les tribunaux.
"Les défendeurs se sont engagés dans un détournement continu, délibéré et non autorisé des précieux travaux des plaignants dans le domaine des médias d'information. Les plaignants intentent cette action afin d'empêcher ces activités illégales et d'obtenir un dédommagement", ajoute une autre déclaration des organismes de presse à l'encontre d'OpenAI et de plusieurs de ses filiales et sociétés affiliées.
Ce procès fait suite à d'autres procédures similaires engagées par des organismes de presse du monde entier, qui cherchent à obtenir une compensation de la part d'OpenAI pour l'utilisation de travaux publiés dans le cadre de la formation de ChatGPT, l'une des applications logicielles grand public les plus populaires qui aient jamais été produites. OpenAI a déjà signé des accords de licence avec certains médias. En juillet dernier, elle a signé un accord de licence avec l'agence de presse américaine The Associated Press. Elle a également conclu des accords avec NewsCorp et Condé Nast.
Un procès est également en cours entre le New York Times et OpenAI et son partenaire Microsoft, les avocats du journal accusant les ingénieurs d'OpenAI d'avoir effacé des preuves que les avocats du journal avaient rassemblées en vue de leur utilisation dans le procès. OpenAI a également fait l'objet de poursuites de la part de son cofondateur Elon Musk.
Fait intéressant, face à ces poursuites, OpenAI s'est défendu en assurant ne pouvoir gagner de l'argent sans utiliser gratuitement du matériel protégé par le droit d'auteur. Selon OpenAI, les matériaux disponibles dans le domaine public ne suffisent pas pour créer des modèles capables de répondre aux besoins actuels des utilisateurs. L’entreprise affirme que le droit d’auteur couvre pratiquement toutes les formes d’expression humaine, rendant ainsi indispensable l’utilisation de contenus protégés pour former des IA performantes. L'éditeur de ChatGPT a même déclaré que "légalement, la loi sur le droit d'auteur n'interdit pas l'entraînement". Une position qui a provoqué une vague de réactions négatives.
Source : Cabinet d'avocats Lenczner Slaght
Et vous ?
Pensez-vous que ces poursuites sont crédibles ou pertinentes ?
Quel est votre avis sur le sujet ?
Voir aussi :
OpenAI reproche au NYT un problème technique qui a effacé les preuves potentielles d'abus de droits d'auteur par ChatGPT et rejette toute intention malveillante
Pour le sénateur Peter Welch, si votre travail a été utilisé pour former une IA, vous devriez être indemnisé. Son projet de loi TRAIN Act vise à obliger les développeurs d'IA à plus de transparence
« Il est impossible de créer des outils comme ChatGPT sans contenus sous copyright », selon OpenAI qui suscite des réactions dont celles de fermer le service ou de l'amener à rémunérer les auteurs