Des éditeurs de presse de Californie, du Colorado, de l'Illinois, de Floride, du Minnesota et de New York ont déclaré que Microsoft et OpenAI avaient utilisé des millions de leurs articles sans paiement ni autorisation pour développer des modèles d'intelligence artificielle pour ChatGPT et d'autres produits. La manœuvre intervient suite à une sortie d’OpenAI dans laquelle le créateur de ChatGPT reconnaît qu’il est impossible de créer des outils de ce genre sans contenus sous copyright. La porte de sortie de la situation semble résider dans la conclusion d’accords de licence avec les éditeurs de presse.
Huit éditeurs de presse américains ont intenté une action en justice contre Microsoft et OpenAI devant un tribunal fédéral de New York. Ils affirment que les entreprises technologiques réutilisent leurs articles sans autorisation dans des produits d'intelligence artificielle générative et leur attribuent à tort des informations inexactes.
Le groupe de huit éditeurs de journaux s'oppose à ChatGPT et à l'assistant Copilot de Microsoft, disponible dans le système d'exploitation Windows, le moteur de recherche Bing et d'autres produits du fabricant de logiciels. ChatGPT et Copilot ont « volé des millions d'articles protégés par le droit d'auteur des éditeurs sans autorisation et sans paiement », selon la plainte, qui a été déposée auprès du tribunal de district des États-Unis pour le district sud de New York.
Les éditeurs de presse derrière la plainte exploitent le New York Daily News, le Chicago Tribune, l'Orlando Sentinel, le Sun Sentinel en Floride, le Mercury News en Californie, le Denver Post, l'Orange County Register en Californie et le Pioneer Press dans le Minnesota. Tous ces journaux sont la propriété du fonds spéculatif Alden Global Capital.
Les éditeurs de presse déclarent dans l'action en justice que OpenAI avait utilisé des ensembles de données contenant du texte provenant de leurs journaux pour entraîner ses grands modèles linguistiques GPT-2 et GPT-3, qui peuvent produire du texte en réponse à une saisie humaine de quelques mots.
Les éditeurs ajoutent que Microsoft copiait les informations de leurs journaux pour l'index de recherche Bing, ce qui permet d'éclairer les réponses dans le Copilot. Mais ces informations ne fournissent pas toujours des liens vers les sites web des journaux, où il est possible d'afficher des publicités à côté des articles ou de payer des abonnements.
Cette bataille juridique intervient quatre mois après que le New York Times a poursuivi OpenAI pour violation des droits d'auteur dans le chatbot ChatGPT que la startup a lancé à la fin de 2022. Dans un billet de blog publié en janvier, OpenAI a déclaré que l'affaire n'était pas fondée, ajoutant qu'elle souhaitait soutenir "un écosystème de l'information sain". Le même mois, Sam Altman, PDG d'OpenAI, a déclaré que la startup souhaitait payer le New York Times et qu'elle avait été surprise d'apprendre l'existence de ce procès.
Au cours des derniers mois, OpenAI a signé des accords avec une poignée de sociétés de médias, dont Axel Springer et le Financial Times, ce qui permet à la startup soutenue par Microsoft de puiser dans le contenu des éditeurs pour améliorer les modèles d'IA.
Google, qui possède son propre chatbot généraliste pour répondre aux questions des utilisateurs, a déclaré en février qu'il avait conclu un accord avec Reddit qui lui donne le droit d'entraîner des modèles d'intelligence artificielle sur le contenu de la plateforme.
Source : plainte
Et vous ?
Quelles sont les implications de l’utilisation du contenu journalistique pour entraîner des modèles d’IA ?
Comment cet accord pourrait-il changer la manière dont nous consommons les actualités à l’avenir ?
Quels avantages un éditeur de presse peut-il tirer de ce partenariat avec OpenAI ?
En quoi la collaboration entre les médias et l’IA peut-elle améliorer l’expérience des lecteurs ?
Quelles mesures de sécurité doivent être mises en place pour protéger le contenu et la marque du FT ?
Comment les organisations de presse peuvent-elles s’assurer que l’IA ne compromet pas l’intégrité du journalisme ?
Quel rôle les lecteurs peuvent-ils jouer pour influencer l’avenir de l’IA dans le journalisme ?
Quels défis le FT et OpenAI pourraient-ils rencontrer dans la mise en œuvre de cet accord ?
Comment cet accord pourrait-il influencer la création de contenu par les journalistes ?
Quel est le potentiel de l’IA pour générer des nouvelles qui sont non seulement informatives mais aussi engageantes et créatives ?
Voir aussi :
Le New York Times envisage d'initier une action en justice contre OpenAI pour l'obliger à effacer les données d'entraînement de ChatGPT, le média dit non à l'usage de son contenu sans son accord
Musk s'engage à poursuivre Microsoft en justice, l'accusant de s'être « entraînée illégalement avec les données de Twitter », tandis qu'elle abandonne l'intégration de Twitter de sa plateforme pub
Des auteurs de livres poursuivent OpenAI en justice, affirmant que la société a abusé de leurs travaux pour former ChatGPT. Selon eux, les livres sont un « ingrédient clé » du chabot IA
Huit éditeurs de presse poursuivent Microsoft et OpenAI pour violation du droit d'auteur lors de l'entraînement de ses modèles d'intelligence artificielle
Huit éditeurs de presse poursuivent Microsoft et OpenAI pour violation du droit d'auteur lors de l'entraînement de ses modèles d'intelligence artificielle
Le , par Patrick Ruiz
Une erreur dans cette actualité ? Signalez-nous-la !