Le Center for Investigative Reporting (CIR) est un organe de presse à but non lucratif basé San Francisco qui produit les médias Mother Jones et Reveal. L'organisation à but non lucratif a déposé jeudi une plainte contre OpenAI et son partenaire Microsoft devant un tribunal fédéral de New York. L'action en justice porte sur la manière dont les résumés d'articles générés par l'IA menacent les éditeurs, ce que le CIR qualifie d'exploitation. Elle marque un nouveau front dans la bataille juridique qui oppose OpenAI et les organes de presse, qui luttent contre l'utilisation non autorisée de leurs contenus en ligne pour former l'IA.
L'action en justice accuse OpenAI et Microsoft, qui détient près de la moitié de la startup d'IA, d'avoir violé à plusieurs reprises le Copyright Act et le Digital Millennium Copyright Act (DMCA). La plainte allègue qu'OpenAI a utilisé le contenu du CIR sans autorisation et sans offrir de compensation à cette dernière, violant ainsi les droits d'auteur sur le journalisme de l'organisation. Elle a décrit les activités d'OpenAI comme "fondées sur l'exploitation d'œuvres protégées par le droit d'auteur". « C'est extrêmement dangereux », a expliqué Monika Bauerlein, directrice générale de l'organisation à but non lucratif, à l'Associated Press (AP).
Elle a ajouté : « notre existence repose sur le fait que les utilisateurs trouvent notre travail précieux et décident de le soutenir. Lorsque les gens ne peuvent plus développer cette relation avec notre travail, lorsqu'ils ne rencontrent plus Mother Jones ou Reveal, leur relation est alors avec l'outil d'IA. Cela réduira à néant les fondements de notre existence en tant que salle de rédaction indépendante, tout en menaçant l'avenir d'autres organismes de presse ». Mother Jones et CIR ont été fondés dans les années 1970 et ont fusionné au début de cette année. Ils sont tous deux basés à San Francisco, en Californie, tout comme OpenAI.
L'action en justice du CIR, également connu pour son podcast Reveal et son émission de radio, souligne les dépenses liées à la production de journalisme d'investigation et prévient que la perte du contrôle du contenu protégé par le droit d'auteur entraînera la baisse des revenus et une diminution du nombre de reporters chargés de rapporter des histoires importantes dans "le paysage médiatique actuel". Dans un communiqué publié jeudi, Bauerlein a déclaré :
Envoyé par Monika Bauerlein
L'été dernier, plus de 4 000 écrivains ont signé une lettre adressée aux PDG d'OpenAI, Sam Altman, et d'autres entreprises technologiques, les accusant de violation de droits dans le processus de construction des chatbots. Bauerlein appelle à agir rapidement contre ce comportement. « Il ne s'agit pas d'une ressource gratuite que ces entreprises d'IA peuvent ingérer et sur laquelle elles peuvent gagner de l'argent. Elles paient des bureaux, de l'électricité, des salaires pour leurs employés. Pourquoi le contenu qu'ils ingèrent serait-il la seule chose qu'ils ne paient pas ? », a déclaré Bauerlein à propos des médias d'information.
Alors que le CIR se joint à des éditeurs comme le New York Times, le New York Daily News, The Intercept, AlterNet et le Chicago Tribune pour poursuivre OpenAI, d'autres éditeurs ont choisi de conclure des accords de licence avec le laboratoire d'IA. Ces accords permettront à OpenAI de former ses modèles sur des archives et des contenus continus publiés par ces éditeurs et de citer des informations provenant de ces derniers dans les réponses proposées par ChatGPT. À travers ses accords de licence, ces organismes de presse vont être rémunérés par OpenAI pour l'accès à l'accès à leurs contenus pour une durée déterminée.
Le dernier en date est Time, qui a annoncé jeudi qu'OpenAI aurait accès à ses vastes archives des 101 dernières années. Le mois dernier, OpenAI a signé un accord pluriannuel de 250 millions de dollars avec News Corp, le propriétaire du Wall Street Journal, pour avoir l'autorisation de former ses modèles sur plus d'une douzaine de marques appartenant à l'éditeur. Le Financial Times, Axel Springer (propriétaire de Politico et Business Insider), The Associated Press et Dotdash Meredith ont également signé des accords de licence avec OpenAI. Petit à petit, OpenAI réussit à se mettre dans la poche les plus grands éditeurs de presse.
OpenAI et d'autres grands développeurs d'IA ne divulguent généralement pas leurs sources de données, mais ont fait valoir que le fait de prendre des textes, des images et d'autres médias en ligne accessibles au public pour former leurs logiciels d'IA est protégé par la doctrine de l'usage loyal de la loi américaine sur le droit d'auteur. L'action en justice du CIR indique qu'un ensemble de données qu'OpenAI a reconnu avoir utilisé pour construire une version antérieure de sa technologie de chatbot contenait des milliers de liens vers le site Web de Mother Jones, un magazine imprimé vieux de 48 ans qui publie en ligne depuis 1993.
Le mois dernier, huit éditeurs de presse de Californie, du Colorado, de l'Illinois, de Floride, du Minnesota et de New York ont poursuivi Microsoft et OpenAI pour violation du droit d'auteur lors de la formation de leurs modèles. Les plaignants exploitent le New York Daily News, le Chicago Tribune, l'Orlando Sentinel, le Sun Sentinel en Floride, le Mercury News en Californie, le Denver Post, l'Orange County Register en Californie et le Pioneer Press dans le Minnesota.
Tous ces journaux sont la propriété du fonds spéculatif Alden Global Capital. L'action en justice allègue qu'OpenAI avait utilisé des ensembles de données contenant du texte provenant de leurs journaux pour former ses modèles de langage GPT-2 et GPT-3. OpenAI et Microsoft n'ont pas commenté l'action en justice du CIR.
Source : document de la plainte (PDF)
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous des allégations du CIR contre OpenAI et Microsoft ?
Est-il possible que le CIR obtienne gain de cause dans cette affaire ? Pourquoi ?
Le paysage d'informations tel qu'on le connaît est-il en voie de disparition ? Quels sont les risques ?
Voir aussi
Huit éditeurs de presse poursuivent Microsoft et OpenAI pour violation du droit d'auteur lors de l'entraînement de ses modèles d'intelligence artificielle
Le New York Times poursuit OpenAI et Microsoft pour violation des droits d'auteur, affirmant que des "millions d'articles" ont été utilisés pour former des chatbots
Microsoft et OpenAI poursuivis en justice par des auteurs pour avoir violé leurs droits d'auteur, en incluant plusieurs de leurs livres dans les données utilisées pour entraîner des programmes d'IA