News Media Alliance poursuit la startup Cohere pour violation systématique du droit d'auteur et de la marque déposée en utilisant des articles de presse pour former son IA sans autorisation ni compensation

Le 14 février 2025 à 19:17, par Jade Emy

339PARTAGES

News Media Alliance poursuit la startup Cohere pour violation systématique du droit d'auteur et de la marque déposée en utilisant des articles de presse pour former son IA sans autorisation ni compensation.

Plus d'une douzaine de grands organes de presse américains ont annoncé qu'ils poursuivaient Cohere, une société d'IA, au motif que la startup technologique avait illégalement réutilisé leur travail et l'avait fait d'une manière qui avait terni leurs marques. L'action en justice fédérale allègue que Cohere a utilisé sans autorisation le contenu des éditeurs de la NMA pour alimenter ses produits d'IA, ce qui, selon eux, constitue une violation de la législation sur le droit d'auteur. Elle affirme que Cohere réutilise des articles complets, parfois avec les titres des journalistes, lorsqu'elle est invitée à demander un article spécifique, entrant ainsi en concurrence directe avec les éditeurs de presse.

Depuis le boom de l'intelligence artificielle (IA), les éditeurs de modèles d'IA sont confrontés à des actions en justice pour leurs pratiques. Début février 2025, Meta a fait face à des allégations selon lesquelles l’entreprise aurait téléchargé plus de 81,7 téraoctets de livres piratés pour enrichir les modèles d’IA utilisés dans ses projets. Ces accusations émanent de plusieurs auteurs et organisations défendant les droits des écrivains.

Récemment, Conde Nast et plusieurs autres entreprises de médias ont intenté une action en justice contre la société d'IA Cohere, alléguant qu'elle s'était livrée à une "violation systématique du droit d'auteur et de la marque déposée" en utilisant des articles d'actualité pour entraîner son grand modèle de langage. Dans la plainte, les plaignants déclarent : "Cohere ne se contente pas de voler nos œuvres, elle fabrique également de manière flagrante de fausses pièces qu'elle nous attribue, trompant ainsi le public et ternissant nos marques."

"Sans autorisation ni compensation, Cohere aurait utilisé des copies des articles, dans le cadre de l'entraînement, de l'utilisation en temps réel et des sorties, pour alimenter son service d'IA, qui entre en concurrence avec les offres des éditeurs et le marché émergent des licences d'IA", indique la plainte déposée auprès du tribunal de district des États-Unis pour le district sud de New York.

Conde Nast, qui possède Ars Technica et d'autres publications telles que Wired et The New Yorker, a été rejoint dans cette action en justice par The Atlantic, Forbes, The Guardian, Insider, The Los Angeles Times, McClatchy, Newsday, The Plain Dealer, Politico, The Republican, The Toronto Star et Vox Media. La plainte vise à obtenir des dommages-intérêts légaux pouvant aller jusqu'à 150 000 dollars en vertu de la loi sur le droit d'auteur pour chaque œuvre violée, ou un montant basé sur les dommages réels et les bénéfices de Cohere. Elle demande également "des dommages-intérêts réels, les bénéfices de Cohere et des dommages-intérêts légaux jusqu'au maximum prévu par la loi" pour la violation de marques et de "fausses appellations d'origine".

Les plaignants ont identifié plus de 4 000 articles dans ce qu'ils appellent une "liste illustrative et non exhaustive d'œuvres contrefaites par Cohere". D'autres pièces fournissent des réponses à des questions et des "hallucinations", qui, selon les plaignants, portent atteinte à leurs droits d'auteur et à leurs marques. Cohere « fait passer ses propres articles hallucinés pour des articles d'éditeurs ».

Cohere a déclaré en réponse : "Cohere s'en tient fermement à ses pratiques en matière de formation responsable de son IA d'entreprise. Nous avons depuis longtemps donné la priorité aux contrôles qui atténuent le risque de violation de la propriété intellectuelle et respectent les droits des détenteurs. Nous aurions apprécié une conversation sur leurs préoccupations spécifiques - et la possibilité d'expliquer notre approche axée sur l'entreprise - plutôt que d'en prendre connaissance par le biais d'une plainte. Nous pensons que cette action en justice est malavisée et frivole, et nous nous attendons à ce que cette affaire soit résolue en notre faveur".

Certaines grandes entreprises technologiques comme OpenAI et Microsoft font l'objet de poursuites judiciaires concernant l'utilisation de contenus pour l'entrainement de l'IA. Mustafa Suleyman, patron de l'IA chez Microsoft, avait déclaré que dès que l'on publie quelque chose sur le web, cela devient un "freeware" que tout le monde peut copier et utiliser librement. Il est donc d'avis qu'il est tout à fait acceptable de voler du contenu s'il se trouve sur le web ouvert et justifie ainsi l'entraînement des modèles d'IA à partir de données sous copyright.

Du côté d'OpenAI, l'éditeur de ChatGPT avait reconnu qu’il est impossible de créer des outils comme ChatGPT sans s’appuyer sur des contenus sous copyright. Dans le cadre d'une enquête de la Chambre des Lords du Royaume-Uni, OpenAI avait affirmé :"Étant donné que le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine ... il serait impossible d’entraîner les meilleurs modèles d'IA d'aujourd'hui sans utiliser des documents protégés par le droit d'auteur."

News/Media Alliance annonce une action en justice contre le vol de contenu par l'IA

Le 13 février, un groupe d'éditeurs de journaux et de magazines, dont Advance Local Media, Condé Nast, The Atlantic, Forbes Media, The Guardian, Business Insider, LA Times, McClatchy Media Company, Newsday, Plain Dealer Publishing Company, POLITICO, The Republican Company, Toronto Star Newspapers et Vox Media, tous membres de News/Media Alliance, la principale association professionnelle du secteur, a déposé une plainte pour violation de droits d'auteur et de marques dans le district sud de New York contre Cohere Inc.

Cette plainte allègue que Cohere, une société d'intelligence artificielle évaluée à plus de 5 milliards de dollars, s'est livrée à une utilisation massive et non autorisée du contenu des éditeurs pour développer et faire fonctionner ses systèmes d'intelligence artificielle génératifs. Le comportement de Cohere constitue une violation massive et systématique des droits d'auteur et des marques déposées. La plainte fournit une liste non exhaustive de milliers d'articles que Cohere a violés, par le biais de la formation, de l'utilisation en temps réel du contenu et des résultats de la contrefaçon. Les plaignants demandent une injonction permanente et des dommages-intérêts pour la contrefaçon étendue et délibérée de Cohere.

"Nous allons devant les tribunaux pour protéger nos droits. L'IA générative devenant de plus en plus répandue, il est impératif que les protections juridiques soient appliquées afin que l'innovation puisse prospérer de manière responsable. Cela permet non seulement de protéger les investissements dans le processus créatif et le développement de la propriété intellectuelle, mais aussi de soutenir la qualité de ce que les utilisateurs consomment et la durabilité des produits d'IA eux-mêmes", a déclaré Danielle Coffey, présidente-directrice générale de News/Media Alliance.

"En tant qu'éditeurs de nouvelles, de magazines et de médias, nous jouons un rôle important en informant la société et en soutenant la libre circulation des informations et des idées, mais nous ne pouvons pas continuer à le faire si des entreprises d'IA comme Cohere sont en mesure de sous-coter nos activités tout en utilisant notre propre contenu pour nous concurrencer."

Tony Hunter, président du conseil d'administration de la News/Media Alliance, a ajouté : "Pendant trop longtemps, les plateformes technologiques ont exploité le contenu de notre secteur sans autorisation ni compensation. Aujourd'hui marque un moment historique, car nos membres s'unissent pour prendre position contre l'utilisation illégale de notre propriété intellectuelle. Il s'agit d'une étape cruciale dans la protection de la valeur de notre journalisme".

"Le New Yorker, Vogue, GQ, Wired, Vanity Fair et nos nombreuses autres marques emblématiques ne peuvent pas être à la hauteur de leurs normes exceptionnelles si nous permettons que leur contenu soit volé, déformé et trafiqué. Nous défendrons nos droits avec acharnement partout où ils seront violés", a déclaré Roger Lynch, PDG de Conde Nast.

"Les protections des droits d'auteur constituent l'épine dorsale de notre écosystème médiatique et des entreprises créatives vers lesquelles nous nous tournons pour obtenir des informations et des divertissements fiables ; elles ne peuvent être ignorées sans conséquence. Il s'agit ici d'un cas de vol flagrant de notre travail original pour créer un produit commercial concurrent. Tout en saluant l'innovation technologique responsable, nous faisons savoir aux sociétés d'IA qu'elles ne sont pas au-dessus des lois et que nous ferons respecter nos droits de propriété intellectuelle", a déclaré Pam Wasserstein, présidente et vice-présidente de Vox Media.

Anna Bateson, PDG du Guardian Media Group, a déclaré : "Dans le cadre d'une approche réfléchie de l'IA générative, le Guardian a étudié et signé des accords avec de nombreux partenaires afin de garantir une rémunération et une attribution équitables pour le journalisme d'investigation primé du Guardian. Malheureusement, Cohere a démontré une tendance flagrante à gratter et à copier des articles de presse pour produire des copies intégrales du contenu original sans compensation - ou pire encore, des hallucinations complètes. Le Guardian est fier de s'associer à certains des plus grands éditeurs du monde pour tenter de mettre un terme au vol et à la déformation éhontés du journalisme original par Cohere."

Voici les principales accusations :

Cohere a utilisé des copies sans licence d'articles d'actualité et de magazines d'éditeurs dans le cadre de formations et de copies en temps réel afin de concurrencer directement les éditeurs. Cohere affirme que le "principal facteur de différenciation" de son chatbot est sa capacité à fournir des "réponses vérifiées", ce qui, d'après le produit de Cohere, inclut du contenu en temps réel extrait des éditeurs.
Cohere copie le contenu des éditeurs, parfois derrière des murs payants, et lorsque l'éditeur a explicitement empêché le robot de Cohere de faire du scraping.
Les produits de Cohere recrachent des régurgitations textuelles et des résumés substitutifs de contenus d'actualité, même lorsque l'invite ne mentionne pas un article ou une publication spécifique. La plainte fournit une liste illustrative de 4 000 exemples spécifiques.
Cohere montre sa liberté d'action avec une fonction appelée "Under the Hood", qui révèle que Cohere fait des copies intégrales, sans autorisation, des articles qui alimentent ses sorties.
Lorsqu'il ne copie pas le contenu de l'éditeur, Cohere se livre à des hallucinations préjudiciables. Cohere fournit souvent de faux articles sous le nom des éditeurs, ce qui sème la confusion dans l'esprit du public et porte atteinte aux marques précieuses des éditeurs en associant faussement ces derniers à un contenu qui n'a pas la qualité que les lecteurs attendent d'eux.

Source : Plainte

Et vous ?

Pensez-vous que cette plainte est crédible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

De nombreuses entreprises spécialisées dans l'IA ignorent le fichier robots.txt et récupèrent le contenu des sites Web, selon une société spécialisée dans la concession de licences

Thomson Reuters remporte la première décision sur l'utilisation équitable du droit d'auteur en matière d'IA. Un ancien concurrent n'est pas autorisé à copier son contenu pour créer une plateforme basée sur l'IA

Huit éditeurs de presse poursuivent Microsoft et OpenAI pour violation du droit d'auteur lors de l'entraînement de ses modèles d'intelligence artificielle

Vous avez lu gratuitement 33 194 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

News Media Alliance poursuit la startup Cohere pour violation systématique du droit d'auteur et de la marque déposée en utilisant des articles de presse pour former son IA sans autorisation ni compensation

Identifiant
Mot de passe

Mot de passe oublié ?