Plus d'une douzaine de grands organes de presse américains ont annoncé qu'ils poursuivaient Cohere, une société d'IA, au motif que la startup technologique avait illégalement réutilisé leur travail et l'avait fait d'une manière qui avait terni leurs marques. L'action en justice fédérale allègue que Cohere a utilisé sans autorisation le contenu des éditeurs de la NMA pour alimenter ses produits d'IA, ce qui, selon eux, constitue une violation de la législation sur le droit d'auteur. Elle affirme que Cohere réutilise des articles complets, parfois avec les titres des journalistes, lorsqu'elle est invitée à demander un article spécifique, entrant ainsi en concurrence directe avec les éditeurs de presse.Depuis le boom de l'intelligence artificielle (IA), les éditeurs de modèles d'IA sont confrontés à des actions en justice pour leurs pratiques. Début février 2025, Meta a fait face à des allégations selon lesquelles l’entreprise aurait téléchargé plus de 81,7 téraoctets de livres piratés pour enrichir les modèles d’IA utilisés dans ses projets. Ces accusations émanent de plusieurs auteurs et organisations défendant les droits des écrivains.
Récemment, Conde Nast et plusieurs autres entreprises de médias ont intenté une action en justice contre la société d'IA Cohere, alléguant qu'elle s'était livrée à une "violation systématique du droit d'auteur et de la marque déposée" en utilisant des articles d'actualité pour entraîner son grand modèle de langage. Dans la plainte, les plaignants déclarent : "Cohere ne se contente pas de voler nos œuvres, elle fabrique également de manière flagrante de fausses pièces qu'elle nous attribue, trompant ainsi le public et ternissant nos marques."
"Sans autorisation ni compensation, Cohere aurait utilisé des copies des articles, dans le cadre de l'entraînement, de l'utilisation en temps réel et des sorties, pour alimenter son service d'IA, qui entre en concurrence avec les offres des éditeurs et le marché émergent des licences d'IA", indique la plainte déposée auprès du tribunal de district des États-Unis pour le district sud de New York.
Conde Nast, qui possède Ars Technica et d'autres publications telles que Wired et The New Yorker, a été rejoint dans cette action en justice par The Atlantic, Forbes, The Guardian, Insider, The Los Angeles Times, McClatchy, Newsday, The Plain Dealer, Politico, The Republican, The Toronto Star et Vox Media. La plainte vise à obtenir des dommages-intérêts légaux pouvant aller jusqu'à 150 000 dollars en vertu de la loi sur le droit d'auteur pour chaque œuvre violée, ou un montant basé sur les dommages réels et les bénéfices de Cohere. Elle demande également "des dommages-intérêts réels, les bénéfices de Cohere et des dommages-intérêts légaux jusqu'au maximum prévu par la loi" pour la violation de marques et de "fausses appellations d'origine".
Les plaignants ont identifié plus de 4 000 articles dans ce qu'ils appellent une "liste illustrative et non exhaustive d'œuvres contrefaites par Cohere". D'autres pièces fournissent des réponses à des questions et des "hallucinations", qui, selon les plaignants, portent atteinte à leurs droits d'auteur et à leurs marques. Cohere « fait passer ses propres articles hallucinés pour des articles d'éditeurs ».
Cohere a déclaré en réponse : "Cohere s'en tient fermement à ses pratiques en matière de formation responsable de son IA d'entreprise. Nous avons depuis longtemps donné la priorité aux contrôles qui atténuent le risque de violation de la propriété intellectuelle et respectent les droits des détenteurs. Nous aurions apprécié une conversation sur leurs préoccupations spécifiques - et la possibilité d'expliquer notre approche axée sur l'entreprise - plutôt que d'en prendre connaissance par le biais d'une plainte. Nous pensons que cette action en justice est malavisée et frivole, et nous nous attendons à ce que cette affaire soit résolue en notre faveur".
Certaines grandes entreprises technologiques comme OpenAI et Microsoft font l'objet de poursuites judiciaires concernant l'utilisation de contenus pour l'entrainement de l'IA. Mustafa Suleyman, patron de l'IA chez Microsoft, avait déclaré que dès que l'on publie quelque chose sur le web, cela devient un "freeware" que tout le monde peut copier et utiliser librement. Il est donc d'avis qu'il est tout à fait acceptable de voler du contenu s'il se trouve sur le web ouvert et justifie ainsi l'entraînement des modèles d'IA à partir de données sous copyright.
Du côté d'OpenAI, l'éditeur de ChatGPT avait reconnu qu’il est impossible de [URL="https://intelligence-artificielle.developpez.com/actu/352783/-Il-est-impossible-de-creer-des-outils-comme-ChatGPT-sans-contenus-sous-copyright-selon-OpenAI-qui-suscite-des-reactions-dont-celles-de-fermer-le-service-ou-de-l-amener-a-remunerer-les...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.