Developpez.com - Rubrique Droit

Le Club des Développeurs et IT Pro

George R.R~? romancier de "Game of Thrones"~? John Grisham et d'autres grands auteurs américains poursuivent OpenAI pour des questions de droits d'auteur

Le 2023-09-21 08:58:38, par Jade Emy, Communiqués de presse
Une association professionnelle d'auteurs américains a intenté un procès à OpenAI devant le tribunal fédéral de Manhattan au nom d'écrivains de renom tels que John Grisham, Jonathan Franzen, George Saunders, Jodi Picoult et le romancier de "Game of Thrones" George R.R. Martin, accusant la société d'avoir illégalement entraîné son populaire chatbot ChatGPT basé sur l'intelligence artificielle à partir de leurs œuvres.

La proposition de recours collectif déposée mardi en fin de journée par l'Authors Guild s'ajoute à plusieurs autres actions intentées par des écrivains, des propriétaires de code source et des artistes visuels contre des fournisseurs d'IA générative. Outre OpenAI, soutenu par Microsoft, des actions similaires sont en cours contre Meta Platforms et Stability AI au sujet des données utilisées pour entraîner leurs systèmes d'IA. Parmi les autres auteurs concernés par ce dernier procès figurent Michael Connelly, auteur de "The Lincoln Lawyer", et David Baldacci et Scott Turow, auteurs de romans juridiques.

OpenAI et d'autres défendeurs de l'IA ont déclaré que leur utilisation de données d'entraînement tirées de l'internet constituait un usage loyal en vertu de la loi américaine sur le droit d'auteur. Un porte-parole d'OpenAI a déclaré mercredi que la société respectait les droits des auteurs et qu'elle avait "des conversations productives avec de nombreux créateurs dans le monde entier, y compris l'Authors Guild".


Mary Rasenberger, PDG de l'Authors Guild, a déclaré dans un communiqué que les auteurs "doivent avoir la possibilité de contrôler si et comment leurs œuvres sont utilisées par l'IA générative" afin de "préserver notre littérature". Dans son action en justice, l'Authors Guild affirme que les ensembles de données utilisés pour entraîner le grand modèle linguistique d'OpenAI à répondre à des invites humaines comprenaient des textes tirés des livres des auteurs, qui auraient pu provenir de dépôts illégaux de livres "pirates" en ligne.

La plainte indique que ChatGPT a généré des résumés précis des livres des auteurs lorsqu'on lui a demandé, ce qui indique que leur texte est inclus dans sa base de données. La plainte fait également état de préoccupations croissantes quant à la possibilité que les auteurs soient remplacés par des systèmes tels que ChatGPT, qui "génèrent des livres électroniques de mauvaise qualité, se font passer pour des auteurs et supplantent les livres écrits par des êtres humains".

Source : Plainte d'Authors Guild

Et vous ?

Pensez-vous que cette plainte soit légitime ou crédible ?
Quel est votre avis sur le sujet ?

Voir aussi :

Des milliers d'auteurs s'opposent à l'exploitation de leur travail sans permission ni rémunération par l'IA générative, certains ont déjà intenté des actions en justice contre OpenAI

Les auteurs veulent être reconnus et indemnisés par les entreprises d'IA qui utilisent leurs œuvres sans leur consentement, affirment des milliers de créateurs

Le syndicat SAG-AFTRA vote à l'unanimité pour étendre sa grève à l'industrie des jeux vidéo, "l'IA met nos membres en danger en réduisant leur possibilité de travailler", déclare sa présidente
  Discussion forum
97 commentaires
  • onilink_
    Membre émérite
    Envoyé par archqt
    Pas évident, moi je lis des livres, imaginons des milliers. Ensuite j'écris un livre qui tient compte de mes lectures. Quelle différence avec l'entraînement de l'IA au final ?
    Ensuite je comprends parfaitement les remarques de ceux dont les œuvres sont "pompées"
    Absolument tout... ?

    Comparer un LLM, un algorithme qui à la fâcheuse tendance à mémoriser ses entrées, mais qui ne connaît rien d'autre du monde que ces données la, avec un humain qui compresse et mémorise mal mais aussi de façon ultra subjective ses lectures tout en les mélangeant à son vécu... sérieusement?

    Cela me semble très dangereux d'essayer de faire le lien entre les deux.

    De plus il ne te faut pas une fraction de seconde pour pondre un livre. Et si tu fais du plagiat tu te prendras un procès.

    OpenAI demandent à ce que leurs magouilles deviennent juridiquement légales. Cela n'apportera rien de bon pour personne, sauf pour eux.
  • OrthodoxWindows
    Membre émérite
    Tant que GPT-4 ne bloque pas les publicités lors de son visionnage, pour Youtube ça ne devrait pas poser de problèmes.

  • _toma_
    Membre averti
    La question du comité : "Comment justifiez-vous de la légalité de votre collecte de données ?"
    La réponse d'openAI : "Nous vous assurons que cette collecte de données est loyale."

    Et la suite de leur réponse :
    L'incertitude juridique sur les implications en matière de droit d'auteur de l'entraînement des systèmes d'IA impose des coûts substantiels aux développeurs d'IA et devrait donc être résolue de manière autoritaire.
    Non mais vous êtes sérieux les gars ? Vous voulez bien faire de la thune mais vous voulez pas en dépenser donc il faudrait prendre une décision autoritaire (qui fasse abstraction de la loi ?) qui aille dans votre sens. C'est vraiment ça la réponse ? Ça me semble tellement hallucinant que je me demande si je comprends bien la phrase.
  • Leruas
    Membre éclairé
    Heureusement qu'ils n'ont pas entrainé GPT-4 sur des vidéos TikTok
  • JRM73
    Futur Membre du Club
    @archqt

    certes, mais toi, comme tu es un gars bien, tu les payes tes livres.

  • kain_tn
    Expert éminent
    Envoyé par _toma_
    La question du comité : "Comment justifiez-vous de la légalité de votre collecte de données ?"
    La réponse d'openAI : "Nous vous assurons que cette collecte de données est loyale."

    Et la suite de leur réponse :

    Non mais vous êtes sérieux les gars ? Vous voulez bien faire de la thune mais vous voulez pas en dépenser donc il faudrait prendre une décision autoritaire (qui fasse abstraction de la loi ?) qui aille dans votre sens. C'est vraiment ça la réponse ? Ça me semble tellement hallucinant que je me demande si je comprends bien la phrase.
    On ne devient pas milliardaire en dépensant de l'argent mais en demandant à ses petits copains de faire passer des lois, donner des contrats, etc. Sam Altman n'échappe pas à la règle.
  • totozor
    Membre expert
    Envoyé par Stéphane le calme
    Êtes-vous surpris de voir les IA génératives s'appuyer sur des œuvres protégées même lorsqu'elles ne sont pas mentionnées en entrée ?
    Non, si la demande réclame une chose qui n'est flaggée que sur une œuvre, elle risque fort de ressortir telle quelle ou presque.
    Cela constitue-t-il, selon vous, une violation du droit d'auteur ? Dans quelle mesure ?
    Que pensez-vous du raisonnement de Gary Marcus qui pense que le problème va toujours exister tant qu'il n'y a pas une modification de l'architecture pour permettre d'identifier les sources ?
    Que pensez-vous de l'argumentation de Zack qui indique que le cas soulevé par le New-York Times ne relève pas du droit d'auteur ?
    Je suis loin d'être un spécialiste du droit d'auteur donc il est compliqué de se prononcer mais j'ai retenu une chose de mes cours de droits : (en France) concernant les marques et logos, la "copie" n'est pas évaluée sur les différences mais sur la ressemblance.
    Zack parle du processus de copie, ce qui me semble hors de propos, si tu retranscrits un texte numérisé en le même texte numérisé ça me semble être simplement du viol de propriété intellectuelle.
    Je verrais plus une question sur l'exploitation commerciale, j'ai le droit d'imprimer mon propre Tshirt avec la couverture de Nevermind de Nirvana mais je n'ai pas le droit de le vendre.
  • Jules34
    Membre chevronné
    Personne se dit qu'en s'entrainant sur youtube un modele d'IA à plus de chambre de finir par ressembler au cousin dégénéré du moyen-âge qu'à un Leonard de Vinci 3.0 ?

    L'IA entrainé à Pewdiepie c'est le début la fin des temps.
  • maxtal
    Membre actif
    si ils viraient leurs brides idéologiques ça irait peut être déjà un peu plus loin
  • Axel Mattauch
    Membre averti
    En vertu de la loi actuelle, l'entraînement des systèmes d'intelligence artificielle constitue un usage loyal
    La loi actuelle prévoit la protection des droits d'auteur. La phrase est donc une pure esbroufe de lobbying: je te pollue le référentiel et je te conditionne pour tes décisions.

    Il est bien possible que
    les systèmes d'IA présentent d'énormes avantages potentiels pour la société
    mais cet argument pourrait à la rigueur être écouté si ces systèmes étaient d’accès publics, gratuits, pour toute individu ou toute entreprise. L'argument serait: oui, je prélève gratuitement dans le fonds de la société, disons le mot, j'exproprie de force les individus, en contrepartie la collectivité en bénéficie.

    Mais, non, nous sommes en pays capitaliste: je suis le plus fort (mon fric, mon lobbying, mes appuis politiques, la mafia a laquelle j'appartiens...) donc je m’approprie ce que je veux, il suffit de dire que c'est légal. Les bénéfices sont pour moi.