La semaine dernière, OpenAI a lancé avec d'enthousiasme GPT-4o, son modèle d'IA le plus puissant à ce jour. Mais l'entreprise était loin de s'imaginer que ce lancement allait très vite se transformer en cauchemar. GPT-4o prend en charge des invites sous forme de texte, d'audio, d'images et de vidéo. Le modèle introduit également un assistant vocal qu'OpenAI a commencé à intégrer à son chatbot ChatGPT. Le problème est que la voix de l'assistant, appelé Sky, ressemble beaucoup à celle de l'actrice Scarlett Johansson. Sky rappelle notamment la performance de Johansson dans le film de science-fiction Her paru en 2023.
Dans ce film, elle joue un chatbot d'IA nommé Samantha qui tombe amoureux d'un homme solitaire. OpenAI venait-il d'imiter son rôle et sa voix ? Officiellement, OpenAI a répondu par la négative. Mais Johansson a lâché une bombe ensuite : les dirigeants de l'entreprise avaient en fait demandé la permission d'utiliser sa voix l'année dernière. Elle a dit non. OpenAI a réitéré sa demande seulement deux jours avant le lancement de Sky. Johansson affirme avoir dit non. Mais ils l'ont fait quand même fait. Pire encore, le PDG d'OpenAI, Sam Altman, a lui-même fait référence à ces similitudes dans un billet publié sur X.
Selon des spécialistes en propriété intellectuelle, cela ne fait qu'aggraver la situation. Ils estiment qu'OpenAI pourrait subir des conséquences juridiques pour avoir créé une voix qui ressemble beaucoup à celle de Johansson, que l'entreprise l'ait fait intentionnellement ou non. Johansson s'est dite choquée par ce comportement, mais l'on ignore si elle envisage de poursuivre OpenAI en justice. « Il y a quelques actions qu'elle peut entreprendre. Mais la jurisprudence soutient sa position », a déclaré Purvi Patel Albers, partenaire du cabinet d'avocats Haynes Boone, expert en matière de marque et de droit d'auteur.
Selon l'expert juridique, Johansson et d'autres célébrités peuvent invoquer les lois sur le droit à l'image, qui protègent les caractéristiques d'identification d'une personne contre l'utilisation sans son autorisation. « Si vous détournez le nom, l'image ou la voix d'une personne, vous risquez de violer son droit à l'image », affirme Albers. De plus, Ryan Calo, professeur de droit à l'université de Washington, a été plus direct : « il s'agit d'un cas très solide d'appropriation de l'image ». James Grimmelmann, professeur de droit numérique et de droit de l'Internet à l'université Cornell, et plusieurs autres experts juridiques partagent cet avis.
« Vous ne pouvez pas imiter la voix distinctive de quelqu'un d'autre pour vendre des produits », a déclaré Grimmelmann. Il existe des précédents d'actions en justice intentées par des célébrités pour appropriation de leur image avant l'avènement de l'IA. Un exemple notable est celui du chanteur Tom Waits. Il avait poursuivi avec succès la marque de chips Doritos pour avoir utilisé un imitateur dans une publicité radiophonique qui imitait sa voix distincte, profonde et rauque. La chanteuse et actrice Bette Midler a poursuivi le constructeur automobile Ford pour avoir fait appel à un tiers pour qu'il l'imite dans une publicité.
Bette Midler avait refusé l'offre de l'entreprise de jouer elle-même dans la publicité. Les deux affaires, portées devant les tribunaux californiens, ont été tranchées en faveur des célébrités. « Les victoires de Midler et de Waits "ont des implications claires pour les clones vocaux de l'IA », déclare Christian Mammen, avocat spécialisé dans le droit de la propriété intellectuelle. Bien sûr, les choses ne se passent pas toujours comme prévu. Lindsay Lohan a tristement tenté de poursuivre Rockstar Games parce qu'elle prétendait qu'un personnage de GTA 5 était son portrait craché ; et elle a perdu. Elle n'a pas su prouver ses allégations.
Toutefois, selon les experts juridiques, l'affaire Johannson semble avoir beaucoup plus de poids. « Ce qui importe avant tout, c'est de savoir s'ils ont essayé de faire en sorte que cela ressemble à ScarJo [Scarlett Johansson ]. La preuve qu'ils l'ont fait est très solide », explique Calo. Les raisons pour lesquelles Altman a voulu recontacter Johansson si peu de temps avant la présentation n'est pas claire. Mais selon des experts juridiques, il est probable qu'Altman et OpenAI étaient conscients de la ressemblance entre les deux voix et savaient qu'ils risquaient d'avoir des ennuis, mais ont publié Sky pour essayer de forcer les choses.
Pour certains avocats, le message posté par Altman sur X peu après le lancement de Sky est un élément important qui pourrait être utilisé pour démontrer que l'entreprise a tenté d'obtenir une voix similaire à celle de Johansson. Altman est un véritable fanboy de Her, qu'il considère comme l'un de ses films de science-fiction préférés. Le jour de la mise à jour de ChatGPT, il a posté sur X le seul mot "her", qui est presque certainement un lien avec le film. Il s'agit peut-être d'une erreur légendaire. Mais dans sa déclaration, Johannson a déclaré que le message posté par Altman ce jour-là indique que la similitude est intentionnelle.
Pour rappel, Johannson était suffisamment déterminée pour poursuivre Disney avec succès dans un passé pas si lointain. L'affaire était en rapport avec sa performance dans le film Black Widow, mais les deux parties ont trouvé un accord. Johansson n'a pas encore décidé de poursuivre OpenAI, mais elle a déclaré avoir engagé un conseiller juridique pour rédiger des lettres à l'intention d'OpenAI afin de demander des explications sur la manière dont la voix de Sky a été créée. OpenAI réfute les allégations selon lesquelles il aurait copié la voix de l'actrice.
OpenAI affirme qu'il n'avait pas l'intention de faire ressembler la voix de Sky à celle de Johansson, mais cela ne protège pas nécessairement l'entreprise. Selon Albers, même si OpenAI n'a pas explicitement mentionné Johansson, les consommateurs soulignaient déjà les similitudes. À tout cela, s'ajoute le commentaire d'Altman sur X. Selon Albers, cela pourrait alimenter l'opinion du public selon laquelle la voix est censée imiter celle de Johansson. OpenAI a retiré la voix de Sky pour le moment, ce qui pourrait apaiser les inquiétudes de Johansson.
Mais Albers estime qu'OpenAI pourrait attiser l'ire de Johansson si la voix de Sky était réintégrée et qu'elle ressemblait toujours à celle de l'acteur. « La question que nous devons nous poser est la suivante : pourquoi OpenAI a-t-elle fait cela ? Johansson est connue pour défendre ses droits, elle n'hésitera donc pas à aller à l'encontre de ces derniers », déclare Albers. Certains critiques affirment qu'OpenAI voulait s'affranchir des lois et s'octroyer le droit de copier les voix des acteurs comme l'entreprise l'avait fait auparavant avec les artistes et les auteurs.
OpenAI ne s'attendait pas à ce que la situation prenne une tournure aussi critique. Altman a déclaré que le fait que la voix soit maintenant suspendue est un geste de respect envers l'actrice. Il a ajouté que la voix a été enregistrée par OpenAI avant le premier contact avec Johansson. OpenAI affirme que les voix utilisées dans ChatGPT proviennent d'acteurs vocaux rémunérés. Cinq d'entre eux ont été sélectionnés à partir d'un groupe initial de 400 et c'est une pure coïncidence que l'actrice anonyme derrière la voix de Sky ait un ton similaire à celui de Johansson.
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous des avis des professionnels du droit sur ce que risque OpenAI dans cette affaire ?
Pensez-vous qu'OpenAI a copié délibérément la voix de l'actrice Scarlett Johansson ? S'agit-il d'une pure coïncidence ?
Peut-on empêcher l'IA de copier les voix de personnes réelles alors qu'elle est formée sur des données vocales produites par des humains ?
Voir aussi
Sam Altman et OpenAI ont promis de consacrer 20 % de la puissance de calcul de l'entreprise à la lutte contre les formes d'IA malveillantes, mais n'ont jamais tenu cette promesse
OpenAI suspend la voix de ChatGPT qui ressemble à celle de Scarlett Johansson dans 'Her' et déclare : L'IA "ne devrait pas délibérément imiter la voix distinctive d'une célébrité"
Comment les voix de ChatGPT ont été choisies : OpenAI a travaillé avec des professionnels du casting et de la réalisation de premier plan pour réduire plus de 400 candidatures avant de sélectionner les 5 voix