Le député américain Adam Schiff a dévoilé mercredi un projet de loi intitulé : Generative AI Copyright Disclosure Act (loi sur la divulgation des droits d'auteur en matière d'IA générative). Ce projet de loi vise à contraindre les entreprises d'IA comme OpenAI et Google à dresser la liste complète des œuvres protégées par le droit d'auteur qu'elles utilisent pour créer des systèmes d'IA générative. La proposition de loi de Schiff intervient alors que les créateurs de contenu humains - les artistes, les scénaristes, les écrivains, les organes de presse - dénoncent les multiples violations de leurs droits d'auteur par les entreprises d'IA.
Dans un communiqué, Schiff explique : « l'IA a le potentiel de bouleverser notre économie, notre système politique et notre vie quotidienne. L'IA a le potentiel de bouleverser notre économie, notre système politique et notre vie quotidienne. Nous devons trouver un équilibre entre l'immense potentiel de l'IA et le besoin crucial de lignes directrices et de protections éthiques. Il s'agit de respecter la créativité à l'ère de l'IA et de marier le progrès technologique à l'équité ». Mais cette proposition risque de faire face à une opposition farouche au Congrès, car les précédentes tentatives ont déjà fait l'objet de nombreux blocages.
Certains opposants craignent en effet qu'une réglementation trop stricte ralentisse le rythme d'expansion de la technologie, ce qui pourrait donner un avantage à des pays comme la Russie et la Chine. La proposition de loi de Schiff vient s'ajouter à un nombre croissant de tentatives de la part de législateurs, de médias et d'artistes pour déterminer comment les entreprises d'IA utilisent des œuvres créatives (chansons, œuvres d'art visuel, livres, films, etc.) pour former leurs logiciels. Ils cherchent en outre à déterminer si ces entreprises construisent illégalement leurs outils à partir de matériels protégés par des droits d'auteurs.
S'il est adopté, le projet de loi de Schiff changera radicalement la donne pour l'industrie. Chaque entreprise d'IA sera tenue de soumettre à l'autorité compétente un document qui recense toutes les œuvres protégées par le droit d'auteur utilisées dans le processus de formation de son modèle. L'entreprise doit faire cette divulgation au moins 30 jours avant le lancer publiquement de son outil d'IA, sous peine de se voir infliger une sanction financière. La proposition de Schiff a déjà obtenu le soutien de groupe et de syndicats du secteur des médias, tels que la Recording Industry Association of America et la Writers Guild of America.
« Tout ce qui est généré par l'IA provient en fin de compte d'une source créative humaine. C'est la raison pour laquelle le contenu créatif humain - la propriété intellectuelle - doit être protégé. SAG-AFTRA soutient pleinement la loi sur la divulgation des droits d'auteur en matière d'IA générative, car cette législation constitue une étape importante pour garantir que la technologie soit au service des personnes et non l'inverse », a déclaré Duncan Crabtree-Ireland, directeur exécutif national et négociateur en chef de la SAG-AFTRA, un syndicat américain représentant plus de 160 000 professionnels des médias du monde entier.
Il convient de souligner que la proposition de Schiff n'interdirait pas à l'entraînement des modèles sur des œuvres protégées par le droit d'auteur, mais elle imposerait aux entreprises de dresser la liste des œuvres qu'elles utilisent pour créer des outils comme ChatGPT et Gemini. Ces données qui sont généralement tenues secrètes. Selon les critiques, cette culture du secret autour de la nature des données d'entraînement signifie que les entreprises d'IA reconnaissent indirectement qu'elles utilisent les matériels protégés par des droits d'auteur pour entraîner leurs outils, sans avoir obtenu l'autorisation des créateurs.
À ce propos, la proposition de Schiff ne vise pas uniquement les nouveaux systèmes d'IA. Les règles du projet de loi seraient rétroactives et obligeraient les systèmes d'IA générative déjà sur le marché à révéler où ils ont obtenu les informations utilisées pour entraîner leurs modèles. Mira Murati, directrice technique d'OpenAI, a récemment déclaré qu'elle ne savait pas si l'outil Sora de l'entreprise utilisait des données provenant de YouTube, de Facebook ou d'Instagram. Mais un récent rapport du New York Times allègue que l'entreprise a transcrit illégalement plus d'un million de vidéos YouTube pour entraîner ses modèles d'IA.
OpenAI, Anthropic, Stability AI, Microsoft, Google, etc. font l'objet de nombreuses actions en justice pour avoir prétendument utilisé des œuvres protégées par le droit d'auteur pour créer leurs modèles. Par exemple, l'actrice Sarah Silverman et le New York Times ont déposé des plaintes pour violation des droits d'auteur contre OpenAI. Selon le Washington Post, OpenAI a engagé une série d'avocats de haut niveau au cours de l'année écoulée, alors qu'il s'apprête à faire face à plus d'une douzaine d'actions en justice importantes. En outre, de nombreux artistes poursuivent également la startup pour violation de droit d'auteur.
Les sanctions prévues par le projet de loi ne sont pas claires, le Bureau américain du droit d'auteur déterminera le montant de l'amende infligée aux entreprises. Elle dépendra de la taille de l'entreprise et de ses antécédents en matière de non-respect de la loi. Les amendes commenceraient à 5 000 $ et augmenteraient ensuite. La proposition du député américain ne fixe pas de plafond à l'amende maximale qui peut être imposée. Selon certains analystes, le projet de loi de Schiff pourrait amener à une certaine responsabilisation des entreprises d'IA et les contraindre à rémunérer les propriétaires des contenus protégés.
En dressant la liste des œuvres protégées utilisées pour la formation, les détenteurs de droits d'auteur pourraient s'assurer qu'ils ont donné leur autorisation pour l'utilisation de leur contenu et qu'ils ont été indemnisés pour cette utilisation. Les entreprises d'IA nient toute faute et affirment que leur utilisation du matériel protégé par le droit d'auteur relevait de l'usage loyal. Cette stratégie juridique constitue un test majeur pour la loi sur le droit d'auteur, et le résultat pourrait mettre à mal les moyens de subsistance des artistes ou les résultats financiers d'OpenAI.
Dans un mémoire présenté à une commission gouvernementale britannique au début de l'année, les avocats d'OpenAI ont affirmé que légalement, la loi sur le droit d'auteur n'interdit pas la formation. Le document indique que, sans accès aux œuvres protégées par le droit d'auteur, ses outils cesseraient de fonctionner.
Sources : communiqué de presse, Generative AI Copyright Disclosure Act (PDF)
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous du projet de loi Generative AI Copyright Disclosure Act ?
Les dispositions de cette proposition de loi protègent-elles les détenteurs de droit d'auteur ?
Quels impacts la divulgation du matériel protégé par le droit d'auteur pourrait-elle avoir sur les entreprises d'IA ?
Ce projet de loi a-t-il des chances d'être voté après l'échec des précédentes tentatives du Congrès américain visant à réglementer l'IA ?
Voir aussi
Les législateurs européens adoptent la première loi importante pour réglementer l'IA dans le monde, mais elle pourrait potentiellement rendre le marché européen peu attrayant pour l'IA
Des milliers d'artistes accusent Midjourney d'avoir utilisé leurs œuvres pour former un modèle d'IA, l'industrie de l'IA exploite sans vergogne le travail créatif des individus pour ses propres gains
ChatGPT : un projet de loi de l'UE pourrait obliger les outils d'IA à révéler le matériel protégé par le droit d'auteur, utilisé dans la construction de leurs systèmes