Suchir Balaji était cité comme détenant des preuves accablantes sur OpenAI

Suchir Balaji avait déclaré qu'il était de plus en plus désillusionné par OpenAI

OpenAI a confirmé qu'il s'appuie sur des œuvres protégées par le droit d'auteur

Selon les récits sur Suchir Balaji , il était très apprécié par ses anciens collègues d'OpenAI. Un cofondateur d'OpenAI a même déclaré récemment que Suchir Balaji avait joué un rôle essentiel dans le développement de certains des produits d'IA générative de l'entreprise. « Les contributions de Suchir à ce projet ont été essentielles, et le projet n'aurait pas abouti sans lui », a déclaré John Schulman, cofondateur d'OpenAI, dans un hommage sur Suchir Balaji.John Schulman, qui a recruté Suchir Balaji dans son équipe, a déclaré que ce qui avait fait de lui un ingénieur et un scientifique exceptionnel était son souci du détail et sa capacité à remarquer des bogues subtils ou des erreurs logiques. « Il avait le don de trouver des solutions simples et d'écrire des codes élégants qui fonctionnaient. Il réfléchissait soigneusement et rigoureusement aux détails des choses », peut-on lire dans le message de John Schulman.Par la suite, Suchir Balaji s'est consacré à l'organisation des énormes ensembles de données utilisés pour former GPT-4, la quatrième génération du grand modèle de langage (LLM) phare d'OpenAI et la base du célèbre chatbot de la société. C'est ce travail qui a amené Suchir Balaji à s'interroger sur la technologie qu'il avait contribué à mettre au point, en particulier après que les éditeurs et les créateurs de contenus ont commencé à poursuivre OpenAI en justice.OpenAI est accusé de violation de droit d'auteur par les plaignants, qui réclament des lois pour protéger leurs moyens de subsistance contre l'essor de l'IA. Suchir Balaji partageait l'avis de ces travailleurs. Il a d'abord fait part de ses préoccupations au New York Times, qui les a rapportées dans un portrait de Suchir Balaji publié en octobre 2024. Le New York Times poursuit également OpenAI pour utilisation non autorisée de ses articles de presse par ChatGPT. Suchir Balaji a ensuite déclaré à l'Associated Press qu'il essaierait de témoigner dans les affaires de violation de droits d'auteur les plus sérieuses et qu'il considérait le procès intenté par le New York Times comme « le plus sérieux ». Les avocats du Times l'ont cité dans un dossier déposé au tribunal le 18 novembre 2024 comme quelqu'un qui pourrait avoir des « documents uniques et pertinents » démontrant la violation délibérée du droit d'auteur par OpenAI.Il n'a pas été auditionné par les tribunaux et l'on ne sait pas dans quelle mesure ses déclarations seront admises comme preuves dans les affaires judiciaires après sa mort. Il a également publié un billet de blogue personnel dans lequel il fait part de ses opinions sur le sujet.Les dossiers de Suchir Balaji ont également été demandés par des avocats dans un procès distinct intenté par des auteurs de livres, dont la comédienne Sarah Silverman. « Il n'est pas normal de s'entraîner sur les données des gens et de leur faire concurrence sur le marché. Je ne pense pas que vous devriez être en mesure de faire cela. Je ne pense pas qu'il soit possible de le faire légalement », a expliqué Suchir Balaji à l'Associated Press fin octobre 2024.Il a déclaré à l'Associated Press qu'il était de plus en plus désillusionné par OpenAI, en particulier après les troubles internes qui ont conduit son conseil d'administration à licencier le PDG, Sam Altman, en 2023, avant le réembaucher. Suchir Balaji a déclaré qu'il était globalement préoccupé par la manière dont ses produits commerciaux étaient déployés, notamment par leur propension à diffuser des informations erronées, connues sous le nom d'hallucinations.Mais parmi les nombreux problèmes qui le préoccupent, il a déclaré qu'il se concentrait sur les droits d'auteur, car « il était réellement possible de faire quelque chose ». Suchir Balaji a reconnu qu'il s'agissait d'une opinion impopulaire au sein de la communauté des chercheurs en IA, qui a l'habitude de puiser des données sur Internet. Cela dit, Suchir Balaji a ajouté que les chercheurs en IA vont finir par changer d'avis et que c'est une question de temps.John Schulman, qui a démissionné d'OpenAI en août 2024, a déclaré que Suchir Balaji et lui avaient quitté OpenAI le même jour, par coïncidence, et qu'ils avaient fêté leur départ avec d'autres collègues le soir même, en dînant et en buvant un verre dans un bar de San Francisco. Un autre des mentors de Suchir Balaji, le cofondateur et scientifique en chef Ilya Sutskever, avait quitté OpenAI quelques mois plus tôt, ce qui a motivé le départ de Suchir Balaji.John Schulman a déclaré que Suchir Balaji lui avait fait part, au début de l'année, de son intention de quitter OpenAI et qu'il ne pensait pas qu’une IA meilleure que l'homme était à portée de main, comme le reste de l'entreprise semblait le croire. « Le jeune ingénieur a exprimé son intérêt pour l'obtention d'un doctorat et l'exploration d'idées plus éloignées des sentiers battus sur la manière de construire l'intelligence », a déclaré John Schulman.Ces dernières années, les capacités des chatbots d'IA, comme ChatGPT d'OpenAI, se sont considérablement améliorées ; ils s'appuient sur de grands modèles de langage (LLM) pour produire du contenu pour les utilisateurs. Mais le processus de formation est largement controversé, certains éditeurs accusant OpenAI d'utiliser des œuvres protégées par des droits d'auteur sans autorisation, et un certain nombre d'affaires juridiques sont en cours.Défendant ses pratiques commerciales dans un récent procès, OpenAI a déclaré : « les modèles apprennent, comme nous le faisons tous, de ce qui a été fait auparavant. La défense de l'usage équitable existe précisément pour cette raison : encourager et permettre le développement de nouvelles idées qui s'appuient sur des idées antérieures ». Cette défense d'OpenAI est conforme aux précédentes déclarations de l'entreprise sur la formation de ses modèles.En janvier 2024, OpenAI affirmait : « étant donné que le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine, il serait impossible d’entraîner les meilleurs modèles d'IA d'aujourd'hui sans utiliser des documents protégés par le droit d'auteur ». OpenAI reconnaît donc ouvertement qu'il utilise des contenus protégés par des droits d'auteurs pour créer ses modèles d'IA . L'entreprise n'a toutefois pas encore été condamnée. Plusieurs éditeurs de presse ont poursuivi Microsoft et OpenAI pour violation du droit d'auteur . Parmi les poursuivants, on peut noter les éditeurs de presse de Californie, du Colorado, de l'Illinois, de Floride, du Minnesota et de New York. Certains procès sont en cours, mais le 7 novembre 2024, le juge de district américain Colleen McMahon, à New York, a rejeté une poursuite contre OpenAI qui avait été intentée par les médias Raw Story et AlterNet.Selon les experts, la porte de sortie de la situation semble résider dans la conclusion d’accords de licence avec les éditeurs de presse. L'Associated Press et OpenAI ont conclu un accord de licence permettant à OpenAI d'accéder à une partie des archives textuelles du média. Mais ces accords sont controversés.Source : billet de blogue Quel est votre avis sur le sujet ?Que pensez-vous du décès subit de l'ancien ingénieur d'OpenAI devenu lanceur d'alerte ?Ses révélations seront-elles d'une quelconque utilité dans les affaires judiciaires en cours contre OpenAI ?