IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

La Free Software Foundation financera des articles sur les problèmes liés à Copilot, l'outil d'IA controversé de GitHub
Pour sa reproduction aveugle des blocs de code

Le , par Stéphane le calme

82PARTAGES

15  0 
Copilot a été lancé en fin juin dans le cadre d'une Preview technique sur invitation uniquement, promettant de faire gagner du temps en répondant au code des utilisateurs par ses propres suggestions intelligentes. Ces suggestions sont basées sur des milliards de lignes de code public dont les utilisateurs ont publiquement contribué à GitHub, en utilisant un système d'IA appelé Codex de la société de recherche OpenAI.

Si Copilot représente un gain de temps considérable que certains qualifient de « magique », d'autres développeurs se montrent sceptiques, craignant que l'outil ne permette de contourner les exigences en matière de licence pour le code source ouvert et de violer les droits d'auteur des utilisateurs individuels.

Armin Ronacher, un éminent développeur de la communauté open source, est l’un des développeurs qui ont été frustrés par la façon dont Copilot a été construit. Il a expérimenté l’outil, a publié une capture d'écran sur Twitter, en trouvant étrange que Copilot, un outil d'intelligence artificielle qui est commercialisé, puisse produit du code protégé par le droit d'auteur.

Fonctionnement de GitHub Copilot

GitHub décrit Copilot comme l'équivalent IA de la « programmation en paire », dans laquelle deux développeurs travaillent ensemble sur un seul ordinateur. L'idée est qu'un développeur peut apporter de nouvelles idées ou repérer des problèmes que l'autre développeur aurait pu manquer, même si cela nécessite plus d'heures de travail.

Dans la pratique, cependant, Copilot est plutôt un outil utilitaire de gain de temps, qui intègre les ressources que les développeurs devraient autrement chercher ailleurs. Lorsque les utilisateurs saisissent des données dans Copilot, l'outil leur suggère des extraits de code à ajouter en cliquant sur un bouton. Ainsi, ils n'ont pas à passer du temps à chercher dans la documentation de l'API ou à rechercher des exemples de code sur des sites comme StackOverflow.


Un réseau neuronal dans GitHub Copilot est entraîné à l'aide de volumes massifs de données, constituées du code : des millions de lignes téléchargées par les 65 millions d'utilisateurs de GitHub, la plus grande plateforme au monde permettant aux développeurs de collaborer et de partager leur travail. Le but est que Copilot en apprenne suffisamment sur les modèles de code pour pouvoir faire du hacking lui-même. Il peut prendre le code incomplet d'un partenaire humain et terminer le travail en ajout les parties manquantes. Dans la plupart des cas, il semble réussir à le faire. GitHub prévoit de vendre l'accès à l'outil aux développeurs.

Comme pour la plupart des outils d'IA, GitHub souhaite également que Copilot devienne plus intelligent au fil du temps en fonction des données qu'il collecte auprès des utilisateurs. Lorsque les utilisateurs acceptent ou rejettent les suggestions de Copilot, son modèle d'apprentissage automatique utilisera ce retour d'information pour améliorer les suggestions futures, de sorte que l'outil deviendra peut-être plus humain à mesure qu'il apprendra.

Vives réactions de la communauté open source

Peu après le lancement de Copilot, certains développeurs ont commencé à s'alarmer de l'utilisation d'un code public pour entraîner l'IA de l'outil. L'une des préoccupations est que si Copilot reproduit des parties suffisamment importantes du code existant, il pourrait violer les droits d'auteur ou blanchir le code open source dans des utilisations commerciales sans licence appropriée. L'outil peut également recracher des informations personnelles que les développeurs ont publiées, et dans un cas, il a reproduit le code largement cité du jeu PC Quake III Arena de 1999, y compris le commentaire du développeur John Carmack.

L’utilisateur Hogan a aussi ajouté dans son fil de discussion : « Ce qui serait vraiment drôle, c'est que les gens qui maintiennent des dépôts populaires commençaient à mettre du mauvais code exprès ».

GitHub affirme que les dérapages de Copilot sont rares. Mais un autre utilisateur de Twitter, répondant au post de Ronacher, a écrit : « Et ici nous avons la preuve directe que GitHub reproduit directement un morceau de code sous GPL, ce qui prouve que c'est un outil vraiment dangereux à utiliser dans des environnements commerciaux ». Dans une autre réponse, on peut lire : « Lol, c'est du blanchiment de code… ».

La réaction de la Free Software Foundation

« GitHub de Microsoft a récemment annoncé un nouveau service appelé Copilot. Ce service utilise l'apprentissage automatique pour aider à suggérer des extraits de code aux développeurs lorsqu'ils écrivent des logiciels. GitHub a entraîné ce réseau de neurones avec le code hébergé sur GitHub*; alors que la Free Software Foundation (FSF) exhorte les développeurs de logiciels libres à ne pas héberger leur code sur GitHub, beaucoup le font, et même beaucoup qui n'y voient pas leur travail reflété par d'autres.

« Nous savons déjà que Copilot tel qu'il est est inacceptable et injuste, de notre point de vue. Il nécessite l'exécution d'un logiciel qui n'est pas gratuit (Visual Studio ou des parties de Visual Studio Code) et Copilot est un service en tant que substitut logiciel. Ce sont des questions réglées en ce qui nous concerne.

« Cependant, Copilot soulève de nombreuses autres questions qui nécessitent un examen plus approfondi.

« La Free Software Foundation a reçu de nombreuses demandes de renseignements sur notre position sur ces questions. Nous pouvons voir que l'utilisation par Copilot de logiciels sous licence libre a de nombreuses implications pour une très grande partie de la communauté du logiciel libre. Les développeurs veulent savoir si la formation d'un réseau de neurones sur leur logiciel peut vraiment être considérée comme une utilisation équitable. D'autres personnes susceptibles d'être intéressées par l'utilisation de Copilot se demandent si les extraits de code et autres éléments copiés à partir des référentiels hébergés sur GitHub pourraient entraîner une violation du droit d'auteur. Et même si tout peut être juridiquement satisfaisant, les militants se demandent s'il n'y a pas quelque chose de fondamentalement injuste à ce qu'une société de logiciels propriétaires construise un service à partir de leur travail.

« Avec toutes ces questions, dont beaucoup ont des implications juridiques qui, à première vue, n'ont peut-être pas été testées auparavant devant un tribunal, il n'y a pas beaucoup de réponses simples. Pour obtenir les réponses dont la communauté a besoin et identifier les meilleures opportunités pour défendre la liberté des utilisateurs dans cet espace, la FSF annonce un appel financé à des livres blancs sur Copilot, le droit d'auteur, l'apprentissage automatique et les logiciels libres.

« Nous lirons les livres blancs soumis et nous publierons ceux qui, selon nous, contribueront à élucider le problème. Nous offrirons une récompense monétaire de 500 $ pour les articles que nous publions.

« Nous examinerons également les demandes de financement pour faire d'autres recherches menant à un article ultérieur ».

Source : Free Software Foundation

Et vous ?

Que pensez-vous de Copilot ?
Que pensez-vous de la démarche de GitHub ?

Une erreur dans cette actualité ? Signalez-le nous !

Avatar de Mingolito
Membre extrêmement actif https://www.developpez.com
Le 03/09/2021 à 17:22
Le triomphe du politiquement correct dans toute sa splendeur

Si on en arrive au fait que les mot Israël ou Palestine sont devenus "offensant" alors la je suis certains que c'est devenu n'importe quoi.

Je préfère avant du temps de Coluche ou de Desproges quand on pouvais encore dire ou écrire des conneries librement, c'était le bon temps...
30  1 
Avatar de 23JFK
Membre expert https://www.developpez.com
Le 03/09/2021 à 19:20
C'est quoi cette merde ? Tu fais un jeu sur la seconde guerre mondiale, manifestement il y aura du nazi dans le code.
18  1 
Avatar de calvaire
Membre expert https://www.developpez.com
Le 03/09/2021 à 21:53
Citation Envoyé par JPLAROCHE Voir le message
bonjour,
Tombé sur la tête .... voilà quand les extrêmes s'appliquent.
blaklist (noir sur fond noir) le mot noir n’appartiens pas à une ethnie par exemple....... etc....

à moins qu'ils soient devenu racialisé bref du n'importe-quoi c'est pareil dans la féminisation des mots, avez remarqué comment les femmes n'utilise pas les mots au féminin c'est impressionnant.

donc tous les mots dans l’argot informatique des divers langage vont être révisés !!!!!!!!! alors il faut réécrire la bible car celle écrite (populaire n'est fait qu'avec 2000 mots pour cause d’illettrisme) et le pti beur de banlieue il en dit quoi rien à branlé... en parlant son jargon. Et ne pensée pas que je soit raciste car j'ai lutter et me bat encore contre le racisme (et fait casser le nez physiquement) mais quand le politique fait de la politique pour elle même on arrive a des aberrations.
dans mes tests unitaires, je prend un truc qui m'inspire pour faire le scénario de teste (titanic, taliban, hitler...) en fonction de ce que je vois passer sur bfm.

Apres pour les créateurs de jeux oui forcément y'a des trucs comme ca dans le code, si le jeu contient des "salopes" (duke nuken 3d) il est je pense intelligent d'appeler une fonction associé a ce personnage "bitche_machintruc", si j'ai hitler qui parle (wolfenstein) il semble logique d'appeler la piste audio Hitler_speech.mp3 ou Fuhrer_speech.mp3 (HOI4 ou Wolfenstein par exemple)
Si j'ai l'ia de ben laden à coder je vais c'réer une fonction ben_laden_ia() (postal 2)
C'est indispensable pour comprendre le code.

dans un logiciel de gestion ce serait étrange de retrouver ces choses par contre.
9  0 
Avatar de JPLAROCHE
Membre éprouvé https://www.developpez.com
Le 03/09/2021 à 19:43
bonjour,
Tombé sur la tête .... voilà quand les extrêmes s'appliquent.
blaklist (noir sur fond noir) le mot noir n’appartiens pas à une ethnie par exemple....... etc....

à moins qu'ils soient devenu racialisé bref du n'importe-quoi c'est pareil dans la féminisation des mots, avez remarqué comment les femmes n'utilise pas les mots au féminin c'est impressionnant.

donc tous les mots dans l’argot informatique des divers langage vont être révisés !!!!!!!!! alors il faut réécrire la bible car celle écrite (populaire n'est fait qu'avec 2000 mots pour cause d’illettrisme) et le pti beur de banlieue il en dit quoi rien à branlé... en parlant son jargon. Et ne pensée pas que je soit raciste car j'ai lutter et me bat encore contre le racisme (et fait casser le nez physiquement) mais quand le politique fait de la politique pour elle même on arrive a des aberrations.
7  0 
Avatar de byrautor
Membre éclairé https://www.developpez.com
Le 10/09/2021 à 10:20
" peut être remplacé par "Hydra", ça a déjà été démontré ! "
Aspartam de quoi as tu peur ?
Vous les jeunes, car j'imagine que tu es jeune (j'ai 89 ans), ne supportez plus rien.
Effectivement après le "lavage de cerveau" des "enseignements modernes" qui "démontrent" l'indémontrable la réalité est devenue virtualité.
nazi, noir, résistant, terroriste, il y en a des milliers comme cela qui me sont insupportables (la moitié de ma famille dont mon père sont morts en 1944), mais si je les supprime de mon langage en créant un autre langage la réalité reste !
Un peu de courage que diable, ah Diable : voilà un mot à supprimer du dictionnaire çà sent les Religions.
Relisez un peu Voltaire SVP !
6  0 
Avatar de Aspartame
Membre confirmé https://www.developpez.com
Le 03/09/2021 à 19:35
Citation Envoyé par 23JFK Voir le message
C'est quoi cette merde ? Tu fais un jeu sur la seconde guerre mondiale, manifestement il y aura du nazi dans le code.
peut être remplacé par "Hydra", ça a déjà été démontré .
5  0 
Avatar de Christian.BG
Futur Membre du Club https://www.developpez.com
Le 10/09/2021 à 9:34
Que l'on utilise des termes pour désigner des fonctions, des variables, des noms de programmes faisant appel à des notions de couleur (noir, blanc, rouge, jaune...), de pays (Israel, Palestine, Nigeria...) de genre (homme, femme, enfant, fille, garçon...) ne me semble pas porter atteinte à la probité des uns et des autres. Ici, on atteint juste des sommets dans l'intolérance, le politiquement correct qui en devient très incorrect comme l'écriture inclusive qui est une hérésie. Ce ne sont pas les termes qu'il faut juridiciser, mais le contexte de leur utilisation Et dans ce cas, il sera difficile même pour de l'IA d'en déterminer la teneur, surtout que le sens n'est pas identique en fonction des pays, des langues et même parfois, localement dans un pays.
5  0 
Avatar de jmsei
Membre régulier https://www.developpez.com
Le 10/09/2021 à 14:38
Le monde anglo-saxon est malade et névrosé, il relève de plus en plus de la psychiatrie.
Le problème avec eux c'est qu'ils cherchent à infester le monde dans tous les domaines avec leur maladie mentale.
Tous systèmes ou toutes applications qui auraient la prétention de me dicter ce que je dois penser et qui voudront m'imposer leurs délires seront boycottés.
Je ne travaillerai jamais pour une entreprise qui pratique l'infamie de l'écriture "inclusive" et toutes les dérives de la bien pensance nord américaine.
6  1 
Avatar de cdubet
Membre confirmé https://www.developpez.com
Le 10/09/2021 à 7:20
Politiquement correct a l americaine appliqué au monde entier
Juste pour info, l escalave ca n a pas concerné que les noirs et de loin !
Pensez aux romains quilors de la conquete de la gaule ont transformé certains de nos ancetres en esclaves
Ou simplement au mot "slave" (le gros de leurs esclaves venait de l est ...)

Quand on en arrive a bruler des tintin & asterix en public car ils donnent une mauvaise images des indiens c est que quelque chose ne tourne pas rond

Il y a des moments ou je me dit que les chinois ont finalement pas tord quand ils nous trouvent decadent
4  0 
Avatar de LuNaTiC93
Membre à l'essai https://www.developpez.com
Le 11/09/2021 à 2:55
Je n'aurais jamais cru que la décadence aurait pu à ce point atteindre un domaine technique comme l'informatique et la programmation mais venant des etatsuniens qui sont quoi qu'on en dise des anglosaxons et par conséquent des fous rien ne m'étonne. A une époque quand un malade nous parlait de ses délires on lui faisait une électrothérapie, maintenant les entreprises prennent en compte ce qu'ils disent ce qui explique l'état actuel de notre société occidentale qui sombre petit à petit dans tous les domaines pendant que les chinois eux consacrent leur temps et leur énergie à des vrais problématiques techniques, mais bon eux ne sont pas "inclusifs"
4  0