El programador y abogado Matthew Butterick demandó a Microsoft, GitHub y OpenAI, alegando que Copilot de GitHub viola los términos de las licencias de código abierto e infringe los derechos de los programadores.
GitHub Copilot, lanzado en junio de 2022, es una ayuda de programación basada en IA que utiliza OpenAI Codex para generar código fuente en tiempo real y recomendaciones de funciones en Visual Studio.
Github Copiloto ahora está disponible para JetBrains y NeoVIM
La herramienta se entrenó con aprendizaje automático utilizando miles de millones de líneas de código de repositorios públicos y puede transformar el lenguaje natural en fragmentos de código en docenas de lenguajes de programación.
Recortes de autores
Si bien Copilot puede acelerar el proceso de escritura de código y facilitar el desarrollo de software, su uso de código abierto público ha hecho que los expertos se preocupen de que viole las atribuciones y limitaciones de licencia.
Las licencias de código abierto, como las licencias GPL, Apache y MIT, requieren la atribución del nombre del autor y la definición de derechos de autor particulares.
Sin embargo, Copilot está eliminando este componente e incluso cuando los fragmentos tienen más de 150 caracteres y se toman directamente del conjunto de entrenamiento, puesto que no se otorga ninguna atribución en absoluto.
Copiloto de Github: Programación por pares mediante Inteligencia Artificial
Algunos programadores han ido tan lejos como para llamar a esto un lavado de código abierto y las implicaciones legales de este enfoque se demostraron después del lanzamiento de la herramienta de Inteligencia Artificial.
“Parece que Microsoft se está beneficiando del trabajo de otros al ignorar las condiciones de las licencias de código abierto subyacentes y otros requisitos legales”, comenta Joseph Saveri, del bufete de abogados que representa a Butterick en el litigio.
Para empeorar las cosas, las personas han informado casos de Copilot filtrando secretos publicados en repositorios públicos por error y por lo tanto, incluidos en el conjunto del aprendizaje del software, como por ejemplo claves API privadas.
La Inteligencia Artificial puede escribir código como los humanos: Hasta con sus errores
Además de las infracciones de licencia, Butterick también alega que la función de desarrollo infringe lo siguiente:
Términos de servicio y políticas de privacidad de GitHub, DMCA 1202, que prohíbe la eliminación de información de gestión de derechos de autor, la Ley de Privacidad del Consumidor de California y otras leyes que dan lugar a las reclamaciones legales relacionadas.
La demanda fue presentada ante el Tribunal Federal de Distrito del Distrito Norte de California, exigiendo la aprobación de daños estatutarios de 9,000,000,000 millones de dólares.
“Cada vez que Copilot proporciona un Producto ilegal, viola la Sección 1202 tres veces (distribuir los Materiales con licencia sin: (1) atribución, (2) aviso de derechos de autor y (3) Términos de licencia)”, esto es lo que se lee en la denuncia.
“Entonces, si cada usuario recibe solo una Salida que viola la Sección 1202 a lo largo de su tiempo usando Copilot (hasta quince meses para los primeros en adoptarlo) entonces GitHub y OpenAI han violado la DMCA 3,600,000 veces. Como daños mínimos legales de 2500 dólares por cada una de las violaciones, eso se traduciría en 9.000.000.000 de dólares”.
Dañando el código abierto
Butterick también abordó otro tema en una publicación de blog a principios de octubre, discutiendo el daño que Copilot podría causar a las comunidades de código abierto.
El programador argumentó que el incentivo para las contribuciones y la colaboración de código abierto se elimina esencialmente al ofrecer a las personas fragmentos de código y nunca decirles quién creó el código que están usando.
“Microsoft está creando un nuevo jardín amurallado que evitará que los programadores descubran las comunidades tradicionales de código abierto”, escribe Butterick.
“Con el paso del tiempo, este proceso matará de hambre a estas comunidades. La atención y el compromiso de los usuarios se alejarán […] de los proyectos de código abierto en sí mismos, lejos de sus repositorios de fuentes, sus rastreadores de problemas, sus listas de correo, sus foros de discusión.”
Butterick teme que con el tiempo suficiente, Copilot provoque el declive de las comunidades de código abierto.
Los periodistas que han podido contactar con Microsoft y GitHub, han recibido repetidamente el mismo mensaje, que es el siguiente:
“Nos hemos comprometido a innovar de manera responsable con Copilot desde el principio y continuaremos desarrollando el producto para servir mejor a los desarrolladores de todo el mundo”, atentamente GitHub.