La News Media Alliance (NMA) ha acusado a las empresas de inteligencia artificial (IA) de participar en actividades ilegales de extracción de datos para entrenar sus grandes modelos de lenguaje (LLM).
En un libro blanco de 77 páginas y documentos adjuntos presentados a la Oficina de Derechos de Autor de los Estados Unidos, la NMA destacó la inquietante tendencia de violación de derechos de autor por parte de los chatbots de IA, enfatizando que una parte significativa de los datos utilizados para entrenar estos modelos de IA provienen de publicaciones de noticias con derechos de autor.
Violación de derechos de autor por parte de chatbots de IA
Las acusaciones de la NMA giran en torno al uso no autorizado de contenido protegido por derechos de autor por parte de los desarrolladores de IA. Sostienen que los chatbots de IA no solo obtienen datos ilegalmente, sino que también compiten directamente con los medios de comunicación al proporcionar “respuestas narrativas a las consultas de búsqueda”.
Esta competencia directa, argumentan, aleja a los consumidores de las fuentes de noticias, lo que en última instancia afecta los ingresos de los medios de comunicación.
La presentación de la NMA subraya que los desarrolladores de IA están cosechando ganancias sustanciales sin asumir los riesgos asociados con la información de noticias. Esta situación, tal y como se describe en el informe, es anómala y señala con el dedo a destacados modelos de IA generativa como Bing Chat, Bard, Claude y ChatGPT por presuntamente infringir los derechos de autor de los editores de noticias.
En palabras de la NMA, “Los miembros de la Alianza de Noticias/Medios están profundamente preocupados por este uso no autorizado e ilegal de su contenido expresivo por parte de las grandes empresas tecnológicas. Estas empresas no asumen el costo o el riesgo de informar las noticias o producir contenido creativo, sino que capitalizan ese valioso trabajo”.
Empresas rentables de IA y valoraciones crecientes
La NMA también destaca las crecientes valoraciones de los principales desarrolladores de IA que se han beneficiado del uso de contenido de terceros no autorizado. Empresas como OpenAI y Anthropic han sido testigos de cómo sus capitalizaciones bursátiles se han disparado, con ingresos a raudales, incluso después de haber comenzado inicialmente como organizaciones de investigación sin ánimo de lucro.
El cambio hacia las suscripciones pagas ha contribuido a sus ganancias financieras sustanciales.
Buscar una solución a través del diálogo
En lugar de recurrir a los litigios, la NMA ha expresado su intención de proseguir el diálogo como medio para resolver estas controversias. Reconocen que la IA generativa tiene varios beneficios potenciales para el periodismo. Los miembros de la NMA han expresado su disposición a debatir soluciones razonables de concesión de licencias para facilitar un acceso fiable y actualizado a contenidos expresivos fiables. Creen que este enfoque beneficiaría a todas las partes implicadas y a la sociedad en su conjunto.
En su declaración, la NMA declaró: “En particular, los miembros de la NMA están listos para sentarse a la mesa y discutir soluciones razonables de licencias para facilitar el acceso confiable y actualizado a contenido expresivo confiable, algo que beneficiará a todas las partes interesadas y a la sociedad en general, en lugar de participar en litigios para proteger sus derechos”.
Las empresas de IA se han enfrentado a desafíos legales por parte de los titulares de derechos de autor que las han llevado a los tribunales por presuntas violaciones de derechos de autor. Empresas como Meta, Anthropic AI y OpenAI se han visto involucradas en demandas colectivas, a menudo invocando el uso legítimo como defensa contra estas acciones legales.
Convergencia de blockchain e IA para mejorar la recopilación de datos
En medio de estas crecientes preocupaciones en torno a la IA y la propiedad intelectual, los expertos han sugerido que la convergencia de la tecnología blockchain y la IA podría mejorar el estado de la recopilación de datos por parte de las empresas de IA. Este enfoque teórico postula que la cadena de bloques podría usarse para identificar contenido generado por IA y, al mismo tiempo, proporcionar trazabilidad para los datos de entrenamiento utilizados en los LLM.
La intersección de blockchain e IA promete crear un ecosistema transparente y responsable en el que se puedan verificar los orígenes de los datos y el contenido, lo que podría mitigar los problemas relacionados con la infracción de los derechos de autor y el raspado de datos.
Las acusaciones de la News Media Alliance contra los chatbots de IA por extracción ilegal de datos y violaciones de derechos de autor subrayan la creciente tensión entre la tecnología de IA y los medios de comunicación tradicionales. A medida que los desarrolladores de IA continúan beneficiándose del contenido generado por IA, las organizaciones de noticias están preocupadas por las implicaciones financieras de esta competencia.
La voluntad de la NMA de buscar una solución a través del diálogo y explorar soluciones para la concesión de licencias sugiere el deseo de encontrar un terreno común y equilibrar los intereses de todas las partes involucradas.
A medida que continúa el debate sobre la ética y la legalidad del uso de datos de IA, la convergencia de blockchain e IA surge como una solución potencial para abordar estos desafíos y garantizar un ecosistema de recopilación de datos justo y transparente.
Es probable que el resultado de estas discusiones tenga implicaciones significativas para el futuro de la IA y el periodismo.