Newsletter
Suscríbete a nuestro Newsletter y entérate de las últimas novedades.
https://centrocompetencia.com/wp-content/themes/Ceco
“Las imágenes llegaron y rompieron tu corazón. Culpa al VCR”
Parece un buen momento para recordar las letras de “Video Killed the Radio Star”, la emblemática canción de los Buggles que, paradójicamente, estrenaron en 1981 la emisión de MTV, icónico canal de videomúsica (que, lamentablemente, cada vez tiene menos música).
«Para Alsup, recordemos, el análisis y la conclusión serían distintos si hubiera evidencia de que los outputs de la IA fueran copias exactas o réplicas burdas de obras protegidas. Para Chhabria, la naturaleza transformativa del entrenamiento de una IA no descarta su ilicitud si se prueba un efecto nocivo para el mercado de los creadores de los contenidos».
Ahora, otras dos herramientas del arte y el entretenimiento se enfrentan. La Inteligencia Artificial (IA) y la literatura batallaron en las cortes distritales de Estados Unidos y, parece (pero solo parece) que la primera triunfó.
Con el riesgo de sobresimplificar, ambos casos tratan del reclamo de pequeños grupos de escritores contra empresas desarrolladoras de modelos de IA Generativa, como Anthropic –desarrolladora de Claude– y Meta –encargada de Llama–, por el uso no autorizado de sus libros como parte de las bases de datos que les sirvieron de entrenamiento.
Como ya hemos desarrollado en otra oportunidad (ver: ChatGPT, inteligencia artificial y el juego de la imitación “anticompetitiva”; e, “Inteligencia artificial generativa y la acumulación de datos como supuesto de abuso de posición dominante”, de próxima publicación en Ediciones UC), el funcionamiento de un modelo de IA Generativa depende de millones de millones de datos que le sirve de entrenamiento y perfeccionamiento (fine tuning). Tratándose de un modelo de lenguaje de gran escala (large language model o LLM), mientras más ricos sean los textos utilizados, es decir, mientras más calidad tenga la base de datos de entrenamiento, su performance será superior. Y, como las propias empresas tecnológicas han admitido, los libros y, en general, las obras protegidas por el derecho de autor, son una fuente de lenguaje enriquecida e indispensable para el funcionamiento de sus LLM.
La pregunta que surge, entonces, es: ¿Se necesita la autorización de los autores de obras protegidas para entrenar estos LLM, o se trata de un uso lícito (fair use) bajo la legislación del copyright?
La respuesta del juez Alsup en el caso Anthropic parece inclinarse decididamente a favor de la defensa del fair use.
En su decisión, y en más de una ocasión, el juez Alsup indicó que el uso de libros para entrenar a Claude era “excesivamente transformativo y un uso leal de acuerdo a la sección 107 del Copyright Act” (traducción libre). Además, destacó que lo que hacía el LLM de Anthropic no era replicar y suplantar los libros, sino generar textos nuevos. El juez fue enfático en señalar que distinto sería el caso si el resultado del LLM fuera una copia exacta o una réplica burda de los libros que utilizó para su entrenamiento (fenómeno conocido como regurgitation), pero los hechos ni las alegaciones de los demandantes planteaban dicha hipótesis.
En cambio, en el caso Kadrey v. Meta Platforms, el juez Chhabria fue menos tajante.
Para el juez del caso de Meta Platforms, no había duda de que el entrenamiento de un LLM en base a libros era un uso transformativo, pero eso no lo convertía inmediatamente en un “uso justo”. Después de todo, el fair use bajo la legislación norteamericana involucra el análisis de cuatro factores: el propósito (comercial o no) del uso de la obra, la naturaleza de la obra utilizada, la cantidad y sustancialidad de la porción de la obra utilizada, y el efecto que el uso genera en el mercado potencial o valor de la obra.
El cuarto factor, el del efecto de sustitución en el mercado, es el más importante, señala Chhabria, apoyándose en amplia jurisprudencia sobre la materia. Y advierte que, mientras Meta había presentado evidencia de que el uso de los libros no había causado algún daño al mercado de los autores, estos últimos no habían aportado evidencia empírica de sustento a favor de su pretensión. Por ello, resolvió a favor de Meta Platforms.
Sin embargo, el juez descarta que el uso de obras protegidas por copyright para entrenar modelos de lenguaje sea, en sí mismo y en todos los casos, lícito. Más bien, cobija la idea de que, normalmente, los demandantes ganarían en un caso similar, si logran demostrar ese efecto perjudicial en el mercado.
Chhabria llega a discrepar explícitamente del análisis de Alsup sobre los efectos en el mercado. Para Alsup, no se podía considerar el daño en el mercado que podían generar nuevos libros escritos por IA, porque el copyright no otorgaría un título que blinde a los autores de las nuevas obras que creen otros autores que aprendieron leyendo a los primeros. Ese daño no sería diferente, razonaba Alsup, del daño que se podía esperar de utilizar libros para “entrenar a niños a escribir bien”.
Para Chhabria, la analogía no es válida, pues “utilizar libros para enseñar a escribir a niños no se asemeja en absoluto a emplear esos mismos libros para crear un producto que permita a una sola persona generar una cantidad ilimitada de obras competidoras, con apenas una fracción del tiempo y del esfuerzo creativo que, de otro modo, serían necesarios” (traducción libre).
Así, para el juez Chhabria, más allá de la naturaleza transformativa de la IA Generativa, resultaría “difícil imaginar” que califique como un uso justo la utilización de obras protegidas para desarrollar una herramienta que sirva para crear obras competidoras que afecten significativamente el mercado de los libros originales.
En otras palabras, habría una clara teoría del daño competitivo en el entrenamiento de la IA Generativa, pero lo que faltó en el caso de Kadrey v. Meta Platforms fue la evidencia.
Aunque se tratan de triunfos concretos para Anthropic y Meta, los jueces en ambos casos no han descartado la posibilidad de considerar ciertos desarrollos de IA generativa como infractores del copyright. Para Alsup, recordemos, el análisis y la conclusión serían distintos si hubiera evidencia de que los outputs de la IA fueran copias exactas o réplicas burdas de obras protegidas. Para Chhabria, la naturaleza transformativa del entrenamiento de una IA no descarta su ilicitud si se prueba un efecto nocivo para el mercado de los creadores de los contenidos que sirvieron de entrenamiento a la IA.
Interesantemente, Chhabria utilizó ejemplos que, para él, harían más sólido el caso contra las IA. Así, indicó que “los mercados de determinados tipos de obras —como los artículos periodísticos— podrían ser particularmente vulnerables a formas de competencia indirecta” derivadas de los outputs que producen herramientas de IA, lo que nos trae a memoria el famoso y vigente caso del The New York Times v. Microsoft y Open AI (Ver, al respecto: Calderón, Andrés. ChatGPT, inteligencia artificial y el juego de la imitación “anticompetitiva”).
Las sentencias de Anthropic y Meta Platforms, aunque emblemáticas, debemos recordar, son decisiones de cortes de distrito, por lo que todavía es prematuro vislumbrar por dónde se decantará la jurisprudencia norteamericana.
Tampoco podemos extrapolar, sin más, las consideraciones de los jueces norteamericanos a otros ordenamientos nacionales, como el chileno o el peruano, en los que las excepciones o limitaciones al Derecho de Autor tienen carácter taxativo y no contemplan una cláusula abierta como el fair use.
Como reflexión final, se podría decir que la decisión de Alsup parece tener una lectura más conservadora y restrictiva de qué es lo que “busca proteger” el copyright, mientras que la de Chhabria es más prospectiva y amplia, en el sentido de lo qué “debería tutelar” el copyright.
Lo que sí parece claro es que el efecto de sustitución en el mercado será clave en las discusiones futuras. Y yendo más allá del ámbito del Derecho de autor, y acercándonos más al mundo antitrust, la valoración de efectos en el mercado será, probablemente, un factor trascendental para las autoridades de competencia en sus incipientes investigaciones en el mundo de la inteligencia artificial generativa.
Regístrate de forma gratuita para seguir leyendo este contenido
Contenido exclusivo para los usuarios registrados de CeCo