Un estudio publicado recientemente por investigadores de la Universidad de Stanford, Cornell y West Virginia revela que el modelo de inteligencia artificial Llama3.1 de Meta puede reproducir textualmente grandes cantidades de contenido protegido por derechos de autor de libros, lo que plantea un riesgo legal potencialmente enorme para esta gigante tecnológica. El estudio señala que el modelo Llama3.170B en las pruebas logró reproducir hasta el 42% del texto del libro "Harry Potter y la piedra filosofal", una cifra mucho mayor que los 4.4% alcanzados por el primer modelo Llama.

Los modelos de inteligencia artificial, como ChatGPT de OpenAI y Llama de Meta, suelen entrenarse con grandes volúmenes de datos con el objetivo de identificar y generar nuevos patrones. Sin embargo, el hallazgo clave de este estudio es que parece que el modelo Llama de Meta no solo aprende patrones lingüísticos, sino que también parece poder "recordar casi completamente" ciertos libros, como "Harry Potter" y "1984". Mark Lemley, experto en derecho y tecnología de Stanford, dijo que si una IA puede generar extractos completos de sus datos de entrenamiento, ya no se considera una obra "transformadora" basada en el aprendizaje, sino más bien como un "enorme archivo ZIP" que contiene obras protegidas por derechos de autor, permitiendo a los usuarios copiar libremente.

Derechos de autor

El nuevo foco de la disputa de derechos de autor: reproducción textual vs. aprendizaje de patrones

Cuando el equipo de investigación de Lemley probó modelos de IA de otras empresas como OpenAI, DeepSeek y Microsoft, descubrieron que Llama de Meta fue el único modelo capaz de repetir fielmente el contenido de los libros. Además de la primera entrega de la saga "Harry Potter", el modelo mostró una notable capacidad de recordar el contenido de "The Great Gatsby" de F. Scott Fitzgerald y "1984" de George Orwell.

El uso de materiales protegidos por derechos de autor para entrenar IA por parte de Meta ha sido motivo de controversia. La empresa actualmente enfrenta múltiples demandas por violación de derechos de autor, incluidas acciones legales presentadas por escritores conocidos (como la actriz cómica Sarah Silverman), quienes acusan a los modelos de Meta de estar entrenados con el conjunto de datos "Books3", que contiene cerca de 200,000 publicaciones protegidas por derechos de autor. Según documentos judiciales, un ingeniero de Meta comentó durante la descarga de archivos torrent: "Sentí algo incómodo al descargar torrents usando mi computadora de trabajo de Meta".

Lemley estima que si solo el 3% del contenido del "Books3" se determina como infracción, Meta podría enfrentar una indemnización legal cercana a los 1000 millones de dólares, sin incluir las ganancias compartidas. Si la proporción de infracciones fuera mayor, la responsabilidad legal de Meta sería aún más grave.

Cambio en la postura de los expertos legales, Meta se niega a responder

Es importante destacar que Lemley representó anteriormente a Meta en una demanda anterior sobre IA generativa (Kadrey v Meta Platforms). Sin embargo, después de liderar esta investigación sobre la memoria y la reproducción de contenidos protegidos por derechos de autor en modelos de IA, anunció a principios de este año que ya no representará a Meta, protestando contra ciertos comportamientos de la empresa y de su director ejecutivo, Mark Zuckerberg. Aunque anteriormente creía que Meta debería salir victoriosa, los resultados del estudio parecen haber cambiado su perspectiva.

Meta se negó a hacer comentarios sobre los últimos hallazgos de Lemley.