Los demandantes en el caso de Kadrey et al. contra Meta han presentado una solicitud alegando que la empresa utilizó deliberadamente obras protegidas por derechos de autor en el desarrollo de sus modelos de IA.
Los demandantes, incluido el autor Richard Kadrey, presentaron su “Respuesta en apoyo de la moción de los demandantes para presentar una tercera queja consolidada enmendada” en el Tribunal de Distrito de los Estados Unidos en el Distrito Norte de California.
El documento acusa a Meta de torrentear sistemáticamente y eliminar información de gestión de derechos de autor (CMI) de conjuntos de datos pirateados, incluidas obras de la notoria biblioteca clandestina LibGen.
De acuerdo con documentos presentados recientemente ante el tribunal, se revelan prácticas altamente incriminatorias que involucran a líderes senior de Meta. Los demandantes alegan que el CEO de Meta, Mark Zuckerberg, dio aprobación explícita para el uso del conjunto de datos LibGen, a pesar de las preocupaciones internas planteadas por los ejecutivos de IA de la empresa.
Un memorándum de diciembre de 2024 de discusiones internas de Meta reconoció a LibGen como”.un conjunto de datos que sabemos que está piratead”., con debates que surgieron sobre las implicaciones éticas y legales de usar esos materiales. Los documentos también revelaron que los principales ingenieros dudaron en torrentear los conjuntos de datos, citando preocupaciones sobre el uso de laptops corporativas para actividades potencialmente ilegales.
Además, las comunicaciones internas sugieren que después de adquirir el conjunto de datos LibGen, Meta eliminó el CMI de las obras protegidas por derechos de autor incluidas en él, una práctica que los demandantes destacan como central para las acusaciones de infracción de derechos de autor.
De acuerdo con la declaración de Michael Clark, un representante corporativo de Meta, la compañía implementó scripts diseñados para eliminar cualquier información que identificara estas obras como protegidas por derechos de autor, incluyendo palabras clave como “copyright”, “agradecimientos” o líneas comúnmente usadas en dichos textos. Clark declaró que esta práctica se realizó intencionalmente para preparar el conjunto de datos para entrenar los modelos de IA Llama de Meta.
“No se siente bien”
Las acusaciones contra Meta pintan un retrato de una empresa que participa deliberadamente en un esquema de piratería generalizada facilitado a través de torrenting.
Según una serie de correos electrónicos incluidos como pruebas, los ingenieros de Meta expresaron preocupaciones sobre la percepción de realizar torrenting de datos pirateados desde espacios corporativos. Un ingeniero señaló que “hacer torrenting desde una [laptop corporativa] de Meta no se siente bien”, pero a pesar de las dudas, se realizó la descarga rápida y distribución —o “seeding”— de datos pirateados.
El asesor legal de los demandantes ha declarado que hasta enero de 2024, Meta ya había “torrentado (descargado y distribuido) datos de LibGen”. Además, los registros muestran que cientos de documentos relacionados fueron obtenidos inicialmente por Meta meses antes pero se retuvieron durante los primeros procesos de descubrimiento. Los demandantes argumentan que esta divulgación demorada equivale a intentos de mala fe por parte de Meta para obstruir el acceso a pruebas vitales.
Durante una declaración el 17 de diciembre de 2024, se reporta que Zuckerberg mismo admitió que dichas actividades levantarían “muchas banderas rojas” y afirmó que “parece algo malo”, aunque ofreció respuestas directas limitadas respecto a las prácticas más amplias de entrenamiento de IA por parte de Meta.
Este caso comenzó originalmente como una acción por infracción de propiedad intelectual en nombre de autores y editores que alegaban violaciones relacionadas con el uso de sus materiales por parte de la IA. Sin embargo, los demandantes ahora buscan agregar dos reclamos importantes a su demanda: una violación de la Ley de Derechos de Autor del Milenio Digital (DMCA) y una violación de la Ley Integral de Acceso y Fraude de Datos de California (CDAFA).
En virtud de la DMCA, los demandantes afirman que Meta eliminó deliberadamente protecciones de derechos de autor para ocultar usos no autorizados de textos protegidos por derechos de autor en sus modelos Llama.
Según se cita en la demanda, se alega que Meta eliminó el CMI “para reducir la posibilidad de que los modelos memoricen estos datos” y que esta eliminación de indicadores de gestión de derechos dificultó descubrir la infracción para los titulares de derechos de autor.
Las alegaciones de la CDAFA involucran los métodos de Meta para obtener el conjunto de datos de LibGen, incluyendo presuntamente participar en torrenting para adquirir conjuntos de datos protegidos por derechos de autor sin permiso. La documentación interna muestra que los ingenieros de Meta discutieron abiertamente preocupaciones de que el seeding y torrenting podrían resultar “legalmente no aceptables”.
El caso de Meta podría impactar la legislación emergente sobre el desarrollo de IA
En el centro de esta batalla legal en expansión reside una creciente preocupación sobre la intersección de la ley de derechos de autor y la IA.
Los demandantes argumentan que eliminar las protecciones de derechos de autor de conjuntos de datos textuales niega una compensación adecuada a los propietarios de derechos de autor y permite a Meta construir sistemas de IA como Llama sobre las ruinas financieras de los esfuerzos creativos de autores y editores.
El enfrentamiento ocurre en medio de un escrutinio global creciente sobre las tecnologías de”.IA generativ”.. Empresas como OpenAI, Google y Meta han enfrentado críticas por el uso de datos protegidos por derechos de autor para entrenar sus modelos. Los tribunales en varias jurisdicciones actualmente lidian con el impacto a largo plazo de la IA en la gestión de derechos, con casos potencialmente históricos siendo decididos tanto en Estados Unidos como en el Reino Unido.
En este caso particular, los tribunales estadounidenses han mostrado una disposición creciente para escuchar quejas sobre el daño potencial de la IA a precedentes de leyes de derechos de autor establecidos desde hace mucho tiempo. En su moción, los demandantes hicieron referencia a The Intercept Media v. OpenAI, una decisión reciente de Nueva York en la que un reclamo DMCA similar fue permitido proceder.
Meta continúa negando todas las acusaciones en el caso y aún no ha respondido públicamente a las declaraciones reportadas en la deposición de Zuckerberg.
Independientemente de si los demandantes tienen éxito en estas enmiendas, autores de todo el mundo enfrentan crecientes ansiedades sobre cómo se manejan sus obras creativas en el contexto de la IA. Con la legislación de derechos de autor luchando por mantenerse al día con los avances tecnológicos, este caso subraya la necesidad de una orientación más clara a nivel internacional para proteger tanto a los creadores como a los innovadores.
Para Meta, estas acusaciones también representan un riesgo reputacional. A medida que la IA se convierte en el enfoque central de su estrategia futura, las acusaciones de dependencia de bibliotecas pirateadas probablemente no ayudarán a sus ambiciones de mantener el liderazgo en el campo.
El caso en desarrollo de Kadrey et al. contra Meta podría tener ramificaciones significativas para el desarrollo de modelos de IA en el futuro, estableciendo potencialmente precedentes legales en los Estados Unidos y más allá.
(Foto por Amy Syiek)