SAFE CREATIVE    CREATORS    SAFE STAMPER    TIPS   BLOG

Noticias

Demanda contra Adobe por entrenar su IA con obras con copyright

La estrategia de Adobe para presentarse como una empresa comprometida con la protección de los creadores en plena expansión de la inteligencia artificial (IA) se ha visto cuestionada por una demanda colectiva presentada en Estados Unidos. Se acusa al gigante de software de utilizar obras con copyright para entrenar su modelo SlimLM sin autorización ni compensación. El caso se suma a una larga lista de litigios contra las tecnológicas por la forma en que entrenan sus sistemas de IA. 

Primer gran proceso contra Adobe 

La autora Elizabeth Lyon ha presentado una demanda en un tribunal federal en la que alega que Adobe ha usado libros protegidos por derechos de autor, incluidos los suyos, para entrenar la familia de modelos SlimLM diseñados para «responder a indicaciones humanas», informa Reuters. La acción legal se plantea como una demanda colectiva en nombre de todos los titulares de derechos cuyas obras se habrían usado sin consentimiento, lo que la convierte en el «primer gran proceso judicial de este tipo contra Adobe», según la agencia. 

Lyon afirma en la denuncia que Adobe ha utilizado «copias pirateadas de libros» para capacitar estos modelos que se utilizan en tareas de asistencia documental en dispositivos como teléfonos móviles, tabletas y portátiles. Además de una indemnización por daños y perjuicios, solicita que el tribunal certifique la demanda como colectiva a nivel nacional y ordene la eliminación de las copias infractoras, detalla Medianama

SlimLM en el centro del conflicto 

Un aspecto relevante del caso es que no se dirige contra Firefly, el sistema de IA creativa más conocido de Adobe y sobre el que la empresa ha construido su discurso de respeto a los creadores. El foco está puesto en SlimLM, una familia de modelos de lenguaje menos visibles. «No se trata de una IA orientada a la generación creativa a gran escala, sino de un sistema que opera en segundo plano», explica Xataka, lo que evidencia que el debate sobre los datos de entrenamiento trasciende las aplicaciones populares. 

Adobe ha señalado que SlimLM se preentrenó con SlimPajama, un conjunto de datos de código abierto publicado en 2023. Sin embargo, la denuncia cuestiona el origen real de ese dataset y pone el foco en su relación con otros repositorios utilizados por la industria. 

Books3 y los datos derivados 

La demanda afirma que «el conjunto de datos SlimPajama se creó copiando y manipulando el conjunto de datos RedPajma, incluida la copia de Books3», recoge TechCrunch. La controvertida biblioteca Books3 contiene cerca de 200.000 títulos electrónicos y ha sido señalada en numerosos litigios por su origen presuntamente ilegal.  

Este conjunto de datos ya se ha citado en otras demandas contra compañías como Apple o Salesforce y se ha convertido en un símbolo de los riesgos legales asociados al entrenamiento de modelos de IA con grandes volúmenes de texto. Lyon sostiene que el carácter «derivado» o «deduplicado» de estos conjuntos no elimina la infracción, puesto que, a su juicio, la «infracción se arrastra desde la fuente original».  

Un caso con impacto para toda la industria 

Si el tribunal acepta este argumento, tendrá que determinar «si los procesos de recopilación y uso de datos por parte de empresas como Adobe cumplen las normas de copyright vigentes», señala Ecosistema Startup. La decisión podría sentar un precedente con impacto en las grandes corporaciones tecnológicas, pero también en startups que desarrollan soluciones basadas en IA. 

Por ahora, Adobe no ha hecho comentarios sobre la demanda, según Reuters, y tampoco lo han hecho Lyon ni sus abogados. Aunque el caso se encuentra en una fase inicial, vuelve a poner sobre la mesa una cuestión esencial para el futuro de la IA: cómo avanzar en innovación tecnológica sin vulnerar los derechos de quienes crean los contenidos de los que estas tecnologías aprenden. 

Fuentes: Reuters, Medianama, Xataka, TechCrunch, Ecosistema Startup. 

Safe Creative
Safe Creativehttps://www.safecreative.org/
Safe Creative es el mayor registro electrónico de propiedad intelectual en línea. La inscripción de la autoría en Safe Creative proporciona al autor una prueba tecnológica irrefutable de su declaración y la consiguiente protección de sus derechos (Convenio de Berna - ONU). Resulta muy aconsejable el registro de una obra antes de darla a conocer, para tener asentada una primera prueba declarativa de su autoría. Al publicar el trabajo o mostrar versiones previas es posible hacerlo con mayor tranquilidad, sabiendo que se dispone de la mejor prueba en el tiempo frente a quien pudiera estar tentado de atribuirse éste como propio.

Compartir

Artículos relacionados