Disposiciones relativas a la minería de textos y datos
En 2019, la Directiva sobre los derechos de autor en el mercado único digital permitió a cualquier persona realizar copias y extraer grandes cantidades de datos protegidos por derechos de autor a los que tienen acceso legal sin el permiso del titular de los derechos, con el fin de llevar a cabo actividades de minería de datos. Esto es posible a menos que el titular de los derechos decida expresamente «excluir» la extracción de los datos protegidos por derechos de autor (a través de medios legibles por máquina). Esta posibilidad de exclusión voluntaria no se aplica a la minería de datos por parte de instituciones de patrimonio cultural e investigación, con fines de investigación. En ese momento, la minería de textos y datos no era nueva en otras partes del mundo, y la Unión Europea sufría una desventaja competitiva al no tener claridad jurídica en su jurisdicción.
Estas disposiciones están ahí para garantizar que los derechos de autor no se interpongan en las oportunidades que el análisis de grandes cantidades de datos brinda a los sectores de la investigación y el patrimonio cultural en la Unión Europea (mediante la mejora sustancial del análisis y la descubribilidad de la información) y para la sociedad de la información en general.
Bloqueo de la extracción de datos de los datos del patrimonio cultural
En 2019, las instituciones de patrimonio cultural, que abogaban por el acceso democrático a la información, se mostraron a favor de las excepciones a la minería de textos y datos. Por lo tanto, era inesperado que estas mismas instituciones consideraran hacer uso de la posibilidad de exclusión voluntaria para bloquear la extracción de datos del patrimonio cultural protegidos por derechos de autor.
La exclusión voluntaria de este tipo de tratamiento ha suscitado recientes debates en el sector del patrimonio cultural. La Biblioteca Nacional de los Países Bajos, por ejemplo, añadió una redacción a sus términos y condiciones que prohíbe a todas las IA generativas comerciales extraer las obras protegidas por derechos de autor de la biblioteca. A través de métodos legibles por máquina, prohíbe explícitamente a ChatGPT cosechar sus colecciones.
En algunos casos, la razón para aplicar una exclusión voluntaria parece ser que los titulares de derechos de autor solicitan esta exclusión voluntaria como condición para que los datos se compartan a través del sitio web de una organización de patrimonio cultural. Esto lo hace a veces el titular individual de los derechos o una entidad de gestión colectiva, como Pictoright en los Países Bajos y Sacem en Francia. Pero a veces la voluntad parece provenir de la propia institución de patrimonio cultural, queriendo garantizar que los creadores sean respetados a través de un uso transparente (atribuido) y basado en el permiso de sus creaciones.
Entre los principales argumentos, algunos advierten de la necesidad de bloquear la extracción de datos para impedir que determinadas empresas de «gran tecnología» que trabajan con IA generativa extraigan datos de la minería. De hecho, algunas grandes empresas con fines de lucro analizan grandes cantidades de datos protegidos por derechos de autor sin mucha transparencia. Se les ha criticado por nutrirse de los «comunes» (contenidos disponibles libres de restricciones de derechos de autor) sin contribuir a ellos al tiempo que refuerzan su ventaja competitiva.
Más allá de lo que es legalmente posible: ¿Qué debe representar el sector del patrimonio?
En la mayoría de los casos, las instituciones de patrimonio cultural darán acceso a materiales que no están protegidos por derechos de autor o que están protegidos y para los que los titulares de derechos han autorizado la publicación en línea, pero para los que la institución de patrimonio cultural no es titular de los derechos de autor. En tales casos, las instituciones de patrimonio cultural no tienen derecho a tomar la decisión de aplicar una exclusión voluntaria de la minería de datos. Solo pueden hacerlo si los derechos de autor existen, y tienen los derechos de autor.
Pero incluso si lo hacen, vale la pena preguntarse si optar por no participar apoya sus objetivos. En cierto modo, bloquear la posibilidad de utilizar datos sobre el patrimonio cultural parece ir en contra de la misión de las instituciones de patrimonio cultural financiadas con fondos públicos. ¿No está más en consonancia con sus objetivos la aportación de información cualitativa fiable y la lucha contra la desinformación y los sesgos (en los algoritmos)?
Cuando se trata de corregir las malas prácticas de algunos grandes actores en el mundo de la IA, ¿la exclusión voluntaria de los datos del patrimonio cultural realmente los debilitaría? Las grandes empresas de tecnología pueden asumir riesgos legales, pagar una multa o pagar el precio por extraer legalmente los datos. Excluir los datos del patrimonio cultural no les impedirá utilizarlos, sino que es probable que tenga un impacto negativo en las pymes, los periodistas, los profesionales del patrimonio cultural y los propios investigadores que utilizan los datos, así como las herramientas tanto para la investigación como para fines más generales. Se corre el riesgo de debilitar a aquellos que más necesitan los bienes comunes. Los límites entre el comercio y la investigación son cada vez más vagos. ¿Dónde trazamos la línea?
¿Deben las instituciones de patrimonio cultural nivelar las condiciones de competencia y salvaguardar el acceso abierto a los contenidos culturales por parte de todos, también por parte de las máquinas? Si no hay soluciones de exclusión voluntaria disponibles o utilizadas que sean adecuadas para aplicarse artículo por artículo, existe un riesgo claro de que la aplicación de una exclusión voluntaria legible por máquina se desborde en el material de dominio público que se pone a disposición en línea.
El caso de las obras fuera del comercio
Con la Directiva sobre derechos de autor mencionada anteriormente, se adoptó el sistema de obras fuera del comercio: una nueva solución jurídica a través de la cual las instituciones de patrimonio cultural puedan compartir materiales en línea en sus colecciones que no estén (o hayan dejado de estar) en circulación comercial, aunque estén sujetos a la protección de los derechos de autor, sin el permiso del titular de los derechos de autor. Este nuevo sistema elimina la carga (imposible) de limpiar los derechos de autor en grandes colecciones.
Esto generalmente requiere obtener una licencia de una entidad de gestión colectiva, que sea representativa de los tipos de materiales en cuestión. Mediante la Directiva, las organizaciones están facultadas para conceder licencias colectivas «ampliadas»: pueden autorizar a las entidades de patrimonio cultural a utilizar materiales que formen parte del repertorio de la entidad de gestión colectiva, pero también materiales que no lo sean.
Algunas entidades de gestión colectiva están incluyendo la obligación de «excluir» estas obras del comercio de la explotación minera, cuando sean compartidas en línea por la institución de patrimonio cultural. En el contexto de la concesión de licencias colectivas «ampliadas», esto plantea problemas tanto prácticos como jurídicos. Prácticamente, ya que limita las posibilidades de reutilización del material y supone una carga adicional para la institución de patrimonio cultural. Legalmente, porque es discutible si una entidad de gestión colectiva en una licencia de gestión colectiva «ampliada» es el titular de los derechos con derecho a ejercer una exclusión voluntaria de la minería de datos.
Próximos pasos
Nosotros en la Comunidad de Derechos de Autor continuaremos siguiendo de cerca los desarrollos en esta área. Estén atentos uniéndose a nuestra Comunidad a través de la Europeana Network Association y siguiéndonos en las redes sociales. Si desea compartir sus comentarios sobre este tema con nosotros, póngase en contacto con [email protected].
Puede obtener más información sobre la extracción de textos y datos en copyrightuser.org y en el portal de transposición de la Directiva CDSM de Communia.
