Formulario Contacto EPI Contacto
Copyright Copyright

 

Noviembre-diciembre de 2019, vol. 28, núm. 6
Estructuras de poder en Comunicación / Power structures in Communication


Digitalización de obras protegidas: software para la detección de obras fuera del circuito comercial

Manuel Blázquez-Ochando; Luis-Fernando Ramos-Simón

Este artículo está en abierto

Resumen: La digitalización de obras protegidas en el contexto de la preservación cultural está cobrando una mayor importancia, según la última propuesta de directiva de la Comisión Europea sobre derechos de autor en el mercado único digital, pendiente de aprobación definitiva. Ello puede representar una oportunidad para las bibliotecas europeas, que pueden crear colecciones digitales con aquellas obras que manifiestamente están fuera de los canales comerciales. Para ello se requiere un conjunto de programas informáticos capaces de extraer información de los catálogos, y que faciliten una primera aproximación de los titulares de las obras y datos de edición. En esta investigación se aborda la metodología para el desarrollo de un software capaz de cruzar la información de los catálogos bibliográficos de las bibliotecas, con los catálogos comerciales, a fin de determinar la presencia o ausencia de sus libros. En su desarrollo se explican las dificultades y soluciones empleadas para su construcción, derivadas de la heterogeneidad de los catálogos consultados. Finalmente se concluye que resulta factible y de gran utilidad, la creación de este tipo de aplicaciones informáticas, ya que puede obtenerse una media de aciertos superior al 90% en la distinción de obras fuera de comercio. Sin embargo, aún se encuentran problemas a la hora de diferenciar las ediciones o incluso de interpretar adecuadamente los falsos positivos, derivados de aspectos tales como los algoritmos de sugerencia automática de obras.

Palabras clave: Obras fuera del circuito comercial; Comparador bibliográfico; Programas informáticos; Catálogos bibliográficos; Web scraping; Parser; Obras descatalogadas; Bibliotecas; Libro; Digitalización.

Digitization of protected works: Software for the detection of out of commerce works

Abstract: The digitization of protected works in the context of cultural preservation is becoming more important, according to the latest proposal of the European Commission directive on copyright in the digital single market, pending final approval. This may represent an opportunity for European libraries, which can create digital collections with those works that are manifestly outside commercial channels. This requires a set of computer programs capable of extracting information from catalogs, and provide a first detection of the owners of the works. This research approach the methodology for the development of a software capable of crossing information from library bibliographic catalogs, with commercial catalogs, in order to determine the presence or absence of their books. In its development, the difficulties and solutions used for its construction are explained, derived from the heterogeneity of the consulted catalogs. Finally, it is concluded that the creation of this type of computer applications is feasible and very useful, since an average of more than 90% correct answers can be obtained in the distinction of non­commercial works. However, there are still problems when trying to differentiate the editions or even interpreting the false positives, derived from aspects such as the algorithms of automatic suggestion of works.

Keywords: Out­of­commerce works; Bibliographic catalogues; Bibliographic comparator; Web scraping; Parser; Out­of­print­works; Computer programmes; Libraries; Book; Digitization.