- Fecha de publicación: 2019-09-25
Transformando y enriqueciendo nuestros datos con OpenRefine
Desde 2015, la Biblioteca Nacional de España tiene entre sus líneas estratégicas el impulso de la reutilización de sus datos y contenidos digitales.
La Biblioteca Nacional de España (BNE) ya ha trabajado mucho en adaptar y enriquecer con tecnología semántica los datos de su catálogo a través de datos.bne.es. Con esta iniciativa, la Biblioteca se suma al reto de publicar los catálogos bibliográficos y de autoridades en formato RDF (Resource Description Framework), conforme a los principios de los Datos Enlazados (Linked Data), ambos componentes básicos de la Web Semántica.
Además, desde 2017 la Biblioteca ha abordado la tarea de apertura de sus datos, tanto bibliográficos como no bibliográficos, para favorecer e impulsar y su posterior reutilización en ámbitos tan diversos como las Humanidades Digitales y el Procesamiento de Lenguaje Natural (PLN), el turismo, big data etc. Como producto de estos trabajos, se han hecho disponibles en los últimos meses una serie de conjuntos o sets de datos, que incluyen desde los ya mencionados catálogos hasta el Archivo de la web española, pasando, por ejemplo, por las estadísticas de nuestros principales servicios.
En concreto, la publicación de nuestros datos bibliográficos ha supuesto un trabajo previo de preparación que permitiera la conversión de los mismos a formatos útiles para un público mucho más allá del bibliotecario (CSV, JSON, ODS, TXT, XML). Para ello se hizo una selección de los campos MARC que incluyen información relevante y se les asoció un literal amigable, creando un mapeo para cada uno de los conjuntos que ofrecemos desde la BNE, y que están disponibles al descargar cualquier conjunto de datos bibliográficos en nuestro portal BNElab.
Consulta la información completa aqui.