Crónica de la VII Jornada Profesional de la RBIC “big data y bibliotecas: convertir datos en conocimiento”

El pasado 11 de diciembre de 2014 la Red de Bibliotecas del Instituto Cervantes (RBIC) programó su VII Jornada profesional bajo el lema “Big data y bibliotecas: convertir datos en conocimiento”.

Desde 2008 la RBIC programa anualmente unas jornadas que, impecablemente organizadas, tienen lugar en la imponente sede del Instituto Cervantes, en Madrid. En esta ocasión el evento levantó expectación hasta el punto que se habilitó un espacio anexo para poder seguir el acto en video. Cosas de la gratuidad. Finalmente el salón de actos de Alcalá 49 pudo acoger sin problemas a los numerosos asistentes que asistieron a la jornada. En breve habrá acceso a las grabaciones en vídeo y presentaciones.

El acontecimiento estaba estructurado en tres partes con un programa muy prometedor, que contaba con expertos, académicos y profesionales que se dedican intensivamente a los big data –o macrodatos, en español urgente–, en un momento que según el famoso gráfico anual de Gartner está en fase de superación del pico de expectativas sobredimensionadas. Sea como fuere, la selección del tema no podía ser más adecuada, y cabe felicitar a los organizadores por la pericia en tratar esa tendencia aún emergente en España, como lo demuestra la reciente exposición en el Centro de Cultura Contemporánea de Barcelona (en febrero próximo el proyecto Bing Bang Data itinera a Madrid, en la Fundación Telefónica), o el reciente monográfico de El Profesional de la Información.

El Panel 1, “Hablemos de big data”, parecía por su posición en el programa un entrante, pero acabó siendo el plato fuerte del día. La periodista Soraya Paniagua bordó la presentación de los primeros ponentes. Y los tres expertos no defraudaron: Mateo Valero, director del Barcelona Supercomputing Center-Centro Nacional de Supercomputación, expuso y abrumó a la audiencia con macrodatos, pero también con reflexiones desmitificadoras. Así, si desde los sesenta sabemos que la información crece exponencialmente, Valero sostuvo que actualmente cada diez años multiplicamos por mil la capacidad de procesar datos: “podemos almacenar sin problemas, pero acceder a la información es más complicado por una cuestión energética”, afirmó Valero, que ostenta en su historial el Premio Eckert-Mauchly 2007, equivalente al Nobel de la computación. Y tiró de pedagogía para aclarar ese matiz: los sistemas actuales de acceso a los datos son poco eficaces energéticamente, tanto como lo sería para los consumidores el desplazarse a un supermercado cada vez que quieran tomarse un yogur, en vez de acudir al frigorífico de su cocina. El centro más preparado en España, el BSC, necesita 11 horas para leer 1 petabyte.

bigata01
Panel 1, de izquierda a derecha Soraya Paniagua, Óscar Méndez, Judith González-Pedraz, y Mateo Valero.
 

La jurista Judith González-Pedraz, asesora en la unidad de apoyo al Director de la Agencia Española de Protección de Datos, narró los desafíos para la privacidad en la protección de datos, poniendo en evidencia que el fenómeno de los macrodatos ha superado la directiva europea de 1995, así como la ley española de protección de datos de 1999. Y es que los principios a salvaguardar (legitimidad y consentimiento, limitación de la finalidad, calidad de los datos, minimización de los mismos, etc.) son difícilmente compatibles con la filosofía big data: como es barato almacenar, las empresas pueden recabar todos los datos posibles para usos futuros, lo cual es incompatible con los principios legales, que señalan que los datos deben ser destruidos una vez cumplida la finalidad para la que fueron obtenidos. En el turno de preguntas la cuestión fue abordada con numerosos ejemplos (los algoritmos nunca son neutrales) , y González-Pedraz superó la habitual rigidez jurídica –el espíritu de la brigada Aranzadi, que diría Enric Juliana– con un mensaje conciliador que resumo en dos frases: “sin un enfoque global (acuerdos internacionales y ética personal), difícilmente podrán las legislaciones regionales proteger a los más vulnerables: los ciudadanos” y “hay que buscar el equilibrio: la protección de datos no está pensada para coartar el avance de las empresas, sino para proteger los derechos fundamentales de los ciudadanos”.

El empresario Óscar Méndez completó el Panel con “la parte menos sexy de los big data: las tecnologías” completando con ingenio las intervenciones de los anteriores, en cuanto a cifras: “ninguna empresa española es capaz hoy de mover terabytes en segundos; Google tiene 6 millones de servidores; las mayores empresas españolas, 9.000”; temas prácticos: “necesitamos nuevas formas de visualización de los resultados: los gráficos de barras o de quesitos no nos sirven”; aspectos legales: “la legislación española es muy restrictiva, y lo agradezco como ciudadano, pero no como empresario. En China o en los países árabes no hay normativa”; y aplicaciones reales, desde las Smart Cities al control de stocks de grandes almacenes. Méndez fue un ponente brillante, que además de mostrar su experiencia en la aplicación práctica de soluciones para empresas, retrató las muchas debilidades de los big data, que lejos de ser una tecnología madura, pueden dar respuesta a las necesidades informativas “solo si las preguntas son las adecuadas”.

bigata02
Óscar Méndez interviene en el Panel 1, “Hablemos de big data”.
 

El Panel 2, tras la pausa, buscaba poner “Caos en el orden”, o poner en conocimiento de la audiencia un abanico de propuestas lo más cercanas posible a la realidad del sector de la información y la documentación. Y siendo una propuesta arriesgada por poco consolidada, no deslució en absoluto la jornada. Moderó sobriamente Víctor Arbe, bibliotecario del Instituto Cervantes en Bremen.

En primer lugar, Jorge Serrano-Cobos, autor de un reciente artículo en EPI, centró su exposición en las armas que tienen los bibliotecarios-documentalistas para mejorar el servicio a los usuarios, del análisis de OPACs a la diagnosis en fidelización de usuarios, pasando por la interpretación de los resultados de Google Analytics. SEO y análisis web avanzado, en una ponencia de un profesional con visión híbrida, pues combina su rol de director de I+D en MASmedios con un perfil académico de sólida trayectoria.

Siguió Ricardo Alonso-Maturana, fundador y CEO de Gnoss.com, filosofando acerca del comportamiento humano en los procesos de búsqueda de información, basados en refinamiento a partir de respuestas. Compartió numerosas ideas (metabuscadores, agregadores, visualización de resultados) y recordó la necesidad de diseñar sistemas que permitan serendipia, margen de maniobra para que los usuarios realicen hallazgos de manera espontánea. Completó su intervención con una síntesis de los estándares de descripción de bibliotecas, archivos y museos.

En tercer lugar Ana Lorente, graduada en Información y Documentación en la Universidad Carlos III de Madrid, reflexionó sobre porqué los profesionales de la Información y la Documentación deberían estar más implicados en los macrodatos. No por obvias sus conclusiones fueron menos necesarias: las carencias y limitaciones en los currículos académicos sitúan a los recién graduados en una posición poco ventajosa. Lorente fue exhaustiva en la enumeración de las circunstancias que alejan a los profesionales de los big data, “la fiebre del oro” de los bibliotecarios, como los denominó.

Finalmente Javier Guallar expuso su visión sobre la curación de contenidos en la era la infoxicación, y las propuestas concretas para bibliotecas y servicios de información. Guallar, que junto al emprendedor Javier Leiva ha creado un emergente modelo de negocio, Los Content Curators, se refirió a las similitudes y divergencias entre la curación de contenidos y los macrodatos, a partir de su propia experiencia como profesional vinculado a los medios de comunicación, y una larga trayectoria docente y científica. Sentenció con una frase de Rosenbaum: “el futuro de la curación se encuentra en la sabia combinación de criterio humano y algoritmos”.

bigata03
Panel 2, de izquierda a derecha, Víctor Arbe, Javier Guallar, Ana Lorente, Ricardo Alonso-Maturana y Jorge Serrano-Cobos.
 

Tras un breve debate llegó el turno de la ponencia de clausura, a cargo de Santos González-Jiménez, director de la Cátedra de Inteligencia Analítica Avanzada de la Universidad de Oviedo, presentado por Ana Nistal, jefa del Departamento de Informática del Instituto Cervantes, que venía a hablar de “La ciencia de los datos y su seguridad. Pasado, presente y posible futuro. Las matemáticas como motor de su desarrollo”. El magnífico invitado demostró su apabullante experiencia y dotes pedagógicas, y si bien su intervención tuvo poca o ninguna relación con el objeto de la jornada –digámoslo más suave: fue una aportación programática iconoclasta–, se agradeció el tono y la sapiencia de quien lleva a sus espaldas una impresionante trayectoria de divulgación científica, a la que se suma una filosofía vital que bien puede resumirse en una de las numerosas citas que trajo a colación: “el rol del maestro no es crear discípulos que le sigan, sino colaboradores que le superen”. Lo han adivinado: Ramón y Cajal en estado puro.

Las Jornadas de la RBIC están por convertirse en una cita ineludible para tomar el pulso a las tendencias que afectan a bibliotecas y servicios de información especializados. En esta ocasión acercaron al público asistente, heterogéneo sin duda, al fenómeno big data, en un formato muy adaptado a las necesidades profesionales actuales –una mañana intensiva–, y asumiendo con valentía el riesgo de tratar un aspecto de la información y la documentación que está, pese al entusiasmo, en una fase muy incipiente. Felicidades pues a los organizadores, y aciertos en próximas convocatorias.

Ciro Llueca
(Universidad de Barcelona).

This entry was posted in Uncategorized. Bookmark the permalink.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>