El profesional de la información


Diciembre 1996

Chadwyck-Healey entra en Internet por la puerta grande

Por José A. Senso

Sir Charles Chadwyck-HealeyPoco a poco van creciendo las aportaciones de nuevas publicaciones distribuidas a través de La Red. Ya no es ninguna novedad que uno u otro servicio o catálogo se consulte directamente en Internet, y nadie duda ya de que por aquí van los tiros en el futuro inmediato.

Lo que sí es una novedad es que uno de estos catálogos en línea esté exclusivamente dedicado al área de las humanidades, y que los registros que aporte cubran los dos últimos ¡siglos! de información.

Ésta es, al menos, la promesa de Chadwyck-Healey en el lanzamiento de Periodicals Contents Index. PCI Web abarca 3.500 publicaciones de 26 áreas de humanidades entre 1770 y 1991. Eso hace un total estimado de 15 a 20 millones de artículos "inéditos" en formato electrónico.

Sin embargo, la publicación no es nueva. PCI nació en Chadwyck-Healey Inc. (EUA) hace ya 3 años, con el objetivo de verter cierta luz sobre las revistas de humanidades que se apilan en los archivos de las bibliotecas de todo el mundo. Buscar artículos sobre un tema determinado en revistas anteriores al año en curso era una labor francamente ardua hasta la aparición del cd-rom; buscar información de los dos últimos siglos era literalmente imposible.

Así, Chadwyck-Healey asume a nivel privado el coste de catalogación de los fondos de publicaciones que pocas instituciones están dispuestas a desembolsar.

Características de PCI

Lo que sí es nuevo en PCI es su canal de distribución: Internet.

Hasta la fecha, éste es el catálogo más extenso en cobertura de artículos para humanidades, "hermana pobre" dentro de todo el sector académico en cuanto a oferta de bases de datos se refiere.

Según sus editores, PCI contiene -a fecha de octubre de 1996 - la tabla de contenidos de 1.600 revistas a nivel mundial. Esto se traduce en 6 millones de artículos volcados entre los años 1770 y 1991.

El nuevo proyecto de Chadwyck-Healey en Internet: PCI

Se han aprobado para su inclusión 3.500 revistas (además de las 1.600 anteriores), que se traducirán en unos 15-20 millones de artículos, cubriendo 26 áreas de humanidades y ciencias sociales. Esta lista sigue "abierta", como más adelante comentaremos.

PCI se actualiza cada 2 meses a un ritmo aproximado de 1,5-2 millones de registros al año. Así, en el año 2001 se habrán volcado, como mínimo, las 3.500 revistas aprobadas para su inclusión.

Puesto que "sólo" se han introducido 1.600 revistas hasta la fecha, se puede acceder (gratuitamente) a la lista completa de revistas aprobadas para su inclusión desde la página de entrada de PCI Web. No hay restricciones geográficas ni idiomáticas (26 idiomas representados, incluidos algunos tan poco extendidos como el "Manx" o "Langue d´Oc").

Más datos técnicos

<body text:Existen ocho criterios de búsqueda, la mayoría indizados (salvo General Keyword y Article Title Keyword, obviamente por su extensión): texto libre (palabra clave), palabra clave en título, autor, nombre de la publicación, idioma, materia, año de publicación y sección de la revista.

Permite truncamiento, operadores booleanos, búsquedas cruzadas y de proximidad por palabras clave o frases en cualquiera de los ocho criterios citados anteriormente.

Una de las ventajas de trabajar con texto libre radica en la inexistencia de autoridades o descriptores de materias que aten al usuario: cada fonema es filtrable en PCI; otra cosa es limpiar el ruido que se genere...

Permite refinar la búsqueda excluyendo o incluyendo críticas a libros, delimitando el número de registros a presentar en pantalla, etc.

No es necesario instalar ningún software de búsqueda: PCI se ejecuta desde nuestro navegador habitual (Netscape, Explorer, etc.).

Se puede dar acceso tanto a todo el dominio IP de la institución, como delimitar el acceso a las direcciones IP que incluye el cliente.

La velocidad de acceso a PCI varía -como siempre - en función del equipo, la conexión y el momento del día en que se realice la prueba. Sin embargo, contando con un 486 a 66MHz, 8Mb RAM, módem de 14.400 baudios y conexión directa a Goya, el tiempo de respuesta para cualquier tipo de búsqueda oscila entre 5-10 segundos a media mañana. Obviamente, los servidores de las universidades superarán con mucho estas marcas: PCI no es lento, mucho menos teniendo en cuenta la cantidad de información gestionada.

Chadwyck-Healey España al completo. De izquierda a derecha: Patricia Morales (administración), Nachi Robledillo (marketing y servicio al cliente), Steve Hall (director general de Chadwyck-Healey), Mercedes Rodríguez (gerente) y Luis Masyebra (jefe de ventas)

Opciones de búsqueda

La estrategia se puede enfocar de dos maneras:

  • General Search: localización de artículos a través de los criterios antes comentados. Una vez recuperados los artículos de interés, cada referencia incluye dos links: a la ficha catalográfica completa de la revista y a la tabla de contenidos del número que contiene el artículo elegido (p. ej. Revista XXX, 25:50 - julio/agosto 1834).

    Esta tabla nos presenta el índice de dicho número, tal y como apareció en el original (paginación incluida).
  • Bibliographic Search: identificación de revistas a través de palabras clave. El resultado es una lista de fichas de revista que contienen la palabra clave en cuestión.

A partir de cada ficha se puede acceder a su vez a una lista de links a todos los números retrospectivos de la publicación desde el comienzo de su edición.

Así, podemos buscar información sin saber dónde se encuentran los artículos (General Search), o abrir directamente un número determinado para acceder a su índice.

El único "pero" de PCI

Uno de los aspectos más interesantes de PCI es la posibilidad que ofrece Chadwyck-Healey a los suscriptores de catalogar sin costo alguno los fondos de revistas con relevancia internacional de la propia institución (sólo colecciones completas).

Una vez delimitado el rango de revistas de interés, éstas se filtran en función de su relevancia/aportación internacional, y se procede a catalogar el fondo resultante a partir de las colecciones que existan en la Institución.

Obviamente, este proceso será bastante lento (localización, aprobación, etc.), pero la iniciativa hay que tenerla en cuenta.

Precisamente se intenta suplir uno de los mayores defectos de PCI Web de cara a nuestro legado: su limitada cobertura a nivel español.

Existen 54 revistas españolas volcadas o aprobadas para su inclusión hasta la fecha, 11 de ellas del propio Csic.

La razón se halla en el origen de la obra: PCI se genera en los EUA y, por lo tanto, es aquel país el que tiene mayor representación bibliográfica, ya que la labor de retroalimentación lleva ya 3 años en proceso. Sigue muy de cerca Inglaterra, Francia, Alemania, y el resto de países de primer orden. Otros, como Tanzania o Egipto, están mínimamente representados.

Pero, sin duda, lo que más se echa en falta es la localización de los fondos representados: desde la propia editorial nos confirman que existen avances para implementar dicho servicio, pero la logística necesaria para administrar lo que pueden llegar a ser 25 millones de artículos de 4 ó 5.000 revistas requiere una muy buena infraestructura... Habrá que tener paciencia.

En resumen, el objetivo de PCI queda claro: convertirse en una base de datos bibliográfica indispensable para la investigación en humanidades de los dos últimos siglos.

La idea, desde luego, es excelente y ambiciosa, y la fórmula propuesta está, a pesar de todo, muy bien resuelta en la mayoría de sus aspectos.

Perspectivas de futuro

El nombre de Chadwyck-Healey España, por muy peculiar que parezca, no es extraño para la mayoría de los bibliotecarios españoles.

Esta empresa, aunque abrió sus puertas en el mercado español allá por 1990, nació con la experiencia de 25 años de su "hermana", Chadwyck-Healey Inglaterra, en la edición de publicaciones bibliográficas enfocadas para el mercado académico y biliotecario del mundo entero.

Bibliografía Nacional Española fue su primera apuesta para y por el mercado español. Seis años después, su catálogo de obras con contenido netamente hispano se ha extendido notablemente: Novum Regestrum, Directorio de Bibliotecas y Autoridades en formato cd-rom, Escritoras Españolas y varios especiales en microficha, por citar algunos.

Es precisamente por la aportación de su catálogo a nuestro -ya no tan abandonado - mundo académico por lo que la Redacción de IWE decidió otorgarle el premio IWE´96 en la reciente edición de Documat.

Entrevista a Luis Masyebra

Estuvimos charlando con Luis Masyebra, jefe de ventas de Chadwyck-Healey España, para obtener algo más de información sobre el pasado, presente y, sobre todo, el futuro de esta peculiar empresa.

¿Cómo nació Chadwyck-Healey?

-Sir Charles Chadwyck-Healey, nuestro presidente, intentó comprar una editorial hace 25 años porque tenía interés comercial en ciertos fondos antiguos que poseía la compañía. Descubrió que dicha empresa no estaba tan "perjudicada" como él esperaba, y, ante la imposibilidad de comprarla, se le ocurrió adquirir los derechos de edición en microficha a nivel mundial, cosa que -por aquel entonces - era toda una novedad.

Poco después empezó a licenciar los catálogos de grandes bibliotecas, que vieron que, además de obtener copias gratuitas de sus catálogos en microfichas con fines de seguridad, recibían dinero por la explotación comercial de sus fondos. Lo que antes era un gasto muy alto... se convirtió en un ingreso.

¿Cómo influyó el cd-rom en Chadwyck-Healey?

-Con la irrupción del cd-rom pudimos editar obras que antes eran impensables: otorgaron a la investigación y el trabajo académico una velocidad y flexibilidad que hoy ya nadie duda... English Poetry, Patrología Latina y las Bibliografías Nacionales superaron con creces nuestras expectativas de mercado. Con ellas dimos el salto de una pequeña, modesta editorial a una mediana multinacional... ¡pero igual de modesta!

¿Y las microfichas?

-Lo curioso es que la microficha no ha muerto tan rápido como mucha gente cree. Todo lo contrario: nuestra colección de Escritoras Españolas se vende estupendamente en los EUA, mucho mejor que en España, aunque por lógica debería ser al revés...

¿Y por qué no lo es?

-Quizá porque en los EUA están más extendidos los estudios de la mujer, quizá porque la microficha sigue teniendo calidad fotográfica cuando se trata de investigar obras antiguas, o quizá porque muchas veces olvidamos que el español sigue siendo el segundo idioma de aquel país... ¡sin olvidarnos de Latino América!

¿Qué pasa con los retos de ahora?

-Puede que Internet nos haga daño en el futuro próximo con algunas publicaciones, pero también nos está ayudando a abrir nuestro mercado haciendo más fácil y barato el acceso a nuestras publicaciones.

Hubo una razón muy poderosa para adelantar nuestra entrada en Internet: las universidades de los EUA ya no querían nuestros cd-roms. Ya no tienen tiempo ni equipos para administrar cantidades ingentes de publicaciones con software diferente, con actualizaciones diferentes, etc. Es una tarea tan ardua, que muchas obras "duermen" en las estanterías de las bibliotecas: si lo quieres ver, instálalo tú mismo.

Nos obligaron literalmente a cambiar nuestro enfoque y llevarlas al formato online.

¿Significa eso la muerte del cd-rom?

-¡Ni mucho menos! El cd-rom pasará el mismo proceso que el diskette o la microficha: aquellas obras que ya no son cómodas de usar en cd-rom pasarán a online; otras mantendrán su formato porque son obras cerradas, manejables desde su estado actual.

Personalmente creo que mucha gente se apunta demasiado rápido al carro de "matar soportes": papel, diskette, microficha, cd-rom, online... son todos formatos diferentes para distribuir información heterogénea. Se puede "envolver" una obra de otras muchas formas, pero un cambio de formato no significa en muchos casos una garantía de éxito.

Pero el futuro de Chadwyck-Healey pasa por la Red, ¿no?

-Sin lugar a dudas.

Cuéntanos cómo habéis enfocado el trasvase a este medio.

-La infraestructura para proveer información por Internet es tremendamente costosa: hay que invertir en máquinas y acumular know how sobre la marcha, aun a expensas de equivocarse.

Nuestra ventaja es que intentamos estar muy cerca del cliente, y él nos dice -por activa y por pasiva - lo que quiere y lo que no. Esto nunca ha cambiado en ningún mercado, sólo que aquí somos "cuatro gatos", y esa cercanía es mucho mayor que en el caso de Danone o Seat.

Periodicals Contents Index (PCI) era la obra idónea para entrar en Internet: 6 millones de registros de artículos que -hasta la fecha - ocupan 10 cd-roms... y creciendo. Seamos realistas, pocas son las universidades que están dispuestas a "hipotecar" tantas bocas para una publicación de humanidades.

Internet nos da la oportunidad de hacer un sistema multi-plataforma y dar acceso a nivel mundial de modo centralizado: no hay instalaciones que hacer, no hay actualizaciones que distribuir, no hay pérdida de funciones..., y podemos dar acceso a todas las máquinas de una institución simplemente a través del dominio IP del cliente.

Si a eso sumamos que la inversión necesaria por parte del cliente para acceder a toda la obra es la décima parte que en el cd-rom, se cierra el círculo mágico de Internet.

Sí, pero el cliente no tiene la propiedad de la información...

-Efectivamente. Es la misma diferencia entre alquilar o comprar un coche. Precisamente por eso no vamos a dejar de editar nuestras obras en cd-rom: hay países donde está estipulado por ley la adquisición obligatoria de ciertos contenidos.

Vuelvo al tema del futuro. ¿Qué tipo de obras editaréis en Internet?

-El futuro está ya aquí, y desde IWE lo gritáis suficientemente mes a mes. En enero de 1997 lanzaremos una idea que todos han soñado, pero que nadie ha realizado aún en el área de humanidades: la verdadera biblioteca virtual a nivel académico.

Este servicio estará totalmente enfocado -por ahora - al ámbito de la filología inglesa. El investigador llamará a una URL donde podrá establecer una serie de criterios o palabras clave para filtrar obras a texto completo: poemas, drama, ficción, etc. Estamos hablando de unas 100.000 obras en total, 80.000 de ellas de fondos de Chadwyck-Healey.

Una vez llegados al texto completo, se puede saltar a otras obras del autor, a su biografía, a otros "sites" que hablen del tema en cuestión, o incluso consultar una palabra en un diccionario que contextualice el significado del término en su época.

En realidad, estamos volcando todos nuestros productos a texto completo para cruzarlos desde un mismo interfaz. Las sinergias entre los productos de  nuestro catálogo de filología inglesa han sido algo premeditado desde hace mucho tiempo, pero esto sólo se pudo hacer realidad gracias a Internet.

Pero hay muchas cosas que no se encuentran en vuestro catálogo...

-Por supuesto. Hemos contado con muchos otros editores: Oxford University Press, Cambridge University Press, etc. La idea es hacer de LiOn (Literature Online) una herramienta indispensable en el estudio del inglés, y los editores han estado muy predispuestos a colaborar, porque en muchos casos  teníamos contenidos muy complementarios.

Pregunta obligada: ¿qué pasa con España?

-El potencial de España sigue siendo muy alto, a pesar del fuerte crecimiento del sector en los últimos años. Nuestro objetivo, aunque suene a tópico editorial, es seguir editando herramientas y obras indispensables para el trabajo diario de la comunidad académica. Autoridades es un claro ejemplo de ello.

Supongo que la Biblioteca Nacional tendrá mucho que decir en eso.

-Indudablemente, la aportación de la Biblioteca Nacional a nuestro catálogo español es innegable. Hay muy pocos productos en los que no haya tenido algún tipo de aportación. En muchos de ellos absolutamente toda. El esfuerzo ha sido conjunto y seguimos trabajando para editar todo lo que tenemos ya en proyecto. Ideas no faltan, desde luego.

Sin embargo, hay muchos contenidos que tienen un gran potencial de ventas fuera del ámbito de la Biblioteca Nacional, y en eso también estamos trabajando.

http://pci.chadwyck.com

http://www.chadwyck.co.uk

Chadwyck-Healey España. Juan Bravo 18 - 2º C. 28006 Madrid.

Tel.: +34-1-575 55 97; fax: 575 98 85

editor ARROBA chadwyck.es

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1996/diciembre/chadwyckhealey_entra_en_internet_por_la_puerta_grande.html