Marzo 1997
Wais: un servicio de Internet para ofrecer bases de datos documentales
Por Cristòfol Rovira
Wais (Wide area information server) es un
servicio de Internet, basado en el protocolo Z39.50 y que
funciona bajo la arquitectura cliente/servidor. Con esta
aplicación se pueden crear y gestionar bases de datos
documentales en Internet a partir de ficheros ascii, páginas
html, ficheros de gráficos, registros en formato
Marc... Cualquier documento de texto puede ser convertido en
base de datos indicando, mediante etiquetas, el inicio de cada
campo y el cambio de registro.
Este sistema incorpora las opciones básicas de los programas de gestión documental, como búsquedas con operadores booleanos, limitación por campos, operadores de proximidad, truncamientos, fichero de palabras vacías... Estas características han hecho que Wais sea, hasta hace poco, la única opción para ofrecer bases de datos documentales en Internet. Ahora, en cambio, parece que se avecina una avalancha de este tipo de productos.
No obstante, el servicio Wais ha tenido poca aceptación: casi nadie se instala un cliente Wais para buscar información en Internet. Sorprende esta situación al constatar que este sistema tiene la misma base tecnológica (cliente/servidor) y las mismas condiciones de adquisición (gratuidad) que otros servicios de Internet. Hay dos motivos básicos para esta infrautilización: la todavía deficiente integración del Wais en la World Wide Web y la aparición de los motores de búsqueda.
Orígenes de Wais
Se debe a un proyecto conjunto de las empresas Apple, Thinking Machines y Dow Jones dirigido por Brewster Kahle. El objetivo era construir una herramienta para facilitar la búsqueda de información en Internet. El diseño original funcionaba mediante comandos en una interface no gráfica. Sin embargo, la gran aceptación de la World Wide Web provocó la creación de pasarelas para consultar bases de datos Wais a partir de páginas html, siguiendo la tendencia general de incorporar todos los servicios de Internet en la web y convirtiendo al html en la interface estándar de usuario.
La integración del Wais en la web es posible gracias a los CGI (Common Gateway Interface), scripts que permiten ejecutar un programa externo a la web, suministrando desde una página html los parámetros y datos necesarios para que el programa funcione y mostrando los resultados también en formato html. Este modo de incorporar el Wais a la web tiene la ventaja de aprovechar el software existente, aunque el rendimiento obviamente se resentirá. El uso de los servidores Wais a partir de páginas html ha hecho innecesario instalar clientes Wais. Tampoco se usan direcciones Wais, ya que en la mayoría de ocasiones se accede directamente a un formulario albergado en una web, ejecutando una búsqueda sin saber siquiera que se está utilizando este servicio.
El objetivo final de los Wais se ha modificado con la aparición de la web. El diseño original pretendía la indexación de la información de Internet de manera descentralizada y con la pretensión de abarcar toda la red. En la actualidad son los motores de búsqueda los que tienen este objetivo, pero de manera más centralizada. Los Wais se utilizan ahora para ofrecer bases de datos o catálogos con la documentación interna de una organización. Por tanto, las búsquedas Wais siempre serán muy parciales, aunque se ofrezca la opción de interrogar diversas bases de datos al mismo tiempo.
Wais y motores de búsqueda
Aunque los Wais y los motores de búsqueda realicen funciones paralelas, tienen diferencias importantes que determinan un uso diferenciado de ambos recursos. Los motores de búsqueda son productos comerciales con una infraestructura tecnológica y humana muy importante y con una administración centralizada. Los Wais, en cambio, no tienen una orientación comercial, ni una administración centralizada porque indexan sólo la información interna de una organización, utilizando muchas veces un software de dominio público.
Otra diferencia importante es el tipo de indexación que ofrece cada producto. Por un lado, los motores de búsqueda disponen de un módulo de indexación automática que viaja autónomamente por Internet, recogiendo direcciones y indexando según las propiedades estadísticas de los recursos localizados. Posteriormente algunos motores realizan además una clasificación manual. El resultado de este proceso es una base de datos de referencias a recursos de Internet, con sus correspondientes enlaces. En los Wais, en cambio, la indexación es sólo manual, y el resultado de la indexación incluye los ficheros de índices que permitirán diferentes tipos de búsquedas y el propio documento indexado.
En otras palabras, los motores de búsqueda son bases de datos referenciales y los Wais normalmente son bases de datos a texto completo. Esta diferencia que en otros soportes (papel, cd-rom, bases de datos online) sería esencial, tiene poca importancia en Internet, ya que en este medio tener la referencia a un documento es prácticamente lo mismo que tener el propio documento (a no ser que la dirección no esté actualizada). En realidad son dos productos complementarios: los Wais para realizar búsquedas muy concretas sobre la documentación de una organización y los motores de búsqueda para realizar búsquedas sobre toda la Internet.
Wais público y Wais privado
A partir de 1992 Brewster Kahle continuó en solitario el proyecto iniciado por Apple, Thinking Machines y Dow Jones fundando la empresa Wais Inc.
http://www.wais.com
Paralelamente algunas organizaciones, sin ánimo de lucro, creaban versiones de dominio público de Wais, responsabilizándose de su mantenimiento con nuevas versiones y moderando grupos de discusión sobre sus productos:
1. freeWais creado por la Cnidr (Clearinghouse for Networked Information Discovery and Retrieval) http://ls6‑www.informatik.uni‑dortmund.de/freeWAIS‑sf/README‑sf
ftp://ftp.cnidr.org/pub/NIDR.tools/
2. freeWais-sf de la Universidad de Dortmund
ftp://ls6-www.informatik.uni-dortmund.de/pub/wais/
Las características de las versiones públicas y privadas de Wais son muy parecidas, aunque el Wais de pago incluye algunas opciones más potentes en la definición de formatos de registro y en las búsquedas.
Existen otros programas en Internet que realizan las mismas funciones que Wais. Los más conocidos son Swish
http://www.eit.com/software/swish/swish.html
e Isite
http://vinca.cnidr.org/software/Isite/Isite.html
Ambos son de dominio público y funcionan también bajo la norma Z39.50. Swish es un programa para recuperar información sobre los índices generados por Wais. Sus creadores dicen que ofrece una instalación más sencilla. Isite está formado por un recuperador (Isearch) y un indexador que genera los índices en su propio formato.
Instalación de freeWais-sf
El freeWais-sf apareció después del freeWais, funciona sobre la versión 2 de la norma Z39.50 y mejora substancialmente el tratamiento por campos que ofrecía su predecesor. Por ahora es el Wais de uso público el que ofrece más garantías y mejores prestaciones. Está formado por tres módulos:
La instalación de freeWais-sf, y en general cualquier producto de uso público, exige grandes dosis de paciencia por el mal acabado en los programas de instalación. Los ficheros que se obtienen vía FTP están en código fuente y se compilan en la máquina donde serán instalados según las características de su sistema operativo. freeWais-sf dispone de un script de instalación que ayuda en este proceso, va pidiendo al usuario las características de la plataforma, para seguidamente compilar con los parámetros adecuados.
Para hacer accesible el freeWais-sf desde la web habrá que instalar también un CGI. Hay diferentes opciones, por ejemplo:
SF-gate es el CGI que ofrece más garantías para trabajar junto a freeWais-sf. También hay que compilarlo en la máquina del servidor y crear una página html que utilizará el usuario en sus consultas. Esta página está formada por una etiqueta <form> para recoger las opciones de búsqueda: términos a buscar, campos a utilizar, número máximo de ítems a encontrar... El form ejecuta el CGI que, a su vez, ejecuta el freeWais-sf según estos parámetros y procesa la respuesta para mostrarla en formato html.
En resumen, FreeWais-sf y SF-gate son dos aplicaciones de dominio público que permiten hacer accesibles bases de datos documentales y catálogos en Internet. A pesar de algunas lagunas en la indexación por frases y en el fichero de sinónimos, ofrecen las prestaciones básicas de una base de datos documental clásica. Con un poco de paciencia en el proceso de instalación, se obtendrá una herramienta para ofrecer búsquedas en bases de datos de todo tipo de documentos: catálogos en formato Marc, páginas web, documento de texto con estructura de campos...
Direcciones útiles
Grupo de discusión sobre Wais:
Lista de distribución sobre Isite:
Lista de distribución sobre freeWais-sf:
Home de Isite:
http://vinca.cnidr.org/software/Isite/Isite.html
Documento creado por la Universidad de Leeds sobre cómo instalar un servidor web. Tiene un apartado sobre programas de indexación y búsqueda muy completo:
http://www.leeds.ac.uk/ucs/WWW/handbook/handbook.html
Cristòfol Rovira
Secció Científica de Biblioteconomia i Documentació. Departament de Ciències Polítiques i Socials. Universitat Pompeu Fabra
Tel.: +34-3-542 22 64; fax: 542 23 72
rovira_cristofol ARROBA fcsc.upf.es
Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1997/marzo/wais_un_servicio_de_internet_para_ofrecer_bases_de_datos_documentales.html