El profesional de la información


Octubre 1993

Nuevos programas de gestión documental para PC

Por Lluís Codina

Tres sistemas de gestión documental para microordenadores renuevan la oferta de este tipo de programas en nuestro país. Se trata de Windows Personal Librarian (CSi), FlashMedia (Centrisa) e Inmagic Plus (Doc6).

Los dos primeros son programas diseñados para Windows (ver IWE-17, p. 6-8), mientras que Inmagic Plus lo es para el sistema operativo DOS. Los tres incorporan, bajo filosofías bien distintas, la capacidad de gestionar imagen, además de texto. Aunque comparten algunas características, como la mencionada, cada uno de ellos se dirige, sin embargo, a nichos relativamente diferenciados dentro de las necesidades propias de la gestión documental.

Windows Personal Librarian está especializado en gestionar bases de datos de texto completo y se mueve con comodidad entre grandes volúmenes de información, no necesariamente organizada de manera uniforme; FlashMedia, por su parte, es una potente combinación de base de datos documental y base de datos relacional, desarrollado por Centrisa con herramientas como Full/Text ; mientras que Inmagic Plus es la versión, bastante renovada, de un "clásico" de los programas documentales, que incorpora ahora la posibilidad de asociar imagen a sus registros.

Personal Librarian parece orientarse con preferencia a las bases de datos de texto completo y a la distribución de información en soportes ópticos; FlashMedia se orienta hacia la gestión integral de la documentación de empresa, incluyendo documentos virtuales y multimedia; e Inmagic Plus se mantiene fielmente pegado al terreno de las bases de datos documentales de tipo referencial, pero con la posibilidad de asociar la imagen del documento. En este artículo se describirá con cierto detalle al primero de ellos, y en próximas entregas se hará igual con los otros dos. En tal sentido, parece oportuno recordar al lector que estos análisis, ni sustituyen ni compiten con la información que sobre ellos pueden proporcionar las empresas que se ocupan de su distribución y soporte técnico, a las cuales remitimos a todos los posibles interesados en estos programas.

Personal Librarian : la innovación por excelencia

Windows Personal Librarian (WPL) es un programa para gestionar grandes volúmenes de información textual que, eventualmente, puede estar acompañada de imágenes, identificadas mediante un botón, y de cuya visualización y manejo se ocupa una utilidad que se integra perfectamente en el programa.

El programa soporta por igual registros libres es decir, sin ningún formato previo y registros estructurados mediante campos, y en todos los casos sin limitaciones en la extensión del texto que pueden contener.

En cuanto a la recuperación de información, además de los procedimientos habituales, con operadores booleanos, operadores de proximidad y truncamientos, etc., ofrece una serie de herramientas potentes y muy innovadoras.

La más importante de ellas consiste en que, cuando recupera un conjunto de documentos susceptibles de satisfacer una necesidad de información, el programa no se limita a mostrarlos al usuario en un orden aleatorio, como hace la mayor parte de los programas existentes, sino que, previamente, calcula la probabilidad de relevancia de cada documento respecto a la consulta concreta que ha formulado el usuario, y ordena todos ellos de acuerdo con dicha probabilidad.

Para comprender bien el valor de esta prestación, recordemos que la cualidad de un documento para satisfacer una necesidad de información se denomina relevancia, concepto que se conoce también como pertinencia y precisión. No vamos a entrar en detalles y matices aquí sobre estos términos tan universalmente controvertidos y discutidos en Documentación, y aún mucho más en sus correspondientes traducciones al castellano. Digamos solamente que últimamente parece que los autores anglosajones están yendo otra vez a relevance.

La relevancia de un documento puede ser total (1), nula (0) o adoptar cualquier valor intermedio. Pero esta relevancia no es un atributo objetivo del documento, sino una conjunción entre la necesidad de información concreta del usuario, sus conocimientos previos, las características del documento y el orden en el cual los documentos recuperados son leídos o explorados por el usuario. En relación a los términos empleados en la búsqueda, téngase presente que éstos pueden figurar una o varias veces en los documentos recuperados, puesto que normalmente se tratará de documentos en texto completo. Un documento en el que el término consultado se repita más veces será más relevante.

Cabe considerar también que la respuesta habitual ante una gran cantidad de documentos recuperados consiste en utilizar nuevos términos de búsqueda combinados por operadores booleanos, para ir restringiendo el número total de documentos y dejarlo por debajo del punto de inutilidad ( futility point ), es decir, por debajo de aquella cantidad de información que el usuario preferirá no leer, dado su volumen.

Sin embargo, para que la operación anterior tenga éxito, debe tenerse un buen conocimiento de la base de datos, un buen dominio de la lógica booleana y un buen conocimiento del tema de búsqueda, además de tiempo y paciencia.

La vía de WPL, en este sentido, consiste en que, no importa cuan grande sea el número de documentos recuperados. El usuario sabe que justo los primeros son los más pertinentes a su pregunta y, por tanto, le basta con atender sólo a aquellos documentos que hayan superado un cierto umbral de pertinencia. Como el primer documento es el más pertinente, el segundo sólo un poco menos pertinente, etc., él puede situar el umbral donde crea conveniente, según el tiempo de que disponga, el tamaño de los documentos, tema, etc.

Así pues, el cálculo del grado de relevancia de un documento sólo puede hacerse en relación a cada necesidad concreta de información, y esto es lo que hace, de forma transparente y automática, el programa WPL. Aunque el manual del programa no lo especifica, es de suponer que este cálculo se basa en las propiedades estadísticas (probablemente en la frecuencia inversa de las palabras no vacías) de los documentos en la base, y en su grado de semejanza con las palabras contenidas en la expresión de búsqueda del usuario.

Una vez calculada esta relevancia, WPL ordena los documentos por el grado de probabilidad de que sean capaces de resolver la necesidad de información del usuario.

Además, para ayudar a éste a estimar la relevancia del conjunto de documentos recuperados, el programa puede mostrar esa información en forma de gráfico de barras. De esta manera, se puede apreciar de un vistazo si existen muchos o pocos documentos que acierten y con qué grado, la similitud entre ellos, etc.

Con ser importante la prestación mencionada, no acaban aquí, ni mucho menos, las posibilidades de RI de este excelente sistema documental, puesto que está dotado de un conjunto de herramientas, de extraordinaria potencia, que convierten al usuario del programa en un auténtico navegante de la información. Existe la opción expand capaz de calcular qué otros conceptos están relacionados con el término o términos de búsqueda utilizados por el usuario, y entonces los presenta en una ventana como sugerencias de nuevos conceptos de búsqueda.

Concept

Una versión aún más potente y espectacular de esta instrucción ( concept ), realiza la misma función pero, demás, ejecuta automáticamente la búsqueda de todos los documentos así vinculados y los presenta ordenados según su grado de relevancia. Ambas opciones se basan, probablemente, en algún cálculo de co‑ocurrencias de palabras, a partir del cual WPL puede estimar la probabilidad de que aquellos documentos en los cuales las co‑ocurrencias superen un cierto umbral, pueden tratar de los mismos temas por los cuales se interesa el usuario.

El resultado de una búsqueda con concept puede ser un grupo de documentos sorprendentemente grande, pero tiene sentido gracias a que WPL siempre presenta los resultados ordenados según su grado de pertinencia.

Otra de las opciones de RI del programa es la posibilidad de seleccionar un bloque de un documento, una frase o un párrafo, y convertirlo en una orden de búsqueda. La instrucción search calcula entonces los documentos que contienen información parecida al bloque de texto seleccionado.

Además, por supuesto, el programa proporciona los operadores booleanos habituales, truncamiento, semejanza fonética, etc., así como las operaciones de hojeo ( browse ) registro a registro, mediante selección del conjunto recuperado, por número, por ligaduras tipo hipertexto, etc.

Como se mencionó anteriormente, WPL puede trabajar con cualquier formato de documentos, con campos o sin ellos, y los campos a su vez pueden estar o no indexados, ocultarse los nombres de los campos o exhibirse, etc., e iguales opciones con el contenido de los campos. Para el administrador de la base las opciones son también generosas, de manera que dispone de todas las herramientas para controlar accesos, otorgar palabras de acceso, establecer niveles de seguridad y confidencialidad, etc.

En conclusión, WPL es, hoy por hoy y en el segmento de los microordenadores, el sistema que incorpora las opciones de recuperación de información más innovadoras del mercado, y todo ello integrado en una interfase de usuario extremadamente agradable y fácil de usar. Cabe destacar que el manual está bien escrito y bien diseñado y que incluye un buen tutorial. El proceso de aprendizaje para un usuario final acostumbrado a Windows será casi instantáneo, por lo menos para las acciones más importantes relacionadas con la interrogación, visualización, etc. El administrador de la base habrá de dedicar más tiempo, naturalmente, pero con todo no le será difícil hacerse con el control del programa.

Su estrategia de utilización lo situaría en el terreno de las bases de datos de texto completo de gran volumen y que deban ser consultadas, indistintamente, por usuarios sin experiencia o usuarios entrenados. Puede resultar idóneo también, y de hecho así lo han considerado ya algunas empresas dedicadas a la publicación electrónica, como sistema para distribuir información mediante disco óptico.

Empresas y productos citados:

Compact Software Internacional (Windows Personal Librarian). Tel: +34-1-578 29 85; fax: 577 45 61

Centrisa (FlashMedia). Tel: +34-3-207 55 11; fax: 459 00 14

Doc6 (Inmagic Plus). Tel: +34-3-414 06 79; fax: 201 63 57

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1993/octubre/nuevos_programas_de_gestin_documental_para_pc.html