El profesional de la información


Septiembre 1995

Inmagic plus: gestión documental con doble sistema de índices y con lenguaje de definición de informes

Por Lluís Codina

Inmagic es un sistema de gestión de bases de datos documentales especializado en información textual no estructurada y/o en documentos científicos y técnicos, con prestaciones suficientes para automatizar las operaciones más importantes de la cadena documental.

Proporciona un conjunto de potentes y bien calibradas herramientas pensadas para ayudar a los profesionales de la documentación, por lo que no es extraño que sea, desde hace años, el programa que cuenta con mayor número de instalaciones en el competitivo mercado anglosajón de las bases de datos documentales.

En primer lugar, presenta la notable propiedad de que, salvo que el diseñador de la base haya indicado lo contrario, todos los campos de un registro Inmagic puede repetirse con el fin de estructurar los diversos valores de un campo en diversas ocurrencias del mismo campo.

Por ejemplo, en Inmagic, el campo "Autor" de una típica referencia bibliográfica puede admitir diversos valores (es decir, diversos nombres de autor) yuxtapuestos (esto es, situados uno a continuación de otro), como sucede con cualquier aplicación documental, pero, a diferencia de la mayor parte de ellas, Inmagic también puede generar n ocurrencias de cada campo, concretamente, tantas como autores tenga cada documento, y que Inmagic identifica entonces como Autor 1, Autor 2... Autor n.

Esto permite ubicar cada nombre de autor, por seguir con este ejemplo, en un campo diferente en aquellos documentos que así lo requieran, sin necesidad de dejar campos en blanco en los documentos con un único autor, como sucedería si quisiéramos alcanzar la misma prestación con otro programa.

Esta posibilidad de trabajar con campos iterados proporciona otras ventajas, principalmente permite un tratamiento diferenciado para cada valor a efectos de indexación, como después se verá, pero también de ordenación o de formateado del registro.

Modelar los datos

Si el diseñador de la base de datos ha establecido un diccionario de datos, Inmagic le proporciona herramientas suficientes para implementarlo. Recordemos en este sentido que recibe el nombre de diccionario de datos el conjunto de las especificaciones y de los criterios que deben satisfacer los valores de cada campo de una base de datos.

Tales especificaciones tienen por objetivo garantizar la coherencia y la consistencia de la información en una base de datos. Por ejemplo, supongamos que deseamos crear una base de datos para gestionar los proyectos de una empresa. Imaginemos que cada proyecto debe dar lugar a un expediente distinto y que, para describirlo en la base de datos hemos previsto, entre otros, un campo de identificación. Para que ese campo cumpla su cometido, no puede quedar nunca vacío ni puede contener un valor que se haya asignado a otro proyecto. ¿Cómo podemos garantizar eso? Pues bien, utilizando las herramientas del diccionario de datos y declarando, concretamente, que tal campo no puede contener valores nulos ni valores repetidos.

En Inmagic, tales funciones de implementación del diccionario de datos están repartidas entre dos módulos, designados por el programa como Estructura de datos y Validación de datos, respectivamente.

La Estructura de datos establece, para cada campo,

  • el nombre que usará internamente el programa y la etiqueta del campo, que es el nombre que mostrará el programa al usuario;
  • el método de indexación, entre los que pueden elegirse cuatro distintos;
  • el método de ordenación, de los que puede elegirse entre nueve posibilidades, así como un método denominado de énfasis, que consiste en el tratamiento de indexación que corresponde dar a los campos iterados (campos "múltiples" en la terminología de Inmagic).

En la Estructura de datos se define también, optativamente,

  • un campo clave que, por definición, nunca puede tener valores nulos ni repetidos;
  • el campo de ordenación por defecto, que no tiene que ser necesariamente el mismo que el campo clave;
  • la lista de palabras vacías, de las que sólo admite 255;
  • y, algo poco usual, la lista de artículos a ignorar cuando se ordenen los registros (por ejemplo, los artículos "el", "la", "los", "un", etc.).

Además puede establecerse una palabra de paso (password) general y un esquema de protección, que actúa a nivel de cada campo, que permite al administrador de la base asignar hasta tres niveles de privilegio distintos para los diversos usuarios de la base.

La Validación de datos, por su parte, incluye un conjunto de restricciones para cada campo, que contempla la ya mencionada imposibilidad de que uno o más campos contengan valores nulos y/o repetidos, así como permite limitar el rango de valores que puede admitir un campo, definir patrones de valores, declarar campos cuyos valores deben coincidir con una lista predefinida y con posibilidad o no de admitir otros valores, etc.

Métodos de indexación

Inmagic, a diferencia de otros programas documentales que indexan por un único método, proporciona tres procedimientos de indexación distintos: por palabras, por términos de indexación y por una combinación de los dos anteriores.

El método por palabras es el habitual de todos los programas documentales, y consiste en identificar cadenas de caracteres situadas entre separadores de palabras (espacios en blanco, símbolos de puntuación, etc.), que serán las entradas del índice, llamado fichero invertido. Este método genera una entrada de índice para cada palabra distinta existente en la base de datos.

El método de términos de indexación, en cambio, acepta cadenas de caracteres compuestas por una o por varias palabras, y así cada entrada del índice puede ser o bien una palabra o bien una frase. Un registro con tres descriptores, por ejemplo <Procesadores>, <Procesadores digitales de señales>, <Procesadores risc>, generará cuatro entradas distintas ("de" no figurará en el índice si se declaró como palabra vacía en la Estructura de datos) por el procedimiento palabra a palabra:

  • Digitales
  • Procesadores
  • Risc
  • Señales

En cambio, por el segundo procedimiento, el índice tendrá tres entradas:

  • Procesadores
  • Procesadores digitales de señales
  • Procesadores risc

Lo mejor de Inmagic es que se pueden combinar los dos métodos de indexación en el mismo campo, de manera que es posible recuperar documentos utilizando las dos formas indistintamente, y se puede consultar uno u otro índice así creado conmutando entre ellos mediante una tecla de función.

Sistemas de ordenación

Por otro lado, Inmagic Plus hace de la ordenación y de la confección de informes una pequeña obra de arte. Respecto a la primera, proporciona diversas maneras de alfabetizar (como dicen los documentalistas) caracteres y palabras. Por ejemplo, se puede elegir entre ordenar palabra a palabra o letra a letra, lo cual produce resultados muy distintos.

En general, estamos acostumbrados a la ordenación palabra a palabra, según la cual, 'nada' va antes que 'algo'. Por ejemplo, la cadena de caracteres <San Juan> irá antes que la cadena <Sanjuán>, y <Barcino> antes que <Barcinova>, etc.; pero, por si esa ordenación no le conviene al usuario, el programa le ofrece otras ocho formas de ordenación, entre las que se encuentra la mencionada ordenación letra a letra y otras formas que combinan distintas maneras de tratar caracteres y cifras, así como otra para ordenar fechas y aun otra para tratar códigos alfanuméricos de la CDU (Clasificación decimal universal).

Definición de informes

La confección de informes es otro de los puntos fuertes de Inmagic. En este sentido, tal vez sea, con mucho, el programa más completo en su género. Inmagic dispone de un conjunto de herramientas que permiten especificar con todo detalle:

  • primero, qué información debe figurar en cada informe, lo cual puede incluir la realización de cálculos numéricos con los valores de los registros;
  • segundo, cómo debe ordenarse esa información en cada página; y,
  • tercero, por qué criterios deben ordenarse los registros que forman parte del informe.

El lenguaje de definición de informes contempla así seis juegos de instrucciones que sirven para establecer los distintos aspectos del informe. Por ejemplo,

  • para especificar los aspectos físicos de la página, tales como dimensiones y distancia entre márgenes (Page definition);
  • para definir cálculos que Inmagic aplicará después de formatear el informe, por ejemplo, sumatorios, totales, divisiones, etc. (Calculations definitions);
  • para especificar la forma en que se presentará cada registro (Record layout), etc.

Inmagic proporciona también 21 funciones, denominadas comandos, que actúan como primitivas del lenguaje de definición de informes, y que incluyen, por ejemplo, una función ARROBA List, que imprime los valores del campo como una lista, mientras que ARROBA Paragraph lo hace, en cambio, como un párrafo.

Otras funciones establecen cómo debe ser la disposición de la información en la página: por ejemplo, el comando Justify, que impone un modo determinado de justificación; y una última serie designa aspectos de formato, por ejemplo, la función Separate, que imprime un texto o una puntuación especificada entre los valores de un campo, etc.

Pese a todo, el proceso de definir informes es extremadamente simple. Además sus sofisticadas posibilidades no anulan nunca la sencillez de uso, entre otras cosas, porque siempre existe una forma de acción por defecto que evita al usuario final la necesidad de profundizar en el programa si no lo desea.

Un pequeño gran programa

En cuanto al lenguaje de interrogación, presenta los clásicos operadores booleanos, de proximidad y de comparación, así como un modo sencillísimo de diseñar máscaras de consulta para el usuario final, que siempre tiene la posibilidad de navegar por la información consultando los índices que crea el programa, y que se pueden mostrar separados para cada campo. El lenguaje de recuperación permite también diferenciar entre combinaciones de palabras: <Procesadores>, <Señales>, con un AND o un OR implícito, y términos de indexación, como <Procesadores de señales>.

Una serie de facilidades adicionales para la creación y edición de registros, para la grabación de estrategias de búsqueda, para efectuar cambios globales en la base de datos, para importar registros, etc., hacen de Inmagic Plus un programa que los documentalistas profesionales apreciarán considerablemente.

Inmagic Plus forma parte, de hecho, de una familia de programas (de la cual es el núcleo principal) que extienden y amplían sus posibilidades. En este sentido, los distribuidores del programa informan que existen aplicaciones complementarias de Inmagic que, entre otras cosas, le permiten gestionar la carga de la información desde un escáner, así como asociar imágenes a registros textuales, lo cual convierte a Inmagic Plus en un sistema de gestión electrónica de documentos (sged). Otra aplicación complementaria consiste en una versión cliente que permite consultas, pero no modificaciones, etc.

El hecho de que se trate de un programa para DOS no deja de tener a

Algunas ventajas. Por ejemplo, sus modestos requerimientos de hardware para los tiempos que corren, ya que no necesita más que 640 Kb de memoria RAM y funciona estupendamente bien en equipos 386.

Finalmente, cabe señalar que existe también versión para red y para máquinas DEC/VAX bajo VMS.

Lluís Codina. Universidad Pompeu Fabra.

codina_lluis ARROBA fcsc.upf.es

Inmagic Plus. DOC6. Mallorca 272, 3ª pl. 08037 Barcelona.

Tel: +34-3‑215 43 13; fax: 488 36 21

Comandante Zorita 8, 1º 2ª. 28020 Madrid.

Tel: +34-1-553 52 07; fax: 534 61 12

100141.3062 ARROBA compuserve.com

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1995/septiembre/inmagic_plus_gestin_documental_con_doble_sistema_de_ndices_y_con_lenguaje_de_definicin_de_informes.html