El profesional de la información


Septiembre 1998

Sistemas GED e indexadores intranet: ¿alternativas excluyentes o tecnologias complementarias?

Por Ricardo Eíto Brun

Un sged almacena los documentos en su formato nativo, es decir, en el formato que se les dio desde la aplicación con la que fueron creados (archivos .doc, .rtf, .mif, .gif, .tif, etc.). Descartamos del grupo de sged a los sistemas que para poder controlar documentos y permitir búsquedas en texto completo, requieren algún tipo de compilación o conversión previa a un formato propietario: Folio, Enigma Insight, etc. Estos productos resultan excepcionales para la publicación de grandes volúmenes de documentación en cd-rom, intranets e internet, etc., pero no responden al modelo de sged al que nos estamos refiriendo.

Ricardo Eíto BrunLa gestión documental es una pieza clave en las iniciativas destinadas a la gestión del conocimiento. De hecho, proveedores tradicionales de aplicaciones para la gestión documental (en adelante sged) proponen sus productos como las soluciones más adecuadas para implantar una gestión del conocimiento eficaz.

Por otra parte, las empresas que estaban ofreciendo motores de recuperación textual han ampliado las funciones de sus aplicacions, añadiéndoles nuevos módulos que las aproximan a los sistemas groupware, al mismo tiempo que garantizan la compatibilidad con los estándares abiertos de internet. Utilizaremos el término indexadores de intranet para hacer referencia a este tipo de soluciones.

Como resultado nos encontramos con un amplio número de aplicaciones que se autoproclaman válidas para implantar un sistema de gestión documental, con lo que resulta difícil decidir cuál es la alternativa más adecuada para las necesidades específicas de una organización. A continuación se describen y comparan las prestaciones y estructura de los sged con la de los indexadores de intranets.

Interface del software cliente de DocsOpen. La parte izquierda recoge las agrupaciones lógicas de documentos, y las macros de búsqueda almacenadas. En la derecha se pueden observar los iconos correspondientes a las aplicaciones integradas.

Sistemas de gestión electrónica de documentos

En primer lugar debemos indicar brevemente a qué nos referimos cuando utilizamos esta expresión. Es posible que resulte confuso, ya que aglutina distintas tecnologías (imaging, workflow, bases de datos relacionales, etc.), y las ofertas comerciales disponibles pueden conducir a error. Este problema se ha acentuado en las últimas fechas con la eclosión de la "gestión del conocimiento": numerosos fabricantes pretenden ofrecer soluciones óptimas para la nueva corriente de moda en la gestión empresarial, y no resulta fácil posicionar la amplia gama de productos disponibles en un mercado caracterizado por un tremendo dinamismo.

Los programas de gestión documental comparten características comunes en cuanto a arquitectura, funcionalidad y capacidad de integración.

Cuando un usuario hace un check-out sobre un documento, está reteniendo ese documento de forma que sólo él puede editar y modificar su contenido. El resto de usuarios sólo podrán consultar el documento en modo lectura, hasta que el usuario que ha realizado el check-out decida desbloquear el documento realizando un check-in. Al hacer un check-in, el sistema permite sobreescribir la versión previa del documento con los cambios que se hayan realizado, crear una nueva versión, o guardarlo como un nuevo documento.

Arquitectura

Un sged se estructura en torno a un repositorio, a un motor de indexación, al software servidor y las herramientas de usuario final, o software cliente.

El repositorio está formado por los archivos que forman los documentos, y por una base de datos relacional (Oracle, Sybase, SQL-Server, etc.).

Los documentos se guardan como archivos en formato nativo; es decir, en el formato que se les haya dado desde la aplicación con la que fueron creados. Un sged gestionará archivos distribuidos en múltiples dispositivos de almacenamiento. La distribución de estos ficheros será transparente para los usuarios, que no necesitarán saber en qué unidad de disco o directorio se encuentra un documento para poder acceder a él. En su lugar, el sged organizará los documentos en agrupaciones lógicas que contendrán documentos almacenados en distintos directorios y unidades de disco.

Un sged siempre utiliza una base de datos relacional para registrar las propiedades descriptivas e identificadores de los documentos. La base de datos relacional no sólo registrará esta información, sino también todos los datos relativos a usuarios y permisos, agrupaciones lógicas de documentos y, en general, el conjunto de metadatos que gestiona el sistema.

Finalmente, un sged cuenta con un último componente: un motor de indexación y búsqueda. Éste creará índices a partir del texto completo de los documentos, y permitirá a los usuarios del sistema interrogar esos índices. El motor de indexación tendrá la capacidad de identificar los términos de los documentos, cualquiera que sea su formato y el dispositivo en el que estén almacenados.

Generalmente los sged implementan los servicios de indexación integrando software de terceros. Por ejemplo, Documentum y Lotus Notes utilizan el motor de indexación de Verity; DocsOpen puede trabajar con Verity o Fulcrum, etc.

El software servidor se encarga de controlar las interacciones con los equipos clientes, y de dar respuesta a sus peticiones, recuperando y gestionando la información disponible en el repositorio -propiedades y documentos- y en el motor de indexación. El software servidor también gestiona los permisos y privilegios de los usuarios, garantizando la integridad de la información gestionada por el sistema.

El software cliente de un sged permite a los usuarios acceder a los documentos y trabajar con ellos. Entre las acciones que pueden realizarse sobre los documentos se encuentran: abrir y editar un documento y sus propiedades descriptivas, grabar en la base de datos, publicar versiones aprobadas, crear versiones de un documento ya existente, enviarlo por correo-e, interrogar sus propiedades y los índices en texto completo, etc.

La integración mediante Odma permite que, al seleccionar el comando "Guardar Como" desde un procesador de texto, se llame a una ventana del software cliente del sged desde la que se podrá grabar el documento en la base documental controlada por el sistema.

Un sged sólo permite la duplicación de información con el propósito de publicar documentos en un formato que garantice un acceso universal, independiente de sistemas operativos, plataformas hardware y de la aplicación con la que se creó. Esta capacidad se denomina rendition, y la utilizan los principales sged para los ciclos de revisión y publicación de documentos con un alto grado de sensibilidad a los cambios de contenido.

Integración

Una de las características más importantes de un sged es la posibilidad de integrar las funcionalidades de su software cliente en las aplicaciones de sobremesa con las que se crean los documentos: procesadores de texto, desktop publishing (autoedición), hojas de cálculo, correo electrónico, etc.

La integración hace efectivo el control sobre la base documental de la organización, ya que los usuarios no tendrán que hacer ningún esfuerzo adicional para que los documentos estén accesibles y no han de aprender a utilizar una nueva herramienta para comenzar a disfrutar de las ventajas de un sged de forma inmediata.

La integración con las aplicaciones de sobremesa se consigue a través de interfaces propietarias desarrolladas a medida, y mediante el protocolo Odma (Open document management api, siendo api = application programming interface) (v. IWE-31, febrero 1995, p. 7), desarrollado y mantenido por la Aiim (Association for image & information management), consorcio de grandes fabricantes de soluciones para la gestión documental. Como ejemplo de interfaces propietarias podemos citar el módulo FrameLink, que integra el software Adobe FrameMaker con el sged Documentum, o la unión de Docs Open con el software de edición electrónica Insight Into Information de la compañía Enigma.

Funciones

Un sged ofrece:

  1. Control sobre la base documental, desde una doble perspectiva:

    En cuanto archivo, un sged se integra con el sistema de ficheros del sistema operativo de red, y amplía sus funciones con utilidades adicionales para el almacenamiento seguro, replicación, bloqueo de accesos concurrentes, seguridad y confidencialidad, etc.

    En cuanto contenedor de información, el sged garantiza que los usuarios del sistema trabajen siempre con información correcta y actualizada. Además elimina las copias no controladas mediante la supresión de versiones, check-in/check-out, y permite el acceso simultáneo a los documentos de trabajo con sus versiones publicadas ("sincronización" han llamado a esto los ingleses).
  2. Acceso a la información mediante búsquedas en texto completo, búsquedas por propiedades y agrupaciones lógicas. Cada agrupación lógica reune un conjunto de documentos relacionados: por ejemplo, todos los documentos generados por la tramitación de un expediente, o las especificaciones de diseño de un nuevo producto. Un documento podrá formar parte de múltiples agrupaciones lógicas sin que sea necesario duplicarlo en cada una de ellas.
  3. Publicación de documentos en otros formatos. Los sged suelen ofrecer módulos para publicar documentos en carpetas públicas de sistemas de mensajería, bases de datos Notes, sistemas de edición electrónica e intranets corporativas. Esta última función ha cobrado especial importancia en los últimos dos años.
  4. Enrutamiento de documentos o control de flujos de trabajo. El sistema permite automatizar y controlar la secuencia de tareas efectuadas sobre los documentos: revisar, aprobar, publicar, notificar cambios a otros usuarios, etc. Implantar un sged sin sus posibilidades de gestión de flujos de trabajo, o sin integrarlo con otro sistema que ofrezca estas prestaciones, restaría una gran funcionalidad al sistema.

Automatismo: hay que tener en cuenta que, si sólo el 20% de la información con la que trabaja una empresa está almacenada de forma estructurada -bases de datos relacionales-, del 80% restante se ha llegado a estimar que sólo un 5% se gestiona mediante un sged, debido en gran parte al desinterés de los usuarios por aprender el funcionamiento de una nueva herramienta.

Empresas citadas

Enigma Europe. Caleruega, 51 - 5º C. 28033 Madrid.

Tel.: +34-917 664 706

http://www.enigmainc.com

Documentum Software Europe. 5 Roundwood Avenue, Stockley Park. Uxbridge, Middlesex UB11 1NZ, Reino Unido.

http://www.documentum.com

Muscat. St. John Innovation Centre, Cowley Road. Cambridge, CB4 4WS, Reino Unido.

http://www.muscat.co.uk

PC Docs, Inc. 25 Burlington Mall Road, 4th Floor. Burlington, MA 01803, EUA.

http://www.pcdocs.com

Verity, Inc. 892 Ross Drive. Sunnyvale, CA 94089, EUA.

http://www.verity.com

Fulcrum Technologies Inc. 785 Carling Avenue, Ottawa K1S 5H4, Canadá.

http://www.fulcrum.com

Indexadores de intranets

La generalización del concepto de intranet puso en dificultades el enfoque cliente/servidor mantenido por los fabricantes de sged tradicionales, y permitió la entrada en el mercado de un nuevo tipo de productos: los llamados indexadores. Quizá este término no resulte el más apropiado para designar a unas herramientas que ofrecen un rendimiento superior al que podría esperarse de este nombre.

Los indexadores tienen su origen en la evolución de los productos ofertados por los fabricantes de motores de recuperación textual: Verity, Fulcrum, Excalibur, etc. El rediseño de estos sistemas ha producido como resultado aplicaciones complejas que ofrecen las siguientes prestaciones:

  • Indexación del texto completo de documentos creados con aplicaciones diferentes, y que están repartidos en distintos dispositivos de almacenamiento.

    Para identificar e indexar diferentes tipos de documentos se emplean dos tecnologías:
    1. conversión de documentos mediante filtros a un formato con el que puede trabajar el motor de indexación; y
    2. crawling, o reconocimiento de enlaces hipertexto para identificar y localizar otros documentos residentes en el mismo servidor o en servidores remotos, que posteriormente serán indexados.
  • Sincronización (simultaneidad de acceso) de fuentes de información: bases de datos relacionales, documentos en distintos formatos, bases documentales, aplicaciones groupware -Notes-, servidores de correo electrónico, etc., ofreciendo acceso a todos lo recursos de información disponibles desde un único punto de acceso.
  • Uso intensivo de la tecnología push (recepción automática de información según perfiles de interés predeterminados), facilitando al usuario toda la información necesaria para poder desarrollar de forma eficiente su trabajo.
  • Administración y acceso al sistema a través de navegadores capaces de interpretar html estándar. Los usuarios buscan y acceden a los documentos a través Microsoft Internet Explorer, Netscape Navigator o cualquier otro navegador. Estas herramientas, de fácil utilización, tienen unos costes de administración e instalación mínimos y no requieren una formación especial. La administración de estos sistemas también se ve simplificada por el uso de páginas html desde las que se gestionará la información sobre usuarios, perfiles, concesión de permisos, etc.

Beneficios de un sged

Frente a un indexador de intranets, un sged ofrece las siguientes ventajas:

  1. Asegura el almacenamiento fiable de los documentos, cualquiera que sea su origen: correo electrónico, aplicaciones de ofimática, recepción por fax, etc. Mediante la integración del sged con las aplicaciones de sobremesa desde las que se crean y gestionan los documentos, los usuarios se ven obligados a grabar el documento en dispositivos de almacenamiento que se encuentran bajo el control del sistema.
  2. Evita la existencia de copias no controladas, garantizando que todos los miembros de la organización están trabajando con el mismo documento, y que se trata de un documento válido. Esta función se consigue mediante el control de versiones, bloqueo de accesos en modo edición (para evitar que dos usuarios modifiquen un documento al mismo tiempo), etc.
  3. Minimiza el espacio de disco requerido para guardar documentos, ya que no tienen por qué existir duplicaciones de un mismo archivo en distintos directorios.
  4. Control y gestión de los metadatos (información sobre la propia información o sobre el documento). Siempre será posible saber hasta qué fecha es válido éste, por quién ha sido creado, revisado, etc.
  5. Organización lógica de los documentos, que se podrán reunir por proyectos, departamentos, expedientes, grupos de trabajo, etc. Como ya se ha dicho, un documento podrá formar parte, simultáneamente, de más de una agrupación, sin que esto suponga una duplicación física del documento.
  6. Publicación de los documentos sin ningún esfuerzo adicional: en cuanto un documento se graba bajo el control del sged, pasará a estar disponible para todos los usuarios autorizados. En el caso de que existan múltiples versiones de un documento, siempre se podrá acceder a la versión más reciente.
  7. Posibilidad de gestionar el enrutamiento de documentos, minimizando el tiempo de transferencia en los procesos de trabajo.
  8. Indexación y recuperación de documentos en texto completo y a partir de los valores asignados a sus propiedades.
  9. Sistema de seguridad que no depende de la estructura de directorios en la que se graben los documentos. Los permisos de acceso se conceden sobre los documentos, y no sobre los directorios en los que se guardan. Con esto se obtiene una gran flexibilidad y se minimizan los costes de administración de los dispositivos de almacenamiento.
  10. Gestión de documentos compuestos, es decir, documentos formados por más de un archivo físico. Esta opción permite reutilizar componentes, con lo que se aumenta la productividad de los grupos dedicados a la producción de documentos.

Ventajas de un indexador

  1. Integración total con la tecnología internet. El acceso a los documentos y la administración del sistema se gestionan a través de browsers.
  2. Posibilidad de sincronizar índices (o sea, de ponerlos aparentemente en común), ofreciendo acceso a múltiples fuentes de información heterogéneas desde un único punto de acceso.
  3. Costes de instalación, administración y formación mínimos.
  4. Utilización intensiva de la tecnología push, facilitando a los usuarios la información que se corresponde con sus perfiles o intereses. Este punto es muy importante, ya que evita el problema que surge cuando el usuario se muestra reticente a trabajar con un sistema que le supone un esfuerzo adicional. Generalmente los cambios se notifican de dos formas: mediante correo electrónico y páginas web personales.
  5. La tecnología push dota a estos sistemas de un nivel de automatismo que los convierte en aplicaciones de valor estratégico para aquellas organizaciones en las que continuamente se está produciendo un elevado número de documentos.
  6. Posibilidad de publicación de la información gestionada por el sistema en cd-rom (sistemas web-cd) y en intranet/internet.

Conclusiones

Los indexadores de intranets son herramientas óptimas si lo que se necesita es:

  • Un sistema de búsqueda sobre el texto completo de grandes volúmenes de documentación.
  • Integrar un motor de recuperación textual con herramientas sged. Por ejemplo, como ya dijimos al principio, Documentum utiliza el motor de indexación Verity, Docs Open usa Fulcrum y Verity, etc.
  • Sincronizar o simultanear fuentes de información diversas, entre las que se pueden encontrar sistemas de gestión documental y aplicaciones groupware tradicionales. Respecto a este último punto es destacable la implantación del motor de indexación Verity en la compañía Ernst & Young, con el propósito de facilitar el acceso a más de 400 bases documentales gestionadas por Lotus Notes, Docs Open, etc.1.

El principal inconveniente de los indexadores es que no ofrecen, salvo casos muy específicos, las funciones propias del módulo de biblioteca de las aplicaciones sged tradicionales: control de versiones, bloqueo de documentos (check in, check out), etc. Es decir, estas herramientas no llevan a cabo la gestión documental propiamente dicha. De todas formas, parece que el problema de la falta de control se intenta solucionar con las últimas versiones de algunos productos2.

La solución óptima requiere la integración de las dos tecnologías: un sged que garantice el control sobre la base documental de la organización, y un indexador que permita consultar todas las fuentes de conocimiento disponibles desde un punto de acceso común. De esta forma el indexador complementa y amplía las funciones de los sistemas GED tradicionales.

Bibliografía

1. "Automated pull is the answer". En Information World Review, mayo 1998, n. 136, pp. 21-22.

2. Leloup, Catherine. Motores de búsqueda e indexación. Barcelona: Gestión 2000; Paris: Eyrolles, 1998.

3. Snow, C. Matthew. "El beneficio y el valor de las intranets". En Datamation, 1998, n. 141, pp. 56-61.

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1998/septiembre/sistemas_ged_e_indexadores_intranet_alternativas_excluyentes_o_tecnologias_complementarias.html