El profesional de la información


Enero 1998

Common Ground: ¿una alternativa de Acrobat?

Por Ricardo Eíto Brun

Resumen: El lenguaje html ha propiciado la difusión masiva de documentos en formato digital a través del World Wide Web y de las intranets corporativas. Sin embargo, a pesar de su carácter abierto y multiplataforma, html presenta una serie de limitaciones para la gestión, edición y distribución de documentos compuestos. Junto al lenguaje html, el formato pdf, propietario de la empresa Adobe, se ha convertido en el estándar de facto para la distribución de documentos en internet.

La gran cuota de mercado de Acrobat ha propiciado cierto desconocimiento de otros productos diseñados para servir las mismas necesidades: Common Ground, Envoy, etc.

El artículo describe el software de edición electrónica Common Ground, de la empresa Hummingbird Communications, y compara su funcionalidad con la del lenguaje html y la de Adobe Acrobat.

Title: Common Ground: an alternative to Acrobat

Abstract: Html has propagated the massive distribution of electronic documents over the World Wide Web and corporate intranets. In spite of its openness and multiplatform features, html presents serious limitations for distributing and managing composite documents.

Besides html, Acrobat's PDF format has become a de facto standard for the distribution of documents over the WWW. The market dominance that Acrobat enjoys has contributed towards a general lack of knowledge about other products with similar functionality, such as Envoy, Common Ground, etc.

This article describes Common Ground, produced by Hummingbird Communications, and compares its functionality with that of html and Adobe Acrobat.

Ricardo Eíto BrunLa necesidad de intercambiar documentos creados con aplicaciones diferentes, en la mayoría de los casos incompatibles, ha sido uno de los principales problemas que ha tenido que afrontar la aplicación de tecnologías informáticas a la gestión documental.

La generalización de internet ha hecho posible que se eliminen barreras y se reduzcan los costes en la transferencia de información en soporte digital. Al mismo tiempo, el lenguaje html, con su carácter independiente de cualquier plataforma hardware y software, parecía ser la solución idónea a los problemas de intercambio de documentación digital generada en entornos heterogéneos.

Lo que le falta al html

Sin embargo pronto se hicieron manifiestas las limitaciones del lenguaje html, y del protocolo http (hypertext transfer protocol), como un medio válido para la distribución de documentación. Entre estas limitaciones cabe señalarse:

  • La incapacidad del lenguaje html para mantener las características tipográficas y el formato de los documentos.
  • Los elevados costes en ancho de banda y las dificultades en la transmisión de documentos compuestos, es decir, documentos formados no sólo por texto, sino también por gráficos, animaciones, etc.
  • La carencia de fórmulas de compresión asociadas al html.
  • La inexistencia en la especificación html de mecanismos tradicionales de acceso y estructuración de la información: tablas de contenidos, búsqueda en texto completo, índices de palabras claves, etc.

El lector ProViewer ofrece la posibilidad de crear, modificar y ver la tabla de contenidos de los documentos DP.

El primer problema se encuentra en vías de solución, gracias a las llamadas cascade style sheets, las cuales amplían el número de etiquetas y atributos de la especificación html, añadiendo la posibilidad de aplicar formato a los documentos.

El segundo problema, de más difícil solución, tiene su origen en la definición actual del protocolo http, que establece cómo debe gestionarse el intercambio de documentos html entre servidores y clientes web.

En el caso de los documentos compuestos el protocolo obliga a transferir de forma independiente los distintos objetos que configuran un mismo documento, de forma que para cada objeto incluido en un documento compuesto se debe establecer una nueva conexión entre el cliente y el servidor.

Visualización de páginas miniatura (thumbnails) de un documento DP. Al hacer clic sobre una miniatura, se visualizará la página correspondiente en la parte derecha de la ventana. Las páginas miniaturas sólo están disponibles con el visor ProViewer.

Las soluciones

Se han propuesto dos posibles remedios a este problema: el protocolo http-.ng, y la adición al protocolo http de dos nuevos métodos: getall y getlist. Hasta el momento ninguna de estas posibilidades ha sido implementada por los fabricantes de software.

Debemos señalar que el problema de la transferencia de documentos compuestos no sólo afecta a la transmisión mediante el protocolo http: también se hace manifiesto cuando se tienen que enviar por correo electrónico documentos con un gran número de objetos vinculados.

Respecto al excesivo tamaño de los documentos html, y la necesidad de aplicar mecanismos de compresión, Microsoft ha sugerido una posible solución con su Html-Help. Si bien la propuesta ya ha sido enviada al W3 Consortium para ser añadida a la especificación html, actualmente sigue teniendo carácter propietario (o sea, ligada a la marca Microsoft).

La limitación indicada en último lugar -inexistencia en el lenguaje html de mecanismos de acceso a la información básicos- sigue haciendo problemática la distribución de grandes volúmenes de documentación en formato html. La búsqueda en texto completo tiene que implementarse en los equipos servidores o se tienen que utilizar desarrollos propietarios como el control ActiveX Html-Help preparado recientemente por Microsoft.

Si bien esta última solución resulta sumamente interesante y está llamada a resolver importantes problemas, su adopción hace que los documentos html con los que se utilice sólo puedan ser interpretados con el navegador de Microsoft, o con browsers de otros fabricantes a los que se incorpore un componente adicional (plug-in), que les permita interpretar controles ActiveX. Por ejemplo, el desarrollado por la empresa Ncompass para los navegadores de Netscape.

Resumiendo, puede decirse que si bien existen soluciones a todas las restricciones indicadas en el apartado anterior, estas soluciones han tardado demasiado tiempo en estar disponibles, y no podrán considerarse como tales a menos que el W3 Consortium las acepte como parte del conjunto de estándares destinados a garantizar el carácter abierto y multiplataforma del lenguaje html.

Pantalla de búsqueda ampliada. Únicamente podrá utilizarse si se dispone del visor ProViewer.

La oportunidad de los sistemas propietarios

Opciones de seguridad para documentos DigitalPaper.En espera de esta resolución, los productores tradicionales de software para la edición y distribución de documentos en soporte digital (Adobe, Tumbleweed, Farallon o Hummingbird) siguen utilizando las restricciones del html como el principal argumento para la comercialización y promoción de sus soluciones propietarias.

Entre este grupo de fabricantes, Adobe, con su sistema Acrobat, ocupa una posición predominante sobre el resto de sus competidores. De hecho Adobe es la única compañía cuyo software de edición electrónica ocupa un lugar destacado en su línea de productos. Para el resto de compañías sus sistemas de edición electrónica ocupan un puesto secundario dentro de sus ofertas comerciales. Por ejemplo, la línea de trabajo de Farallon y Hummingbird se centra en el desarrollo de software para la conectividad entre sistemas hardware heterogéneos.

Hummingbird y Common Ground

Desde el momento de su creación en 1984, Hummingbird se especializó en la integración de redes de PCs con sistemas mainframe y máquinas Unix. En 1995 el impacto de intranet llevó a Hummingbird a desarrollar un sistema de colaboración basado en los estándares abiertos de internet: Columbus. Un año más tarde Hummingbird adquirió Common Ground Software, antes No Hands Software, una de las empresas que ofrecían una alternativa suficientemente fuerte al estándar de facto pdf de Adobe.

La adquisición de Common Ground por una empresa dedicada a la conectividad entre sistemas demuestra:

  1. la importancia que ha adquirido en los últimos años la gestión y distribución de documentos en las redes corporativas,.
  2. la necesidad de ser compatibles con los estándares de internet.
  3. la importancia de desarrollar productos que amplíen las posibilidades de estos estándares.

Si el documento recuperado por una búsqueda incluye una tabla de contenidos, podremos saber con mayor exactitud qué páginas del documento contienen los términos propuestos en la consulta.

Funcionalidad de Common Ground

Si pdf (portable document format) es el formato diseñado por Adobe para la distribución de documentos electrónicos entre plataformas hardware heterogéneas, dp (DigitalPaper), es el formato propuesto por Common Ground. DigitalPaper presenta las siguientes similitudes con pdf:

  • Emulación de fuentes: los dos formatos almacenan información sobre los tipos de letra utilizados en los documentos. En el caso de que el ordenador desde el que se lee el documento no disponga del tipo de letra utilizado al diseñar el documento, el software lector será capaz de emularla de forma satisfactoria. DigitalPaper trabaja con la tecnología TrueDoc.
  • Fusión de todos los objetos que forman un documento compuesto en un solo archivo. Este problema, intrínseco a los documentos en formato html, también se presenta en aquellos que contienen componentes “enlazados”. Al convertir un documento a los formatos dp o pdf, todos los componentes se fusionarán en un único archivo, de forma que únicamente deberá distribuirse al destinatario de la documentación sólo un fichero por cada documento.
  • Independencia de las plataformas hardware y de los sistemas operativos. Los documentos en formato pdf y dp pueden ser interpretados en cualquier sistema que disponga del software lector. No es necesario generar documentos diferentes para distintas plataformas. Los documentos se convierten una sola vez, y podrán distribuirse sin tener en cuenta las características del ordenador con el que trabajen los destinatarios.
  • Compresión de documentos, minimizando el espacio requerido para su almacenamiento, y el tiempo necesario para la transmisión a través de redes.

Common Ground se distribuye de dos formas: Common Ground Desktop Edition y Common Ground Publisher. Este último, orientado hacia los productores de grandes volúmenes de documentación, ofrece funcionalidades adicionales a la Desktop Edition, como la conversión en modo batch, mayor integración con servidores http, y utilidades para administrar colecciones de documentos dp.

Crear documentos DP

De la misma forma que Acrobat (Adobe), Replica (Farallon) o Envoy (Corel-WordPerfect), Common Ground funciona como un controlador (driver) de impresión. Para convertir un documento al formato DigitalPaper, bastará con imprimir el documento desde la aplicación con la que se creó (Microsoft Word, WordPerfect, Quark Xpress, Frame Maker, etc.), tras haber seleccionado el driver Common Ground Maker desde el cuadro de diálogo con las opciones de impresión.

Common Ground ofrece otra herramienta para la creación de documentos en formato DigitalPaper: PostScript Converter. Este módulo permite la conversión masiva de documentos en PostScript al formato DigitalPaper. Equivale al módulo Distiller de Adobe.

Post-edición de documentos

Tras la conversión del documento a formato DigitalPaper, será posible editar su contenido para diseñar tablas de contenidos, índices, enlaces hipertexto, etc. La edición del documento se efectúa mediante la herramienta Common Ground ProViewer, equivalente a Acrobat Exchange de Adobe.

ProViewer ofrece las siguientes funcionalidades:

  • Creación de tablas de contenidos.
  • Visualización del documento en páginas miniatura o thumbnails. A diferencia de lo que sucede con Adobe Acrobat, con el que hay que crear las miniaturas de forma explícita, Common Ground las genera automáticamente al convertir el documento al formato dp.
  • Posibilidad de añadir marcas de lectura o bookmarks al hiperdocumento.
  • Añadir anotaciones. Las notas se visualizarán como un pequeño icono, y bastará hacer doble clic sobre ellas para poder leer su contenido.
  • Subrayar fragmentos significativos del documento. Las partes subrayadas serán resaltadas para llamar la atención del lector.
  • Añadir enlaces hipertexto. Los enlaces pueden establecerse a otros documentos DigitalPaper, y a páginas html residentes en el propio ordenador o en servidores remotos. No se puede establecer enlaces a secciones determinadas dentro de un documento dp.
  • Copiar al portapapeles Windows partes del documento para que puedan reutilizarse en otros documentos creados o editados con aplicaciones que funcionan bajo Windows.
  • Eliminar páginas y añadir nuevas páginas extraídas de otros documentos dp. Podrán añadirse en cualquier lugar del documento.
  • Buscar palabras dentro del documento.
  • Imprimir el documento o copiarlo a otros dispositivos de almacenamiento.
  • Buscar documentos dp dentro de una colección indexada.
  • Crear índices full-text a partir de varios documentos dp.
  • Trabajar con distintas opciones de visualización: zoom, mosaico horizontal, vertical, etc. El lector ProViewer ofrece al usuario la posibilidad de ver simultáneamente el contenido del documento, y su tabla de contenidos, marcas de lectura, miniaturas, o relación de enlaces que parten de él. De esta forma, se optimizan las posibilidades de navegación.

Una vez se ha modificado el documento, se podrán guardar los cambios y establecer sus propiedades y opciones de seguridad.

Propiedades de los documentos y opciones de seguridad

Un documento dp cuenta con una serie de propiedades. Algunas son editables, y otras las establece Common Ground de forma automática al hacer la conversión. Las propiedades editables son el título, el autor, el tema y las palabras clave. El valor de estas propiedades se puede indicar al crear el documento mediante el driver de impresión, y pueden ser modificadas desde el editor ProViewer.

Las opciones de seguridad establecen qué acciones puede ejecutar un lector sobre el documento. Es posible restringir:

  • La impresión del documento.
  • La copia al portapapeles de texto o de gráficos.
  • La creación o modificación de tablas de contenidos y enlaces.
  • La creación o modificación de notas, marcas de lectura y subrayados.

También permite proteger la lectura del documento mediante contraseñas.

Opciones de búsqueda en colecciones

Common Ground ProViewer permite crear índices sobre el texto completo de varios documentos dp. Al iniciar la consulta se puede buscar en todos los índices registrados, o elegir los índices en los que se quiere buscar. La consulta está implementada a partir del motor Topic de Verity, coincidiendo en esto con Adobe Acrobat.

Permite incluir un número ilimitado de términos unidos por los conectores booleanos tradicionales, buscar valores específicos en las propiedades de los documentos (título, autor, fecha de creación, fecha de última modificación, palabras clave, etc.), utilizar proximidad, listas de sinónimos, truncamientos, y limitar el número de items recuperados.

Como resultado se obtendrá una ventana con todos los documentos dp que satisfacen las condiciones de búsqueda. Los documentos se ordenan por orden de relevancia a partir del número de ocurrencias de las palabras buscadas. Es posible cambiar el orden de los documentos utilizando otros criterios como la fecha de creación, la fecha de última actualización, etc., pudiendo llegar a anidarse hasta tres criterios de ordenación. Por ejemplo, en primer lugar podrían ordenarse los documentos por su ponderación, y a continuación por su fecha de creación, de forma que si hubiese más de un documento con una misma ponderación, en primer lugar aparecerían los más recientes...

La ventana con los resultados de la búsqueda ofrece dos funcionalidades realmente interesantes:

  • Si el documento incluye una tabla de contenidos, será posible desplegar las entradas de la tabla de contenidos que apuntan a páginas en las que aparecen las palabras indicadas en la ecuación de búsqueda. De esta forma, se evita la necesidad de consultar todo el documento en busca de las secciones que pueden interesarnos realmente. Para cada página se indica el número de ocurrencias de la palabra buscada. Al hacer doble clic sobre la entrada de la tabla de contenidos, se visualizará la página a la que apunta dicha entrada.
  • Mostrar contexto: esta opción permite ver parte de la frase en la que aparece el término propuesto en la ecuación de búsqueda.

Las opciones de búsqueda en texto completo ofrecidas por Adobe Acrobat 3 no incluyen ninguna funcionalidad similar.

Para ver un documento recuperado por la búsqueda bastará con hacer doble clic sobre él.

Distribución de documentos

Los documentos creados con Common Ground pueden distribuirse de la misma forma que cualquier documento en soporte digital: correo electrónico, cd-rom o desde servidores http-d.

Common Ground ProViewer ofrece la posibilidad de enviar el documento que está siendo editado en pantalla seleccionando una opción de menú. La integración con el sistema de correo electrónico que se encuentre instalada en el puesto de trabajo cliente se configura en el momento de la instalación de Common Ground, pudiendo utilizarse cualquier sistema de e-mail compatible con las especificaciones Mapi (messaging application program interface), VIM (vendor independent messaging) o Lotus Notes. Adobe Acrobat no ofrece una prestación similar.

Tanto si se envía el documento por correo electrónico, como si se graba en un dispositivo de almacenamiento, el destinatario de la documentación deberá disponer del software capaz de interpretar documentos en formato dp y mostrar su contenido en pantalla.

Hummingbird suministra dos lectores: MiniViewer y ProViewer. Ambos están disponibles para plataformas Unix, Windows 3.x, Windows 95, Windows NT y Macintosh.

El primero, de libre distribución, no permite trabajar con todas las funcionalidades que pueden estar presentes en un documento DigitalPaper. Por ejemplo, con MiniViewer no se pueden ver las anotaciones ni las miniaturas (thumbnails), no es posible reenviar documentos, buscar en índices, etc.

En este punto nos encontramos con otro aspecto novedoso a favor de Hummingbird: a diferencia de lo que sucede con Adobe Acrobat, al crear un documento Common Ground es posible fusionar el documento con el visor MiniViewer en un único archivo ejecutable.

De esta forma el usuario final sólo tendrá que recibir un solo archivo, y no necesitará tener instalado ningún software adicional. Al incorporar MiniViewer a un documento, se aumentará el tamaño de éste unos 150K. Desafortunadamente sólo puede fusionarse al documento dp el lector de funcionalidad restringida: MiniViewer.

Si se quiere disfrutar de todas las posibilidades de Common Ground, el destinatario de la documentación deberá disponer del software ProViewer, que se puede distribuir previo pago de royalties.

Distribución de documentos DP a través de web

Los documentos DigitalPaper pueden distribuirse a través de servidores web. Para publicar documentos.dp en internet el administrador del servidor http deberá instalar un script cgi. Este script se encarga de distribuir el documento dp página a página (Page on demand), a medida que son solicitadas desde el equipo cliente. De esta forma no es necesario esperar a que se haya transferido todo el archivo para poder comenzar a leer su contenido. Este mecanismo de distribución fue adoptado inicialmente por Adobe en su especificación Amber 1, que constituyó la base para la versión 3.0 de Acrobat.

El script cgi que posibilita el servicio “página a página” deberá configurarse de la siguiente forma:

  • Si no se ha distribuido la versión compilada, se compilará el código C del script.
  • Se copiará el script al directorio /cgi-bin del servidor http.
  • Se creará un alias para este directorio, al que se llamará /cg-cgi-bin.
  • Se incluirá la llamada al script en la URL de los documentos dp que se quieran ver “página a página”, por ejemplo:
    http://www.servidor.es/cg-cgi-bin/nombreScript/documento.dp
  • Para poder leer documentos dp desde un navegador se deberá instalar un plug-in. Actualmente este componente está disponible para los browsers Microsoft Internet Explorer y Netscape.

Conclusiones

Sin entrar en cuestiones sobre la calidad de las conversiones o la capacidad de compresión del formato dp frente a otras alternativas (principalmente Acrobat), la no disponibilidad de un lector de libre distribución que permita trabajar con todos los componentes de un documento, resta funcionalidad e interés a la propuesta de Hummingbird.

De hecho hace ya años que Adobe tuvo que abandonar la distribución de lectores de documentos pdf con "prestaciones limitadas". Sin duda alguna, junto a la calidad de su producto, esta decisión contribuyó en gran medida a la difusión y promoción de Acrobat, hasta el punto de convertirlo en un estándar de facto.

Sin embargo las compañías dedicadas al diseño de software para la edición electrónica, continúan con la política incorrecta en la distribución del software lector, y siguen mostrándose reacias a aceptar uno de los principios básicos en el mercado de la información: si bien los diseñadores de tecnologías y canales para la distribución de información pueden obtener una rentabilidad que excede con creces a la de los proveedores de contenidos, las oportunidades de negocio no deben buscarse en los destinatarios de la información (usuarios finales), sino en los proveedores de contenidos.

Esta lección, aplicada por Adobe con la distribución de Acrobat, ha caracterizado desde su fundación a otra empresa dedicada al diseño de herramientas para la distribución de información: Netscape.

Una de las posibles razones por las que Hummingbird persiste en mantener esta política de distribución a todas luces obsoleta puede deberse a la concepción que tiene la empresa canadiense de su software de edición electrónica: Common Ground encaja bien con Columbus y podría utilizarse como reclamo para dirigir la atención de clientes potenciales hacia sus soluciones groupware.

Hummingbird, al distribuir un lector con funcionalidad restringida, se basa en que la mayoría de documentos que se distribuyen en soporte digital están destinados a ser impresos en papel, por lo que los usuarios de estos sistemas no necesitan lectores sofisticados que ocupen gran cantidad de espacio en disco.

De momento sólo cabe esperar a que, con la nueva versión de Common Ground, Hummingbird opte por una política de distribución más flexible que le permita a ocupar el lugar que verdaderamente se merece en el mercado de software para la edición electrónica.

Notas

1 Hípola, Pedro. "Amber: el nuevo estándar de Acrobat". En: Information World en Español, nº 42, marzo 1996, pp. 1-3.

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1998/enero/common_ground_auna_alternativa_de_acrobat.html