El profesional de la información


Mayo 1998

The Dialog Corporation evoluciona hacia el mundo intranet

Por Ricardo Eíto Brun

La empresa Muscat Ltd., fabricante del software de indexación y recuperación probabilística Muscat fx, fue adquirida por Maid el mes de agosto del pasado año.

Meses más tarde, concretamente en noviembre de 1997, Maid compró KR Information, división de Knight Ridder que incluía a los distribuidores de bases de datos Dialog y DataStar.

Como resultado de esta compra se creó The Dialog Corporation, en la que se integraron los servicios de información electrónica Dialog, DataStar, Profound, Livewire, etc., la tecnología Muscat fx, y todos los sistemas de indexación y organización de información propietarios de Dialog, DataStar y Maid, entre los que destaca el de categorización automática InfoSort.

El pasado 11 de marzo tuvo lugar en la sede de Sedic (Madrid) la presentación de las soluciones propuestas por The Dialog Corporation para la gestión y optimización de los recursos de información en intranets corporativas.

Corrió a cargo de Russell Ward, director de la división IntraNet Development de The Dialog Corporation para Emea (Europe, Middle East and Africa), Ben Owen, jefe de ventas, y Francisca García Sicilia, responsable de la sucursal de The Dialog Corporation en España.

Posteriormente mantuvimos una entrevista con Ben Owen para profundizar en los nuevos productos y servicios ofrecidos por la empresa, enfocados a concentrar en torno a las intranets corporativas la información externa distribuida por Dialog, DataStar y Profound, y la información interna que generan las propias organizaciones.

La oferta de The Dialog Corporation materializa una de las grandes expectativas abiertas por internet para los gestores de información: eliminar barreras entre la información generada dentro de las organizaciones y la procedente de fuentes externas.

Con esta aproximación al mercado, The Dialog Corporation quiere ser, además del mayor proveedor mundial de información en línea, una empresa de servicios con un amplio potencial de crecimiento.

De izquierda a derecha: Ben Owen, Mercè Alba, Francisca García-Sicilia y Russell Ward

Intranets: la infraestructura lógica para compartir información

En poco más de un año se ha generalizado la noción de intranet. Muchas organizaciones reconocen la necesidad de disponer de una, que permita a sus empleados acceder de forma inmediata, fácil e intuitiva a toda la información que necesitan para realizar de forma eficiente su trabajo.

El concepto de intranet se convierte en la infraestructura básica para la comunicación interna de la empresa. Los menores costes de administración, la facilidad de uso de unas herramientas con las que todos empezamos a estar familiarizados, y su carácter abierto e independiente de plataformas hardware y software específicas, convierten la intranet en el marco idóneo para la integración de recursos y tecnologías.

Como muestra de la importancia creciente de las intranets, y de la necesidad de invertir en esta tecnología, Ben Owen y Russell Ward citaron un informe Zona en el que se indica que un 68% de las compañías americanas ya cuenta con una intranet, al igual que un 25% de las mil empresas británicas más importantes. Se estima que la inversión en intranets crecerá, de los 250 M US$ que se le dedican en la actualidad, hasta los 5.600 M US$ a finales del año 2001.

A pesar de todas sus ventajas, el desarrollo de una intranet corre el riesgo de convertirse en una inversión infructuosa, a menos que se consideren con la debida atención los siguientes factores:

  • Mecanismos que se van a emplear para hacer la información fácilmente recuperable.
  • Calidad de la información que se va a depositar.

El primer problema resulta realmente preocupante: desarrollar una intranet sin un sistema de recuperación lo suficientemente flexible tan sólo va a garantizar una mayor sobrecarga de información, duplicados innecesarios, grandes pérdidas de tiempo y una infrautilización de la información, que ha llegado a estimarse en un 62%. Es importante recordar que el 25% de los casos de estrés laboral se produce por la dificultad cada vez mayor de gestionar un volumen de información desbordante.

La solución de este primer problema obliga a las organizaciones a elegir entre dos alternativas:

  • Sacrificar las ventajas de intranet y optar por una herramienta groupware o ged (gestión electrónica de documentos) propietaria.
  • Añadir a su intranet un sistema de indexación y recuperación como los que ofrece The Dialog Corporation: Muscat fx e InfoSort.

El segundo problema lo plantea Ben Owen cuando propone el término "emptynet" como la designación más acertada para referirse a un gran número de las intranets que actualmente se encuentran en funcionamiento. Es importante recordar que una intranet puede y debe utilizarse como medio de comunicación distendida dentro de una empresa; pero este planteamiento está muy lejano de la función principal de una intranet, y nunca garantizará que se rentabilice la inversión realizada en la adquisición de equipos y software.

El diseño informativo o conceptual de una intranet requiere un complejo análisis que deberá conducir a la selección de las fuentes de información más adecuadas.

Orientación hacia el mundo intranet

Para afrontar con éxito el desarrollo de una intranet corporativa y evitar los problemas anteriores, The Dialog Corporation propone una implantación en tres fases.

En primer lugar, la selección de la información externa que realmente necesita la empresa. En este punto ofrece servicios de auditoría y análisis de necesidades para diseñar servicios personalizados de difusión selectiva basados en la tecnología webcasting. Estos servicios establecen un envío regular de información desde los servidores web de The Dialog Corporation hacia el servidor web de la red corporativa del cliente.

Posteriormente, este servidor distribuirá esa información a todos los puestos cliente conectados a la intranet, haciendo llegar a cada empleado, de forma selectiva, tan sólo la información que realmente necesite. The Dialog Corporation facilita el acceso de todos los empleados a un precio fijo.

El segundo paso consiste en la creación de una base de datos con toda la información anterior. Esta información se indexará mediante InfoSort, y se gestionará a través del servidor web de la intranet corporativa. Por razones de copyright, la información enviada por el servidor de The Dialog Corporation se mantendrá en el servidor web del cliente durante un período predeterminado; existe la posibilidad de ampliar este plazo todo el tiempo que se considere necesario, mediante un acuerdo LAN/WAN Agreement.

El último paso consiste en la integración de la información procedente de The Dialog Corporation con la información interna generada dentro de la organización. Para organizar esta información se podrían utilizar las dos tecnologías citadas en un apartado anterior: Muscat fx como sistema de indexación y recuperación en texto completo, eInfoSort para la clasificación, estructuración y categorización de la información. Uno de los aspectos más importantes de esta propuesta es la utilización de un mismo sistema de indexación y categorización para la información interna y la externa.

El resultado final incluirá un sistema de alerta personalizado para cada usuario, que informará puntualmente siempre que se añada o actualice un documento creado internamente, o procedente de una fuente externa.

Si bien esta configuración es la más recomendable, existen otras opciones: por ejemplo, sería posible emplear fuentes de información adicionales a las propuestas por The Dialog Corporation.

Uno de los aspectos importantes de esta propuesta es la posibilidad de mantener informados a todos los empleados de la organización, sin necesidad de que tengan que perder tiempo en busca de información relevante. La difusión selectiva mediante tecnología push, y la persistencia de esta información en los servidores de la intranet corporativa, convierten a las intranets en unas bases de conocimiento que se actualizan de manera continua. Tal y como indica Ben Owen, estamos hablando de Live Intranets: repositorios de conocimiento actualizado, recuperable, y fácilmente accesible para todos los miembros de la organización.

InfoSort: tecnología avanzada para la organización del conocimiento

No es necesario hacer ninguna referencia al volumen de información en línea gestionada por The Dialog Corporation: se ha estimado que el tamaño de las bases de datos distribuidas a través de Dialog, DataStar y Profound, aparte de otros servicios complementarios como LiveWire, es cincuenta veces superior al del World Wide Web.

Quizá resultan menos conocidas las potentes herramientas que The Dialog Corporation ofrece para la organización, indexación y categorización de información distribuida: Muscat fx e InfoSort.

InfoSort es el sistema de indexación automática basada en lenguaje controlado utilizado por Maid en su interface WorldSearch desde hace más de ocho años. El sistema se estructura en torno a un mapa de conceptos jerárquico que agrupa los términos en cuatro categorías: temas ( scope), países ( countries), sectores de mercado ( market aectors) y organizaciones ( company names).

El mapa de conceptos utilizado con Profound incluye más de 750 sectores de mercado, más de 200 países, 100 temas, y millones de empresas. Durante la fase de desarrollo de un proyecto intranet será posible parametrizar los términos incluidos en estas categorías, así como sus relaciones, para adaptarlas a las necesidades de cada organización.

En el proceso de indexación, InfoSort añade cuatro etiquetas a cada documento, una para cada categoría. En cada etiqueta se escriben todos los términos que el sistema haya deducido a partir del contenido del documento. InfoSort deduce los conceptos que debe asignar a cada categoría a partir de un conjunto de reglas que gestiona internamente.

Únicamente añade a los documentos descriptores extraídos de su thesaurus interno. Para recuperar posteriormente los documentos indexados con los descriptores propuestos por InfoSort, es necesario utilizar un motor de búsqueda como Muscat fx, Verity,AltaVista, o cualquier otro, siendo el primero la opción recomendada por The Dialog Corporation.

Es importante indicar que InfoSort es un sistema independiente de cualquier sistema de indexación, de forma que una organización que disponga de un indexador para su intranet puede utilizar InfoSort sin necesidad de cambiar su sistema de indexación. Muscat fx implementa la recuperación probabilística, y ofrece la posibilidad de redefinir la búsqueda a partir de los criterios sobre la relevancia de los documentos recuperados que emita el usuario. De esta forma se puede aumentar la precisión de los resultados de manera progresiva.

A la capacidad de Muscat fx para realizar búsquedas en texto completo, se une la precisión de la indexación automática de InfoSort. Complementando las dos soluciones, es posible alcanzar una precisión sin precedentes en el proceso de recuperación.

Para interrogar los índices generados por InfoSort, el usuario únicamente tendrá que acceder a un formulario html usando un browser internet. Desde este formulario, podrá seleccionar los términos que quiere buscar en cada categoría mediante listas desplegables. Los términos que se podrán seleccionar para cada categoría serán aquellos que estén incluidos en el thesaurus de InfoSort.

El usuario no necesitará conocer ningún lenguaje de interrogación específico. Es importante recordar que en el proceso de recuperación podrá combinarse la búsqueda por categorías asignadas por InfoSort con la búsqueda sobre los índices en texto completo generados por Muscat fx.

Cuando se quiera ver uno de los documentos recuperados, el sistema lo convertirá a html de forma automática. Para realizar estas conversiones e interpretar el formato de los documentos en el proceso de indexación, Muscat utiliza filtros propietarios de la empresa Inso.

Nuevas propuestas en los servicios tradicionales

The Dialog Corporation no sólo une las tecnologías Muscat fx e InfoSort para diseñar una solución con un potencial ilimitado para la organización de información: en un futuro próximo existe la posibilidad de que se complementen las técnicas que se utilizan para interrogar sus bases de datos online con el sistema de indexación automática InfoSort. Así se logrará uno de los principales objetivos de la compañía: permitir el acceso a más de 900 bases de datos mediante un único sistema de fácil utilización.

Si bien la orientación de The Dialog Corporation hacia el mundo intranet es la noticia más novedosa, no es la única sorpresa que reserva a los profesionales de la información. Entre estas novedades se incluye:

  1. La unificación de los sistemas de facturación para todos sus servicios de información en línea,
  2. La promoción del acceso a sus bases de datos a través de internet, y
  3. La segmentación de la oferta de bases de datos para satisfacer la demanda de los mercados verticales.

La unificación en los próximos meses de los sistemas de facturación aplicados a DataStar, Dialog y Profound es uno de los aspectos más destacables. Hasta ahora la consulta a estos servicios se ha facturado de forma independiente, utilizando distintas unidades monetarias para cada uno de ellos. En su intención por ofrecer mayores facilidades a sus clientes, The Dialog Corporation establecerá un sistema de facturación único para todos sus hosts, empleando la moneda de cada país. Se espera que a partir de este mes se unifique la facturación de Profound y Dialog.

Respecto al segundo punto, The Dialog Corporation va a hacer un esfuerzo para dar a conocer a todos sus clientes las ventajas que supone el acceso a sus hosts a través de browsers internet, en lugar de seguir utilizando las aplicaciones cliente para Windows ( DialogLink, ProBase, etc.). El acceso mediante browsers no sólo permitirá al usuario obtener información con mayor riqueza gráfica, disponer de servicios de alerta, etc.; también será posible consultar en tiempo real el sistema de administración de The Dialog Corporation para saber los costes acumulados durante el período de facturación en curso, conocer el coste que supondría conseguir los documentos recuperados durante la sesión actual, etc.

Es necesario indicar que el acceso a través de internet va a ofrecer los mismos servicios que se encontraban disponibles en las aplicaciones cliente para Windows: utilidades para diseñar búsquedas, consulta al directorio de bases de datos, etc. De todas formas, aunque The Dialog Corporation congelará el desarrollo de nuevas versiones del software cliente para Windows, no se va a retirar el soporte a aquellos usuarios que opten por continuar usando este medio de acceso.

La última novedad es la segmentación de su oferta de bases de datos para orientarlas con mayor precisión hacia las necesidades de mercados verticales. Se agruparán las bases de datos más utilizadas por cada sector de actividad: industria farmacéutica, seguros, industria automotriz, etc. Dentro de esta línea, se reunirán en un mismo servicio todas las bases de datos de información económico-financiera, patentes, etc., comunes a Dialog y DataStar.

The Dialog Corporation.

Numancia, 85 bajos 1a. 08029 Barcelona.

Tel.: +34-934 107 669; 933 229 911

Londres, 17 - 2º dcha. 28028 Madrid.

Tel.: +34-913 615 434; fax: 917 257 481

http://www.dialog.com

http://www.profound.com

Muscat Limited. St John's Innovation Centre. Crowley Road, Cambridge CB4 4WS. Reino Unido.

Tel.: +44-122-342 1222

http://www.muscat.co.uk

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1998/mayo/the_dialog_corporation_evoluciona_hacia_el_mundo_intranet.html