El profesional de la información


Noviembre 1996

Data Warehouses: nuevas perspectivas en la gestión de los sistemas de información (Parte II)

Por Ricardo Eíto Brun

Tipos de Data Warehouses

En la primera parte nos referimos a un tipo de almacén de datos configurado en torno a una única base de datos central. Si bien ésta es la solución más utilizada y más aconsejable, no es la única alternativa disponible a la hora de configurar un DW. Tenemos que considerar además los denominados Data Warehouses virtuales o 'punto a punto' y los data warehouses distribuidos en dos o más niveles.

En el primer caso no existirá una base de datos central, es decir, los usuarios podrán acceder directamente a las bases de datos transaccionales de forma transparente desde sus puestos de trabajo gracias a middleware del tipo EDA/SQL, de Information Builders, que ofrece un interface SQL con un gran número de sgbd, o SequeLink, de Intersolv.

La opción del DW virtual evita el problema, más ficticio que real, de la redundancia de datos, y no ofrece la flexibilidad de un DW con persistencia física.

De todas formas, se considera que un DW virtual puede resultar una gran ayuda para identificar las necesidades informativas de los analistas en aquellas compañías que deseen implementar un almacén de datos.

En el segundo caso, el DW estará distribuido entre distintas bases de datos independientes con el propósito de descargar al servidor central de parte de su trabajo (que será procesado por otros sistemas intermedios localizados en departamentos o áreas funcionales de la empresa a los que denominaremos 'data marts'). Las aplicaciones del usuario final serán clientes de estos sistemas intermedios, y éstos a su vez del DW central.

Es el modelo más redundante y el más difícil de gestionar, aunque se muestra más acorde con los nuevos rasgos característicos de la gestión en los entornos empresariales modernos.

Recomendaciones para el diseño de un DW: los 10 factores críticos de éxito de William Inmon.

La simplicidad con que percibimos el concepto de DW no se corresponde con una implementación sencilla. Un error de apreciación de este tipo puede generar un sistema de registro de datos que, pretendiendo ofrecer la funcionalidad de un DW, diste en exceso de la misma. Para estos casos, Harry Zimmer, CIO de AT&T Global Information Solutions, ha propuesto una serie de denominaciones, como 'data outhouse', para aquellos sistemas construidos a partir de datos incompletos, erróneos o desactualizados; 'data shack', para los sistemas que con motivo de un diseño deficiente se ven colapsados por la gran cantidad de datos que recopila; o 'data jailhouse', para aquellos sistemas en los que el acceso a los datos resulta excesivamente complejo. La implementación de un DW no difiere de la de cualquier otro proyecto que incorpore nuevas tecnologías informáticas al patrimonio de la organización, por lo que deberá atenderse a las fases de planificación, definición de requerimientos, diseño, prototipo e implementación.

Sin embargo existe una importante diferencia entre el diseño de un almacén de datos y el de una aplicación transaccional. En ésta, tomamos como punto de partida unas necesidades formuladas con la suficiente especificidad por el usuario. En el diseño de un DW debemos ofrecer un grado de flexibilidad que permita al analista obtener respuesta a interrogantes que nunca habían sido formulados con anterioridad. Una posible estrategia podría consistir en la configuración de un DW virtual a partir del cual procederíamos al seguimiento de un grupo de usuarios para registrar sus necesidades informativas más frecuentes.

William Inmon ha propuesto una serie de factores a tener en cuenta en la construcción de un almacén de datos, aunque más que tratarse de recomendaciones sobre cómo diseñar un DW, consiste en una serie de ideas que debemos tener presentes a la hora de considerar qué es DW y si es necesario proceder a su construcción:

  1. Se ha de establecer una clara distinción entre los datos y los métodos empleados para su procesamiento en los sistemas transaccionales, y los datos y procesos propios de un almacén de datos;
  2. Gestión eficiente del volumen de datos: los propósitos que está llamado a servir un DW no necesitan el nivel de granularidad necesario en un sistema transaccional. Más aún, un excesivo nivel de detalle implicará más espacio de almacenamiento, hasta el punto de llegar a desvirtuar la eficiencia y funcionalidad del DW;
  3. El DW no pretende sustituir a ningún sistema transaccional existente en la organización; todos los sistemas están llamados a coexistir;
  4. La puesta en marcha de un DW debe efectuarse de manera progresiva; se recomienda comenzar a trabajar con pequeños DW de carácter departamental o incluso personal para que el usuario vaya asimilando las ventajas que le ofrece la nueva tecnología;
  5. Tratamiento riguroso de los metadatos;
  6. El DW debe integrar datos procedentes de los sgbd de la organización, normalmente heterogéneos e incompatibles;
  7. Para modelar un esquema lo suficientemente flexible y funcional, el administrador del DW deberá ser capaz de comprender la forma en que piensa el usuario final, cómo necesita ver la información en los procesos de toma de decisiones y qué uso desea hacer del sistema;
  8. Conocimiento del valor de los datos desde su perspectiva histórica; es decir, el DW cobra valor en cuanto sintetiza datos corrientes y facilita una visión global de la actividad de la empresa a lo largo del tiempo;
  9. Justificación de costes: una vez que el DW se haya puesto en funcionamiento y su valor para la organización se haya hecho manifiesto, no será necesario justificar su mantenimiento para así a su vez justificar el capital invertido;
  10. Siempre será más provechoso proceder a la construcción de un DW que confiar en las metodologías de re-ingeniería de sistemas existentes.

Bibliografía

Andreu, Rafael; Ricart, Joan. E.; Valor, Josep. Estrategia y sistemas de información. Madrid [etc.]: McGraw-Hill, 1991.

Inmon, William H. Building the Data Warehouse. 2ª ed. New York: John Wiley & Sons, 1996.

Orr, Ken. Data Warehouse Technology.

http://www.kenorrinst.com/ data_wr1.html

Parsaye, Kamran. Surveying Decission Support: new Realms of Analysis. Database Programming and Design: the Online edition, abril 1996.

http://www.dbpd.com/parsaye.htm

Porter, John D.; Rome, John J. The Data Warehouse: 2 years later lessons learned. Cause Annual Conference, Orlando 1994.

Raden, Neil. Maximizing your Warehouse. Information Week, 18 marzo 1996.

http://techweb.cmp.com/iw/571/71oldvan.htm

Standardizing Metadata: interview MetaGroup's Karen Rubenstrunk. Dbms, febrero 1996.

http://www.dbmsmag.com/int9602.html

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1996/noviembre/data_warehouses_nuevas_perspectivas_en_la_gestin_de_los_sistemas_de_informacin_parte_ii.html