Noviembre 1996
Data Warehouses: nuevas perspectivas en la gestión de los sistemas de información (Parte II)
Por Ricardo Eíto Brun
Tipos de Data Warehouses
En la primera parte nos referimos a un tipo de almacén de datos configurado en torno a una única base de datos central. Si bien ésta es la solución más utilizada y más aconsejable, no es la única alternativa disponible a la hora de configurar un DW. Tenemos que considerar además los denominados Data Warehouses virtuales o 'punto a punto' y los data warehouses distribuidos en dos o más niveles.
En el primer caso no existirá una base de datos central, es decir, los usuarios podrán acceder directamente a las bases de datos transaccionales de forma transparente desde sus puestos de trabajo gracias a middleware del tipo EDA/SQL, de Information Builders, que ofrece un interface SQL con un gran número de sgbd, o SequeLink, de Intersolv.
La opción del DW virtual evita el problema, más ficticio que real, de la redundancia de datos, y no ofrece la flexibilidad de un DW con persistencia física.
De todas formas, se considera que un DW virtual puede resultar una gran ayuda para identificar las necesidades informativas de los analistas en aquellas compañías que deseen implementar un almacén de datos.
En el segundo caso, el DW estará distribuido entre distintas bases de datos independientes con el propósito de descargar al servidor central de parte de su trabajo (que será procesado por otros sistemas intermedios localizados en departamentos o áreas funcionales de la empresa a los que denominaremos 'data marts'). Las aplicaciones del usuario final serán clientes de estos sistemas intermedios, y éstos a su vez del DW central.
Es el modelo más redundante y el más difícil de gestionar, aunque se muestra más acorde con los nuevos rasgos característicos de la gestión en los entornos empresariales modernos.
Recomendaciones para el diseño de un DW: los 10 factores críticos de éxito de William Inmon.
La simplicidad con que percibimos el concepto de DW no se corresponde con una implementación sencilla. Un error de apreciación de este tipo puede generar un sistema de registro de datos que, pretendiendo ofrecer la funcionalidad de un DW, diste en exceso de la misma. Para estos casos, Harry Zimmer, CIO de AT&T Global Information Solutions, ha propuesto una serie de denominaciones, como 'data outhouse', para aquellos sistemas construidos a partir de datos incompletos, erróneos o desactualizados; 'data shack', para los sistemas que con motivo de un diseño deficiente se ven colapsados por la gran cantidad de datos que recopila; o 'data jailhouse', para aquellos sistemas en los que el acceso a los datos resulta excesivamente complejo. La implementación de un DW no difiere de la de cualquier otro proyecto que incorpore nuevas tecnologías informáticas al patrimonio de la organización, por lo que deberá atenderse a las fases de planificación, definición de requerimientos, diseño, prototipo e implementación.
Sin embargo existe una importante diferencia entre el diseño de un almacén de datos y el de una aplicación transaccional. En ésta, tomamos como punto de partida unas necesidades formuladas con la suficiente especificidad por el usuario. En el diseño de un DW debemos ofrecer un grado de flexibilidad que permita al analista obtener respuesta a interrogantes que nunca habían sido formulados con anterioridad. Una posible estrategia podría consistir en la configuración de un DW virtual a partir del cual procederíamos al seguimiento de un grupo de usuarios para registrar sus necesidades informativas más frecuentes.
William
Inmon ha propuesto una serie de factores a tener en
cuenta en la construcción de un almacén de datos, aunque más que tratarse de
recomendaciones sobre cómo diseñar un DW, consiste en una serie de ideas que
debemos tener presentes a la hora de considerar qué es DW y si es necesario
proceder a su construcción:
Bibliografía
Andreu, Rafael; Ricart, Joan. E.; Valor, Josep. Estrategia y sistemas de información. Madrid [etc.]: McGraw-Hill, 1991.
Inmon, William H. Building the Data Warehouse. 2ª ed. New York: John Wiley & Sons, 1996.
Orr, Ken. Data Warehouse Technology.
http://www.kenorrinst.com/ data_wr1.html
Parsaye, Kamran. Surveying Decission Support: new Realms of Analysis. Database Programming and Design: the Online edition, abril 1996.
http://www.dbpd.com/parsaye.htm
Porter, John D.; Rome, John J. The Data Warehouse: 2 years later lessons learned. Cause Annual Conference, Orlando 1994.
Raden, Neil. Maximizing your Warehouse. Information Week, 18 marzo 1996.
http://techweb.cmp.com/iw/571/71oldvan.htm
Standardizing Metadata: interview MetaGroup's Karen Rubenstrunk. Dbms, febrero 1996.
http://www.dbmsmag.com/int9602.html
Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1996/noviembre/data_warehouses_nuevas_perspectivas_en_la_gestin_de_los_sistemas_de_informacin_parte_ii.html