ARTÍCULO
Grupo de Trabajo de DWH, BI y Modelado
En este artículo, se describen los fundamentos conceptuales del BI y todo lo que el término contempla.
En el mundo del BI cada uno tiene su definición (es un lugar donde estén todos los datos de mi empresa donde yo pueda acceder de forma fácil, eficiente y sin esfuerzo; quiero un informe que me saque todo; quiero 5 listados; etc..). Y la única forma válida para poder llevar esto a término son los Datawarehouse (DW), con sus ventajas e inconvenientes
Una de las necesidades básicas y por lo que nace el Business Intelligence (BI) es que debes buscar la información original, antes de que se produzcan todos los procesos de carga, y a partir de ahí, debes hacer un modelo de destino para poder tener los datos de manera que su uso sea lo más eficiente posible.
“Tenemos tanta información, que es necesario gestionarla y para poder hacerlo de una manera coherente lo más efectivo es plantear un BI”
La realidad es que el 80% del esfuerzo viene en esta parte (depurar, Integrar, homogeni-zarlos, modelizarlos y cargar los datos), y el fracaso también. La otra parte del fracaso viene determinada porque, al fin y al cabo, modelizar es un arte, y no sirve que para cada informe cree un modelo en estrella, y con eso piense que ya lo tengo, pero estaríamos cayendo en un error.
Introducción
Las palabras clave en el punto anterior son modelos, BI y DW. Según DAMA- DMBOK, el modelo de datos es el proceso de descubrir, analizar y alcanzar requerimientos de datos, y entonces representar y comunicar estos requerimientos en una forma precisa, el modelo de datos [1].
[1] DAMA International, DAMA-DMBOK, 2017, 124
Es interesante también, diferenciar entre BI, Datawarehouse y Datawarehousing.
De una forma sencilla podemos decir que el BI es la tecnología que soporta, el Datawarehouse las bases de datos y las herramientas de extracción, transformación y carga y el Datawarehousing los procesos para llevar a cabo el Datawarehouse.
En la actualidad tenemos tanta información que es necesario gestionarla y para poder hacerlo de una manera coherente lo más efectivo es plantear un BI.
Para poder llevar a cabo esto, lo primero que debemos hacer es intentar que la empresa vea lo que es mundo BI de lo que no, es decir, diferenciar una información puramente operacional (transaccional) de lo que son análisis más tácticos o estratégicos. Si lo hacemos bien, el BI debe cubrir las
visiones tácticas y estratégicas, pudiendo llegar hoy en día incluso al dato operacional. Es importante cambiar la forma de pensar y en consecuencia la forma de diseñar, se diseña alrededor de los datos y no a nivel del proceso.
A la hora de plantear un nuevo proyecto, una evolución lógica del proyecto sería primero identificar los conceptos y métricas de negocio necesarias la toma de decisiones, los cuales serán puestos a disposición a través de diversas palancas técnicas(Informes dinámicos, paneles de control…) y posteriormente ya entrar en el mundo de la analítica avanzada (advanced analytics), cuyo objetivo es buscar relaciones y correlaciones entre cientos datos para cubrir infinidad de casos de uso (fraudes, abandonos, ventas cruzadas, perfilado de clientes, etc.). En ambos planteamientos, hay que tener en cuenta una regla de oro, la calidad de los datos que introduzco es equivalente a la calidad de los datos que extraigo, recordemos que si meto basura saco basura, en consecuencia, los esfuerzos necesarios para garantizar la calidad del dato son muy importantes, esfuerzos que la mayoría de la gente no ve.
Por lo tanto, si tenemos construido un sistema de Datawarehousing, mejorando sustancialmente la calidad de los datos y tenemos diversas formas de consumir los datos (cuadros de mando, informes al vuelo, análisis, etc.), tendremos armada una inteligencia “reactiva”.
Piedra angular para seguir evolucionando hacia una inteligencia “proactiva” gracias a la analítica avanzada, pudiendo realizar predicciones, simulaciones, alertas, etc.
Arquitectura & Componentes
Las nuevas arquitecturas deben contemplar varios escenarios, desde los sistemas de BI a los escenarios de descubrimiento y experimentación del Big Data, sin olvidar las necesidades analíticas. Todo ello se habilita en función de la velocidad de los datos y los casos de uso.
Se debe tener en cuenta que, a la hora de plantear un nuevo proyecto, una evolución lógica del proyecto sería primero plantear procesos de toma de decisiones reactiva (Informes dinámicos, paneles de control…) y posteriormente ya entrar en el mundo de la toma de decisiones proactiva (advanced analytics).
Característica del DW
Según William H. Imon (1945), las características que debe tener un DW son las siguientes:
· No volátil: los datos que son almacenados no sufren de ninguna actualización solo son incrementados.
· Orientado al tema: centra una gran colección de información al respecto de un tópico central. Todo girará en torno a ese tema.
· Tiempo variante: Los datos son relativos a un período de tiempo y estos deben ser integrados periódicamente.
Son almacenados como fotos que se corresponden a períodos de tiempo.
· Integrado: toda la información recopilada se trata de forma íntegra y estable a pesar de que provenga de diferentes fuentes.
En el mundo del DW solo hay dos procesos válidos, el de insertar y el de consultar.
Y un modelo bien hecho, seguramente no debería existir el DELETE ni el UPDATE.
En modelos de datos más antiguos, rara vez se almacenaban históricos de los
datos, y tampoco se guardaba un registro de cuándo o cómo se modificaron los datos, esto se puso en práctica entrando ya en el s. XXI.
En cuanto al almacenamiento y estructuras que podemos utilizar en un DW, se encuentran resumidas en la siguiente tabla comparativa:
Conclusión
El DW debe responder a una necesidad de negocio y la realización de informes no implica el desarrollo de todo un BI ya que se debe pensar siempre en aportar un valor añadido, aplicando especial atención a la modelización del DW, ya que el mayor fracaso de los sistemas de BI viene por la ausencia de pericia en la creación de las estructuras de los modelos de datos.
El modelo es el pilar del BI, se debe comprender las ventajas e inconvenientes de cada tipo de modelo y cuando se tenga un buen modelo se tendrán los cimientos para la creación y posterior evolución del sistema de BI a un Data Analytics.
Por ello, los cambios que sean necesarios hacer si tenemos un modelo en copo de nieve y otro en estrella y tenemos herramientas que unas lo permiten y otras no, se deberían realizar en el gestor de base de datos.
Grupo de Trabajo de DWH, BI y Modelado de DAMA ESPAÑA