El concepto de Data Warehouse fue acuñado por primera vez por William H. Inmon, considerado por muchos como el padre de Data Warehousing, quien lo define como “una colección de datos orientada al negocio, integrada, variante en el tiempo y no volátil, que tienen por objetivo dar soporte a la toma de decisiones de la gerencia”. Con esta definición W. H. Inmon específica las principales características de un Data Warehouse que son:
- Orientada al negocio: El Data Warehouse se organiza alrededor de temas específicos de un problema de negocio y no a las aplicaciones de estas.
- Integrada: Se integran diversas fuentes operacionales a través de un proceso ETL (extracción, transformación y carga).
- Variante en el tiempo: En un Data Warehouse se mantiene un registro de los datos históricos para diferentes periodos de tiempo. A diferencia de los datos transaccionales que comúnmente mantienen el registro más reciente.
- No volátil: La información una vez ingresada en el Data Warehouse no se modifica, ni se elimina, solo se puede leer y realizar consultas a esta.
En líneas generales, el Data Warehouse es un almacén centralizado de datos, que integra las diversas transacciones en una empresa.
Para la creación de un Data Warehouse es necesario conocer bien el proceso ETL bajo el cual se construye un Almacén de Datos:
- Extracción: Corresponde a la extracción de los datos desde las diversas fuentes de datos (CRM, ERP, etc) a una base de datos intermedia llamada Data Staging Area (DSA).
- Transformación: Es la etapa donde se homogeniza los datos de las diferentes fuentes, se limpian y se transforman de acuerdo a los indicadores que se quieran almacenar.
- Carga: Los datos una vez limpios y transformados son cargados en el Data Warehouse.
Con este proceso pasamos de diversas fuentes de datos a una base de datos confiable, centralizada y con información relevante para el negocio.
Para una organización la creación e implementación de un Data Warehouse constituye uno de los primeros pasos para la implementación de soluciones de Business Intelligence, debido a sus grandes beneficios como:
- Facilidad de acceso a la información
- Mayor flexibilidad y rapidez de respuesta
- Consolidación y homogeneización de la información
- Mejor comunicación entre departamentos de la empresa
- Entrega de información relevante que antes no se almacenaba
- Se tiene una base confiable para aplicar técnicas de analytics
Por estas razones la construcción de un Data Warehouse es un primer paso en la transformación de las organizaciones en la era digital, donde como Penta Analytics apoyamos a esta construcción y vemos en este un gran potencial para posteriores análisis que generen ventajas competitivas en la organización, como por ejemplo, implementar la solución de pedido sugerido que corresponde a un motor de recomendaciones personalizadas a partir de canastas regulares, relaciones cruzadas y clientes espejos o también un motor de recomendaciones personalizadas para el e – commerce que permita entregar ofertas con los productos que está buscando el cliente final.