Modelado de datos dimensional: Organización y creación de un modelo estrella en Power BI

¡Bienvenidos, muy buenos días tardes o noches , según donde me leas !

En este artículo, exploraremos el fascinante mundo del modelado de datos dimensional y su aplicación en Power BI. El modelado de datos dimensional es una técnica clave para organizar y estructurar conjuntos de datos complejos, permitiendo un análisis eficiente y una visualización clara en herramientas de inteligencia empresarial como Power BI.

Comenzaremos familiarizándonos con las convenciones de Microsoft y cómo organizar nuestras carpetas y consultas para facilitar el proceso de modelado. A continuación, nos sumergiremos en la creación de dimensiones, identificando las características esenciales y aplicando técnicas para eliminar duplicados y optimizar el rendimiento.

Exploraremos ejemplos prácticos de diferentes dimensiones, como ubicación geográfica, minoristas y productos, y aprenderemos a asignar claves subrogadas para mejorar la eficiencia del modelo. Además, abordaremos la creación de la dimensión de calendario, una parte fundamental en cualquier modelo dimensional.

A lo largo del artículo, destacaremos la importancia de seguir las reglas de creación de un modelo estrella y cómo establecer relaciones efectivas entre las tablas. También discutiremos la creación de tablas de medidas y la importancia de organizarlas correctamente para un análisis eficiente.

Para complementar este artículo, proporcionaremos enlaces a recursos oficiales de Microsoft que respaldan los conceptos y pasos descritos, brindando una base sólida para aquellos que deseen profundizar en el modelado de datos dimensional y aprovechar al máximo Power BI.

Prepárate para explorar un enfoque estructurado y eficiente en el mundo del análisis de datos con el modelado dimensional y Power BI. ¡Comencemos a construir modelos estrella impactantes y significativos!

Primer post que crearemos. Crearemos el modelado de datos dimensional.

Siguiendo las convenciones de Microsoft, antes que nada creamos una carpeta llamada «stage» y otra llamada «datos». En «stage» estará la consulta origen y deshabilitamos su carga, y en la otra carpeta es donde alojaremos las tablas dimensiones y hechos, así organizamos de mejor manera nuestras consultas.

Lo primero será identificar cuáles serán mis dimensiones. La primera dimensión, que es obvia, es la de ubicación o geografía. Tenemos región, estado y ciudad. La granularidad más pequeña es la ciudad, así que nos quedaremos con estas tres en una dimensión. Analizando esto, creamos la dimensión.

Ahora, para eliminar duplicados, es muy importante entender que seleccionamos primero la ciudad y luego el estado, para garantizar quitar solo los duplicados de menor granularidad pero sin perder los datos completos. Quedando con 52 ciudades, 50 estados y 5 regiones.

Creamos una clave subrogada que optimizará la tabla de hechos y seguimos las buenas reglas de creación de dimensiones con la columna autoincremental.

Pasamos a crear la siguiente dimensión que sería de los minoristas (Retailer) y el ID de minorista (Retailer ID). En este caso, sí usaremos la clave de negocio que viene en el dataset sin añadir una columna incremental.

La siguiente dimensión es la de producto. Vamos a por ello. Como ya sabemos, creamos los procesos que ya conocemos para crear el modelo dimensional. En este caso, también crearemos una clave subrogada.

Pasamos a la siguiente dimensión en la cual utilizaremos la columna categórica «Sales Method» o método de venta. A esta dimensión también le crearemos una clave subrogada.

Ahora creamos la dimensión calendario con unos pasos sencillos. Primero, creamos una consulta en blanco. Luego de esto, redactaremos las siguientes funciones del lenguaje M, las cuales a partir de una lista de números en un rango mínimo y máximo crearán una lista apartada del mínimo de la columna «fecha» de la tabla de hechos y el máximo de la columna «fecha». Este es el código:

let Source = {Number.From(List.Min(SportProducts[Invoice Date]))..Number.From(List.Max(SportProducts[Invoice Date]))} in Source

Después de ello, convertimos a tabla esta lista, cambiamos el formato a tipo fecha y añadimos la granularidad para realizar el análisis de los tiempos.

En la tabla de hechos, creamos los merges necesarios para hacer y llevar las llaves foráneas a la tabla de hechos.

Como podemos ver, las relaciones están creadas de manera eficiente y tenemos un modelo dimensional eficiente y correcto para Power BI, respetando las reglas para la creación de un modelo estrella.

Tablas de medidas: Creamos una medida eliminando la columna y tenemos nuestra tabla organizada.

Aquí comparto el documento oficial de Microsoft que respalda estos pasos: «Documento para la creación de un modelo estrella»: enlace al documento

Explicación de las claves subrogadas: enlace a la explicación

Y este es el paso a paso para el orden de las medidas y crear una tabla solo para medidas: «Medidas en Power BI Desktop – Power BI | Microsoft Learn».https://learn.microsoft.com/es-es/power-bi/transform-model/desktop-measures#organizing-your-measures

 

Vicente Antonio Juan Magallanes

Business Intelligence Technical.

 

Perfil linkedin.

 

Loading

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *