Creación de un modelo dimensional a partir de datos de reseñas de productos

Hola muy buenas tardes, días o noches según donde me leas, hoy veremos la Creación de un modelo dimensional a partir de datos de reseñas de productos

El dia de hoy crearemos las dimensiones en postgresql sobre el reto pomerol de marzo con el cual venimos trabajando en este blog.

Lo que veras en este código, se está realizando la creación de un modelo dimensional a partir de una tabla llamada «stage2», que es la tabla de aterrizaje que utilizamos,  que contiene información de reseñas de productos.

En primer lugar, se crean las dimensiones «Dim_profile_name», «Dim_Reviews», «Dim_helpful_numbers» y «Dim_calendar».

Empecemos….

La creación de un modelo dimensional es una técnica utilizada en el análisis de datos que permite organizar la información de una manera estructurada y sencilla de entender. En este artículo, se describirá cómo crear un modelo dimensional a partir de datos de reseñas de productos, utilizando como ejemplo el código que se muestra a continuación.

La dimensión «Dim_profile_name» se crea a partir de la columna «profile_name» de la tabla «stage2». Se hace una consulta para conocer el máximo aproximado de la longitud de la columna y luego se crea la tabla con una clave primaria auto-incrementable. Se insertan los datos de la columna «profile_name» y se verifica que se hayan cargado correctamente.

La dimensión «Dim_Reviews» se crea a partir de las columnas «review_title» y «review_text» de la tabla «stage2». Se hace una consulta para conocer los tamaños máximos de ambas columnas y se crea la tabla con una clave primaria auto-incrementable. Se insertan los datos de ambas columnas y se verifica que se hayan cargado correctamente.

La dimensión «Dim_helpful_numbers» se crea a partir de la columna «helpful_count» de la tabla «stage2». Se hace una consulta para separar los números de las palabras y se insertan los datos en una tabla temporal. Luego se crean rangos de números para analizar de mejor manera los datos de las reseñas que tuvieron más visibilidad y se insertan en la tabla «Dim_helpful_numbers».

La dimensión «Dim_calendar» se crea a partir de la columna «reviewed_at» de la tabla «stage2». Se hace una consulta para conocer la fecha mínima y máxima de la columna y luego se genera una serie de fechas consecutivas que se utilizan como calendario para las métricas. Se obtienen las fechas, meses y años de la serie generada y se insertan en la tabla «Dim_calendar».

La creación de un modelo dimensional a partir de datos de reseñas de productos es una herramienta útil para analizar la información de manera más efectiva y tomar decisiones más informadas. Al utilizar el código presentado en este artículo, se puede crear un modelo dimensional que organice los datos de manera adecuada, lo que facilita el análisis y la comprensión de los mismos. La creación de modelos dimensionales es una técnica importante en el análisis de datos y debe ser considerada por aquellos que deseen mejorar su capacidad para tomar decisiones basadas en datos.

El link del código  esta acá en el GitHub https://github.com/vicente2121/Dimensiones_reto_pomerol_marzo_2023/blob/main/Modelado_datos.sql

Vicente Antonio Juan Magallanes

Business Intelligence Technical.

 

Perfil linkedin.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *