De nuevo tu mejor Blog de BI en la web Solutions Geek
Hoy conversaremos sobre data flows en PBI service.
Cualquier proyecto de analítica de datos en la actualidad requiere un proceso muy importante de preparación de datos, transformación y obtención de modelos útiles para su consumo por analistas y usuarios de negocio. Según expertos, este proceso suele tener entre el 60% y el 80% del peso dentro de cualquier proyecto de analítica.
Desde ahora, DataFlow de Power BI puede cumplir este propósito proporcionando funciones de carga y transformación de datos e incluso esquemas de datos por defecto que pueden reducir considerablemente el tiempo de desarrollo.
Con los flujos de datos se puede cambiar con varios pasos y dejar listos los datos tengamos en cuenta que el flujo de datos de PBI con el se puede realizar todo el proceso de ETL,
- Crear una logia de información reutilizable.
- Crear una única fuente de confianza dado que obligamos a los analistas a conectarse al flujo de datos
- Con grandes volúmenes de datos y hacer ETL en escala son más flexibles.
- Impedir que tenga acceso directo al subyacente BBDD.
DataFlow de Power BI, como otras herramientas de ETL, se puede utilizar para cargar, limpiar, transformar, integrar, enriquecer y esquematizar fácilmente datos de una gran variedad de fuentes transaccionales y de observación, que abarcan toda la lógica de preparación de datos.
Hasta ahora, este proceso de ETL sólo podía hacerse de forma externa a Power BI y se debía consumir en un conjunto de datos ya alimentado de los datos finales que deja preparados este proceso.
Con esta herramienta se puede ganar tiempo, reducir costes y facilitar este proceso con una interfaz mucho más user-friendly para el usuario, pues para alguien acostumbrado a Power Query de Power BI no le debe resultar nada extraña la interfaz de Data Flow. Los flujos de datos se crean y administran en las áreas de trabajo, contando con todas las capacidades que ofrece el servicio Power BI, como la administración de permisos, actualizaciones programadas y más.
Data Flow usa el sistema CDM (Common Data Model) que es un conjunto de esquemas de datos estandarizados y un sistema de metadatos para permitir la coherencia de los datos y su significado en todas las aplicaciones y procesos empresariales. Ofrece un mapeo fácil de cualquier información a las entidades de CDM estándar, como Cuenta, Contacto, etc. Se puede aprovechar el esquema estándar, o personalizar las entidades según necesidades.
Como podemos resumir es fantástico las diferentes funciones y la facilidad de uso de data flow.
En próximas publicaciones realizare explicación breve y resumida de los bloques de data flow con varios ejemplos.
Vicente Antonio Juan Magallanes
Business Intelligence Technical.