La combinación de conjuntos de datos para generar información compleja puede ayudar a las organizaciones a aprovechar al máximo los datos.
Getty Images/iStockphoto

Es posible que la herramienta de análisis Power BI de Microsoft no obtenga la publicidad del resto de Power Platform, pero a medida que la empresa continúa invirtiendo en su aplicación de línea de negocio y plataforma de automatización, seguirá recibiendo actualizaciones periódicas con nuevas funciones. El último lote hace que sea mucho más fácil personalizar modelos y trabajar con más fuentes de datos, e incluso usar análisis de Power BI en herramientas de análisis y visualización de terceros.

Una de las funciones más importantes de Power BI es DirectQuery, que proporciona un mecanismo para conectarse a fuentes de datos externas sin importar los datos a su propio almacén de análisis local. Aunque las importaciones de datos siempre son más eficientes que trabajar con fuentes de datos remotas, es posible que se encuentre en una posición en la que no pueda importar datos a su instancia de Power BI. Esto podría deberse a motivos normativos o de propiedad de los datos, o cuando los datos cambian rápidamente y no hay posibilidad de importarlos, o simplemente no tiene la capacidad de almacenamiento para replicar los datos.

Índice

Uso de DirectQuery

Las conexiones de DirectQuery se comportan de manera diferente a las importaciones estándar. Cree consultas de la misma manera que lo haría con cualquier otra conexión, seleccionando fuentes y tablas. La diferencia es que no se importan datos y, cuando crea o actualiza una visualización, Power BI consulta la fuente de datos remota como parte del proceso de generación de informes. Esto puede llevar un tiempo, especialmente si está trabajando con conjuntos de datos muy grandes que podrían no admitir consultas en memoria u otras optimizaciones de Power BI.

No todos los conectores admitidos ofrecen DirectQuery, aunque encontrará que la mayoría de ellos son otras herramientas de análisis empresarial o son repositorios a gran escala. Tiene sentido: no desea haber pasado todo ese tiempo construyendo un enorme almacén de Teradata o configurando SQL Server Analysis Services y luego replicando todo ese trabajo en Power BI. Al crear sus modelos con herramientas familiares y luego usar Power BI como su capa de visualización e informes, obtiene el máximo provecho de los recursos y habilidades disponibles, con análisis a escala en todos los servidores, así como visualización y exploración en PC.

Al usar DirectQuery, puede comenzar a construir a partir de estos patrones existentes, combinándolos con datos adicionales para crear rápidamente un análisis personalizado. Tal vez tenga un almacén de datos de ventas para una tienda por departamentos y desee vincularlo a los datos de su sistema ERP, sin sobrecargar ninguno de los sistemas con consultas complejas ni llenar los servidores de informes con terabytes de datos costosos. Microsoft promete más conectores DirectQuery en futuras versiones, centrándose en sistemas como estos diseñados para funcionar de forma interactiva.

Informes de datos en vivo con DirectQuery

Debido a que los modelos de los servicios de análisis existentes a menudo se crean en torno a sus propias métricas, ya utilizan datos agregados. DirectQuery puede trabajar con estas métricas en lugar de los datos subyacentes, por lo que no duplica el esfuerzo y agrega complejidad innecesaria a sus consultas. Ahora puede trabajar con herramientas de análisis de big data, como Apache Spark, permitiendo que las herramientas especializadas manejen datos no estructurados y aprovechen sus funciones especializadas desde Power BI sin tener que diseñar sus propias consultas complejas.

Una vez que haya creado una visualización o un informe basado en una conexión DirectQuery, la visualización inicialmente será estática, según la última consulta realizada en el origen. Si actualiza la vista, se volverá a cargar. Si los usa como mosaicos en un tablero, deberá configurar un programa de actualización, generalmente cada hora. Cuando abra un informe, verá el estado de la última actualización, y si desea datos actualizados fuera de un programa de actualización de informes, deberá actualizar manualmente los datos.

VER: Trucos para el menú de inicio de Windows 10 (Premium de TechRepublic)

Hay otra buena razón para usar DirectQuery: si sus datos necesitan estar seguros, aplicar una capa de administración de permisos a los datos de origen significa que solo los datos aprobados se pasan a Power BI. La conexión de DirectQuery pasa las credenciales de Power BI a la fuente, lo que permite que los datos protegidos se entreguen a los usuarios autorizados. La compartimentación de las consultas de esta manera garantiza que los equipos de desarrollo puedan probar los tableros de CEO y CFO sin comprometer los datos confidenciales.

Es importante tener en cuenta que DirectQuery limita ciertas funciones de Power BI, tanto en la creación de modelos como en la ejecución de informes. Estos no son problemas importantes, pero si confía en tablas calculadas, por ejemplo, es posible que prefiera usar una conexión tradicional. No puede usar algunas de las funciones basadas en el aprendizaje automático de Power BI, como Quick Insights y Q&A, porque dependen de conjuntos de datos locales para la velocidad o para crear modelos de ML.

Creación de análisis encadenados con DirectQuery y Power BI

Donde las cosas se ponen interesantes es usar DirectQuery con conjuntos de datos de Power BI y Azure Analysis Services. Lanzado recientemente en versión preliminar, esto le permite combinar datos de sus propios modelos con otros datos, de conexiones DirectQuery existentes u otras fuentes de datos. Tal vez tenga un conjunto de datos aproximado en Excel y quiera ver cómo afecta las predicciones u otros análisis. Puede configurar rápidamente una conexión en vivo a sus modelos de Power BI existentes y comenzar a realizar cambios.

Este enfoque le brinda la capacidad de encadenar modelos y conjuntos de datos, comenzando, por ejemplo, con un modelo de Azure Analysis Services que trae varias fuentes a un Azure Data Lake. Con una conexión DirectQuery en Power BI, puede combinar esto con otras fuentes para crear un nuevo modelo. Tal vez use datos de IoT de un parque eólico para mostrar la producción de energía a diferentes velocidades del viento y combinarlos con pronósticos meteorológicos para producir un modelo de Power BI que prediga el rendimiento del parque eólico. Encadenar este modelo a otro que prediga el precio le permite crear un sistema que sugiera cuándo y cuánta producción se necesita para obtener el mejor precio.

VER: 60 trucos de Excel que todo usuario debe dominar

Actualmente puede encadenar hasta tres patrones; cualquier otro le dará un error. También debe tener en cuenta que los datos de un modelo pueden fluir hacia otro, lo que puede provocar una fuga de información no deseada, especialmente si uno de los conjuntos de datos intermedios es una consulta estándar.

No es difícil ver cuán importantes son estas nuevas características. Microsoft está integrando capacidades de análisis que anteriormente requerían un importante trabajo de desarrollo en sus herramientas de inteligencia comercial de escritorio. La combinación de conjuntos de datos para generar información compleja puede ayudar incluso a la organización más pequeña a aprovechar al máximo sus datos, pasando de big data en Azure a paneles dirigidos a escritorios ejecutivos con solo unas pocas consultas. Los conocimientos resultantes ayudarán a esos líderes a tomar mejores decisiones, mucho más rápido. En un mundo incierto, es algo que vale la pena construir.