¿Qué es Microsoft Fabric?
En resumidas palabras: “Microsoft Fabric es una solución completa de datos end-to-end que busca optimizar y centralizar el trabajo en una sola plataforma basada en Software como Servicio (SaaS)”.
Lo que resulta emocionante es que previamente, el mensaje, tanto en artículos, videos, charlas, etc., era: “Crea tu Data Factory, tu Synapse, tu SQL Server, etc., en tan solo unos minutos, con tan solo unos clics”. Esto era bastante bueno, porque ya no tenías que desgastar tantas horas en una implementación de una infraestructura o plataforma para que empieces a trabajar, sino que en su lugar podrías empezar a generar valor al negocio poniendo manos a la obra.
Y si pensábamos que eso ya era “lo máximo”, imagínate ahora tener que ingresar a una plataforma y empezar a “trabajar” directamente. Sí, así como lo lees. ¿Necesitas conectarte a una fuente de datos y extraer lo que hay ahí? Pues bien, ya no tienes que crear tu Data Factory, sino ir directo a “crear pipeline”. ¿Necesitas analizar tus datos? Ok, ve a la opción de SQL query y empieza a crear tus consultas, o por qué no ver el modelo de datos que tienes actualmente en tu warehouse.
¿Qué podemos encontrar en Microsoft Fabric?
Veamos, cuando digo que es una solución end-to-end, quiero decir que abarca todos los servicios y componentes que forman parte de una plataforma de datos con integración, análisis de inteligencia empresarial en tiempo real y ciencia de datos. Es decir, los 3 servicios principales de Microsoft: Azure Data Factory (ADF), Azure Synapse Analytics (ASA) y Power BI; los 3 en una sola plataforma unificada.
Psst! Lo bueno de Microsoft Fabric es que podrás aprovechar los conocimientos que ya tienes al día de hoy sobre los servicios de Azure Data Platform. Eso nos ayudará mucho al momento de navegar y aprender más sobre esta plataforma 😉
Ahora, empecemos a conocerlo por sus funcionalidades:
Integración de Datos
Data Factory es la estrella aquí, ya que permitirá tanto a usuarios como a desarrolladores poder integrar sus datos usando cualquiera de los más de 200 conectores nativos a través de los ya conocidos Data Flow y Data Pipelines.
En el caso de los Data Flow, te brindan una interfaz de usuario de bajo código similar a la experiencia que teníamos con Power Query, con la cual podrás realizar agregaciones, transformaciones, limpieza de datos, etc.
Por otro lado, con los Data Pipelines permite crear flujos de trabajo a una mayor escala (tanto a nivel de movimiento de datos de gran tamaño como a nivel de transformaciones más sofisticadas).
Ingeniería de Datos
Cuando tengamos escenarios que requieran funcionalidades más robustas y completas para extraer, almacenar, procesar y analizar grandes volúmenes de datos, entonces necesitamos de nuetro poderoso Synapse, el cual nos ofrece la infraestructura necesaria para poder crear data pipelines complejos que almacenen datos en el Lakehouse (OneLake) ya sea a modo de archivos o tablas.
Ciencia de Datos
Si necesitamos enriquecer los datos y la información empresarial a través de analítica avanzada y predicciones, los científicos de datos necesitarán el poder de Synapse integrado con Azure Machine Learning para poder crear, implementar, desplegar y dar seguimiento a sus modelos de aprendizaje automático.
Al trabajar en la misma area de trabajo que los ingenieros de datos y los analistas de datos podrán aprovechar del uso compartido y la colaboración de los datos de forma más transparente.
Data Warehouse
Tener la libertad de escalar de manera independiente el computo para procesamiento y el almacenamiento es algo muy util sobretodo en el entorno rápidamente cambiante en la que nos encontramos.
Synapse nos permite no solo consultar datos de manera muy eficiente utilizando la tecnología de SQL con Apache Spark, sino que también nos proporciona un data warehouse completamente escalable.
Análisis en Tiempo Real
Y ¿Qué hay de los datos que provienen de interacciones humanas, aplicaciones, microservicios, etc? Synapse Real Time Analytics tiene un motor de alto rendimiento y una plataforma totalmente administada para poder centrarnos en analizar macrodatos en streaming o serie temporal.
Esto significa que podrá centrarte en sus soluciones analíticas al mismo tiempo que democratizas los datos a los científicos de datos e ingenieros de datos.
Power BI
Seguro que ya conoces o haz oído de Power BI, por lo que sabemos que es una plataforma completa que permite a las organizaciones acceder a sus datos de una forma amigable para poder tomar decisiones.
Ahora, Power BI se integra con Microsoft Fabric para utilizar el almcenamiento OneLake, el cual claramente nos permitirá acceder a los distintos tipo que podremos ingestar o trabajar previamente.
Conclusiones
Como ya has observado, Microsoft Fabric simplifica el uso de los diferentes servicios – de trayectoria claramente comprobada – existentes de Azure Data Platform y reúne todas las experiencias obtenidas en un solo lugar. Esto permite a ingenieros de datos, científicos de datos, analistas de datos y power users trabajar en un mismo lugar.
Como organización, deberás enfocarte en obtener beneficios y máxima rentabilidad de tus proyectos analíticos, en lugar de invertir tiempo y recursos para integrar los diversos servicios o productos que tienes hoy.
1 Comentario
Manuel Monsalve · 17 Enero, 2024 en 3:05 pm
Excelente explicación, conocia los servicios por separado pero ahora ya podemos utilizar todo desde Frabric, gracias por la info