DP-3011 Implementing a Data Analytics Solution with Azure Databrick

DP-3011 Implementing a Data Analytics Solution with Azure Databrick
Descripción
El siguiente curso obtendra información sobre cómo aprovechar todas las ventajas de Apache Spark y los eficaces clústeres que se ejecutan en la plataforma de Azure Databricks para ejecutar grandes cargas de trabajo de ingeniería de datos en la nube.
Objetivos
- Aprenderá a realizar análisis de datos con Azure Databricks. Explore varios métodos de ingesta de datos y cómo integrar datos de orígenes como Azure Data Lake y Azure SQL Database. Este módulo le guía en el uso de cuadernos colaborativos para realizar análisis exploratorios de datos (EDA), de modo que pueda visualizar, manipular y examinar los datos para descubrir patrones, anomalías y correlaciones.
- Conocerá como Azure Databricks se basa en Apache Spark.
- Obtendrá información como como Delta Lake es una solución de administración de datos en Azure Databricks que proporciona características que incluyen transacciones ACID, aplicación de esquemas y viajes de tiempo, lo que garantiza la coherencia, integridad y control de versiones de los datos.
- Conocerá el procesamiento de datos en tiempo real, escalable y confiable mediante las características avanzadas de Delta Lake en Azure Databricks.
Contenido del Curso
- Introducción a Azure Databricks
- Identificación de las cargas de trabajo de Azure Databricks
- Descripción de los conceptos clave
- Gobierno de datos mediante Unity Catalog y Microsoft Purview
- Ejercicio: Explorar Azure Databricks
- Ingesta de datos con Azure Databricks
- Herramientas de exploración de datos en Azure Databricks
- Análisis de datos mediante las API de DataFrame
- Ejercicio: Exploración de datos con Azure Databricks
- Descubra Spark
- Creación de un clúster de Spark
- Uso de Spark en cuadernos
- Uso de Spark para trabajar con archivos de datos
- Visualización de datos
- Ejercicio: Uso de Spark en Azure Databricks
- Primeros pasos con Delta Lake
- Administración de transacciones ACID
- Implementar el cumplimiento de esquemas
- Control de versiones de datos y desplazamiento y viaje en el tiempo en Delta Lake
- Integridad de datos con Delta Lake
- Ejercicio: Uso de Delta Lake en Azure Databricks
- Exploración de delta Live Tables
- Ingesta e integración de datos
- Procesamiento en tiempo real
- Ejercicio: Creación de una canalización de datos con Delta Live Tables
- ¿Qué son los flujos de trabajo de Azure Databricks?
- Descripción de los componentes clave de los flujos de trabajo de Azure Databricks
- Exploración de las ventajas de los flujos de trabajo de Azure Databricks
- Implementación de cargas de trabajo mediante flujos de trabajo de Azure Databricks
- Ejercicio: Creación de un flujo de trabajo de Azure Databricks



















