DP-3011 Implementing a Data Analytics Solution with Azure Databrick

DP-3011 Implementing a Data Analytics Solution with Azure Databrick

WHATSAPP

Descarga el catálogo de cursos

Modalidad

Online en vivo

Duración (horas)

40 horas

Horario

6:30 p.m. a 9:30 p.m.

Descripción

El siguiente curso obtendra información sobre cómo aprovechar todas las ventajas de Apache Spark y los eficaces clústeres que se ejecutan en la plataforma de Azure Databricks para ejecutar grandes cargas de trabajo de ingeniería de datos en la nube.

Objetivos

  • Aprenderá a realizar análisis de datos con Azure Databricks. Explore varios métodos de ingesta de datos y cómo integrar datos de orígenes como Azure Data Lake y Azure SQL Database. Este módulo le guía en el uso de cuadernos colaborativos para realizar análisis exploratorios de datos (EDA), de modo que pueda visualizar, manipular y examinar los datos para descubrir patrones, anomalías y correlaciones.
  • Conocerá como Azure Databricks se basa en Apache Spark.
  • Obtendrá información como como Delta Lake es una solución de administración de datos en Azure Databricks que proporciona características que incluyen transacciones ACID, aplicación de esquemas y viajes de tiempo, lo que garantiza la coherencia, integridad y control de versiones de los datos.
  • Conocerá el procesamiento de datos en tiempo real, escalable y confiable mediante las características avanzadas de Delta Lake en Azure Databricks.

Contenido del Curso

  • Introducción a Azure Databricks
  • Identificación de las cargas de trabajo de Azure Databricks
  • Descripción de los conceptos clave
  • Gobierno de datos mediante Unity Catalog y Microsoft Purview
  • Ejercicio: Explorar Azure Databricks
  • Ingesta de datos con Azure Databricks
  • Herramientas de exploración de datos en Azure Databricks
  • Análisis de datos mediante las API de DataFrame
  • Ejercicio: Exploración de datos con Azure Databricks
  • Descubra Spark
  • Creación de un clúster de Spark
  • Uso de Spark en cuadernos
  • Uso de Spark para trabajar con archivos de datos
  • Visualización de datos
  • Ejercicio: Uso de Spark en Azure Databricks
  • Primeros pasos con Delta Lake
  • Administración de transacciones ACID
  • Implementar el cumplimiento de esquemas
  • Control de versiones de datos y desplazamiento y viaje en el tiempo en Delta Lake
  • Integridad de datos con Delta Lake
  • Ejercicio: Uso de Delta Lake en Azure Databricks
  • Exploración de delta Live Tables
  • Ingesta e integración de datos
  • Procesamiento en tiempo real
  • Ejercicio: Creación de una canalización de datos con Delta Live Tables
  • ¿Qué son los flujos de trabajo de Azure Databricks?
  • Descripción de los componentes clave de los flujos de trabajo de Azure Databricks
  • Exploración de las ventajas de los flujos de trabajo de Azure Databricks
  • Implementación de cargas de trabajo mediante flujos de trabajo de Azure Databricks
  • Ejercicio: Creación de un flujo de trabajo de Azure Databricks

También te puede interesar

Descarga el catálogo de cursos

WHATSAPP