DP-3011 Implementing a Data Analytics Solution with Azure Databrick

Categorías: Inteligencia artificial, Microsoft, Tecnología de la información

DP-3011 Implementing a Data Analytics Solution with Azure Databrick

Categorías: Inteligencia artificial, Microsoft, Tecnología de la información

Descarga el catálogo de cursos

Modalidad

Online en vivo

Duración (horas)

40 horas

Horario

6:30 p.m. a 9:30 p.m.

Descripción

El siguiente curso obtendra información sobre cómo aprovechar todas las ventajas de Apache Spark y los eficaces clústeres que se ejecutan en la plataforma de Azure Databricks para ejecutar grandes cargas de trabajo de ingeniería de datos en la nube.

Objetivos

Aprenderá a realizar análisis de datos con Azure Databricks. Explore varios métodos de ingesta de datos y cómo integrar datos de orígenes como Azure Data Lake y Azure SQL Database. Este módulo le guía en el uso de cuadernos colaborativos para realizar análisis exploratorios de datos (EDA), de modo que pueda visualizar, manipular y examinar los datos para descubrir patrones, anomalías y correlaciones.
Conocerá como Azure Databricks se basa en Apache Spark.
Obtendrá información como como Delta Lake es una solución de administración de datos en Azure Databricks que proporciona características que incluyen transacciones ACID, aplicación de esquemas y viajes de tiempo, lo que garantiza la coherencia, integridad y control de versiones de los datos.
Conocerá el procesamiento de datos en tiempo real, escalable y confiable mediante las características avanzadas de Delta Lake en Azure Databricks.

Contenido del Curso

Módulo 1: Explorar Azure Databricks

Introducción a Azure Databricks
Identificación de las cargas de trabajo de Azure Databricks
Descripción de los conceptos clave
Gobierno de datos mediante Unity Catalog y Microsoft Purview
Ejercicio: Explorar Azure Databricks

Módulo 2: Haga análisis de datos con Azure Databricks

Ingesta de datos con Azure Databricks
Herramientas de exploración de datos en Azure Databricks
Análisis de datos mediante las API de DataFrame
Ejercicio: Exploración de datos con Azure Databricks

Módulo 3: Uso de Apache Spark en Azure Databricks

Descubra Spark
Creación de un clúster de Spark
Uso de Spark en cuadernos
Uso de Spark para trabajar con archivos de datos
Visualización de datos
Ejercicio: Uso de Spark en Azure Databricks

Módulo 4: Administración de datos con Delta Lake

Primeros pasos con Delta Lake
Administración de transacciones ACID
Implementar el cumplimiento de esquemas
Control de versiones de datos y desplazamiento y viaje en el tiempo en Delta Lake
Integridad de datos con Delta Lake
Ejercicio: Uso de Delta Lake en Azure Databricks

Módulo 5: Compilación de canalizaciones de datos con Delta Live Tables

Exploración de delta Live Tables
Ingesta e integración de datos
Procesamiento en tiempo real
Ejercicio: Creación de una canalización de datos con Delta Live Tables

Módulo 6: Implementación de cargas de trabajo con flujos de trabajo de Azure Databricks

¿Qué son los flujos de trabajo de Azure Databricks?
Descripción de los componentes clave de los flujos de trabajo de Azure Databricks
Exploración de las ventajas de los flujos de trabajo de Azure Databricks
Implementación de cargas de trabajo mediante flujos de trabajo de Azure Databricks
Ejercicio: Creación de un flujo de trabajo de Azure Databricks

DP-3011 Implementing a Data Analytics Solution with Azure Databrick

DP-3011 Implementing a Data Analytics Solution with Azure Databrick

DP-3011 Implementing a Data Analytics Solution with Azure Databrick

WHATSAPP

Descarga el catálogo de cursos

Modalidad

Duración (horas)

Horario

Descripción

Objetivos

Contenido del Curso

También te puede interesar

Descarga el catálogo de cursos

WHATSAPP

Inscríbete al Newsletter

Navegación

Catálogo

Contáctanos

Panamá

Nicaragua

Guatemala

Ecuador

El Salvador

Honduras

Costa Rica