DP-203T00 Data Engineering on Microsoft Azure + Examen
Categoría:
Aprende a implementar y administrar cargas de trabajo de ingeniería de datos en Microsoft Azure, mediante servicios de Azure como Azure Synapse Analytics, Azure Data Lake Storage Gen2, Azure Stream Analytics, Azure Databricks y otros. El curso se centra en tareas comunes de ingeniería de datos, como la orquestación de canalizaciones de transferencia y transformación de datos, el trabajo con archivos de datos en un lago de datos, la creación y carga de almacenes de datos relacionales, la captura y la agregación de flujos de datos en tiempo real y el seguimiento de recursos y linaje de datos.
Objetivos
- Exploración de las opciones de proceso y almacenamiento de las cargas de trabajo de ingeniería de datos en Azure.
- Ejecución de consultas interactivas con grupos de SQL sin servidor.
- Realización de exploraciones y transformaciones de datos en Azure Databricks.
- Exploración, transformación y carga de datos en almacenamientos de datos con Apache Spark.
- Ingesta y carga de datos en almacenamientos de datos.
- Transformación de datos con canalizaciones de Azure Data Factory o Azure Synapse.
- Integrar datos de Notebooks con canalizaciones de Azure Data Factory o Azure Synapse.
- Soporte de procesamientos analíticos transaccionales híbridos con Azure Synapse Link.
- Poner en marcha una seguridad integral con Azure Synapse Analytics.
- Realizar procesamientos de secuencias en tiempo real con Stream Analytics.
- Crear una solución de procesamiento de secuencias con Event Hubs y Azure Databricks.
La audiencia principal de este curso son profesionales de datos, arquitectos de datos y profesionales de business intelligence que quieren obtener información sobre la ingeniería de datos y la creación de soluciones analíticas mediante las tecnologías de plataforma de datos que hay en Microsoft Azure. La audiencia secundaria de este curso son analistas de datos y científicos de datos que trabajan con soluciones analíticas basadas en Microsoft Azure.
Módulo 1: Introducción a la ingeniería de datos en Azure
- Identificar tareas comunes de ingeniería de datos.
- Describir conceptos comunes de ingeniería de datos.
- Identificar los servicios de Azure para la ingeniería de datos.
Módulo 2: Introducción a Azure Data Lake Storage Gen2
- Describir las principales características y ventajas de Azure Data Lake Storage Gen2.
- Habilitar Azure Data Lake Storage Gen2 en una cuenta de Azure Storage.
- Comparar Azure Data Lake Storage Gen2 con Azure Blob Storage
- Describir dónde encaja Azure Data Lake Storage Gen2 en las fases del procesamiento analítico.
- Describir cómo se usa Azure Data Lake Storage Gen2 en cargas de trabajo analíticas comunes.
Módulo 3: Introducción a Azure Synapse Analytics
- Identifique los problemas empresariales que aborda Azure Synapse Analytics.
- Describir las capacidades principales de Azure Synapse Analytics.
- Determine cuándo usar Azure Synapse Analytics.
Módulo 4: Uso del grupo SQL sin servidor de Azure Synapse para consultar archivos en un lago de datos
- Identificar capacidades y casos de uso para grupos de SQL sin servidor en Azure Synapse Analytics
- Consultar archivos CSV, JSON y Parquet mediante un grupo de SQL sin servidor
- Cree objetos de base de datos externos en un grupo de SQL sin servidor
Módulo 5: Uso de grupos de SQL sin servidor de Azure Synapse para transformar datos en un lago de datos
- Utilice una instrucción CREATE EXTERNAL TABLE AS SELECT (CETAS) para transformar datos.
- Encapsule una declaración CETAS en un procedimiento almacenado.
- Incluir un procedimiento almacenado de transformación de datos en una canalización.
Módulo 6: Crear una base de datos de lago en Azure Synapse Analytics
- Comprender los conceptos y componentes de la base de datos de Lake
- Describir las plantillas de bases de datos en Azure Synapse Analytics
- Crear una base de datos del lago
Módulo 7: Analizar datos con Apache Spark en Azure Synapse Analytics
- Identifique las características y capacidades principales de Apache Spark.
- Configure un grupo de Spark en Azure Synapse Analytics.
- Ejecute código para cargar, analizar y visualizar datos en un cuaderno Spark.
Módulo 8: Transformar datos con Spark en Azure Synapse Analytics
- Utilice Apache Spark para modificar y guardar marcos de datos
- Particione archivos de datos para mejorar el rendimiento y la escalabilidad.
- Transformar datos con SQL
Módulo 9: Uso de Delta Lake en Azure Synapse Analytics
- Describir las características y capacidades principales de Delta Lake.
- Cree y use tablas de Delta Lake en un grupo de Synapse Analytics Spark.
- Cree tablas de catálogo de Spark para datos de Delta Lake.
- Utilice tablas de Delta Lake para transmitir datos.
- Consulta tablas de Delta Lake desde un grupo SQL de Synapse Analytics.
Módulo 10: Analizar datos en un almacén de datos relacional.
- Diseñar un esquema para un almacén de datos relacional.
- Cree tablas de hechos, dimensiones y preparación.
- Utilice SQL para cargar datos en tablas del almacén de datos.
- Utilice SQL para consultar tablas de almacén de datos relacionales.
Módulo 11: Cargar datos en un almacén de datos relacional
- Cargar tablas provisionales en un almacén de datos
- Cargar tablas de dimensiones en un almacén de datos.
- Dimensiones de tiempo de carga en un almacén de datos.
- Cargar dimensiones que cambian lentamente en un almacén de datos
- Cargar tablas de hechos en un almacén de datos
- Realizar optimizaciones posteriores a la carga en un almacén de datos.
Módulo 12: Creación de una canalización de datos en Azure Synapse Analytics
- Describir los conceptos básicos de las canalizaciones de Azure Synapse Analytics.
- Cree una canalización en Azure Synapse Studio.
- Implementar una actividad de flujo de datos en una canalización.
Iniciar y monitorear ejecuciones de tuberías.
Módulo 13: Uso de Spark Notebooks en una canalización de Azure Synapse
- Describir la integración de notebooks y canalizaciones.
- Utilice una actividad del cuaderno de Synapse en una canalización.
- Utilice parámetros con una actividad de cuaderno.
Módulo 14: Planificación del procesamiento analítico y transaccional híbrido mediante Azure Synapse Analytics
- Describir patrones de procesamiento híbrido transaccional/analítico.
- Identifique los servicios de Azure Synapse Link para HTAP.
Módulo 15: Implementación de Azure Synapse Link con Azure Cosmos DB
- Configure una cuenta de Azure Cosmos DB para usar Azure Synapse Link.
- Cree un contenedor habilitado para el almacén analítico.
- Cree un servicio vinculado para Azure Cosmos DB.
- Analice datos vinculados usando Spark.
- Analice datos vinculados utilizando Synapse SQL.
Módulo 16: Implementar Azure Synapse Link para SQL
- Comprender los conceptos y capacidades clave de Azure Synapse Link para SQL.
- Configure Azure Synapse Link para Azure SQL Database.
- Configure Azure Synapse Link para Microsoft SQL Server.
Módulo 17: Introducción a Azure Stream Analytics
- Comprender los flujos de datos.
- Comprender el procesamiento de eventos.
- Comprender las funciones de las ventanas.
- Comience con Azure Stream Analytics.
Módulo 18: Ingesta de datos de streaming mediante Azure Stream Analytics y Azure Synapse Analytics
- Describir escenarios de ingesta de transmisiones comunes para Azure Synapse Analytics.
- Configure entradas y salidas para un trabajo de Azure Stream Analytics.
- Defina una consulta para ingerir datos en tiempo real en Azure Synapse Analytics.
- Ejecute un trabajo para ingerir datos en tiempo real y consumir esos datos en Azure Synapse Analytics.
Módulo 19: Visualice datos en tiempo real con Azure Stream Analytics y Power BI
- Configure una salida de Stream Analytics para Power BI.
- Utilice una consulta de Stream Analytics para escribir datos en Power BI.
- Cree una visualización de datos en tiempo real en Power BI.
Módulo 20: Introducción al ámbito de Microsoft
- Evalúe si Microsoft Purview es apropiado para las necesidades de gobierno y descubrimiento de datos.
- Describir cómo funcionan las características de Microsoft Purview para proporcionar control y detección de datos.
Módulo 21: Integrar Microsoft Purview y Azure Synapse Analytics
- Catalogue los recursos de la base de datos de Azure Synapse Analytics en Microsoft Purview.
- Configure la integración de Microsoft Purview en Azure Synapse Analytics.
- Busque en el catálogo de Microsoft Purview desde Synapse Studio.
- Realice un seguimiento del linaje de datos en las actividades de canalizaciones de Azure Synapse Analytics.
Módulo 22: Explorar Azure Databricks
- Aprovisione un área de trabajo de Azure Databricks.
- Identifique cargas de trabajo y personas principales para Azure Databricks.
- Describir conceptos clave de una solución de Azure Databricks.
Módulo 23: Uso de Apache Spark en Azure Databricks
- Describir los elementos clave de la arquitectura Apache Spark.
- Cree y configure un clúster Spark.
- Describir casos de uso para Spark.
- Utilice Spark para procesar y analizar datos almacenados en archivos.
- Utilice Spark para visualizar datos.
Módulo 24: Ejecute cuadernos de Azure Databricks con Azure Data Factory
- Describir cómo se pueden ejecutar los cuadernos de Azure Databricks en una canalización.
- Cree un servicio vinculado de Azure Data Factory para Azure Databricks.
- Utilice una actividad de Notebook en una canalización.
- Pasar parámetros a un cuaderno.
Los alumnos aptos comienzan este curso con conocimientos de informática en la nube y fundamentos de datos, y experiencia profesional con soluciones de datos.
Realizando en concreto:
-
- AZ-900: Fundamentos de Azure.
- DP-900: Fundamentos de datos en Microsoft Azure.
Detalles del Examen
Entrega | En línea (basado en la web) |
Formato | Elección múltiple |
Supervisión | En vivo |
Duración | Entre 100 a 120 minutos |
# de preguntas | Entre 40 y 60 preguntas |
Puntuación | 700 o más. |
- Todas las puntuaciones de los exámenes técnicos se indican en una escala de 1 a 1000. La puntuación de aprobado es de 700 o más. Como se trata de una puntuación escalada, puede que no sea igual al 70 % de los puntos.
Certificación