DP-3014 Implementing a Machine Learning Solution with Azure Databricks

DP-3014 Implementing a Machine Learning Solution with Azure Databricks
Descripción
Azure Databricks es una plataforma a escala de la nube para análisis de datos y aprendizaje automático. Los científicos de datos y los ingenieros de aprendizaje automático pueden usar Azure Databricks para implementar soluciones de aprendizaje automático a escala.
Objetivos
- Conocerás Azure Databricks como servicio en la nube que proporciona una plataforma escalable para el análisis de datos mediante Apache Spark.
- Descubrirá cómo Apache Spark y permite a los ingenieros y analistas de datos ejecutar trabajos de Spark para transformar, analizar y visualizar datos a escala.
- Conocerá lo que implica el uso de datos para entrenar un modelo predictivo.
- Descubrá MLflow como plataforma de código abierto para administrar el ciclo de vida del aprendizaje automático que es compatible de forma nativa con Azure Databricks.
- Aprenda a ajustar los hiperparámetros, parte esencial del aprendizaje automático. En Azure Databricks, puede usar la biblioteca Hyperopt para optimizar los hiperparámetros automáticamente.
- Aprenderás a usar AutoML en Azure Databricks para simplificar el proceso de creación de un modelo de aprendizaje automático eficaz para sus datos.
- Conocerás por qué el aprendizaje profundo utiliza redes neuronales para entrenar modelos de aprendizaje automático altamente efectivos para pronósticos complejos, visión artificial, procesamiento del lenguaje natural y otras cargas de trabajo de IA.
Prerequisitos
Se recomienda contar con previa experiencia en el uso de Python para explorar datos y entrenar modelos de aprendizaje automático con marcos de código abierto comunes, como Scikit-Learn, PyTorch y TensorFlow.
Contenido del Curso
- Introducción a Azure Databricks
- Identificación de las cargas de trabajo de Azure Databricks
- Descripción de los conceptos clave
- Gobierno de datos mediante Unity Catalog y Microsoft Purview
- Ejercicio: Explorar Azure Databricks
- Conozca Spark
- Crear un clúster Spark
- Usar Spark en cuadernos
- Utilice Spark para trabajar con archivos de datos
- Visualizar datos
- Uso de Spark en Azure Databricks
- Comprender los principios del aprendizaje automático
- Aprendizaje automático en Azure Databricks
- Preparar datos para el aprendizaje automático
- Entrenar un modelo de aprendizaje automático
- Evaluar un modelo de aprendizaje automático
- Entrenar un modelo de aprendizaje automático en Azure Databricks
- Capacidades de MLflow
- Ejecutar experimentos con MLflow
- Registrar y servir modelos con MLflow
- Uso de MLflow en Azure Databricks
- Optimice los hiperparámetros con Hyperopt
- Revisión de los ensayos de Hyperopt
- Ensayos a escala de Hyperopt
- Optimizar hiperparámetros para el aprendizaje automático en Azure Databricks
- ¿Qué es AutoML?
- Usar AutoML en la interfaz de usuario de Azure Databricks
- Utilice el código para ejecutar un experimento de AutoML
- Uso de AutoML en Azure Databricks
- Comprender los conceptos de aprendizaje profundo
- Modelos de trenes con PyTorch
- Distribuya la formación de PyTorch con TorchDistributor
- Entrenar modelos de aprendizaje profundo en Azure Databricks
- Automatice sus transformaciones de datos
- Explorar el desarrollo de modelos
- Explorar estrategias de implementación de modelos
- Explorar el control de versiones del modelo y la gestión del ciclo de vida
- Gestionar un modelo de aprendizaje automático



















