Desarrollo de soluciones de Big Data Analytics





Resumen del Curso

20/09/2022 a 20/10/202240 horas
presencialPrecio (externos) : 960€
Precio (Asociado) : 816€
Precio (Colegiado) : 816€

Voy a contar con ...

course imageCurso de formación realizado en colaboración con el Instituto Tecnológico de Informática (ITI)

Contenido del curso

DescripciónEste curso trata de dar visión completa del proceso de desarrollo de una solución de Big Data Analytics, desde el diseño de los procesos de digitalización a la construcción de los cuadros de mando de usuario para la monitorización y explotación de los resultados de los modelos estadísticos, pasando por la adquisición y preparación de los datos, modelado y entrenamiento de modelos, evaluación de resultados y empaquetado de los modelos como servicio.
Serás capaz de...El objetivo de este curso es resolver las principales dudas con las que se enfrentan los jefes de proyecto y desarrolladores a la hora de desarrollar una solución de Big Data Analytics en la empresa. Se cubre el ciclo de vida de la ciencia de datos (digitalización, adquisición y preparación de los datos, entrenamiento y evaluación de modelos predictivos, despliegue de modelos y generación de conocimiento) presentando las principales técnicas a aplicar en cada una de las etapas.
Programa
  • Módulo 1. Introducción
La aparición de nuevos conceptos relacionados con la digitalización y la búsqueda del conocimiento a lo largo de estos últimos años hace que muchos equipos de desarrollo etiqueten equivocadamente su necesidad, lo que conduce a construir sistemas que no van a cumplir con las expectativas. Nos encontramos casos en los que no se pueden aplicar técnicas de aprendizaje automático porque falta digitalizar los procesos (de negocio, de fabricación, etc.). A veces se desea digitalizar toda una planta cuando una extracción de datos históricos con unos pocos sensores en un cubo multidimensional es suficiente. Hay escenarios que requieren almacenar grandes cantidades de datos. Otros requieren desarrollar herramientas auxiliares que capturen métricas para poder aplicar técnicas de aprendizaje automático. Hay mucha heterogeneidad y no hay una solución única. En este primer módulo introductorio se presentarán los conceptos clave del dominio y de los proyectos de Big Data Analytics. Se hablará sobre objetivos y expectativas, así como de la evaluación del riesgo asociado a la ejecución del mismo. También se considerarán aspectos transversales como el cambio de cultura en la organización que supone aplicar estas técnicas, el data governance.
  1. Introducción a Big Data Analytics
    • Motivaciones
    • Nuevos conceptos: IoT, BI, IA, Machine Learning, Deep Learning, Data Engineering, Data Science, Data Analytics, Data Governance
    • ¿Qué problema resuelvo con Big Data?
    • Escenarios y retos
  2. Tecnologías Big Data
    • Fundamentos técnicos
    • La era Hadoop
    • Apache Hive
    • La era Spark
  • Módulo 2. Estrategia de implantación Big Data
El objetivo de este módulo es resolver las principales dudas con las que se enfrentan los equipos de dirección técnica a la hora de implantar una estrategia de Big Data en su empresa. Así, se cubre desde un vistazo casos prácticos en materia de diseño de infraestructuras Big Data, explotación y analítica de datos, pasando por una revisión de las principales tecnologías que hoy en día pueblan el horizonte de Big Data (para ingesta masiva, consulta, análisis, visualización…), hasta un roadmap para la adopción de dichas técnicas y tecnologías en nuestras empresas.
  1. Quiero ser arquitecto Big Data
    • Ecosistema Hadoop
    • Nuestra pila de servicios
    • Por dónde empezar
    • Despliegue de modelos de Machine Learning
  2. Herramientas disponibles
    • Data Engineer
    • Data Scientist
    • Data Analyst
  3. Casos prácticos
    • La infraestructura de UBER
    • Graph Analytics
    • Procesamiento de Lenguaje Natural
    • Detección de Anomalías
    • Forecasting
  4. Definiendo una estrategia Big Data
    • El equipo Big Data
    • De los datos a las aplicaciones
    • Puesta en marcha
  • Módulo 3. Adquisición y estructuración de los datos
La aplicación de modelos requiere corpus de entrenamiento de calidad que se extraen de las redes de sensores y los sistemas transaccionales. Se describirán posibles soluciones para capturar, obtener y almacenar la información, en función de la dimensión de los datos y su disponibilidad. Además, se explicarán técnicas de transformación de los datos, prestando especial atención al concepto de calidad del dato.
  1. Ciclo de vida del dato
  2. Digitalización del entorno
    • Instrumentación industrial
    • Sensorización IoT
  3. Extracción de datos
    • Diversidad de orígenes: No SQL, BBDD, ficheros, web, etc.
  4. Ingesta/Almacenamiento de los datos
    • Data Warehouse, Data Lake, Lakehouse
  5. Entendimiento de los datos
    • Análisis Inicial de los Datos (IDA)
    • Técnicas de formateo
    • Técnicas de limpieza (normalización, estandarización, fusión,...)
    • Adaptación de los datos (imputación de datos faltantes)
  6. Taller: Adquisición y preparación de datos
  • Módulo 4. Modelos predictivos
La construcción de los modelos que permiten realizar diagnósticos, pronósticos, simulaciones o prescripciones sobre los datos pasa por tres etapas claramente diferenciadas: diagnóstico y análisis exploratorio de datos, construcción y entrenamiento del modelo, y empaquetado para ser consumidos como servicio desde aplicaciones de usuario y cuadros de mando. En este módulo se presentan las técnicas utilizadas en cada una de las etapas.
  1. Análisis de modelos predictivos
  2. Análisis Exploratorio de Datos (EDA)
  3. Pre-Procesado de datos
  4. Entrenamiento y evaluación de modelos predictivos
  5. Despliegue de modelos
  6. Taller: Realización de un EDA, entrenamiento y evaluación de un modelo predictivo
  • Módulo 5. Generación de conocimiento
La explotación de los resultados de los modelos es un punto fundamental en los proyectos tanto de BI, como de Data Analytics, dado que permite transformar los datos de entrada y los resultados de los modelos en información y potencialmente en conocimiento para el apoyo a la toma de decisiones. Por ese motivo, en este módulo se mostrarán distintas formas de generación de cuadros de mando para la monitorización en tiempo real de los datos y la explotación de los modelos predictivos.
  1. Automatización de los mecanismos de captura, limpieza e integración de las fuentes de datos
  2. Soluciones de usuario para el análisis de datos
  3. Integración de modelos predictivos en cuadros de mandos
  4. Taller: Generación de conocimiento

Inscripción

Tipo de CursoPropio, organiza COITCV/AVIT
ClaseAula de formación del Instituto Tecnológico de Informática- ITI. Ciudad Politécnica de la Innovación, Edificio 8G, Cuarta Planta
AgendaMartes y jueves. De 16:00 a 20:00h.
Inicio plazo de inscripción02/05/2022
Fin plazo de inscripción10/09/2022
Proceso de Inscripción
  • Precio público general: 960€ (IVA no incluido)
  • Precio AVIT: descuento del 15% por el convenio firmado entre la AVIT y el ITI (este descuento no es aplicable en el curso cuando esté en "período de venta anticipada") Consulta condiciones.
——————————————————————————-
  • Si eres asociado y/o colegiado identifícate como tal y envía la “Inscripción del Colegiado”. Una vez recibida la inscripción te enviaremos el "código descuento" para que puedas aplicarlo en la inscripción y obtener el descuento.
Si necesitas más información escribe a rrhh@coitcv.org con el nombre del curso y la consulta. Más información aquí.

Preinscripción

    Datos del alumno

    Inscripción

    Modalidad
    PresencialTelepresencial

    Soy mayor de 18 años y he leído y acepto la [Política de Privacidad] de este sitio web.

    Ir arriba
    Utilizamos cookies propias y de terceros para ofrecerte una mejor experiencia y servicio, de acuerdo a tus hábitos de navegación. Si continúas navegando, consideramos que aceptas su uso.