Framework Spark
Objetivos:
Capacitar a los asistentes con los conocimientos necesarios para el trabajo con el lenguaje Python en el mundo de Big Data.
Metodología:
El curso se realiza con formación presencial constante, alternando las explicaciones del instructor con la continua práctica de los asistentes.
Dirigido a:
Analistas, analistas programadores y, en general, desarrolladores que quieran conocer y emplear este framework Spark.
Asistencia postcurso:
Pondremos a disposición de los asistentes una cuenta de correo electrónico a la que pueden dirigirse para plantear cualquier duda que pudiera surgirles a la finalización del curso.
Serán atendidos por su instructor en: formacion@puntoes.es
Datos generales
DURACIÓN:
20 Horas
CERTIFICACIÓN:
Puntoes entregará un certificado de asistencia a quienes hayan participado como mínimo, en un 85% de la duración total del curso.
REQUISITOS PREVIOS:
Recomendable tener conocimientos de Python para poder completar con éxito el curso.
Temario
- Introducción a Big Data
- Introducción a Spark
- Configurando Python con Spark
- Configurando PySpark
- Uso de las instancias de Amazon Web Services (AWS) EC2 para Spark
- Configurando Databricks
- Configuración del clúster EMR de AWS
- Introducción a Spark DataFrames
- Implementando Operaciones Básicas con Spark
- Usando Groupby y operaciones agregadas
- Trabajando con marcas de tiempo y fechas
- Trabajando con MLlib, Spark y Python para realizar aprendizaje automático
- Teoría de regresión lineal
- Implementando código de evaluación de regresión
- Teoría de la regresión logística
- Implementando código de regresión logística
- Teoría de los métodos del árbol de aprendizaje
- Implementando Árboles de Decisión y Códigos Forestales Aleatorios
- Teoría de los métodos del árbol de aprendizaje
- Comprender la teoría de agrupamiento de K-means
- Implementando un código de agrupamiento K-means
- Uso de filtros colaborativos
- Uso de filtros basados en contenido
- Comprender el procesamiento del lenguaje natural (NLP)
- Descripción de las herramientas de PNL
- Trabajando en un ejercicio de muestra NLP
- Descripción general Streaming with Spark
- Ejercicio Spark Streaming de muestra