Framework Spark

Objetivos:

Capacitar a los asistentes con los conocimientos necesarios para el trabajo con el lenguaje Python en el mundo de Big Data.

Metodología:

El curso se realiza con formación presencial constante, alternando las explicaciones del instructor con la continua práctica de los asistentes.

Dirigido a:

Analistas, analistas programadores y, en general, desarrolladores que quieran conocer y emplear este framework Spark.

Asistencia postcurso:

Pondremos a disposición de los asistentes una cuenta de correo electrónico a la que pueden dirigirse para plantear cualquier duda que pudiera surgirles a la finalización del curso.
Serán atendidos por su instructor en: formacion@puntoes.es

Datos generales

DURACIÓN:

20 Horas

CERTIFICACIÓN:

Puntoes entregará un certificado de asistencia a quienes hayan participado como mínimo, en un 85% de la duración total del curso.

REQUISITOS PREVIOS:

Recomendable tener conocimientos de Python para poder completar con éxito el curso.

Temario
  • Introducción a Big Data
  • Introducción a Spark
  • Configurando Python con Spark
  • Configurando PySpark
  • Uso de las instancias de Amazon Web Services (AWS) EC2 para Spark
  • Configurando Databricks
  • Configuración del clúster EMR de AWS
  • Introducción a Spark DataFrames
  • Implementando Operaciones Básicas con Spark
  • Usando Groupby y operaciones agregadas
  • Trabajando con marcas de tiempo y fechas
  • Trabajando con MLlib, Spark y Python para realizar aprendizaje automático
  • Teoría de regresión lineal
  • Implementando código de evaluación de regresión
  • Teoría de la regresión logística
  • Implementando código de regresión logística
  • Teoría de los métodos del árbol de aprendizaje
  • Implementando Árboles de Decisión y Códigos Forestales Aleatorios
  • Teoría de los métodos del árbol de aprendizaje
  • Comprender la teoría de agrupamiento de K-means
  • Implementando un código de agrupamiento K-means
  • Uso de filtros colaborativos
  • Uso de filtros basados en contenido
  • Comprender el procesamiento del lenguaje natural (NLP)
  • Descripción de las herramientas de PNL
  • Trabajando en un ejercicio de muestra NLP
  • Descripción general Streaming with Spark
  • Ejercicio Spark Streaming de muestra