Sistemas de Big Data

Profesor: Jon Ander Maiz

Sistemas de Big Data

En la asignatura de Sistemas de Big Data, los estudiantes aprenden a gestionar y analizar grandes volúmenes de datos utilizando herramientas como Apache Hadoop, Apache Spark y Apache Kafka. Aprenden a implementar técnicas de procesamiento distribuido y a utilizar herramientas de visualización de datos.

Contenidos principales

  • Fundamentos de Big Data: conceptos, arquitecturas, ecosistema
  • Apache Hadoop: HDFS, MapReduce, YARN
  • Apache Spark: RDDs, DataFrames, Spark SQL, Spark Streaming
  • Apache Kafka: arquitectura, productores, consumidores, streams
  • Procesamiento distribuido: paradigmas, modelos, optimización
  • Bases de datos NoSQL: HBase, Cassandra, MongoDB
  • Seguridad en Big Data: autenticación, autorización, encriptación

Proyectos y prácticas

Los estudiantes trabajan en proyectos como:

  • Análisis de logs en tiempo real
  • Procesamiento de datos de IoT a gran escala
  • Implementación de data lakes
  • Análisis de grafos con tecnologías Big Data

Salidas profesionales

Esta asignatura prepara a los estudiantes para roles como:

  • Big Data Engineer
  • Data Architect
  • Especialista en Hadoop/Spark
  • Administrador de sistemas Big Data

Metodología

La asignatura combina clases teóricas con talleres prácticos y desarrollo de proyectos reales, siguiendo la metodología ETHAZI.