Sistemas de Big Data
Profesor: Jon Ander Maiz
Sistemas de Big Data
En la asignatura de Sistemas de Big Data, los estudiantes aprenden a gestionar y analizar grandes volúmenes de datos utilizando herramientas como Apache Hadoop, Apache Spark y Apache Kafka. Aprenden a implementar técnicas de procesamiento distribuido y a utilizar herramientas de visualización de datos.
Contenidos principales
- Fundamentos de Big Data: conceptos, arquitecturas, ecosistema
- Apache Hadoop: HDFS, MapReduce, YARN
- Apache Spark: RDDs, DataFrames, Spark SQL, Spark Streaming
- Apache Kafka: arquitectura, productores, consumidores, streams
- Procesamiento distribuido: paradigmas, modelos, optimización
- Bases de datos NoSQL: HBase, Cassandra, MongoDB
- Seguridad en Big Data: autenticación, autorización, encriptación
Proyectos y prácticas
Los estudiantes trabajan en proyectos como:
- Análisis de logs en tiempo real
- Procesamiento de datos de IoT a gran escala
- Implementación de data lakes
- Análisis de grafos con tecnologías Big Data
Salidas profesionales
Esta asignatura prepara a los estudiantes para roles como:
- Big Data Engineer
- Data Architect
- Especialista en Hadoop/Spark
- Administrador de sistemas Big Data
Metodología
La asignatura combina clases teóricas con talleres prácticos y desarrollo de proyectos reales, siguiendo la metodología ETHAZI.
