El trabajo con datos masivos exige la utilización de infraestructuras computacionales específicamente diseñadas para ellos. Estas infraestructuras difieren de las infraestructuras tradicionales en varios aspectos. Para empezar, es necesario combinar la potencia de cómputo de muchos ordenadores, construyendo lo que se conoce como un cluster de ordenadores. Por otro lado, es necesario utilizar paradigmas de programación que puedan aprovechar la potencia de cómputo del cluster pero de una forma sencilla para el desarrollador encargado de implementar los programas para el análisis de datos masivos. Ambos aspectos pueden desarrollarse utilizando servicios de proveedores en la nube. En esta asignatura se muestran algunas de las tecnologías más importantes que permiten desplegar infraestructuras para el procesamiento de datos masivos.
CONTEXTUALIZACIÓN
La asignatura de Infraestructuras Computacionales para Procesamiento de Datos másivos se trata de una asignatura de 6 créditos ECTS, con carácter obligatorio, impartida en el primer semestre del Máster Universitario en Ingeniería y Ciencia de Datos. Guarda relación con las siguientes asignaturas también disponibles en el mismo Máster:
Programación en entorno de datos
Visualización de datos
Gestión/almacenamiento de información no estructurada.