La asignatura "Recuperación de información y minería de datos" está orientada al tratamiento automático de datos textuales. Se divide en dos grandes bloques diferenciados: En la primera parte de la asignatura, se aborda la extracción de información estructurada a partir de contenido textual no estructurado, mediante el reconocimiento de patrones, entidades nombradas, relaciones, etc. Gracias a este primer bloque, el estudiante se familiarizará con las técnicas principales de pre-procesamiento de texto, así como con las herramientas más importantes para la recuperación de información.
En la segunda parte de la asignatura se trabaja sobre el tratamiento de dichos datos utilizando diversas técnicas de representación de la información previamente adquirida. Esta representación del conocimiento nos permite realizar diversas tareas de tratamiento textual: se estudiarán tanto técnicas y algoritmos no supervisados orientados a la agrupación y organización (clustering) de documentación textual, como técnicas supervisadas orientadas a la resolución de tareas de clasificación automática de documentos.