Esta asignatura tiene por objetivo estudiar técnicas que permiten transformar información textual no estructurada presente en documentos de distintas clases en datos estructurados fáciles de procesar, que contendrán información relevante y permitirán la extracción de conocimiento. Estos procesos tienen su base en las técnicas de procesamiento de lenguaje natural y aprendizaje automático, que permiten identificar y analizar los elementos informativos de los textos.
Se trata de una asignatura obligatoria que se imparte en el primer semestre el máster.
A la asignatura le corresponde 4 créticos ECTS, que equivalen a una estimación de 100 horas de trabajo.
Reseña del profesorado:
ARAUJO SERNA, LOURDES:
Desde 1990 ha desarrollado en universidades públicas diversa actividad docente relacionada con los lenguajes de programación y la algoritmia. Desde 1994 hasta la actualidad ha colaborado de forma continua en programas de doctorado de la Universidad Complutense de Madrid y de la UNED. En la actualidad investiga en procesamiento del lenguaje natural, recuperación de información y en la aplicación de estas técnicas a dominios específicos como el biomédico.
e.mail: lurdes@lsi.uned.es
MARTÍNEZ UNANUE, RAQUEL:
Ha realizado la mayor parte de su actividad docente en el campo de la programación, la algoritmia, la documentación electrónica y la minería de textos. Su actividad investigadora reciente se centra en la minería de textos, especialmente en representación, clustering y clasificación automática de documentos, tanto monolingües como multilingües, aplicada a diversos tipos de textos (páginas web, noticias, microblogs, historia clínica) y dominios, en particular el dominio biomédico.
e.mail: raquel@lsi.uned.es