Accesos directos a las distintas zonas del curso

Ir a los contenidos

Ir a menú navegación principal

Ir a menú pie de página

MINERÍA DE TEXTOS

Curso 2020/2021/Subject's code31110041

MINERÍA DE TEXTOS

NAME SUBJECT MINERÍA DE TEXTOS
CODE 31110041
SESSION 2020/2021
DEGREE IN WHICH IT IS OFFERED MÁSTER UNIVERSITARIO EN INGENIERÍA Y CIENCIA DE DATOS
TYPE CONTENIDOS
ECTS 4
HOURS 100.0
PERIOD SEMESTRE  1
OFFER LANGUAGES CASTELLANO

PRESENTACIÓN Y CONTEXTUALIZACIÓN

Esta asignatura tiene por objetivo estudiar técnicas que permiten transformar información textual no estructurada presente en documentos de distintas clases en datos estructurados  fáciles de procesar, que contendrán información relevante y permitirán la extracción de conocimiento. Estos procesos tienen su base en las técnicas de procesamiento de lenguaje natural y aprendizaje automático, que permiten identificar y analizar los elementos informativos de los textos.  

Contribución al perfil profesional: La minería de textos tiene muchas aplicaciones dentro de la ciencia de datos ya que hay que tener en cuenta que buena parte del volumen de datos que se maneja son datos no estructurados, texto libre. Esta asignatura permitirá capacitar a los estudiantes para la extracción de este tipo de información y su análisis en grandes volúmenes de documentos de diferentes dominios y de diferentes tipos, incluyendo páginas web, redes sociales, informes médicos, etc.

Se trata de una asignatura obligatoria que se imparte en el primer semestre el máster.
A la asignatura le corresponde 4 créticos ECTS, que equivalen a una estimación de 100 horas de trabajo.

Está relacionada con las siguientes asignaturas:

  • Programación en entornos de datos
  • Aprendizaje Automático I

En Minería de Textos se presentan librerías y arquitecturas de software específicas para el tratamiento de textos, de ahí su relación con la asignatura Programación en Entornos de Datos. Con respecto a Aprendizaje Automático I,  la asignatura de Minería de Textos se centra en los algoritmos de aprendizaje automático aplicados al tratamiento de los textos.

Reseña del profesorado:
 
ARAUJO SERNA, LOURDES:
 
Desde 1990 ha desarrollado en universidades públicas diversa actividad docente relacionada con los lenguajes de programación y la algoritmia. Desde 1994 hasta la actualidad ha colaborado de forma continua en programas de doctorado de la Universidad Complutense de Madrid y de la UNED.  En la actualidad investiga en procesamiento del lenguaje natural, recuperación de información y en la aplicación de estas técnicas a dominios específicos como el biomédico.  
 e.mail: lurdes@lsi.uned.es
 
 
MARTÍNEZ UNANUE, RAQUEL:
 
Ha realizado la mayor parte de su actividad docente en el campo de la programación, la algoritmia, la documentación electrónica y la minería de textos. Su actividad investigadora reciente se centra en la minería de textos, especialmente en representación, clustering y clasificación automática de documentos, tanto monolingües como multilingües, aplicada a diversos tipos de textos (páginas web, noticias, microblogs, historia clínica) y dominios, en particular el dominio biomédico.   
e.mail: raquel@lsi.uned.es