Accesos directos a las distintas zonas del curso

Ir a los contenidos

Ir a menú navegación principal

Ir a menú pie de página

SISTEMAS DE INFORMACIÓN NO ESTRUCTURADA

Curso 2017/2018 / Cod.31106116

SISTEMAS DE INFORMACIÓN NO ESTRUCTURADA

CONTENIDOS DE LA ASIGNATURA

El temario de la asignatura es el siguiente:

  1. Introducción: Fundamentos y arquitectura de un sistema de acceso a la información no estructurada. Adquisición, transformación e indexación.
  2. Adquisición y procesamiento de contenidos en internet: Crawling y tratamiento de texto.
  3. Técnicas de organización de la información: ordenación (ranking), agrupación (clustering) y clasificación de documentos.
  4. Redes sociales y otros objetos de búsqueda.

  Muchos de los sistemas de acceso a información no estructurada se aplican sobre conjuntos de datos locales o centrados en un dominio. Por ello, con el fin de evitar exceso de contenidos, no se abordarán técnicas específicas de indexación y compresión para búsquedas sobre cantidades masivas de datos (como es el caso de los buscadores Web). Por el mismo motivo no se discuten las metodologíasd de evaluación de sistemas de acceso a la información. La evaluación es particular de cada problema concreto independientemente del tipo de información que se accede, mientras que este curso se centra en los aspectos característicos de la información no estructurada. Por ello, más que en la evaluación global de un sistema de información, el curso cubrirá evaluación de componentes específicos del tratamiento de información no estructurada, como son el ranking, agrupación o clasificación de documentos.