Accesos directos a las distintas zonas del curso

Ir a los contenidos

Ir a menú navegación principal

Ir a menú pie de página

SISTEMAS DE INFORMACIÓN NO ESTRUCTURADA

Curso 2016/2017 / Cod.31106116

SISTEMAS DE INFORMACIÓN NO ESTRUCTURADA

CONTENIDOS DE LA ASIGNATURA

El temario de la asignatura cubrirá los siguientes contenidos:

  1. Introducción: Fundamentos y arquitectura de un sistema de acceso a la información no estructurada. Adquisición, transformación e indexación.
  2. Adquisición y procesamiento de contenidos en internet: Crawling y tratamiento de texto.
  3. Técnicas de organización de  la información: ranking, agrupación y clasificación de documentos.
  4. WEB.2.0: Redes sociales, recomendación y búsqueda colaborativa.
  5. Otros objetos de búsqueda: XML, entidades y contenidos multimedia.

  La inmensa mayoría de ingenieros informáticos dedicados al acceso a la información no estructurada, desarrollan sistemas sobre conjuntos de datos locales o centrados en un dominio. Por ello, con el fin de evitar exceso de contenidos, no se abordarán técnicas específicas de indexación y compresión para búsquedas sobre cantidades masivas de datos. Estas técnicas requieren un estudio en profundidad que no es compatible en tiempo con el estudio de aspectos más generales como son las técnicas de organización de documentos o más novedosos como son la búsqueda en entornos sociales.

  Otro aspecto que queda fuera de temario por los mismos motivos es la evaluación de sistemas de acceso a la información. La evaluación es particular de cada problema concreto independientemente del tipo de información que se accede, mientras que este curso se centra en los aspectos característicos de la información no estructurada. Por ello, más que en la evaluación global de un sistema de información, el curso cubrirá evaluación de componentes específicos del tratamiento de información no estructurada, como son el ranking, agrupación o clasificación de documentos.