Accesos directos a las distintas zonas del curso

Ir a los contenidos

Ir a menú navegación principal

Ir a menú pie de página

MINERÍA DE LA WEB

Curso 2021/2022/Subject's code31101023

MINERÍA DE LA WEB

RESULTADOS DE APRENDIZAJE

  1. Tener una visión amplia de las áreas relacionadas con la extracción de información en la web.
  2. Hábito de lectura de artículos científicos.
  3. Capacidad para buscar información que complete el material propuesto inicialmente. Esta búsqueda es un entrenamiento necesario en la formación del alumno como investigador. Con cada trabajo tendrá mayor capacidad para encontrar y discriminar fuentes de información relevantes, requisito para desarrollar cualquier trabajo de investigación posterior.
  4. Capacidad de reflexión sobre el material estudiado, necesaria para poder realizar una síntesis de calidad.
  5. Capacidad para escribir textos con un formato de artículo científico, tanto en lo referente a la estructuración de contenidos, como de formato del propio artículo.

 

Objetivos por tema

 

Tema 1. Introducción

Objetivos:

O.1.1 Determinar los problemas que surgen al interactuar con la web.

O.1.2 Definir Minería de la web

O.1.3 Definir Crawling

O.1.4 Definir Búsqueda en web

O.1.5 Definir Minería de contenido de la web (minería de texto)

O.1.6 Definir Minería de uso de la web

O.1.7 Definir Minería de estructura de la web

O.1.8 Definir Dinámica de la web.

 

Tema 2. Consulta y búsqueda en web

Objetivos:

O.2.1 Determinar las características propias de la web que afectan a la búsqueda.

O.2.2 Caracterizar los tipos de información a considerar en la búsqueda en web (Contenido textual, Información en los enlaces, Estructura de enlace entre páginas, etc.).

O.2.3 Estudiar interfaces de exploración y visualización de la búsqueda.

O.2.4 Definir Metabúsqueda y Agentes web.

 

Tema 3. Minería de textos

Objetivos:

O.3.1 Definir corpus.

O.3.2 Comprender cómo se puede crear y usar un corpus a partir de la web.

O.3.3 Definir Extracción de Información textual.

O.3.4 Conocer la arquitectura de un sistema de Extracción de Información.

O.3.5 Definir Extracción de terminología.

O.3.6 Conocer alguna metodología de extracción de terminología a partir de la web.

O.3.7 Identificar la problemática asociada al lenguaje natural.

 

Tema 4. Minería de uso de la web

Objetivos:

O.4.1 Definir y establecer los objetivos de minería de uso de la web.

O.4.2 Determinar las etapas de procesamiento (Preprocesamiento, Inferencia de patrones, Análisis de patrones).

O.4.3 Conocer algunas herramientas existentes.

O.4.4 Identificar técnicas de aprendizaje aplicadas a minería de uso.

O.4.5 Saber qué son los sitios web adaptativos.

 

Tema 5. Minería de estructura de la web

 

Objetivos:

O.5.1 Definir y establecer los objetivos de la minería de estructura de la web.

O.5.2 Definir y modelar las nociones de Autoridad (authoritative page), prestigio, Centralidad y Co-cita.

O.5.3 Conocer cómo se realiza el ranking de páginas web basado en enlaces: PageRank y HITS.

O.5.4 Estudiar cómo se realiza el análisis de comunidades en la web.

 

Tema 6.   Dinámica de la web

 

Objetivos:

O.6.1 Definir y establecer los objetivos del estudio de la dinámica de la  web.

O.6.2 Determinar las características de la web susceptibles de estudio.

O.6.3 Estudiar la Ley de Zipf, "power laws" en la web así como sus aplicaciones.

O.6.4 Comprender cómo se determina el tamaño y tendencia de crecimiento de la web.

O.6.5 Comparar las web pública y web oculta.

O.6.6 Comprender cómo se determina la presencia de un idioma en la web.

O.6.7 Conocer estudios sobre la web española.