Accesos directos a las distintas zonas del curso
Ir a los contenidos
Ir a menú navegación principal
Ir a menú pie de página
Subject's code : 31101023
El primer tema persigue introducir al alumno en los contenidos que serán tratados en la asignatura. El alumno adquirirá, en primer lugar, conocimiento acerca de los problemas habituales que los usuarios y sistemas experimentan en su interacción con la web. Seguidamente, se presentará al alumno una definición “inicial” de los principales conceptos relacionados con la extracción de información en la web, tanto a partir de sus contenidos como de su estructura y su uso. Estos conceptos serán desarrollados en detalle en los siguientes temas.
Contenido detallado:
Este tema profundiza en el concepto de búsqueda en la web, ahondando fundamentalmente en los problemas que plantea tanto para usuarios como para desarrolladores de motores de búsqueda, así como en los diferentes tipos de contenidos presentes en la web.
El tercer tema se desglosa en tres bloques principales. El primero desarrolla el concepto de corpus, desde su definición hasta los posibles usos y utilidades que proporciona en el contexto de la minería de la web. El segundo bloque trata los problemas de la extracción de información textual y de terminología en la web. Finalmente, se incluye un tercer bloque donde se presentan las tareas de clasificación, clustering y cálculo de la similitud textual.
El cuarto tema establece y desarrolla los objetivos de la minería de uso de la web, definiendo las etapas involucradas en el proceso de inferencia y análisis de patrones y presentando algunas de las técnicas de aprendizaje más utilizadas en el contexto de la minería de uso de la web.
El quinto tema establece y desarrolla los objetivos de la minería de estructura de la web, presentando y definiendo los conceptos de “autoridad”, “prestigio”, “centralidad” y “co-cita”, fundamentales en el estudio de la estructura de la web. Se introducen también algunos de los algoritmos más populares para el ranking de páginas web y el análisis de comunidades.
El sexto tema establece y desarrolla los objetivos y fundamentos del estudio de la dinámica de la web, con el fin último de comprender cómo evoluciona la web (tanto en términos de tamaño como de otras características como el idioma, la distribución geográfica, etc.).