Accesos directos a las distintas zonas del curso
Ir a los contenidos
Ir a menú navegación principal
Ir a menú pie de página
Subject's code : 31106116
El objetivo de este tema consiste en dar una visión global de un sistema de acceso a información no estructurada, con todos sus componentes principales. Como caso paradigmático, siguiendo los primeros capítulos del libro base, nos centraremos en el planteamiento general de un sistema genérico de recuperación de información orientado a texto, que incluya los componentes básicos de este tipo de sistemas como son la adquisición de texto, procesamiento, interacción con el usuario, y el ranking de documentos.
Los resultados específicos para este tema son:
La motivación y arquitectura de un sistema de información no estructurada guarda cierta relación con los conocimientos adquiridos en la asignatura del mismo master Métodos de Desarrollo y Análisis de Entornos Colaborativos y Redes Sociales.
Teniendo en cuenta las limitaciones en cuanto a horas de dedicación en el presente curso, se evitará el esfuerzo de síntesis de fuentes por medio de la focalización en el libro base. Dado que el libro se centra en sistemas de recuperación de documentos de texto, se aportará en el curso material introductorio describiendo la importancia de la información no estructurada en la actualidad, además de referencias a artículos de interés. Éstos estarán disponibles en el curso virtual.
La información no estructurada no se ciñe necesariamente a documentos de textos extraídos de internet. Existen bases de datos documentales en formato digital que no forman parte de la WEB, y existe también otros tipos de información como imágenes, audios, etc. Sin embargo, la inmensa mayoría de la información que puede ser explotada en un contexto comercial mediante un sistema de información no estructurada es la que se encuentra accesible en Internet y en formato textual. En este tema se describen las herramientas básicas para obtener y procesar estos datos.
Los resultados de aprendizaje esperados para este tema son fundamentalmente:
Este tema en concreto guarda estrecha relación con los primeros temas de la asignatura de este master Métodos de Desarrollo y Análisis de Entornos Colaborativos y Redes Sociales, dado que mucha de la información no estructurada disponible en la red se encuentra en este tipo de entornos.
El estudio de este tema se apoyará fundamentalmente en el libro base, junto con la descripción del escenario a tratar y enlaces relacionados. Los enlaces relacionados propuestos por el equipo docente dependerán del problema propuesto, que estará disponible en el curso virtual.
En este tema nos centraremos en las técnicas de organización de la información no estructurada. Básicamente, los documentos o unidades de información pueden ordenarse (ranking), clasificarse en base a un conjunto predefinido de categorías o agruparse en base a algún criterio de similitud.
Las técnicas de clasificación y agrupación tienen su fundamento en tecnologías básicas de inteligencia artificial, por lo que este tema se interrelaciona con las asignaturas de Aprendizaje Automático y Fundamentos de la Inteligencia Artificial de este master.
El estudio de este tema se apoyará fundamentalmente en el libro base, junto con la descripción del problema a tratar y enlaces relacionados. Los enlaces relacionados propuestos por el equipo docente dependerán del problema propuesto, que estará disponible en el curso virtual.
Muchas de las técnicas empleadas para el acceso y manejo de información no estructurada no se apoyan directamente en el análisis de contenidos (textual o multimedia) sino en cómo interactúan los usuarios entre sí y con las piezas de información. Es decir, el proceso de acceso a la información es colaborativo. Bajo esta filosofía, se recomienda a usuarios productos que han sido consumidos por usuarios próximos, o se identifica la relevancia de un video o post en función del número de “likes”. A medida que las redes sociales y los procesos colaborativos cobran peso, este tipo de técnicas adquieren más relevancia en el ámbito comercial. Por otro lado, es importante tener en cuenta que los contenidos textuales son solo una parte de toda la información no estructurada. En este tema se abordarán también otros objetos de búsqueda distintos del documento tradicional. En particular, se estudiaran algunos conceptos básicos la búsqueda de entidades, en donde el objeto de búsqueda es una persona, organización o concepto en general, y la búsqueda de imágenes y audio.
Análogamente a los temas anteriores, los resultados de aprendizaje esperados para este tema son fundamentalmente:
Este tema está íntimamente ligado a la asignatura de Métodos de Desarrollo y Análisis de Entornos Colaborativos y Redes sociales.