Accesos directos a las distintas zonas del curso

Ir a los contenidos

Ir a menú navegación principal

Ir a menú pie de página

VISIÓN ARTIFICIAL

Curso 2017/2018 / Cod.31101235

VISIÓN ARTIFICIAL

CONTENIDOS DE LA ASIGNATURA

Parte 1. Introducción a la visión artificial

Parte 2. Visión de bajo nivel

Parte 3. Visión de medio nivel

Parte 4. Visión de alto nivel

 

 

Objetivos por tema y orientaciones breves

 

Parte 1: Introducción a la visión artificial.

1. Introducción a la visión artificial

1.1. Introducción

1.2. Terminología

1.3. Etapas del procesado

1.4. Niveles de descripción

1.5. Introducción histórica

Objetivo:
Este primer tema es de carácter introductorio, sin embargo, resulta fundamental para entender el conjunto de la asignatura. Además de definir la terminología utilizada habitualmente en un sistema de visión artificial, se mostrará al alumno la envergadura del problema, recalcando: 1) la necesidad descomponer la tarea en diferentes subtareas y en distintos niveles de descripción o representación con grado creciente de semántica; 2) la necesidad de inyectar conocimiento en cada una de las etapas de procesado para poder llegar a una solución sin incertidumbre del problema planteado.
Este objetivo global puede descomponerse en los siguientes objetivos más concretos:
- Conocer las dificultades que entraña la visión artificial.
- Familiarizarse con la terminología básica utilizada en visión.
- Conocer las etapas de procesado en que se suele descomponer un sistema de visión artificial.
- Distinguir los distintos niveles de descripción con creciente grado de semántica que nos - encontramos a lo largo del proceso de interpretación de una imagen o escena.
- Familiarizarse con las estructuras de datos utilizadas y con las librerías software existentes.
Orientaciones:

El material docente desarrolla los conceptos fundamentales del capítulo. Posteriormente, el alumno realizará distintas actividades de consulta bibliográfica y de práctica sobre diversos ejemplos para la consolidación de los conceptos objetivo. 

 

Parte 2: Visión de bajo nivel.

2. Visión de bajo nivel: Preprocesado

2.1. Introducción

2.2. Filtrado de imágenes digitales: Eliminación del ruido y Realce de características

2.3. Detectores de bordes

2.4. Transformaciones basadas en las intensidades del nivel de gris

2.5. Flujo óptico y campo de flujo óptico

3. Visión de bajo nivel: Segmentación

3.1. Introducción

3.2. Segmentación basada en la detección de fronteras

3.3. Segmentación basada en la umbralización

3.4. Segmentación basada en la agrupación de píxeles

3.5. Segmentación basada en el movimiento

Objetivo:

La visión de bajo nivel comprende las transformaciones realizadas sobre la imagen captada con el objetivo de reducir el ruido y aumentar la información contenida en los datos. Los procesos de bajo nivel son guiados por los propios datos, es decir, sin conocimiento del dominio de aplicación.

El contenido se organiza en dos capítulos, uno dedicado al preprocesado de la imagen y otro dedicado a la segmentación. El preprocesado engloba el conjunto de tareas dedicadas a eliminar el ruido presente en la imagen y a realzar aquellas características de interés con el fin de mejorar la imagen captada por el sensor y así facilitar el procesamiento posterior. La segmentación tiene por objetivo descomponer la imagen en distintas zonas con alguna característica visual común.

Este objetivo global puede descomponerse en los siguientes objetivos más concretos:

- Conocer las técnicas básicas de visión de bajo nivel y sus características: descripción del algoritmo, coste computacional, suposiciones e influencia en etapas posteriores.

- Relacionar estas técnicas con el resto de etapas de un sistema de visión.

- Capacitar al alumno para implementar estas técnicas e integrarlas en aplicaciones de visión.

Orientaciones:

El material docente desarrolla los conceptos fundamentales del capítulo. Posteriormente, el alumno realizará distintas actividades de consulta bibliográfica y de práctica sobre diversos ejemplos para la consolidación de los conceptos objetivo. 

 

Parte 3: Visión de medio nivel.

4. Visión de medio nivel: Segmentación con conocimiento

4.1. Transformada de Hough
4.2. Contornos activos

5. Visión de medio nivel: Seguimiento

5.1. Introducción
5.2. Estimadores demovimiento
5.3. Seguimiento de objetosmediante contornos activos

Objetivo:

Normalmente, la informacion obtenida en la etapa de preprocesado contiene mucho ruido, de modo que existen gran cantidad de bordes y/o regiones en la imagen que no corresponden a superficies de los objetos de interés, mientras que otras superficies, que sí son significativas, no quedan bien definidas. Por este motivo, se han desarrollado métodos que tratan de segmentar la imagen en blobs con mayor significado semántico, esto es, que estén relacionados con las superficies de los objetos existentes en la imagen. La entrada a estos métodos serán los elementos primitivos obtenidos en la etapa anterior y la salida serán los blobs asociados a las superficies o los contornos de los objetos.

Por tanto, podríamos decir que la visión de medio nivel se caracteriza por la inyección de conocimiento geométrico genérico. En el capítulo 4, se describirán distintas técnicas de segmentación que utilizan cierto conocimiento de las estructuras esperadas para controlar el proceso de selección de los elementos primitivos de bajo nivel que intervienen en la definición de contornos y superficies de los objetos. Otros temas que encajan dentro de esta categoría, como recuperación de la forma a partir de la textura, del movimiento, de la sombra, de par estéreo, se dejan fuera de esta introducción a la visión artificial por motivos de espacio.

Este objetivo global puede descomponerse en los siguientes objetivos más concretos:

- Conocer las técnicas básicas de visión de medio nivel y sus características: descripción del algoritmo, coste computacional, suposiciones e influencia en etapas posteriores.

- Identificar el conocimiento utilizado en el desarrollo de la tarea.

Relacionar las técnicas de segmentación con el resto de etapas de un sistema de visión.

- Capacitar al alumno para implementar estas técnicas e integrarlas en aplicaciones de visión.

Orientaciones:

El material docente desarrolla los conceptos fundamentales del capítulo. Posteriormente, el alumno realizará distintas actividades de consulta bibliográfica y de práctica sobre diversos ejemplos para la consolidación de los conceptos objetivo.

 

Parte 4: Visión de alto nivel.

6. Visión de alto nivel: Modelado de objetos

6.1. Introducción

6.2. Representación de estructuras geométricas bidimensionales

6.3. Representación de estructuras geométricas tridimensionales

6.4. Representación en un espacio de características discriminantes

7. Visión de alto nivel: Reconocimiento

7.1 Reconocimiento de patrones

7.2 Métodos estadísticos

7.3 Métodos estructurales y sintácticos

7.4 Métodos basados en la apariencia

7.5 Reconocimiento de actividades

7.6 Aplicaciones

8. Visión de alto nivel: Interpretación de imágenes

8.1 Arquitecturas básicas

8.3 Ontología de la tarea

8.4 Modelado del dominio

8.6 Aplicaciones

Objetivo:

El objetivo final del sistema de visión es la descripción de la escena orientada a la tarea. Esta descripción consiste, desde la simple identificación o el reconocimiento de los objetos de interés, hasta la determinación de las actividades que están llevando a cabo un objeto o un conjunto de objetos.

La descripción orientada a la tarea es una descripción abstracta ("el hombre, llamado Pepe, está sentado y comiendo palomitas"). Para llegar a esta descripción a partir de características de la imagen, es necesario reconocer los objetos de interés ("que es un hombre", "que es Pepe", "que está sentado", "que hay palomitas", "que está comiendo", etc). Todos estos objetos pertenecen al dominio de aplicación y, para reconocerlos, es necesario primero modelarlos y, posteriormente, establecer la correspondencia entre el modelo y los datos procedentes de la imagen.

Además, debido a la incertidumbre asociada a las distintas etapas del sistema de visión, salvo en situaciones muy simples, en las que se puede utilizar una estrategia de control guiada por los datos, es necesario incluir conocimiento del dominio en la estrategia de control del sistema de visión para guiar los procesos de bajo y medio nivel, de modo que se facilite el reconocimiento de los objetos de interés y esto haga posible la descripción coherente de la escena.

En resumen, la visión de alto nivel se caracteriza por el uso intenso de conocimiento del dominio e implica procesos de razonamiento abstractos y planificación de operaciones orientadas a cumplir el objetivo final: la descripción de la escena orientada a la tarea.

La organización del tema es la siguiente. En el capítulo 6, se estudiará el modelado de los objetos, en concreto, la representación de la forma. En el capítulo 7, se estudiarán las técnicas de reconocimiento de patrones como método de reconocimiento de objetos y de actividades y se distinguirán las fases de diseño (aprendizaje) y de operación (clasificación). Finalmente, en el capítulo 8, se estudiarán las arquitecturas de control de los sistemas de interpretación de imágenes y se analizarán nuevos enfoques desde la perspectiva de la ingeniería del conocimiento.

Este objetivo global puede descomponerse en los siguientes objetivos más concretos:

- Conocer la problemática de la visión de alto nivel.

- Conocer y manejar las arquitecturas utilizadas en interpretación de imágenes.

- Analizar un problema de visión artificial, representar el conocimiento del dominio necesario y definir una arquitectura de visión que resuelva el problema.

Orientaciones:

El material docente desarrolla los conceptos fundamentales del capítulo. Posteriormente, el alumno realizará distintas actividades de consulta bibliográfica y de práctica sobre diversos ejemplos para la consolidación de los conceptos objetivo.