Logo de la UNED

Madrid, 14 de septiembre de 2018




Un algoritmo matemático desarrollado en la UNED eleva el porcentaje de acierto en la clasificación del polen al 97 por ciento

Los sistemas actuales, basados en el trabajo humano de identificación, se sitúan en el 63’5 por ciento




Cuadro

La revista PLOS ONE publica hoy un trabajo de investigación titulado Improving Classification of Pollen Grain Images of the POLEN23E Dataset through three different Applications of Deep Learning Convolutional Neural Networks cuyos resultados muestran cómo la aplicación de algoritmos basados en técnicas de inteligencia artificial han aumentado la tasa de acierto en las técnicas de identificación de granos de polen en más de 30 puntos. Hasta la fecha, los trabajos de clasificación se realizan de forma manual por individuos que deben identificar visualmente los tipos de polen recogidos en las placas en las que impactan empleando su conocimiento previo sobre los mismos; incluso las técnicas actuales que introducen sistemas automáticos trabajan siguiendo estos patrones de actuación, por lo que los porcentajes de acierto son similares –en torno al 68’5 por ciento en caso de las técnicas automatizadas-. Sin embargo, con la aplicación del algoritmo matemático desarrollado en esta investigación se ha logrado situar este porcentaje en más del 97 por ciento. La investigación forma parte del Trabajo Fin de Máster del alumno Víctor Sevillano, quien ha cursado el Máster en Inteligencia Artificial Avanzada del Departamento de Inteligencia Artificial de ETSI Informática de la universidad. Su director de proyecto e investigador Ramón y Cajal del departamento, José Luis Aznarte Mellado, es el coordinador del trabajo publicado.


Es Aznarte quien explica que “hasta el momento, el trabajo de conteo e identificación de tipos de polen es una tarea tediosa y poco eficaz realizada por personas generalmente en condiciones laborales precarias. Estos individuos reciben las placas en las que han impactado los granos de polen y, con la ayuda de un microscopio, tienen que diferenciar cuántos tipos distintos hay y en qué cantidad. El problema principal es que los granos de polen son muy similares entre sí, a veces están unidos unos a otros, o no están en buenas condiciones… de ahí que el trabajo no sea tan eficaz como debería y que la tasa de acierto se sitúe en el 63’57 por ciento”. Sin embargo, conseguir que estos datos se acerquen lo máximo posible a la exactitud es de suma importancia, pues de ellos depende la información que reciben las personas con algún tipo de alergia, por ejemplo. Este aspecto se perfila como relevante por el aumento de la prevalencia de alergias, con un 30 por ciento de adultos y un 40 por ciento de niños que tienen al menos una alergia, según datos de la American College of Allergy, Asthma and Immunology recogidos en el estudio.


El modelo definido por Sevillano y Aznarte no es el primer intento de automatizar el proceso. “Existen otros modelos basados en el aprendizaje automático que enseñan a las máquinas a reconocer las mismas características que se manejan en la identificación visual: redondez, rugosidad, etc., pero la tasa de acierto apenas es superior, estableciéndose para los mismos datos que hemos usado en el 68’5 por ciento”. La principal novedad que aporta el trabajo presentado por los dos investigadores de la UNED es que es el propio sistema el que se encarga de establecer qué características son más apropiadas para identificar los granos de polen recogidos y de aplicarlas a continuación. De hecho, definen tres modelos distintos basados en el uso de una Red Neuronal Convolucional (Convolutional Neural Network –CNN) que extrae automáticamente las características discriminantes de las imágenes. El profesor Aznarte añade que “estas características no son ni reconocibles ni interpretables, sino que están dentro del sistema y es el propio sistema el que discrimina cuáles son las importantes y cuáles no”.


Tal y como se recoge en el artículo, “en el primer método, un clasificador simple se utiliza para catalogar las imágenes directamente desde las características extraídas por la CNN. El segundo método aplica una técnica conocida como Transfer learning o ‘aprendizaje por transferencia’ y hace uso de una red neuronal profunda preentrenada (pre-trained deep neural network). Finalmente, el tercer método constituye una solución híbrida de los dos anteriores y es precisamente el que alcanza un éxito mayor: “Con una combinación de tres técnicas - transfer learning, feature extraction y lineal discriminnant”, continúa Aznarte, “subimos el porcentaje de acierto al 97’23 por ciento”.


La repercusión de esta información no se limita al mundo de la salud. La industria de la miel y los productos elaborados a partir de ella también podría resultar beneficiada, pues de la identificación del polen depende la correcta clasificación del producto final. Igualmente, el éxito en la catalogación de algunas muestras de estos granos podría favorecer investigaciones policiales en las que los pólenes atrapados en telas y cuerpos podrían determinar numerosos datos relacionados con los hechos investigados. Por todo ello, el mundo de la empresa ya está interesado en la aplicación de este algoritmo: “Estamos en contacto”, afirma Aznarte, “con una empresa que comercializa un tipo de reconocedor de polen a nivel industrial”.


Víctor Sevillano

Estés donde estés, algo más que un lema

La historia de Víctor Sevillano podría ser la plasmación del lema de la UNED: Estés donde estés. Afincado en Estados Unidos, donde llegó hace ya doce años por motivos laborales, se decidió a cursar el Máster en Inteligencia Artificial Avanzada de la Escuela Técnica Superior de Ingeniería Informática de la UNED porque “el motivo fundamental de mi traslado a Estados Unidos fue la posibilidad de trabajar en proyectos de gran envergadura y presupuesto que hicieran posible conocer los últimos avances en tecnología y desarrollo y me permitieran avanzar en mi gran interés: la investigación y aplicación de nuevos métodos y soluciones. En este marco, el Máster que ofrecía la UNED era especialmente atractivo por centrarse precisamente en la investigación”. Sevillano reconoce que “a pesar de estar estudiando desde Miami, donde desafortunadamente ya no existe un centro de la UNED, en ningún momento he tenido la sensación de inaccesibilidad a los profesores o a los recursos necesarios. Al contrario, creo que ha servido para establecer un marco de trabajo que es muy cercano a la realidad laboral en la que actualmente nos desenvolvemos. El trabajo realizado durante el Máster, en mi caso, ha sido algo de lo que realmente he disfrutado y la base para obtener los resultados que ahora presentamos”.

Tanto es así que Sevillano va a continuar la investigación dentro de sus estudios de Doctorado: “Durante el tiempo que he trabajado en el máster he encontrado un apoyo y un interés muy importante en mi director de proyecto, José Luis Aznarte, con quien, sinceramente es un placer trabajar y conseguir todos estos avances. Su dedicación y pasión por el trabajo realizado me ha llevado a continuar con la investigación y ampliarla durante la realización del Doctorado”.


El autor principal de la investigación presentada destaca que “la realización del Máster me ha ayudado considerablemente a realizar la transición laboral hacia el área de Data Science & AI en la que actualmente trabajo y que es especialmente restrictiva a la hora de contratar profesionales”.

Sevillano, tal y como él relata, inició su andadura profesional en una compañía de publicidad digital y poco después comenzó a trabajar en mercados financieros desarrollando estrategias de trading automático y high frequency trading para diferentes tipos de productos tales como acciones (stocks) y derivados (futuros y opciones). Su trabajo consistía en desarrollar modelos predictivos basados tanto en regresión como en clasificación. “Principalmente trabajé en el mercado de futuros con índices y monedas, desarrollando diferentes estrategias y filtros basados en técnicas de machine learning para realizar las transacciones de forma automática”. Trabajó también, durante cinco años, en una compañía de procesamiento de pagos y garantía de transacciones, desarrollando modelos de predicción de riesgo. Actualmente trabaja en Royal Caribbean Ltd como Senior Data Scientist & Computer Vision lead: “Desde hace mes y medio mi trabajo consiste en desarrollar modelos para áreas como visión artificial, reconocimiento facial, seguimiento de objetos, procesamiento de lenguaje natural, extracción de tópicos y desarrollo de modelos predictivos”.




Itziar Romera

Edición web: Elena Lobato

Comunicación UNED