Es Aznarte quien explica que “hasta el momento, el trabajo de conteo e identificación de tipos de polen es una tarea tediosa y poco eficaz realizada por personas generalmente en condiciones laborales precarias. Estos individuos reciben las placas en las que han impactado los granos de polen y, con la ayuda de un microscopio, tienen que diferenciar cuántos tipos distintos hay y en qué cantidad. El problema principal es que los granos de polen son muy similares entre sí, a veces están unidos unos a otros, o no están en buenas condiciones… de ahí que el trabajo no sea tan eficaz como debería y que la tasa de acierto se sitúe en el 63’57 por ciento”. Sin embargo, conseguir que estos datos se acerquen lo máximo posible a la exactitud es de suma importancia, pues de ellos depende la información que reciben las personas con algún tipo de alergia, por ejemplo. Este aspecto se perfila como relevante por el aumento de la prevalencia de alergias, con un 30 por ciento de adultos y un 40 por ciento de niños que tienen al menos una alergia, según datos de la American College of Allergy, Asthma and Immunology recogidos en el estudio.
El modelo definido por Sevillano y Aznarte no es el primer intento de automatizar el proceso. “Existen otros modelos basados en el aprendizaje automático que enseñan a las máquinas a reconocer las mismas características que se manejan en la identificación visual: redondez, rugosidad, etc., pero la tasa de acierto apenas es superior, estableciéndose para los mismos datos que hemos usado en el 68’5 por ciento”. La principal novedad que aporta el trabajo presentado por los dos investigadores de la UNED es que es el propio sistema el que se encarga de establecer qué características son más apropiadas para identificar los granos de polen recogidos y de aplicarlas a continuación. De hecho, definen tres modelos distintos basados en el uso de una Red Neuronal Convolucional (Convolutional Neural Network –CNN) que extrae automáticamente las características discriminantes de las imágenes. El profesor Aznarte añade que “estas características no son ni reconocibles ni interpretables, sino que están dentro del sistema y es el propio sistema el que discrimina cuáles son las importantes y cuáles no”.
Tal y como se recoge en el artículo, “en el primer método, un clasificador simple se utiliza para catalogar las imágenes directamente desde las características extraídas por la CNN. El segundo método aplica una técnica conocida como Transfer learning o ‘aprendizaje por transferencia’ y hace uso de una red neuronal profunda preentrenada (pre-trained deep neural network). Finalmente, el tercer método constituye una solución híbrida de los dos anteriores y es precisamente el que alcanza un éxito mayor: “Con una combinación de tres técnicas - transfer learning, feature extraction y lineal discriminnant”, continúa Aznarte, “subimos el porcentaje de acierto al 97’23 por ciento”.
La repercusión de esta información no se limita al mundo de la salud. La industria de la miel y los productos elaborados a partir de ella también podría resultar beneficiada, pues de la identificación del polen depende la correcta clasificación del producto final. Igualmente, el éxito en la catalogación de algunas muestras de estos granos podría favorecer investigaciones policiales en las que los pólenes atrapados en telas y cuerpos podrían determinar numerosos datos relacionados con los hechos investigados. Por todo ello, el mundo de la empresa ya está interesado en la aplicación de este algoritmo: “Estamos en contacto”, afirma Aznarte, “con una empresa que comercializa un tipo de reconocedor de polen a nivel industrial”.