Logo de la UNED


LAUDATIO Eduard Hendrik Hovy

Doctor Honoris Causa por la UNED 2013

Mª Felisa Verdejo Maillo. Catedrática de Lenguajes y Sistemas Informáticos de la UNED

Discurso de Verdejo

 

SR. RECTOR
AUTORIDADES
CLAUSTRO DE PROFESORES, COLEGAS, ESTUDIANTES
SEÑORAS Y SEÑORES

Introducción

En 1991, año en que se  publicó en el BOE la creación de la Escuela Universitaria de Informática de la UNED,  las dos asociaciones que agrupaban mayor número de profesionales de informática, la Association for Computing Machinery (ACM)  junto con el  capítulo del IEEE –Computer Science  (IEEE-CS) publicaron el resultado de los trabajos de un grupo conjunto que habían establecido en el 88, para definir  el Computing Curricula (A.B.Tucker Ed) (1) .  Este  informe tuvo un alto impacto internacional, e  inspiró una buena parte de los planes de estudios de informática en la década de los 90.  En ese documento se recordaban los tres pilares que constituyen la informática como disciplina : teoría, abstracción (modelado) y diseño, basados respectivamente en las raíces interdisciplinares que la sustentan: matemáticas, ciencias experimentales e ingeniería.

En el 2001, se creó la Escuela Superior de Ingeniería Informática de la UNED. En ese año, el grupo de trabajo ACM & IEEE-CS  publicó una nueva referencia, el Computing Curricula-2001,  en donde se dedicaba un apartado a enumerar los enormes cambios tecnológicos  que se habían producido en solo una década, dibujando un nuevo paisaje para la informática que hacía necesario replantear el alcance de la enseñanza de la disciplina, ampliándola para reconocer la emergencia de 5 subdisciplinas:  Computer Engineering, Computer Science, Software Engineering, Information Systems, Information Technology. En el documento se analizan en detalle los cambios tecnológicos (baste recordar que en el 91 la Web era poco menos que una idea en la mente de sus creadores), pero además se resaltan los cambios sociales y económicos propiciados por las tecnologías de la información y las comunicaciones, en todos los ámbitos de la actividad humana. En la sociedad de la información, las personas actúan e interactúan mediante sistemas informáticos, de ahí la importancia que cobra el diseño de sistemas centrados en el usuario, más aún en todos los aspectos de acceso a la información y la comunicación interpersonal o en grupo, en una buena parte, expresadas en lenguaje natural.  Así mismo, se destaca que el ejercicio de la profesión informática, conlleva el trabajo en equipo, a menudo con carácter interdisciplinar, y por tanto se recomienda que desde el principio de los estudios,  se fomenten estas capacidades a través de un aprendizaje teórico-práctico articulado mediante la realización de proyectos.

Tras doce años de funcionamiento de  la  E. T. Superior de Ingeniería Informática de la UNED, hoy tenemos el honor de celebrar la investidura de nuestro primer doctor honoris causa, y para ello contamos con un informático, cuya carrera profesional  ilustra los rasgos subrayados en las recomendaciones curriculares,  y  que en unas breves pinceladas voy a describir a continuación.


SEMBLANZA

Orígenes

Eduard Hovy, nació en Sudáfrica,  graduándose en Matemáticas en la  Rand Afrikaans University en marzo de 1979. Obtuvo su master en  Computer Science en la Universidad de Yale  (USA) en 1982. Con un marcado perfil interdisciplinar, con raíces en los campos de Inteligencia Artificial (procesamiento de lenguaje natural, planificación y aprendizaje) , Psicología (ciencia cognitiva), Lingüística (discurso, pragmática y semántica),  Teoría de la Computación y Filosofía, el Profesor Eduard Hovy es uno de los  investigadores  reconocidos como fundadores del área de Procesamiento Automático del Lenguaje Natural. Su producción científica ha sido fundamental en diversos temas, destacando su contribución seminal tanto en  generación de lenguaje natural como en ontologías y semántica léxica.

Su tesis doctoral, PAULINE (Planning and uttering language in Natural Environments), defendida en la U. De Yale en 1987, introdujo la pragmática como una dimensión clave para la generación automática del lenguaje natural,  modelando el problema en términos de objetivos de comunicación, que se refinan en un nivel intermedio en objetivos retóricos para capturar rasgos tales como formalidad, simplicidad, detalle, parcialidad, respeto, ect . Al modelar el problema como una resolución de objetivos, se  puede formalizar la generación de textos mediante planes y estrategias; así, un sistema, partiendo de una misma representación conceptual del contenido, podría construir diferentes textos adaptados a un contexto pragmático específico, teniendo en cuenta además a los interlocutores. El contexto se modelaba en términos de un amplio conjunto de características ( pares atributo-valor) , por ejemplo para las condiciones de situación se consideraba entre otros el tiempo (mucho, algo, poco)  el tono (formal, informal, festivo..), en la caracterización de los hablantes: el conocimiento y grado de interés en el tema, la opinión sobre el tema (buena, neutral, mala), el estado emocional, ect.  El proceso de planificación se llevaba a cabo de forma dinámica,  (limited-commitment), mezclando las fases de planificación y realización, que de alguna manera también es un modelo acorde con la investigación en psicolingüística. La planificación en este caso sigue una estrategia de resolución, mezcla de prescripción (top-down ) y restricción (seleccionar entre alternativas, en forma bottom-up, para manejar objetivos conflictivos).

Etapa de Consolidación

Al terminar su tesis, tras una breve estancia en los laboratorios de investigación de IBM Alemania, se incorporó en 1990 al Information Sciences Institute, asociado a la University of Southern California (ISI-USC). Quiero resaltar dos aspectos acerca de esta institución, primero el papel fundamental y pionero que jugó en la creación y la implementación de Internet, y segundo, su vocación de institución puente entre la Universidad y la Industria, para realizar una investigación de calidad financiada con un partenariado público-privado. En  el ISI, el Dr. Hovy, ha  creado un equipo  dinámico y puntero en Human Languages Technologies, involucrado en estos veinte años en mas de 75 proyectos, financiados en convocatorias competitivas de diferentes organismos como la NSF o el DARPA, y de la mano de laboratorios de investigación de empresas como BBN o IBM. A lo largo de su carrera, ha demostrado su liderazgo trabajando en cooperación con otros equipos de investigación de primera línea, en grandes proyectos que han sido referencia en cada una de las temáticas, entre los que destacaremos:

Diseño e implementación de sistemas:

     • PANGLOSS: Un sistema de traducción automática basado en Interlingua.  En colaboración  con  J. Carbonell y S.Nirenburg (CMU), y Y. Wilks (NMSU) (1989-1994)

    • The Webclopedia: Sistema automático de Pregunta-Respuesta sobre la wb 2000-2003. 2º puesto  (de 35) en la competición del TREC 2000

Teoría e infraestructura de evaluación de sistemas:

   • BE Automated Summarization Evaluation Package, utilizado por el National Institute of Standards (NIST) para evaluar a los sistemas participantes en las competiciones del TAC.  Licencia de distribución pública.

Modelado semántico y  metodologías para la creación de recursos anotados

     • The OntoNotes. Diseño de una ontología capturando los niveles léxico, semántico y conceptual, y creación de un recurso (corpus multilingüe anotado) . En cooperación  con Dr. Ralph Weischedel (BBN), Prof. Mitch Marcus (UPenn) y la Prof. Martha Palmer (U of Colorado). Distribuido por el LDC.

    • RACR-ISI: Reader and Contextual Reasoner. Dirigido por IBM Yorktown Heights,  con participación de  la U. of Texas (Austin), CMU, y la U of Utah. May 2009.  Creación de grandes bases de conocimiento para su utilización en análisis e inferencia textual.

Trayectoria investigadora
 
El modelado computacional de la semántica del lenguaje natural es el leivmotiv de su investigación,  que ha evolucionado desde una aproximación basada en formalismos lógico-simbólicos a un enfoque distributivo (basado en información estadística de co-ocurrencia de palabras). Su trabajo se ha situado siempre en la frontera, atento a la evolución del área y de la tecnología, abriendo caminos inexplorados, como lo es actualmente su empuje hacia una hibridación de los modelos proposicional, estadístico y vectorial. La siguiente figura ilustra  los tres grandes campos en las que ha desarrollado su carrera, y su desglose en líneas temáticas, de las que  comentaré solo algunas  a continuación :


En Ontologías

La definición de notaciones y el desarrollo de herramientas para la representación semántica superficial, que sirven para anotar corpus textuales multilingües de gran volumen, a nivel semántico. Esta línea se articuló mediante varios proyectos, como el Ontonotes mencionado previamente, en donde se trataron 7 lenguas entre ellas el inglés, chino y árabe.   La base de la notación proviene de la ontología Omega (2003),  creada por su equipo en el ISI, mediante una combinación de técnicas de mezclado y enriquecimiento de diversas fuentes , tales como otras ontologías a diferente nivel de representación y granularidad léxico-semántica-conceptual (Princeton's WordNet, NMSU's Mikrokosmos y ISI’SENSUS), el conocimiento extraído de textos y de las relaciones de interdependencia en diccionarios.  Omega tiene más de 120.000 términos conceptuales, y varios millones de instancias y ha sido un recurso ampliamente utilizado en traducción automática, extracción e integración de información.

En Procesamiento del lenguaje natural

     • El diseño y desarrollo de tecnología para un proceso masivo de textos, con el fin de extraer grandes cantidades de información tanto a nivel conceptual como a nivel de instancias.  En un gran numero de proyectos desde 1996, el Dr. Hovy,  junto con sus estudiantes y colaboradores, ha desarrollado una serie de extractores para llevar a cabo minería de textos, y construir así grandes colecciones de aserciones acerca de personas, localizaciones y objetos.  Esta información factual, almacenada en una base de datos,  está conectada con la ontología Omega. En  uno de sus recientes proyectos “aprender leyendo”, las técnicas de análisis sintáctico, semántico e inferencia se combinan para crear automáticamente una base de datos a partir de la lectura de textos (en varios formatos, incluyendo páginas web) de Biología y Química de enseñanza secundaria, de forma que el sistema  puede contestar a preguntas de exámenes de este nivel de enseñanza.  En esta línea cabe señalar su colaboración en el sistema WATSON.  (Watson es un sistema informático de inteligencia artificial que es capaz de responder a preguntas formuladas en lenguaje natural, desarrollado por IBM. A lo largo de tres días en febrero de 2011, para probar sus capacidades reales, participó en un concurso de televisión estadounidense Jeopardy!, derrotando a sus dos oponentes humanos, campeones hasta el momento)


    • Investigación en traducción automática, en diversos aspectos como (1) el diseño de representación interlingüa y metodología de anotación textual- fundamentales para la creación automática de recursos multilingües anotados, que son la base para el aprendizaje automático que requieren los sistemas de procesamiento estadístico-  y (2) en la evaluación de sistemas de traducción. En el periodo 2002–04, lideró la elaboración del informe “FEMTI” (una sistematización de las principales medidas de evaluación de traducción automática) junto con los profesores M. King y  Dr. Andre Popescu-Belis de la Universidad de Ginebra. Este informe involucró a un buen numero de estudiantes e investigadores de otras universidades así como a compañías de traducción automática.


   • El diseño y desarrollo de sistemas de generación automática de resúmenes, así como la formulación teórica para su evaluación. Entre las implantaciones, se encuentran SUMMARIST (para tratar un único documento), NeATS (múltiples documentos), y GOSP (para generar titulares).  Es bien conocido el paquete de evaluación ROUGE (2003–04),  y el BE (2005, y una nueva versión de 2008), desarrollado por el Dr. Hovy y el Dr. Lin, en colaboración con otros investigadores de su equipo.

Los resultados de su trabajo han dado lugar a más de 250 publicaciones ( índice H de 55) entre las que se incluyen 6 libros, 26 artículos en revistas, 179 artículos en los congresos de primera línea, y 22 capítulos de libros; software de aplicaciones, e infraestructura de evaluación automática para diferentes tipos de tareas de PLN (utilizadas en las competiciones internacionales del DUC 2005-2007 y el  TAC 2008, organizadas por el NIST), así como el establecimiento de una amplia red de colaboradores (por ejemplo en la conocida base de datos  de DBLP aparecen 174 publicaciones en coautoría con 28 autores diferentes, coincidiendo con cada uno en más de 5 publicaciones distintas)

Esta estrategia de colaboración es clave para acometer la complejidad y escalabilidad de los retos que hoy plantea la investigación en estas disciplinas.

Articulación profesional de la disciplina

Es de destacar su labor para promover  y establecer una comunidad científica a nivel mundial , siendo su participación decisiva para estructurar con cobertura internacional, la Association for Computational Linguistics (ACL), inicialmente creada en USA. Hoy, con un ámbito global es la organización científica de referencia en esta disciplina relativamente joven . También ha sido Presidente de la International Association of Machine Translation (IAMT).  Ha sido conferenciante invitado y panelista en numerosos congresos; organizador, y presidente del comité de programa  en numerosas ocasiones. Destaca especialmente la actividad del Profesor Hovy  en China y en Europa, en donde mantiene una presencia constante de apoyo a los grupos de investigación. Siempre ha considerado esencial articular el trabajo científico con la sociedad, y con los responsables de la política científica y ha dedicado su tiempo y energía a trabajar y promover iniciativas en pro de  políticas científicas que favorezcan  la cooperación y el desarrollo de recursos tecnológicos  para el tratamiento de todas las lenguas.  En particular siempre ha apoyado a la comunidad investigadora en España, con la que mantiene un amplio contacto desde su primera visita a la U. Autónoma  de Madrid en 1994. La relación ha sido continua  en el caso del grupo de investigación de NLP&IR de la UNED desde el año 1995, cuando nos respaldó  para la organización del congreso del ACL 97 en la UNED, el primero que se celebró fuera de Estados Unidos, y que fue un paso clave  para dar visibilidad a los grupos españoles y europeos en la comunidad internacional.  Hoy nos acompañan colegas de la  UPV, de la U. De Alicante, de la UPC, de la U. de Barcelona,   de la U. Complutense y de la UNED a los que E. Hovy  ha acogido en su grupo de investigación del ISI-USC en Marina del Rey en la última década. 

En su brillante y amplísima trayectoria  investigadora ha realizado contribuciones muy relevantes en otras temáticas como por ejemplo:

     • promoción y organización de campañas de evaluación internacionales, para crear estándares, medidas y transferir resultados a productos. Quiero mencionar aquí la serie de  campañas Question Answering for Machine Reading Evaluation (QA4MRE), coorganizadas por A. Peñas (UNED) y E. Hovy (ISI_USC).

    • gobernanza digital (E-Government),  habiendo sido presidente de la Digital Government Society of North America.  Ha participado activamente en  diversos eventos para una colaboración en este campo entre USA y la EU, entre ellos el proyecto con el consorcio europeo QUALEG  con el objetivo de facilitar la interacción entre organismos gubernamentales y el ciudadano. El trabajo de su grupo en el ISI se centró en el diseño y desarrollo de un sistema para clasificar correo electrónico, extrayendo opiniones, y partes implicadas .  Sobre este tema es coautor del libro Digital Government: Advanced  E. Government Research and Case Studies, Springer-Verlag 2007.

Ha sido co-organizador y co-editor de informes estratégicos sobre el estado del arte en temas especializados, como por ejemplo el Report in Multilingual Information Management , encargado por la National Science Foundation, y resultado de una serie de reuniones multilaterales  de expertos celebradas en Granada (Mayo 1998) y en Montreal (Agosto 1998).

Ha participado como asesor (Scientific Advisory Board)  en gran número de consorcios  europeos y organismos punteros en investigación en todo el mundo.  Colabora con editores internacionales en la definición de un nuevo modelo para las publicaciones y difusión científica, encabezando el comité del Elsevier Grand Challenge. Este evento fue un concurso de ideas, plasmadas en un prototipo software, dirigido a mejorar el acceso y el uso  del contenido científico que se presenta en los artículos de revistas on-line en el campo de Ciencias de la vida. El ganador fue un prototipo que procesa artículos, identificando en los textos las menciones a cualquier gen, presentando dinámicamente al lector información adicional a diferente nivel de detalle y especialización.

Formación de investigadores
 
Su faceta investigadora, se complementa con su labor docente. Ha sido profesor en el Computer Science Department de la  University of Southern California (USC) desde Diciembre de 1989,  realizando una notable labor de mentorización de jóvenes investigadores, por la que recibió un premio especial de Excelencia en 2006.  Además es “Advisory Professor” en  varias universidades de China, Canadá  y Corea.  Ha colaborado en nuestro  programa de doctorado de Inteligencia Artificial y Lenguajes y Sistemas Informáticos desde el año 2009, como asesor externo, con seminarios para doctorandos y formando parte del panel de expertos en las jornadas de doctorandos realizadas en junio del 2012. Ha acogido en diversas estancias a nuestros doctorandos,  e investigadores seniors, desarrollando una colaboración fructífera tanto en publicaciones como en la organización de eventos internacionales.

El profesor Hovy ha iniciado una nueva etapa de su carrera en la Carnegie Mellon University en Octubre del 2012, incorporándose al prestigioso “Language Technologies Institute”, desde dónde seguiremos contando con su colaboración.

A modo de conclusión

Lo reseñado aquí es un brevísimo resumen de la trayectoria del Dr. Hovy, como investigador pionero, como impulsor de nuevas áreas de investigación ligando la visión tecnológica con otras disciplinas relacionadas con el lenguaje, como formador de investigadores, como científico preocupado por la dimensión internacional y social de la ciencia, como promotor de asociaciones para fomentar la cohesión de las disciplinas científicas y favorecer la visibilidad de la investigación en los diferentes países, como profesional responsable involucrándose en la estructuración y financiación cooperativa de la investigación a nivel internacional. Sudafricano de nacimiento, con raíces familiares en Holanda, suizo de nacionalidad por su madre, con una carrera profesional centrada en Estados Unidos,  con un buen número de discípulos chinos y con una compañera japonesa, nos demuestra bien  su talante de ciudadano de la sociedad globalizada  que la tecnología informática ha propiciado en tan solo unas décadas, y a la que  ha contribuido de forma significativa las tecnologías del lenguaje y el acceso a la información multilingüe.

Por todo ello, es un honor y una satisfacción para nuestra Escuela contar con Ed Hovy como miembro distinguido de la comunidad informática de la UNED. No quiero terminar sin evocar con cariño al Profesor Mira, Catedrático de Inteligencia Artificial de la UNED,  con quien tuvimos la suerte de  recorrer desde el principio, el camino en esta Escuela,  y con quien creamos el programa de doctorado conjunto de  Inteligencia Artificial y Lenguajes. Su  espíritu abierto y constructivo nos acompaña siempre. 

Profesor Hovy, en nombre de todos los colegas y de los compañeros de la UNED, a quienes represento en este abrazo,  bienvenido y gracias por estar entre nosotros.

(1)Los documentos mencionados pueden encontrarse en esta enlace

 

 

 

Madrid, enero de 2013