Su trabajo permite la mejora de aplicaciones informáticas para el reconocimiento del habla y la escritura manuscrita y para la traducción automática

El profesor Francisco Zamora Martínez, del Grado en Ingeniería Informática de Sistemas de Información de la Universidad CEU Cardenal Herrera, desarrolla su labor investigadora en la aplicación de redes neuronales artificiales para el modelado de lenguaje. El procesamiento del lenguaje natural es un área de aplicación de la inteligencia artificial, que estudia, entre otras cosas, incorporar información sintáctica (modelo de lenguaje) sobre cómo deben unirse las palabras de una determinada lengua, para así permitir a los sistemas informáticos de reconocimiento y traducción decidir cual es la mejor hipótesis y penalizar aquellas cuya construcción gramatical sea incorrecta.

La labor investigadora del profesor Francisco Zamora tiene aplicación en tres áreas en desarrollo en el ámbito informático: la compresión automática del habla por sistemas automáticos de diálogo, el reconocimiento de la escritura manuscrita en distintos tipos de terminales y la traducción automática estadística. Múltiples aplicaciones informáticas para ordenadores personales, tables, smartphones y videojuegos están basadas en este tipo de sistemas. El uso de redes neuronales artificiales puede mejorar la eficacia de estas aplicaciones, cada día más utilizadas.

Modelos de lenguaje basados en redes neuronales

Dentro de esta área, el trabajo del profesor Francisco Zamora estudia los denominados modelos conexionistas de lenguaje, esto es, modelos de lenguaje basados en redes neuronales, con buenos resultados en diversas áreas del procesamiento del lenguaje natural. Estos modelos conexionistas de lenguaje plantean aún algunos problemas, principalmente computacionales, por lo que los sistemas se construyen en dos etapas totalmente desacopladas. En la primera fase se encuentra, a través de un modelo de lenguaje estándar, un conjunto de hipótesis factibles, asumiendo que dicho conjunto es representativo del espacio de búsqueda en el cual se encuentra la mejor hipótesis. En la segunda fase, sobre dicho conjunto, se aplica el modelo conexionista de lenguaje y se extrae la hipótesis con mejor puntuación, en un procedimiento denominado “rescoring”.

Las investigaciones del profesor Zamora se centran en proponer técnicas que puedan reducir drásticamente el coste computacional de estos modelos, degradando lo mínimo posible la calidad de la solución encontrada. También estudia el efecto que tiene la integración de los modelos conexionistas de lenguaje en el proceso de búsqueda de las tareas propuestas, así como modificaciones del modelo original que permitan mejorar su calidad.

Los resultados obtenidos por el profesor Francisco Zamora en su análisis de los problemas computacionales de estas aplicaciones y sus propuestas de nuevas soluciones han sido difundidas a través de 17 publicaciones en revistas científicas y congresos internacionales en los dos últimos años y forman parte también de su tesis doctoral, defendida el 30 de noviembre en la Universitat Politècnica de València, bajo la dirección de la doctora María José Castro, miembro del Departamento de Sistemas Informáticos y Computación. La tesis ha recibido la calificación de sobresaliente “cum laude” y la mención de doctorado internacional.

La tesis del profesor Francisco Zamora está disponible para su descarga aquí: TESIS EN RIUNET.

La presentación de su tesis y las publicaciones científicas en revistas y congresos pueden consultarse en Prezi: clic aquí. Y en Slideshare: clic aquí.