Sistemas de Diálogo
Profesor | RAMÓN LÓPEZ-CÓZAR DELGADO |
Categoría | Profesor Titular de Universidad |
Institución | Universidad de Granada |
Contacto | rlopezc@ugr.es |
Créditos | |
Horario | |
Sobre el profesor
Descripción
- Carácter introductorio, práctico e instrumental.
- Descripción: Los denominados “sistemas de diálogo” son programas informáticos cuya finalidad es interactuar con los usuarios oralmente o de forma multimodal para proporcionarles determinados servicios, como por ejemplo, información y reserva de viajes de avión o tren, información meteorológica, o control de terminales telefónicos. El objetivo de estos sistemas es aumentar la rapidez, efectividad y facilidad a la hora de realizar estas tareas de forma automática.
Requisitos
Dada la extensión del campo de estudio, el curso será de naturaleza eminentemente introductoria, por lo que se partirá desde cero en todos los aspectos a tratar, no siendo necesarios en consecuencia ningunos conocimientos previos. Es recomendable tener conocimientos del idioma Inglés para aprovechar en mayor medida los contenidos del curso.
Objetivos
Con este curso se pretende que los alumnos adquieran los conocimientos fundamentales de las tecnologías empleadas hoy en día para desarrollar este tipo de sistemas. Asimismo, se pretende que conozcan diversas herramientas software disponibles en el mercado hoy en día para facilitar la implementación de tales sistemas. Para ello, el curso está estructurado en 6 temas de teoría acompañados de 2 sesiones de prácticas (como se indica en el punto 9), contabilizándose un total de 20 horas lectivas.
Programa
- Temario de Teoría
- Introducción (2 horas).
Con este tema se pretende presentar a los alumnos una versión panorámica del curso que incluirá un repaso histórico de las diversas técnicas de interacción con sistemas informáticos, hasta llegar a los sistemas de diálogo actuales. La introducción incluirá una breve descripción de los temas a tratar a lo largo del curso y contará con varios vídeos ilustrativos relacionados con este tipo de sistemas.
- Interfaz de entrada de sistemas de diálogo (2 horas).
Los sistemas de diálogo más sofisticados de hoy en día permiten utilizar diversos dispositivos para proporcionar datos al ordenador, como por ejemplo teclados, ratones, teléfonos, micrófonos, cámaras de video, guantes de datos o pantallas sensibles al tacto. Ello representa una gran ventaja, puesto que los datos se pueden introducir usando varios dispositivos simultáneamente o de forma concurrente. Además, los usuarios pueden utilizar aquellos dispositivos que les resulten más adecuados según sus preferencias o necesidades. En este tema se realizará una introducción a las tecnologías que permiten implementar este tipo de interacción persona-ordenador, entre las que destacan: procesamiento de lenguaje natural, lectura de labios, localización y seguimiento de la cara del usuario, seguimiento de su mirada, reconocimiento de gestos, y reconocimiento de escritura a mano.
- Análisis y gestión del diálogo (2 horas).
Dado que actualmente las tecnologías empleadas en la interfaz de entrada no proporcionan un 100% de exactitud, los sistemas de diálogo deben incorporar mecanismos que les permitan solventar los posibles errores que se puedan producir durante la interacción con el usuario. Con este tema se pretende que los alumnos conozcan las diversas aproximaciones al modelado del diálogo, así como las estrategias de interacción y confirmación que se suelen emplear para implementar sistemas de diálogo capaces de funcionar satisfactoriamente en condiciones reales.
- Interfaz de salida de sistemas de diálogo (2 horas).
Los sistemas de diálogo actuales pueden utilizar diversos canales de comunicación para interactuar con los usuarios, como por ejemplo, gráficos de diversos tipos, lenguaje natural en forma de texto o voz humana generada artificialmente. De esta forma se logra una mayor comprensión de la información proporcionada por el ordenador, y a la vez, se logra que éste sea más amigable y adaptativo a las necesidades y/o preferencias de los usuarios. En este tema se realizará una introducción a las tecnologías empleadas para lograr este tipo de interacción tan sofisticada, destacando entre éstas la relacionada con los agentes animados (animated agents o talking heads).
- Estándares (2 horas).
Durante los últimos años se han llevado a cabo notables esfuerzos destinados a crear estándares que faciliten la implementación de sistemas de diálogo. Las empresas de desarrollo y los proveedores de servicios han apostado por potenciar estándares que permiten solventar, en cierta medida, las dificultades existentes a la hora de implementar este tipo de sistemas. Con este tema se pretende que los alumnos conozcan y aprendan a utilizar el estándar VoiceXML para la implementación de sistemas de diálogo.
- Herramientas de implementación (2 horas).
Recientemente se han llevado a cabo notables esfuerzos destinados a crear herramientas que faciliten la implementación de sistemas de diálogo. Con este tema se presente que los alumnos conozcan la existencia de tales herramientas (CSLU Toolkit, Voxeo Designer y Xface), se familiaricen con su uso y puedan decidir entre usar una u otra a la hora de implementar un sistema de diálogo para una aplicación concreta.
- Temario de Prácticas
- Práctica nº 1: Implementación de un sistema de diálogo mediante redes de transiciones entre estados (4 horas).
Las redes de transiciones entre estados constituyen una técnica de modelado del diálogo que permite implementar el flujo de la interacción con un sistema de diálogo de una manera muy estructurada, teniendo en cuenta la información que se debe intercambiar en cada momento. Mediante esta práctica, los alumnos podrán aprender a utilizar una herramienta que permite implementar sistemas de diálogo mediante redes de transiciones entre estados.
- Práctica nº 2. Implementación de sistemas mediante VoiceXML (4 horas).
VoiceXML (Voice Extensible Markup Language), también llamado VXML, es un lenguaje basado en marcas similar a HTML, que permite gestionar fácilmente la lógica de los sistemas de diálogo mediante navegadores Web que soportan voz. El objetivo principal de VoiceXML es favorecer la implementación de estos sistemas aprovechando las ventajas ofrecidas por los sistemas de transmisión de información basados en Internet. Mediante esta práctica, los alumnos podrán aprender a utilizar una herramienta que permite implementar sistemas de diálogo mediante este lenguaje.
Metodología
Clases teóricas: 12 horas
Clases prácticas (aula, laboratorio): 8 horas
Bibliografía y documentación complementaria
- Kraiss, K. F. (Ed.). 2006. Advanced Man-Machine Interaction: Fundamentals and Implementation. Springer
- Kuppevelt, J., Dybkjaer, L., Bernsen, N. O. 2005. Advances in Natural Multimodal Dialogue Systems. Springer
- López-Cózar, R., Araki, M. 2005. Spoken, Multilingual and Multimodal Dialogue Systems: Development and Assessment. Wiley
- Minker, W., Bühler, D., Dybkjaer, L. 2005. Spoken Multimodal Human-Computer Dialogue in Mobile Environments. Springer
- Prendinger, H., Ishizuka, M. (Eds.). 2004. Life-Like Characters. Tools, Affective Functions, and Applications. Springer
- Wahlster, W. (Ed.) 2006. SmartKom: Foundations of Multimodal Dialogue Systems. Springer