Corpus orales y tecnologías del habla
Profesor | JOAQUIM LLISTERRI BOIX |
Categoría | Profesor Titular de Universidad |
Institución | Universidad Autónoma de Barcelona |
Contacto | Joaquim.Llisterri@uab.cat |
Créditos | |
Horario | |
Sobre el profesor
Joaquim Llisterri es Doctor en Filología Románica por la Universidad Autónoma de Barcelona (UAB) y profesor titular de Lingüística General en la misma universidad. Imparte cursos de lingüística general, fonética, lingüística aplicada y tecnologías del habla y, actualmente, es responsable del Grupo de Fonética del Departamento de Filología Española de la UAB. Su investigación, sus publicaciones y su participación en proyectos nacionales e internacionales se han centrado en la aplicación de la fonética experimental a las tecnologías del habla - especialmente en el campo de la conversión de texto en habla - y en la caracterización de la interferencia fonética en la adquisición de segundas y terceras lenguas. Se ha ocupado también de aspectos relacionados con la evaluación del habla sintetizada y con la constitución y anotación de bases de datos y corpus orales particularmente en el ámbito de la prosodia-, así como del uso de las tecnologías de la información y de la comunicación en la enseñanza de lenguas y en la investigación en lingüística.
Descripción
Requisitos
Es obligatorio haber cursado previamente el módulo común de fonética.
Objetivos
Al finalizar la asignatura los estudiantes deben conocer los tipos de recursos lingüísticos necesarios para el desarrollo de una aplicación en el ámbito de las tecnología del habla, los estándares actuales en lo que se refiere al diseño, a la transcripción ortográfica y al etiquetado fonético de corpus orales, así como las principales iniciativas relacionadas con la creación y la distribución de recursos lingüísticos.
Programa
- Los recursos lingüísticos. Iniciativas relacionadas con la creación y la distribución de recursos lingüísticos.
- Diseño de corpus orales para el desarrollo de tecnologías del habla.
- Transcripción, codificación y etiquetado fonético de corpus orales.
Metodología
Clases teóricas: 8 horas
Bibliografía y documentación complementaria
- Cieri, C., Liberman, M., Arranz, V., y Choukri, K. (2006). Linguistic data resources. En T. Schultz, y K. Kirchhoff (Eds.), Multilingual speech processing. (pp. 33-70). Burlington, MA: Elsevier Academic Press.
- Cieri, C., Reed, M., DiPersio, D., y Liberman, M. (2012). Twenty years of language resource development and distribution: A progress report on LDC activities. En LREC 2012. Proceedings of the 8th International Conference on Language Resources and Evaluation. Istanbul, Turkey. 21-27 May 2012. Consultado en http://www.lrec-conf.org/proceedings/lrec2012/summaries/1117.html
- Gibbon, D., Moore, R., y Winski, R. (Eds). (1997). Handbook of standards and resources for spoken language systems. Berlin - New York: Mouton de Gruyer.
- Mapelli, V., Arranz, V., Carré, M., Mazo, H., Mostefa, D., y Choukri, K. (2012). ELRA in the heart of a cooperative HLT world. En LREC 2012. Proceedings of the 8th International Conference on Language Resources and Evaluation. Istanbul, Turkey. 21-27 May 2012. Consultado en http://www.lrec-conf.org/proceedings/lrec2012/summaries/701.html
- Piperidis, S. (2012). The META-SHARE language resources sharing infrastructure: Principles, challenges, solutions. En LREC 2012. Proceedings of the 8th International Conference on Language Resources and Evaluation. Istanbul, Turkey. 21-27 May 2012. Consultado en http://www.lrec-conf.org/proceedings/lrec2012/summaries/1086.html
Una bibliografía más detallada se encuentra en:
http://liceu.uab.cat/~joaquim/language_resources/spoken_res/biblio_corpus_orals.html