Análisis de la señal acústica y procesado digital de la señal de voz
Profesor | PEDRO GÓMEZ VILDA Y RAFAEL MARTÍNEZ OLALLA |
Categoría | Catedrático de Universidad - Profesor Titular de Escuela Universitaria |
Institución | Universidad Politécnica de Madrid |
Contacto | pedro@pino.datsi.fi.upm.es / rmolalla@junipera.datsi.fi.upm.es |
Créditos | |
Horario | |
Sobre el profesor
Descripción
- Carácter instrumental
- Descripción:
- Señales y sistemas
- Transformadas
- Filtrado
- Registro y representación de señales
- Audio cognitivo
- Se requiere un tipo de puesto específico para cada dos alumnos, consistente en un ordenador con entrada y salida de audio y plataforma MATLAB
Requisitos
Son recomendables los conocimientos básicos de física de ondas, matemática discreta y rudimentos de programación.
Objetivos
Se pretende que el alumno se familiarice con conceptos básicos de acústica y el procesado de señal, para realizar representaciones visuales, análisis espectral y caracterización de sonidos, desde un punto de vista eminentemente práctico, mediante interfaces de usuario de aplicaciones estándar en tratamiento de sonido.
Programa
- Temario:
- Señales y sistemas
- Dominios del tiempo y la frecuencia
- Dominios continuo y discreto
- Sistemas ltsi
- Estabilidad, causalidad
- Series de Fourier
- Transformada de Fourier
- Transformada z
- Transformacion bilineal
- Transformada ondicular
- Estimacion tiempo-frecuencia
- Filtrado, interpolacion, prediccion
- Fisiología de la voz
- Modelo generador de Fant
- Voz sonora: generación de la onda glótica
- Voz sorda: tipos de espectros
- Modelado del sistema glótico
- Modelado del tracto vocal
- Predicción lineal
Metodología
- Se desarrollarán clases introductorias en que se expondrán los conceptos básicos de un modo teórico, aunque apoyados en ejemplos prácticos sobre la plataforma de ordenador, para pasar progresivamente a aumentar el componente de trabajo práctico en modalidad “learning by doing”, reduciendo paulatinamente la componente teórica explicativa e incorporando módulos de autoaprendizaje, desde un balance de 1/2T+1/2P hasta 1P.
- Las clases se desarrollarán en aula-laboratorio.
- Requiere trabajo individual.
Bibliografía y documentación complementaria
- G. M. Ballou, Handbook for Sound Engineers , Focal Press, 2003. BIB
- J. R. Deller et al., Discrete-Time Processing of Speech Signals , John Wiley, 2000. BIB
- X. Huang, Spoken Language Processing , Prentice-Hall, 2001. BIB