Análisis de la señal acústica y procesado digital de la señal de voz

Profesor	PEDRO GÓMEZ VILDA Y RAFAEL MARTÍNEZ OLALLA
Categoría	Catedrático de Universidad - Profesor Titular de Escuela Universitaria
Institución	Universidad Politécnica de Madrid
Contacto	pedro@pino.datsi.fi.upm.es / rmolalla@junipera.datsi.fi.upm.es
Créditos
Horario

Sobre el profesor

Descripción

Carácter instrumental
Descripción:
- Señales y sistemas
- Transformadas
- Filtrado
- Registro y representación de señales
- Audio cognitivo
Se requiere un tipo de puesto específico para cada dos alumnos, consistente en un ordenador con entrada y salida de audio y plataforma MATLAB

Requisitos

Son recomendables los conocimientos básicos de física de ondas, matemática discreta y rudimentos de programación.

Objetivos

Se pretende que el alumno se familiarice con conceptos básicos de acústica y el procesado de señal, para realizar representaciones visuales, análisis espectral y caracterización de sonidos, desde un punto de vista eminentemente práctico, mediante interfaces de usuario de aplicaciones estándar en tratamiento de sonido.

Programa

Temario:
- Señales y sistemas
- Dominios del tiempo y la frecuencia
- Dominios continuo y discreto
- Sistemas ltsi
- Estabilidad, causalidad
- Series de Fourier
- Transformada de Fourier
- Transformada z
- Transformacion bilineal
- Transformada ondicular
- Estimacion tiempo-frecuencia
- Filtrado, interpolacion, prediccion
- Fisiología de la voz
- Modelo generador de Fant
- Voz sonora: generación de la onda glótica
- Voz sorda: tipos de espectros
- Modelado del sistema glótico
- Modelado del tracto vocal
- Predicción lineal

Metodología

Se desarrollarán clases introductorias en que se expondrán los conceptos básicos de un modo teórico, aunque apoyados en ejemplos prácticos sobre la plataforma de ordenador, para pasar progresivamente a aumentar el componente de trabajo práctico en modalidad “learning by doing”, reduciendo paulatinamente la componente teórica explicativa e incorporando módulos de autoaprendizaje, desde un balance de 1/2T+1/2P hasta 1P.
Las clases se desarrollarán en aula-laboratorio.
Requiere trabajo individual.

Bibliografía y documentación complementaria

G. M. Ballou, Handbook for Sound Engineers , Focal Press, 2003. BIB
J. R. Deller et al., Discrete-Time Processing of Speech Signals , John Wiley, 2000. BIB
X. Huang, Spoken Language Processing , Prentice-Hall, 2001. BIB