TEMARIO DE TEORÍA
El temario de la asignatura puede dividirse en tres bloques: Bloque 1: Generación y captación de la señal de voz (temas 1 y 2). Bloque 2: Parametrización, esto es, como se puede medir la señal de voz (tema 3). Bloque 3: Sistemas de tratamiento de la señal de voz: (temas 4, 5, 6 y 7) - Codificación: formas eficientes de almacenar/transmitir la voz (ej. de utilidad: Telefonía móvil). - Síntesis de la voz.: permitir que una máquina hable. - Reconocimiento de voz: entender que se está diciendo. - Reconocimiento del locutor: averiguar la identidad de la persona que habla.
Estos son los puntos fundamentales de cada uno de los temas tratados: 1. Producción de voz y fonética 1.1.- La señal de voz 1.2.- Características temporales de la señal de voz 1.3.- Naturaleza de las señales de voz 1.4.- Características estadísticas de la señal de voz 1.5.- Modelos para análisis de la producción de voz 1.6.- Fonética acústica
2. La percepción de la voz. 2.1.- El sentido de la audición 2.2.- Fisiología del sistema auditivo 2.3.- Psicoacústica 3. Análisis de la voz. Parametrización. 3.1.- Análisis localizado de la voz 3.2.- Análisis temporal localizado 3.3.- Análisis localizado en frecuencia 3.4.- Análisis de predicción lineal 3.5.- Análisis espectral localizado 4. Codificación de la Voz. 4.1.- Historia de los codificadores de voz 4.2.- Muestreo y cuantificación 4.3.- Clasificación de los codificadores de voz 4.4.- Codificadores de forma de onda 4.5.- Vocoders 4.6.- Codificadores híbridos 4.7.- Medidas de calidad
5. Síntesis de la Voz y del Habla 5.1.- Introducción 5.2.- Conversión texto-voz 5.3.- Procesado lingüístico 5.4.- Procesado acústico 5.5.- Evaluación de la calidad 5.6.- Conclusiones
6. Reconocimiento de voz 6.1.- Introducción 6.2.- Problemática 6.3.- Clasificación 6.4.- Esquema de trabajo 6.5.- Técnicas de reconocimiento 6.6.- Conclusiones
7. Reconocimiento del locutor 7.1.- Introducción 7.2.- Clasificación 7.3.- Fases del reconocimiento 7.4.- Técnicas de reconocimiento 7.5.- Evaluación
TEMARIO DE PRÁCTICAS Durante el desarrollo del curso habrá un conjunto de prácticas a desarrollar, las cuales todavía están por determinar. Los temas propuestos para las prácticas son los siguientes: 1. Captura de señal de voz; segmentación y clasificación 2. Parametrización de la señal de voz capturada 3. Lectura del espectrograma 4. Análisis de predicción lineal 5. Síntetizador de voz 6. Reconocedor de voz La realización de las prácticas está condicionada a la evolución de la teoría de forma que trataremos de adecuar su distribución en el tiempo para que no se tenga que realizar una práctica cuyos fundamentos teóricos no se hayan dado todavía en las clases de teoría.
|