UA
   TECNICAS DE RECONOC. Y SINT.DEL HABLA    Año académico       Versión PDF.  Versión PDF para convalidación.
Código7061Descripción
Crdts. Teor.3
Crdts. Pract.4,5
A efectos de intercambios en programas de movilidad, la carga de esta asignatura equivale a 9,38 ECTS.


Departamentos y Áreas
DepartamentosÁreaCrdts. Teor.Crdts. Pract.Dpto. Respon.Respon. Acta
FISICA, INGENIERIA DE SISTEMAS Y TEORIA DE LA SEÑALTEORIA DE LA SEÑAL Y COMUNICACIONES34,5


Estudios en los que se imparte
Ingeniería Técnica de Telecomunicación. Sonido e Imagen - plan 2001


Pre-requisitos
Sin incompatibles


Incompatibilidades de matrícula por contenidos equivalentes
Sin Datos


Matriculados (2013-14)
Sin Datos


Ofertada como libre elección (2013-14)
Sin departamento
Consulta Gráfica de Horario
A efectos de intercambios en programas de movilidad, la carga de esta asignatura equivale aPincha aquí


Horario (2013-14)
Sin horario


Grupos de matricula (2013-14)
Grupo (*)CuatrimestreTurnoIdiomaDistribución (letra nif)
1 2do. M CAS desde - hasta -
(*) 1: GRUPO 1 - CAS


Objetivos de las asignatura / competencias (2013-14)
El objetivo general de la asignatura es proporcionar unos conocimientos básicos sobre la problemática asociada al reconocimiento y a la síntesis del habla, así como presentar las técnicas y aplicaciones más empleadas. La asignatura se apoya en muchas ocasiones en un análisis exhaustivo de la señal de voz desde el punto de vista de la teoría de la señal, pero no se centra únicamente en estos análisis sino en la evaluación de los resultados para darle un sentido más práctico al tema.

Este objetivo genérico se centra en los siguientes aspectos:

- Entender las peculiaridades de la señal de voz y de los procesos fisiológicos asociados con su generación y captación; entender cómo estas peculiaridades pueden influir en los métodos de análisis.
- Introducir las técnicas más comunes de análisis y parametrización de esta señal y el sentido físico que tienen.
- Entender nuestra fonética y relacionar los conceptos analíticos adquiridos con el estudio fonético del habla.
- Presentar las técnicas de codificación de voz que tiene relación directa con su síntesis y con los análisis propios de la voz ya presentados.
- Comprender toda la problemática que afecta a la producción de voz de forma sintética y las técnicas desarrolladas para hacerles frente.
- Presentar las técnicas actualmente empleadas en reconocimiento del habla y del hablante y profundizar en las dificultades de estos tipos de análisis
- Presentar las aplicaciones prácticas de este campo desarrolladas y a desarrollar.

Se trata de una asignatura de último curso y optativa de una intensificación; desde esta perspectiva hemos tratado de dar al contenido un punto de vista práctico: no se trata tanto de conseguir que el alumno sepa desarrollar completamente un sistema de reconocimiento o síntesis del habla como de que sepa evaluar cuáles son los sistemas más empleados en la actualidad, cuáles son sus fundamentos teóricos y cuáles sus principales ventajas e inconvenientes.


Contenidos teóricos y prácticos (2013-14)
TEMARIO DE TEORÍA

El temario de la asignatura puede dividirse en tres bloques:
Bloque 1: Generación y captación de la señal de voz (temas 1 y 2).
Bloque 2: Parametrización, esto es, como se puede medir la señal de voz (tema 3).
Bloque 3: Sistemas de tratamiento de la señal de voz: (temas 4, 5, 6 y 7)
- Codificación: formas eficientes de almacenar/transmitir la voz (ej. de utilidad: Telefonía móvil).
- Síntesis de la voz.: permitir que una máquina hable.
- Reconocimiento de voz: entender que se está diciendo.
- Reconocimiento del locutor: averiguar la identidad de la persona que habla.

Estos son los puntos fundamentales de cada uno de los temas tratados:

1. Producción de voz y fonética
1.1.- La señal de voz
1.2.- Características temporales de la señal de voz
1.3.- Naturaleza de las señales de voz
1.4.- Características estadísticas de la señal de voz
1.5.- Modelos para análisis de la producción de voz
1.6.- Fonética acústica

2. La percepción de la voz.
2.1.- El sentido de la audición
2.2.- Fisiología del sistema auditivo
2.3.- Psicoacústica

3. Análisis de la voz. Parametrización.
3.1.- Análisis localizado de la voz
3.2.- Análisis temporal localizado
3.3.- Análisis localizado en frecuencia
3.4.- Análisis de predicción lineal
3.5.- Análisis espectral localizado

4. Codificación de la Voz.
4.1.- Historia de los codificadores de voz
4.2.- Muestreo y cuantificación
4.3.- Clasificación de los codificadores de voz
4.4.- Codificadores de forma de onda
4.5.- Vocoders
4.6.- Codificadores híbridos
4.7.- Medidas de calidad

5. Síntesis de la Voz y del Habla
5.1.- Introducción
5.2.- Conversión texto-voz
5.3.- Procesado lingüístico
5.4.- Procesado acústico
5.5.- Evaluación de la calidad
5.6.- Conclusiones

6. Reconocimiento de voz
6.1.- Introducción
6.2.- Problemática
6.3.- Clasificación
6.4.- Esquema de trabajo
6.5.- Técnicas de reconocimiento
6.6.- Conclusiones

7. Reconocimiento del locutor
7.1.- Introducción
7.2.- Clasificación
7.3.- Fases del reconocimiento
7.4.- Técnicas de reconocimiento
7.5.- Evaluación

TEMARIO DE PRÁCTICAS

Durante el desarrollo del curso habrá un conjunto de prácticas a desarrollar, las cuales todavía están por determinar. Los temas propuestos para las prácticas son los siguientes:

1. Captura de señal de voz; segmentación y clasificación
2. Parametrización de la señal de voz capturada
3. Lectura del espectrograma
4. Análisis de predicción lineal
5. Síntetizador de voz
6. Reconocedor de voz

La realización de las prácticas está condicionada a la evolución de la teoría de forma que trataremos de adecuar su distribución en el tiempo para que no se tenga que realizar una práctica cuyos fundamentos teóricos no se hayan dado todavía en las clases de teoría.



Más información
Profesor/a responsable
Bleda Pérez , Sergio


Metodología docente (2013-14)
Clases teóricas y prácticas
Esta asignatura no tiene docencia pues pertenece a un plan en extinción.


Tipo de actividades: teóricas y prácticas
Laboratorios
Esta asignatura no tiene docencia pues pertenece a un plan en extinción.


Profesores (2013-14)
Grupo Profesor/a
TEORIA DE 70611Bleda Pérez, Sergio
PRÁCTICAS DE LABORATORIO DE 70611Bleda Pérez, Sergio
Enlaces relacionados
Sin Datos


Bibliografía

Digital speech processing, syntesis and recognition
Autor(es):FURUI, Sadaoki
Edición:New York : Marcel Dekker, 2001.
ISBN:0-8247-0452-5
Recomendado por:BLEDA PEREZ, SERGIO (*1)
[ Acceso al catálogo de la biblioteca universitaria ]
(*1) Este profesor ha recomendado el recurso bibliográfico a todos los alumnos de la asignatura.
Fechas de exámenes oficiales (2013-14)
ConvocatoriaGrupo (*)fechaHora inicioHora finAula(s) asignada(s)Observ:
Pruebas extraordinarias de finalización de estudios -1 27/11/2013 -
Periodo ordinario para asignaturas de segundo semestre y anuales -1 03/06/2014 -
Pruebas extraordinarias para asignaturas de grado y máster -1 02/07/2014 -
(*) 1: GRUPO 1 - CAS


Instrumentos y criterios de evaluación (2013-14)
Evaluación continua, examen final
El 100% de la asignatura se evaluará en un examen teórico.