UA
   TÈCNIQUES DE RECONEIXEMENT I SÍNTESI DE LA PARLA    Any acadèmic       Versió PDF.
Codi7061Descripció
Crdts. Teor.3
Crdts. Pract.4,5
A efectes d'intercanvis en programes de mobilitat, la càrrega d'aquesta assignatura equival a 9,38 ECTS.


Departamentos y Áreas
DepartamentsÀreaCrdts. Teor.Crdts. Pract.Dpto. Respon.Respon. Acta
FÍSICA, ENGINYERIA DE SISTEMES I TEORIA DEL SENYALTEORIA DEL SENYAL I COMUNICACIONS34,5


Estudis en què s'imparteix
Enginyeria Tècnica de Telecomunicació. So i Imatge - pla 2001


Prerequisitos
Sense incompatibles


Incompatibilitats de matricula per continguts equivalents
Sense Dades


Matriculats (2014-15)
Sense Dades


Oferida com a lliure elecció (2014-15)
Sense departament
Consulta Gràfica d'Horari
A efectes d'intercanvis en programes de mobilitat, la càrrega d'aquesta assignatura equival aFeu clic ací


Horari (2014-15)
Sense horari


Grups de matricula (2014-15)
Grup (*)QuadrimestreTornIdiomaDistribució (lletra nif)
1 2do. M CAS des de - fins a -
(*) 1: GRUPO 1 - CAS


Objectius de l'assignatura / competències (2014-15)
El objetivo general de la asignatura es proporcionar unos conocimientos básicos sobre la problemática asociada al reconocimiento y a la síntesis del habla, así como presentar las técnicas y aplicaciones más empleadas. La asignatura se apoya en muchas ocasiones en un análisis exhaustivo de la señal de voz desde el punto de vista de la teoría de la señal, pero no se centra únicamente en estos análisis sino en la evaluación de los resultados para darle un sentido más práctico al tema.

Este objetivo genérico se centra en los siguientes aspectos:

- Entender las peculiaridades de la señal de voz y de los procesos fisiológicos asociados con su generación y captación; entender cómo estas peculiaridades pueden influir en los métodos de análisis.
- Introducir las técnicas más comunes de análisis y parametrización de esta señal y el sentido físico que tienen.
- Entender nuestra fonética y relacionar los conceptos analíticos adquiridos con el estudio fonético del habla.
- Presentar las técnicas de codificación de voz que tiene relación directa con su síntesis y con los análisis propios de la voz ya presentados.
- Comprender toda la problemática que afecta a la producción de voz de forma sintética y las técnicas desarrolladas para hacerles frente.
- Presentar las técnicas actualmente empleadas en reconocimiento del habla y del hablante y profundizar en las dificultades de estos tipos de análisis
- Presentar las aplicaciones prácticas de este campo desarrolladas y a desarrollar.

Se trata de una asignatura de último curso y optativa de una intensificación; desde esta perspectiva hemos tratado de dar al contenido un punto de vista práctico: no se trata tanto de conseguir que el alumno sepa desarrollar completamente un sistema de reconocimiento o síntesis del habla como de que sepa evaluar cuáles son los sistemas más empleados en la actualidad, cuáles son sus fundamentos teóricos y cuáles sus principales ventajas e inconvenientes.


Continguts teòrics i pràctics (2014-15)
TEMARIO DE TEORÍA

El temario de la asignatura puede dividirse en tres bloques:
Bloque 1: Generación y captación de la señal de voz (temas 1 y 2).
Bloque 2: Parametrización, esto es, como se puede medir la señal de voz (tema 3).
Bloque 3: Sistemas de tratamiento de la señal de voz: (temas 4, 5, 6 y 7)
- Codificación: formas eficientes de almacenar/transmitir la voz (ej. de utilidad: Telefonía móvil).
- Síntesis de la voz.: permitir que una máquina hable.
- Reconocimiento de voz: entender que se está diciendo.
- Reconocimiento del locutor: averiguar la identidad de la persona que habla.

Estos son los puntos fundamentales de cada uno de los temas tratados:

1. Producción de voz y fonética
1.1.- La señal de voz
1.2.- Características temporales de la señal de voz
1.3.- Naturaleza de las señales de voz
1.4.- Características estadísticas de la señal de voz
1.5.- Modelos para análisis de la producción de voz
1.6.- Fonética acústica

2. La percepción de la voz.
2.1.- El sentido de la audición
2.2.- Fisiología del sistema auditivo
2.3.- Psicoacústica

3. Análisis de la voz. Parametrización.
3.1.- Análisis localizado de la voz
3.2.- Análisis temporal localizado
3.3.- Análisis localizado en frecuencia
3.4.- Análisis de predicción lineal
3.5.- Análisis espectral localizado

4. Codificación de la Voz.
4.1.- Historia de los codificadores de voz
4.2.- Muestreo y cuantificación
4.3.- Clasificación de los codificadores de voz
4.4.- Codificadores de forma de onda
4.5.- Vocoders
4.6.- Codificadores híbridos
4.7.- Medidas de calidad

5. Síntesis de la Voz y del Habla
5.1.- Introducción
5.2.- Conversión texto-voz
5.3.- Procesado lingüístico
5.4.- Procesado acústico
5.5.- Evaluación de la calidad
5.6.- Conclusiones

6. Reconocimiento de voz
6.1.- Introducción
6.2.- Problemática
6.3.- Clasificación
6.4.- Esquema de trabajo
6.5.- Técnicas de reconocimiento
6.6.- Conclusiones

7. Reconocimiento del locutor
7.1.- Introducción
7.2.- Clasificación
7.3.- Fases del reconocimiento
7.4.- Técnicas de reconocimiento
7.5.- Evaluación

TEMARIO DE PRÁCTICAS

Durante el desarrollo del curso habrá un conjunto de prácticas a desarrollar, las cuales todavía están por determinar. Los temas propuestos para las prácticas son los siguientes:

1. Captura de señal de voz; segmentación y clasificación
2. Parametrización de la señal de voz capturada
3. Lectura del espectrograma
4. Análisis de predicción lineal
5. Síntetizador de voz
6. Reconocedor de voz

La realización de las prácticas está condicionada a la evolución de la teoría de forma que trataremos de adecuar su distribución en el tiempo para que no se tenga que realizar una práctica cuyos fundamentos teóricos no se hayan dado todavía en las clases de teoría.



Enllaç al programa
Professor/a responsable
Bleda Pérez , Sergio


Metodologia docent (2014-15)
Classes teòriques i pràctiques
Esta asignatura no tiene docencia pues pertenece a un plan en extinción.


Tipus d'activitats: teòriques i pràctiques
Laboratoris
Esta asignatura no tiene docencia pues pertenece a un plan en extinción.


Professorat (2014-15)
Grup Professor
TEORIA DE 70611Bleda Pérez, Sergio
PRÁCTICAS DE LABORATORIO DE 70611Bleda Pérez, Sergio
Enllaços relacionats
Sense Dades


Bibliografia

Digital speech processing, syntesis and recognition
Autors:FURUI, Sadaoki
Edició:New York : Marcel Dekker, 2001.
ISBN:0-8247-0452-5
Recomanat per: BLEDA PEREZ, SERGIO (*1)
[ Accés al catàleg de la biblioteca universitària ]
(*1) Aquest professor ha recomanat el recurs bibliogràfic a tot l'alumnat de l'assignatura.
Dates d'exàmens oficials (2014-15)
ConvocatòriaGrup (*)DataHora d’iniciHora d’fiAules assignadesObservacions:
Proves extraordinarias de finalització d'estudis -1 08/10/2014 -
Període ordinari per a assignatures de segon semestre i anuals -1 03/06/2015 -
Proves extraordinàries de assignatures de grau i màster -1 08/07/2015 -
(*) 1: GRUPO 1 - CAS


Instruments i criteris d'avaluació (2014-15)
Avaluació contínua, examen final
El 100% de la asignatura se evaluará en un examen teórico.