course 2013-2014
Tractament Digital de la Parla (12468)
Titulació / Estudis: Enginyeria en Informàtica
Curs: 3er curs
Període: 2n trimestre
Nombre de crèdits ECTS: 3,6 crèdits
Nombre total d'hores de dedicació a l'assignatura: 90 hores
Llengua de docència: Català/Castellà/Anglès
1. Presentació de l'assignatura
Aquest és un curs intermitj al processament digital del senyal aplicat als senyals de la parla pensat per estudiants d'informàtica. És una continuació del curs de Processament del Senyal I: Àudio i del curs de Informàtica de l'Àudio i la Música, on ens centrem en les tècniques pel processament de senyals de parla.
2. Prerequisits per al seguiment de l'itinerari formatiu
Per a poder cursar aquesta assignatura cal haver cursat les assignatures de Processament del Senyal I: Àudio i Informàtica de l'Àudio i la Música.
3. Competències a assolir en l'assignatura
Competències generals |
Competències específiques |
|
1. Entendre i saber utilitzar els conceptes matemàtics adequats per representar els senyals i els sistemes digitals.
|
4. Objectius d'aprenentatge
En aquesta assignatura es vol que l'alumne desenvolupi una metodologia per a analitzar, codificar, reconèixer i sintetitzar senyals de parla utilitzant tècniques de processament del senyal. Més concretament es pretén que l'alumne:
- Aprengui els fonaments del processament digital dels senyals de parla.
- Aprengui els fonaments acústics, fisiològics i perceptuals de la parla.
- Aprengui a utilitzar els filtres digitals per a modelar els senyals de parla.
- Aprengui a implementar amb un llenguatge de programació algorismes de processament del senyal pel tractament de la parla.
5. Avaluació
5.1. Criteris generals d'avaluació
L'avaluació es fa per a cada una de les tres activitats que constitueixen l'assignatura: classes de teoria, laboratoris i seminaris. Essent:
- T: l'avaluació de la teoria mitjançant un examen final
- L: l'avaluació dels laboratoris amb les pràctiques
- S: l'avaluació dels seminaris amb la participació en aquests
La nota final s'obté fent la mitjana ponderada de la següent manera:
Nota Final = 0,5xT + 0,35xL + 0,15xS
Al final de l'assignatura es realitza un examen escrit i individual per avaluar la comprensió dels continguts presentats en les classes de teoria i reforçats amb els seminaris i laboratoris. Aquesta avaluació és obligatòria i ha de ser qualificada amb com a mínim un 50% per tal de aprovar l'assignatura.
En els laboratoris es realitzen un sèrie de pràctiques que posen a prova la capacitat dels alumnes de resoldre problemes pràctics i d'implementar algorismes en forma de programes en un ordinador. Les practiques s'han d'entregar individualment abans de la practica següent. L'avaluació es fa a partir del seguiment realitzat a classe pel professor i d'una prova oral que es realitza la darrera setmana de classe on el professor planteja preguntes sobre les pràctiques entregades per cada alumne amb l'objectiu de valorar el grau de comprensió de les pràctiques realitzades. Aquesta avaluació també és obligatòria i ha de ser qualificada com a mínim amb un 50% per tal de aprovar l'assignatura.
Abans de cada seminari s'entrega una col·lecció de problemes als alumnes per tal que ells els resolguin individualment abans de la sessió, com a una preparació prèvia al seminari. Aquests problemes corresponen a conceptes o coneixements tractats a classe de teoria i posats a la practica en els laboratoris. Durant el seminari tots els estudiants han de participar en la resolució dels problemes entregats prèviament i en d'altres relacionats. L'avaluació d'aquesta activitat es centra en la participació dels estudiants en el seminaris.
5.2. Concreció per competències
Competències a assolir en l'assignatura |
Indicador d'assoliment |
Procediment d'avaluació |
Temporalització |
1. Capacitat d'anàlisi i síntesi |
Capacitat de proposar solucions a problemes |
Avaluació de pràctiques, seminaris i examen final |
Tot el trimestre |
3. Treball en equip |
|
Avaluació de seminaris |
Tot el trimestre |
5. Comunicació oral i escrita 6. Capacitat per integrar coneixements i metodologies en la pràctica 7. Preocupació per la qualitat
|
Presentacions orals i escrites correctes
|
Avaluació de pràctiques, seminaris i examen final |
Tot el trimestre |
1. Entendre i saber utilitzar els conceptes matemàtics adequats per representar els senyals i els sistemes digitals. 2. Entendre els mecanismes fisiològics i perceptuals que intervenen en el procés de comunicació amb la parla.
|
Realitzar correctament les diferents proves de l'assignatura. |
Avaluació de pràctiques, seminaris i examen final |
Tot el trimestre |
6. Continguts
Blocs de contingut
1. Introducció al tractament digital de la parla
2. Producció i classificació dels sons de la parla
3. Models basats en la producció de la parla
4. Models basats en la percepció del so
5. Reconeixement de parla
7. Metodologia
Enfocament metodològic de l'assignatura
El procés habitual d'aprenentatge per cada un dels blocs de continguts està compost per una sessió de teoria, un seminari i una sessió de laboratori. Cada bloc comença amb una sessió de teoria en la que es presenten certs fonaments teorico-pràctics. Aquesta activitat es realitza en grup gran. L'estudiant ha de complementar aquesta activitat amb una lectura detinguda dels seus propis apunts i del material addicional que el professor hagi proporcionat. Per exemple, una sessió de teoria de 2 hores, convenientment aprofitades, requerirà un treball addicional fora de l'aula d'1 hora per part de l'estudiant.
Posteriorment es realitzarà un seminari centrat en la resolució d'exercicis o problemes per posar en pràctica els conceptes i tècniques presentades a la sessió de teoria. Per als primers exercicis de la sessió es proporcionaran les solucions, però per a la resta no. L'objectiu és que l'estudiant consolidi els fonaments per tal que posteriorment pugi resoldre problemes de major complexitat. Aquesta activitat es realitza en grups petits de seminari on tots els estudiant han de participar activament en la resolució dels problemes.
El següent pas en el procés d'aprenentatge és el laboratori o sessió de pràctiques. En ell es proposen uns problemes pràctics que requereixen un disseny previ de la solució a implementar i que han d'integrar diferents conceptes i tècniques. Aquesta activitat es pot realitzar per parelles, i es pressuposa que continua fora de l'aula.
L'últim pas en el procés d'aprenentatge de cada bloc de continguts és el de la realització de l'examen final de teoria i de la prova oral de pràctiques per comprovar si l'estudiant ha adquirit les competències demanades.
8. Fonts d'informació i recursos didàctics
8.1. Fonts d'informació per a l'aprenentatge. Bibliografia bàsica (suport paper i electrònic)
Quatieri, T. F. 2001. Discrete-Time Speech Signal Processing: Principles and Practice. Prentice Hall.
Web de l'Assignatura: http://www.mtg.upf.edu/~xserra/cursos/TDP
8.2. Fonts d'informació per a l'aprenentatge. Bibliografia complementària (suport paper i electrònic)
Rabiner, L. R. and R. W. Schafer. 1978. Digital Signal Processing of Speech Signals. Prentice Hall.
O'Shaughnessy, D. 1999. Speech communications: human and machine. Wiley, John & Sons.
Rabiner, L. R. and B. H. Juang. 1993. Fundamentals of Speech Recognition. Prentice Hall.
Park, Sung-won. Linear Predictive Speech Processing.
Park, Sung-won. Discrete Wavelet Transform.
Spanias, Andreas. 1994. "Speech Coding: A Tutorial Review". Proceedings of the IEEE.
Pan, Davis. 1995. "A Tutorial on MPEG/Audio Compression". IEEE Multimedia Journal.
Rabiner, Lawrence. 1989. "A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition". Proceedings of the IEEE.
8.3. Recursos didàctics. Material docent de l'assignatura
Per a cada sessió de teoria hi ha disponible uns apunts a la Web de l'assignatura.
Per a cada sessió de seminari hi ha disponible una col·lecció de problemes a la Web de l'assignatura.
Per a cada sessió de pràctiques hi ha disponible el enunciat de la pràctica a la Web de l'assignatura.