Lingüística computacional 1

Estudi

Màster Universitari en Lingüística Teòrica i Aplicada

Codi de l'assignatura

31395

Nom de l'assignatura

Lingüística Computacional 1

Curs

 

Trimestre

1

Nombre de crèdits ECTS

 

Hores de dedicació de l'estudiant

100

Professorat de grup gran

Juan María Garrido

Llengua de la docència

Català

  

Competències (generals i específiques

del pla d'estudis)

Objectius avaluables o

resultats d'aprenentatge

 

 

Generals:

 

 

 

Instrumentals

1.     Cerca d'informació

2.     Treball amb eines informàtiques

 

 

·         Ser capaç de fer servir eines informàtiques per al processament digital de la parla

 

Interpersonals

1.     Treball en equip

 

 

·         Capacitat de portar a terme un treball en grup relacionat amb el tractament de la parla

 

 

Sistèmiques

1.     Autoaprenentatge

 

 

·         Capacitat d'aprendre per un mateix amb la realització de les pràctiques

 

 

Específiques:

 

 

 

Introducció a les eines, tècniques i mètodes d'anàlisi experimental de la parla:

1.     Reforçament dels conceptes bàsics de fonètica general, i especialment acústica.

2.     Coneixement teòric/pràctic de les tècniques bàsiques d'anàlisi acústica.

3.     Coneixement de Praat i altres eines d'anàlisi i processament de parla.

4.     Coneixement del mètode experimental i aplicació a l'anàlisi de la parla.

 

·         Domini del conceptes tèorics relacionats amb la fonètica

·         Habilitats bàsiques en l'ús de programes d'anàlisi de la parla (Praat).

·         Ser capaç de fer servir i interpretar les principals eines d'anàlisi acústica de la parla: representacions de forma d'ona, espectres, espectrogrames, representacions LPC, corbes d'amplitud i F0.

·         Ser capaç d'aplicar el mètode experimental al disseny de petits experiments d'anàlisi de la parla.

  

 

Introducció a les principals tecnologies de la parla:

1.     Domini teòric/pràctic dels conceptes bàsics en aquest camp

2.     Introducció al treball lingüístic en tecnologies de la  parla

 

 

·         Domini dels conceptes bàsics relacionats amb les tecnologies de la parla (codificació, síntesi reconeixement de parla).

·         Habilitats bàsiques en el tractament digital de la parla (conversió analògic-digital, emmagatzemament, codificació de veu).

·         Habilitats bàsiques en la utilització de diferents sistemes de generació de parla (síntesi per formants, síntesi articulatòria, síntesi multimodal...)

 


Continguts

 

1. Anàlisi acústica de la parla

 

1.1.  La producció de les ones sonores de veu

L'ona sonora. Paràmetres bàsics: temps, amplitud i freqüència. Sons periòdics i aperiòdics. Ones simples i complexes. Descomposició espectral: la transformada de Fourier. Model acústic de la producció de la parla: font i filtre. Tipus de fonts sonores. Fonamental i harmònics. Filtres i ressonadors. Trets acústics dels senyals de parla.

 

1.2.  Mètodes bàsics de representació i anàlisi acústica de la veu

La representació temporal de la forma d'ona. Representacions espectrals: espectres, envolvents LPC, espectrogrames. Representació dels paràmetres prosòdics: corbes de freqüència fonamental, corbes d'energia. Eines per a l'anàlisi de la veu.

 

1.3.  L'anàlisi experimental de la parla

Mètode experimental i anàlisi acústica de la parla. El disseny d'un experiment. Determinació de la hipótesi. La recollida de les dades: selecció i control de  variables; preparació del corpus de treball. Anàlisi experimental. La selecció del procediment experimental. L'análisi estadística. La presentació dels resultats.

 

  

2. Codificació de parla

 

2.1. La conversió analògic-digital (A/D)

Senyals analògics i senyals digitals. Concepte de mostreig. Freqüència de mostreig. Resolució del convertidor A/D. Aliasing. Saturació.

 

2.2. Codificació de senyals de parla

Concepte de codificació: necessitat i aplicacions. Mètodes de codificació del senyals de veu: codificació de forma d'ona i codificació paramètrica. Codificació de forma d'ona: PCM, ADPCM. Codificació paramètrica: LPC, codificació sinusoidal, MP3, AAC, CELP.

 

  

3. Síntesi de parla

 

3.1. Mètodes i tècniques per a la síntesi

Anàlisi-resíntesi, síntesi per concatenació d'unitats. Tècniques basades en codificació: LPC, sinusoidal. Les aproximacions paramètriques: síntesi articulatòria, síntesi per formants.

 

3.2. Conversió text-parla

Síntesi de parla i conversió text-parla. Fases en la conversió text-parla. El processament lingüístic per a la conversió text-parla: preprocessament, transcripció fonètica, anàlisi morfosintàctica, anàlisi prosòdica. El procés de síntesi en la conversió text-parla: la selecció de les unitats; la generació dels paràmetres prosòdics; tècniques per a la manipulació dels paràmetres prosòdics. PSOLA, MBROLA. La síntesi multimodal.

 

  

4. Reconeixement de parla

 

4.1. Conceptes generals

Concepte de reconeixement de parla. Fases en el procés de reconeixement: parametrització i reconeixement. Altres tipus de reconeixement: reconeixement de locutor, reconeixement d'idioma, reconeixement d'estats emocionals.

 

4.2. La parametrització del senyal

Tipus de paràmetres empleats en reconeixement. Paràmetres temporals i prosòdics: creuaments per zero, energia, freqüència fonamental. Paràmetres espectrals: formants, cepstrum.

 

4.3. Tècniques de reconeixement

La comparació de patrons: alineament temporal (DTW). Reconeixement  amb models de Markov: fase d'entrenament i fase de reconeixement. El reconeixement amb xarxes neuronals. Aproximacions basades en coneixement lingüístic: el reconeixement basat en regles. Models del llenguatge pel reconeixement.

 


Metodologia

docent

L'assignatura s'articula en torn de dos eixos:

-          les classes teòriques (15 hores), a les quals s'introduiran els diferents conceptes teòrics;

-          les sessions pràctiques (10 hores), al llarg de les quals els alumnes hauran de realitzar, amb el suport del professor, una sèrie d'activitats per reforçar els conceptes teòrics treballats a les sessiones teòriques i assolir les competències pràctiques objecte del curs.

 

Els alumnes hauran de completar la seva dedicació a l'assignatura amb un nombre d'hores de treball fora d'aquestes sessions, per completar les activitats pràctiques i realitzar el treball de curs, si es tria aquesta forma d'avaluació.

 

 

 

 

 

Avaluació

Ordinària

Els alumnes podran triar entre dues opcions, tant a la primera convocatòria com a la segona, per a l'avaluació:

-          Examen teòric/pràctic al final del trimestre (70% de la qualificació), més una pràctica avaluada durant la segona part del trimestre (30%).

-          Treball de curs, individual o en grup, sobre un tema prèviament acordat amb el professor relacionat amb el temari de l'assignatura.

 

Independentment de l'opció triada, serà requisit previ per a ser avaluat haver entregat totes les activitats proposades a les sessions pràctiques.

 

Extraordinària (setembre)

Igual que l'ordinària

 

 

 

Fonts

Bibliografia bàsica

 

GOLD, B- MORGAN, N. (2000).- Speech and Audio Signal Processing, Processing and Perception of Speech and Music, Wiley.

 

FURUI, S. (2001).- Digital Speech Processing, Synthesis and Recognition (Second Edition, Revised and Expanded) New York, Marcel Dekker, Inc.

 

HARRINGTON, J. - CASSIDY, S. (1999).- Techniques in Speech Acoustics, Dordrecht, Kluwer Academic Publishers.

 

HOLMES, J.N.- HOLMES, W. (2001).- Speech Synthesis and Recognition. London, Taylor & Francis.

 

LADEFOGED, P. (2003).- Phonetic Data Analysis. An Introduction to Fieldwork and Instrumental Techniques, Malden, Blackwell.

 

NEJAT, A. (Ed.) (1991).- Digital Speech Processing: Speech Coding, Synthesis and Recognition, The International Series in Engineering and Computer Science.

 

O´SHAUGHNESSY, D. (1987).- Speech Communication. Human and Machine. Addison Wesley Series in Electrical Engineering, 2na edició, 2000.

 

QUANTIERI, T.F. (2002).- Discrete-Time Speech Signal Processing. Principles and Practice, Prentice Hall.

 

RODMAN, R. D. (1999).- Computer Speech Technology, Boston/London, Artech House.

 

SCHROEDER, M. R. (1999).- Computer Speech. Recognition, Compression, Synthesis, Springer-Verlag.

 

  

  

Materials en línia

 

ROBINSON, T. Speech Analysis, University of Cambridge

http://svr-www.eng.cam.ac.uk/~ajr/SpeechAnalysis/

 

 

La programació de les activitats setmanals es detallarà a l'Aula Global de cada assignatura.