Curs 2009-2010

Llicenciatura en Lingüística  

Morfosintaxi Computacional (13296)  

Continguts

1. Dominar i comprendre les expressions regulars i els autòmats d'estats finits

i. repàs de les expressions regulars,
ii. els autòmats d'estats finits:

  • deterministes,
  • no deterministes.

2. Comprendre el tractament computacional de la morfologia i l'ús de transductors d'estats finits

i. repàs dels aspectes essencials de la morfologia,
ii. el lèxic i la morfotàctica
iii. les regles ortogràfiques
iv. l'anàlisi morfològica amb transductors d'estats finits.

3. Dominar i comprendre els models de llengua amb n-grames

i. què i com comptem en els corpus lingüístics,
ii. n-grames simples ,
iii. smoothing i altres tècniques de millora dels models de n-grames.

4. Conèixer i entendre les diverses tècniques d'etiquetat de textos

i. les etiquetes morfosintàctiques,
ii. l'etiquetat morfosintàctic:

  • basat en regles,
  • probabilístic,
  • transformacional.

iii. problemes generals en l'etiquetat morfosintàctic

5. Les Gramàtiques Lliures de Context (CFG)

i. repàs dels aspectes essencials de la sintaxi,
ii. les CFG,
iii. equivalència entre gramàtiques; la forma normal.

6. L'anàlisi amb les CFG

i. l'anàlisi com a cerca
ii. l'anàlisi descendent
iii. l'anàlisi ascendent
iv. l'algorisme d'Early

7. Representació lingüística amb trets; la unificació

i. estructures de trets i unificació d'estructures de trets
ii. les estructures de trets en la gramàtica
iii. la implementació de la unificació
iv. l'anàlisi amb restriccions d'unificació
v. els tipus i l'herència

8. L'anàlisi probabilística

i. CFG probabilístiques
ii. problemes de les CFG probabilístiques
iii. CFG probabilístiques lexicalitzades