Curs 2010-11

Traducció Automàtica (13315)

Titulació/estudi: Llicenciatura en Lingüística
Trimestre: tercer
Nombre de crèdits ECTS: 5 crèdits
Llengua o llengües de la docència: Català
Professor: Toni Badia

Objectius

Aquest curs té com a objectiu bàsic donar a conèixer una de les aplicacions centrals de la lingüística computacional o processament automàtic del llenguatge: la traducció automàtica. L'assignatura, doncs, ofereix un recorregut per les diverses tècniques que s'utilitzen a l'hora de construir sistemes de traducció automàtica. És convenient seguir aquest curs després d'haver superat alguna de les assignatures de processament del llenguatge de la Llicenciatura de Lingüística (per exemple, Fonaments de Processament del Llenguatge Natural, Introducció a la Lingüística Computacional o Morfosintaxi Computacional) o Tecnologies de la Traducció del Grau de Traducció i Interpretació. 

L'objectiu fonamental d'aquesta assignatura és aprendre les tècniques principals que s'utilitzen en la construcció dels sistemes de traducció automàtica: sistemes basats en el coneixement lingüístic (sistemes de transferència i d'interlingua) i sistemes basats en dades (estadístics o basats en exemples). 

En aquesta assignatura l'estudiant podrà:    

* conèixer els diversos tipus de sistemes de traducció automàtica    
* construir algun sistema de traducció automàtica de joguina    
* practicar amb algun sistema de traducció automàtica estadístic    
* conèixer i practicar mètodes d'avaluació automàtica dels resultats de la traducció automàtica.

Competències generals

Capacitat d'analitzar un text en el seu sentit general.
Capacitat d'identificar els recursos lingüístics utilitzats per l'autor
Capacitat d'identificar els recursos estilístics utilitzats per l'autor
Capacitat d'aprenentatge autònom
Capacitat de prendre decisions i justificar-les
Capacitat de recerca documental 

Competències específiques

 1. Lingüística

  • Capacitat d'entendre el plantejament lingüístic que hi ha a la base de les diferents solucions tècniques dels sistemes de traducció automàtica
  • Capacitat per formalitzar els problemes de traducció que es plantegen

2. Tecnologia

  • Capacitat per escriure algun embrió de sistema de traducció automàtica
  • Capacitat per diferenciar entre les diferents tecnologies que s'usen normalment
  • Capacitat per fer servir adequadament programes pre-establerts i entendre'n el funcionament

 3. De traducció

  • Capacitat per comprendre i practicar algun mètode d'avaluació extensiu i quantitatiu dels resultats dels sistemes de traducció automàtica
  • Capacitat per valorar les possibilitats d'ús de sistemes de traducció automàtica en el context professional de la traducció 

 

Continguts

1. Introducció a la Traducció Automàtica

  • Objectius i plantejaments generals
  • Problemes de formalització en traducció automàtica

2. Classes de sistemes de traducció automàtica

  • segons diverses aproximacions (finalitat, llengües, tècnica emprada...)

3. Traducció automàtica per transferència

  • problemes principals que afronta i mètode per resoldre'ls
  • construcció d'un sistema de joguina de traducció per transferència 

4. Traducció automàtica per interlingua

  • problemes principals que afronta i mètode per resoldre'ls
  • construcció d'un sistema de joguina de traducció per interlingua 

5. Traducció automàtica estadística

  • conceptes bàsics de l'aproximació estadística a la traducció
  • la preparació del sistema i el procés de traduir
  • el muntatge d'un petit sistema de traducció estadística

6. Traducció automàtica basada en exemples

  • conceptes bàsics d'aquesta aproximació a la traducció

7. Avaluació de la traducció automàtica

  • necessitat de mètodes automàtics d'avaluació
  • conceptes bàsics de l'avaluació automàtica de la traducció
  • l'ús de mètodes automàtics d'avaluació

 

Metodologia docent

El curs està organitzat a base de:

  • 7 temes de teoria     
  • 7 activitats pràctiques 

A cada classe de gran grup li correspon un material docent que es troba en el Moodle de l'assignatura. 

A més del material proporcionat a les classes (de gran grup i de seminari), s'oferiran algunes lectures que proporcionen plantejaments complementaris als proporcionats a classe. 

Les activitats pràctiques es plantejaran a classe, i es podran realitzar autònomament a partir del guió proporcionat.  Els fitxers amb les pràctiques seran penjats a Moodle i tindran sempre el nom de la forma següent: "practN_COGNOM_NOM", essent N el número de la pràctica (1, 2...).

Avaluació

L'assignatura està organitzada de manera que els estudiants puguin aprovar-la seguint la progressió proposada a classe a través de les explicacions i discussions de classe i dels exercicis de les pràctiques. 

La qualificació final de l'assignatura serà la nota obtinguda en un examen final que consistirà en preguntes relacionades amb els continguts treballats específicament en les classes pràctiques, els continguts presentats en les classes teòriques, o els continguts de les lectures assenyalades. 

Haver realitzat correctament i lliurat les pràctiques setmanals permetrà millorar la nota fins en un 30%. 

Què s'avaluarà  

  • comprensió de les tècniques bàsiques de traducció automàtica   
  • habilitat de formular adequadament problemes de traducció per ser tractats en sistemes de traducció automàtica    
  • anàlisi de programes de traducció automàtica

 

Bibliografia recomanada

Jurafsky, D. & Martin, J.K. (2000) Speech and Language Processing, Upper Saddle River : Prentice Hall.

Knight, K.(1997) "Automating Knowledge Acquisition for Machine Translation," AI Magazine 18(4) http://citeseer.ist.psu.edu/4106.html

Somers, H (1999) Example-based machine translation, Machine Translation 14 (també a : stp.ling.uu.se/~ebbag/somers.pdf -)

Trujillo, A. (1999) Translation Engines: Techniques for Machine Translation [London] [etc.] : Springer