Curs 2010-11

Pragmàtica i Semàntica Computacional (13295)

Titulació/estudi: Llicenciatura en Lingüística
Curs: segon
Trimestre: tercer
Nombre de crèdits: 4.5 crèdits
Hores de dedicació de l'estudiant: 112.5 hores
Llengua o llengües de la docència: La llengua d'impartició de la docència és el català o l'anglès, en funció del perfil lingüístic dels estudiants. Les lectures són en anglès.
Professor: Gemma Boleda, Stefan Bott  

Competències (generals i específiques del pla d'estudis)

Objectius avaluables o resultats d'aprenentatge
(relacionats amb la competència corresponent)

Competències generals:
* Anàlisi crítica
* Escepticisme científic
* Classificació d'informació
* Anàlisi de situacions i resolució de problemes
* Abstracció i generalització; raonament inductiu
* Raonament deductiu

Les competències pròpies són, entre d'altres:
* Capacitat per identificar els problemes que plantegen els fenòmens semàntics i pragmàtics per a diversos tipus d'aplicacions.
* Entendre el funcionament basic tècniques de classificació automàtica de dades.
* Capacitat per aplicar les tècniques desenvolupades a classe per tractar computacionalment alguns problemes semàntics i pragmàtics.

* Anotació d'un petit segment de corpus segons criteris semàntiques, com una tasca de classificació que requereix l'enteniment de nocions fonamentals de la semàntica lèxica.
* Comparació qualitativa i quantitativa entre anotacions del mateix text realitzades per diferents anotatodors.
* Us pràctic de una eina informàtica que classifica automàticament els diferents significats de una sèrie de paraules.
* Estudi de gramàtiques computacionals a petita escala que produeixen una anàlisi semàntic i ampliació d'aquestes gramàtiques per cobrir més fenòmens lingüístics. Es tracta de una tasca analítica que  profunditza el coneixement de la teoria de representació del discurs (punt 4 de Continguts) i requereix un enteniment del problemes semàntics subjacents.   
* Classificació de parelles de enunciat segons les relacions discursives que demostren.

Continguts

La Semàntica i Pragmàtica Computacional és una àrea amb importància creixent en el desenvolupament de tecnologies de la informació i la comunicació (TIC), que van més enllà de les aplicacions lingüístiques clàssiques. Per tal de desenvolupar aplicacions per a traducció automàtica o recuperació i extracció d'informació, cal tractar adequadament fenòmens semàntics i pragmàtics com ara l'ambigüitat de sentits o l'expressió dels referents al discurs. No obstant això, moltes de les tècniques de l'estat de l'art actual del camp o bé no són robustes o bé tenen una fiabilitat molt baixa. Aquest curs està dirigit a entendre les principals dificultats d'origen pragmàtic i semàntic a què s'enfronta el tractament computacional del llenguatge i a familiaritzar l'estudiant amb les tècniques principals que s'han desenvolupat, des de l'ús d'eines estadístiques i d'aprenentatge automàtic fins a la programació lògica.

Temes i unitats:

  1. Introducció a la semàntica lèxica computacional./ Introduction to Computational Lexical Semantics.
  2. Càlcul de l'acord entre anotadors. / Inter-annotator agreement.
  3. Aprenentatge automàtic aplicat a la Semàntica Lèxica Computacional:  desambiguació de sentits i etiquetat de rols semantics. / Machine Learning approaches to Computational Lexical Semantics: Word Sense Disambiguation and Semantic Role Labeling.
  4. La teoria de representació del discurs i semàntica dinàmica/Discourse Representation Theory
  5. Algoritmes per a la resolución de pronoms  i la identificació de cadena de referents/ Pronoun resolution algorithms and reference Tracking.
  6. Diàleg i Agents de conversasió./Dialog and Conversational Agents.

Metodologia
docent

  • 1 sessió setmanal de "grup gran" i 1 sessió setmanal de seminari, La participació activa de tots els estudiants és essencial, en tots dos tipus de sessió, però especialment a les sessions de seminari.
  • Lectura setmanal:  Cada setmana hi haurà una lectura obligatòria per fer abans del "grup gran". Les lectures s'assignaran amb antelació i s'especificaran al moodle.
  • Pràctiques/exercicis:  O bé es donarà un petit grup d'exercicis per fer cada setmana, o bé es farà una pràctica en grup que durarà diverses setmanes.

Avaluació

Ordinària

50% de la nota final: Examen de semàntica computacional a mig trimestre.
50% de la nota final: Examen de pragmàtica computacional a final de trimestre.

Els exercicis/pràctiques lliurats cada semana són obligatoris però no contribuiran directament a la nota final, excepte en cas que no s'entreguin, cas en el qual es restaran punts de la nota final. Així mateix, fer-los contribuirà a millorar la nota final en casos limítrofs. També cal tenir en compte que fer les pràctiques ajudarà a preparar-se per la pràctica final i a entendre millor la teoria.

En casos excepcionals, l'avaluació es realitzarà a través d'un treball a concretar entre el docent i l'estudiant.

Extraordinària (setembre)

La avaluació de una de les parts (semàntica computacional o pragmàtica computacional) o les dos es es realitzarà a traves d'un treball a concretar en docent i l'estudiant. Excepcionalment també es pot  realitzar a traves d'un examen.

Fonts
(5 títols de bibliografia recomanada)

Blackburn, Patrick and Johan Bos (1999). Working with Discourse Representation Theory: An Advanced Course in Computational Semantics. Online publication available at: http://homepages.inf.ed.ac.uk/jbos/comsem/book2.html

Bunt, Harry & Bill Black. 2000. "The ABC of Computational Pragmatics". In Bunt & Black. Believe and Context in Dialogue. Amsterdam: Benjamins. 1-46.

Jurafsky, Daniel & James H. Martin. 2008. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Second Edition. New York: Prentice-Hall.

Ian H. Witten, Eibe Frank. 2005. Data Mining: Practical Machine Learning Tools and Techniques (Second Edition). Morgan Kaufmann.

Ruslan Mitkov (ed). 2004. The Oxford Handbook of Computational Linguistics. Oxford: OUP.

La programació de les activitats setmanals es detallarà a l'Aula Global de cada assignatura.