Curs 2008-2009

 

Llicenciatura en Lingüística

13295- Pragmàtica i Semàntica Computacional

 

 

Continguts

  

Aplicacions bàsiques de processament del llenguatge natural que impliquen informació semantica o pragmatica./Basic NLP applications that make use of semantics and/or pragmatics.

Problemes que presenten fenòmens semantics/pragmatics per a aplicacions computacionals./Problems that semantics and pragmatics presents for computational tasks.

Recursos lèxics i ontologies/Lexical resources and ontologies

Corpora: Què cal anotar semànticament, si res?/What to annotate semantically, if anything?

Recuperació d'informació./Information retrieval.

Extracció d'informació: Preguntes i respostes, resums automatics, i la identificació de referents/Information extraction: Question answering, summarizing, and reference tracking

Diàleg i Agents de conversasió./Dialog and Conversational Agents.

 

Curset intensiu / Short course (in English):

Visiting professor: Marco Baroni, U. Trento

Title: Current issues in corpus-based computational lexical semantics

When: 10 hores total, previst per finals de maig o principis de juny/10 hours, tentatively scheduled for the end of May or beginning of June

Description: Corpus-induced Semantic Models (CSMs), such as Latent Semantic Analysis, achieved impressive results in simulating various aspects of human semantic knowledge, such as synonymy detection and free association. After a general introduction to this class of models, I will discuss (and propose partial solutions to) two fundamental challenges that CSMs currently face 1) CSMs provide a single measure of similarity among words, whereas different semantic tasks highlight different facets of semantics ("car" and "truck" are similar in a different way from the one in which "car" and "drive" are similar) and 2) CSMs still fail to account for compositionality (they will typically find the sentences "pandas eat bamboo" and "bamboo eats pandas" equally likely).

 

 

Competències

 

Anàlisi crítica

Escepticisme científic

Classificació d'informació

Anàlisi de situacions i resolució de problemes

Abstracció i generalització; raonament inductiu

Raonament deductiu

Les competències pròpies de la capacitat d'anàlisi, aplicada a la pragmàtica i semàntica computacionals, són, entre altres:

Capacitat per identificar els problemes que planteja els fenòmens semàntics/pragmàtics per diversos tipus d'aplicacions

Capacitat per idear estratègies generals per tractar alguns problemes semàntics i pragmàtics concrets

Capacitat per analitzar lèxics, ontologies, i corpus bàsics i per contribuir a la seva elaboració

Capacitat per aplicar les tècniques desenvolupades a classe a l'anàlisi d'exemples lingüístics concrets

 

 

Bibliografía

 

Aquesta assignatura té un espai al moodle de la Facultat/Departament: http://parles.upf.es/moodle on es trobaran tota la informació i els materials relacionats amb l'assignatura, amb l'única excepció d'algunes lectures.

 

Bibliografia bàsica:

Jurafsky, Daniel & James H. Martin. 2008. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Second Edition. New York: Prentice-Hall.