Curs 2014-15
Aplicacions Intel·ligents per a la Web
Titulació: | Codi: | Tipus: |
Grau en Enginyeria Informàtica | 21449 | Optativa |
Grau en Enginyeria Telemàtica | 22623 | Optativa |
Grau en Enginyeria en Sistemes Audiovisuals | 21635 | Optativa |
Crèdits ECTS: | 4 | Dedicació: | 100 hores | Trimestre: | 1r |
Departament: | Dept. de Tecnologies de la Informació i les Comunicacions |
Coordinador: | Horacio Saggion |
Professorat: | Horacio Saggion, Miguel Ballesteros, Francesco Barbieri |
Idioma: | Castellà i anglès (la majoria dels temes es faràn en castellà a excepció dels que es detallen més avall) Extracció d'informació (en anglès - material i explicació) Resum automàtic (en anglès - material i explicació) Mineria d'opinions (en anglès - material i explicació) |
Horari: | |
Campus: | Campus de la Comunicació - Poblenou |
En aquesta assignatura s'estudiaran tècniques i algoritmes per al desenvolupament d'aplicacions intel·ligents per a la Web.
S'estudiaran algorismes tant supervisats com no supervisats per al tractament de dades de la Web i s'analitzaran els avantatges i desavantatges dels mètodes presentats.
Així mateix s'estudiaran aplicacions com l'extracció d'informació, la mineria de textos i opinions, i el resum automàtic.
També s'inclouran tòpics com el processament d'informació en xarxes socials (Twitter), els repositoris semàntics i el “linked data”.
Es requereix coneixement d'algorismes i estructures de dades i lògica per a computació. Es requereixen coneixements de programació Java per al desenvolupament de les pràctiques y seminaris.
Coneixements de Java, aprenentatge automàtic (desitjable), processament de llenguatge natural (desitjable).
Competències transversals | Competències específiques |
---|---|
Instrumentals G1. Capacitat d'anàlisi i síntesi G2. Capacitat d'organització i G3. Capacitat per aplicar els coneixements a l'anàlisi de situacions i la resolució de problemes G5. Habilitat en la presa de G6. Capacitat de comunicar-se amb propietat de forma oral i Interpersonals G8. Capacitat de treball en equip Sistèmiques G11. Capacitat d'aplicar amb flexibilitat i creativitat els coneixements adquirits i d'adaptar-los a contextos i situacions noves G12. Capacitat per progressar en els processos de formació i G14. Capacitat de motivació per tecnologies G15. Capacitat de generació de noves idees |
Competències Específiques Professionals H1. Capacitat de concebre i dur a terme projectes informàtics utilitzant els Competències Específiques de Formació Bàsica B16-A. Conèixer els fonaments teòrics Competències Específiques d'Enginyeria en Informàtica IN16. Conèixer el funcionament de les IN7. Conèixer les estructures de dades Competències Específiques Comunes a la branca de Telecomunicació T1. Capacitat d'aprendre de manera autònoma nous coneixements i tècniques adequats per a la Competències de tecnologia específica: TE3. Capacitat de construir, explotar i Competències de tecnologia específica: AU15. Adquirir els coneixements bàsics AU36. Dominar els formalismes principals de la representació del contingut en la web i capacitat per implementar fragments del coneixement d'un domini en aquests AU37. Conèixer les tècniques bàsiques AU38. Dominar les tècniques del resum AU39. Domini de les tècniques avançades |
Teòriques:
Treballs teòrics (durant el curs): 20% de la nota final. Aquests treballs teòrics no es recuperen. 80% dels treballs hauran d'estar lliurats.
Pràctiques:
Pràctica 1 (una sessió), 15% de la nota fina .
Pràctica 2 (dues sessions), 25% de la nota final.
Pràctica 3 (dues sessions), 20% de la nota final.
Cal obtenir almenys 40% de la nota en cadascuna de les pràctiques per aprovar el curs.
Al final del curs es realitzarà una entrevista amb el grup de pràctiques per determinar el grau de participació
i coneixements adquirits en el desenvolupament de cada pràctica. Això permetrà avaluar individualment a cada participant iajustar la nota de manera apropiada.
NOTA: En cas que en una i només una de les pràctiques s'obtingui menys d'un 40% de la nota es donarà a l'estudiant la possibilitat d'aixecar la nota durant una sessió pràctica. Les pràctiques no poden recuperar-se en l'anomenat de juliol.
Seminaris:
20% de la nota final. Es realitzaran lliuraments individuals en cada un dels seminaris.
A cada seminari s'haurà d'obtenir almenys un 40% de la nota. Els seminaris no es poden recuperar.
Bloc I: Manipulaciód'informacióen basesde dades textual si la Web.
- Introducció a les aplicacions intel·ligents del web
- Algorismes per a la classificació de textos
- Algorismes d'agrupació ("clustering") de documents
Bloc II: Aplicacions amb informacions textuals.
- Extracció d'informació
- Resum automàtic
- Mineria d'opinions
Bloc III: Tòpics avançats
- Sistemes de recomanacions
- Repositoris semàntics, “linked-data"
- temes d'aprenentatge de màquina.
L'assignatura té classes teòriques, seminaris i laboratoris (pràctiques). Cada classe teòrica està aparellada amb una sessió de seminari o de pràctica.
Els professors presentaran les bases teòriques exposant els continguts preparats a partir de la bibliografia suggerida i d'articles científics pertinents. Els alumnes han de complementar els conceptes impartits amb lectures suggerides pels professors. Durant alguna de les teòriques es lliurarà un exercici de caràcter teòric perquè els estudiants els desenvolupin i lliurin per a la seva avaluació.
L'assignatura té quatre sessions de seminari, on se seguiran tutorials dirigits perquè els estudiants pugui preparar-se per
resoldre la pràctica que es donarà a la setmana següent o bé seminaris on es desenvolupa un
tema vist a la teòrica. A cada seminari es lliurarà el desenvolupament d'una o diverses tasques.
L'assignatura té cinc sessions de pràctiques, en les quals es desenvoluparan 3 pràctiques que es podran fer en grups de dues persones.
Cadascuna d'aquestes tres pràctiques compte en la nota final de l' assignatura. Per a les pràctiques s'utilitzaran eines (software) i dades lliures.
Activitats a l'aula | Activitats fora de l'aula | ||||
---|---|---|---|---|---|
Temes | Grup gran | Grup mitjà | Grup petit | ||
Bloc I |
6 |
0 |
2 |
24 |
|
Bloc II | 8 | 6 | 6 | 30 | |
Bloc III |
4 |
4 |
0 |
24 |
|
Examen |
|
|
|
|
|
Total: |
18 |
10 |
8 |
68 |
Total: 104 |
Bibliografia bàsica :
Manning, C.D. Prabhakar Raghavan, Hinrich Schütze. Introduction to information retrieval. New York: Cambridge University Press, 2008
Haralambos Marmanis and Dmitry Babenko. Algorithms of the intelligent web. Manning Publications, 2009.
Seguessin, programming collective intelligence: building smart web 2.0 applications. O'Reilly, 2007.
Bibliografia complementària
Ethem Alpaydin. 2010. Introduction to Machine Learning . Second Edition . MIT Press .
Baeza- Yates, R. Thier Rierol - Net. Modern information retrieval. Reading, Mass: Addison - Wesley Longman, 1999
Bramer, M. Principles of Data Mining. Springer. 2007.
GATE user guide. Disponible en http://gate.ac.uk/sale/tao/split.html
Grigoris Antoniou and Frank van Harmelen. A Semantic Web primer. The MIT Press, 2008.
Jurafsky, Dan & Martin, James. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition, Upper Saddle River, NJ.: Pearson Prentice Hall, 2009
Mani, Inderjeet. Automatic Summarization. John Benjamins Publishing Company. 2001.
Manning, C.D. Prabhakar Raghavan , Hinrich Schütze . Introduction to information retrieval . New York: Cambridge University Press , 2008
Manning , Christopher D. & Schutze, H. Foundations of statistical natural language processing Cambridge, Mass: MIT Press, 1999
Mitchell, Tom M. Machine learning. New York: McGraw - Hill, 1997.
Mitchell, Tom (2005) Generative and Discriminative Classifiers: Naive Bayes and Logistic Regression. Supplementary chapter for Mitchell, Tom (1997) Machine Learning. McGraw - Hill.
Pang, B. and Lillian Lee. Opinió mining and sentiment analysis. Foundations and Trends in Information Retrieval 2 (1-2), 2008.
Pazienza. MT. Information extraction: a multidisciplinary approach to an emerging information technology. Springer, 1997.
Ian H. Witten, Eibe Frank. Data mining: practical machine learning tools and techniques. Morgan Kaufman, 2005.
Altres recursos
Articles científics seran posats a disposició dels alumnes a través de l'aula global. Software.