Curs 2010-11

Tecnologies de la Informació (21419)

Titulació/estudi: Grau en Enginyeria en Informàtica
Curs: segon
Trimestre: tercer
Nombre de crèdits ECTS: 4 crèdits
Hores de dedicació de l'estudiant: 100 hores
Llengua o llengües de la docència: castellà
Professor: Ricardo Baeza, David Nettleton, Georgina Rámirez

1. Presentació de l'assignatura

Aquesta assignatura pretén introduir els conceptes bàsics de recuperació de la informació i la seva aplicació a la tecnologia dels cercadors Web. Es donarà èmfasis als models de recuperació i a les tècniques d'avaluació més importants actualment, incloent-hi tècniques de jerarquització de pàgines Web. S'introduirà l'índex de text més utilitzat, l'índex invertit, com construir-lo i com utilitzar-lo. S'estudiarà també com resoldre problemes d'escalabilitat quan el volum de dades i de les consultes augmenta. Per acabar, s'aplicaran aquests conceptes a altres tipus de dades com el text estructurat en XML i multimèdia, a més de la seva aplicació a dominis específics, com bases documentals legals o de salut.

2. Prerequisits per al seguiment de l'itinerari formatiu

És necessari tenir coneixements tant de programació com d'estructures de dades bàsiques. Es recomana conèixer també operacions relacionades amb el processament de cadenes de caràcters (strings), a més de nocions d'XML, algorítmica i aprenentatge automàtic. Es pressuposa a més coneixement avançat en l'ús de cercadors Web.

3. Competències que s'han d'assolir

Competències generals

Competències específiques

Instrumentals

1. Capacitat d'anàlisi i síntesi

2. Resolució de problemes

3. Raonament lògic

4. Gestió de la informació

5. Organització del temps i planificació

 

Sistèmiques

6. Capacitat per aplicar el coneixement teòric a la pràctica

 

1. Coneixement de l'arquitectura de software bàsica d'un sistema de recuperació de la informació

2. Coneixement dels models bàsics de recuperació de la informació

3. Coneixement de les tècniques de processament de text i de la consulta

4. Coneixement de les tècniques d'avaluació de la qualitat i l'eficiència d'un sistema de recuperació de la informació

5. Coneixement de com construir i cercar en un índex invertit

6. Coneixement de com funciona un cercador Web, incloent les tècniques més importants de jerarquització de pàgines Web

7. Identificació dels problemes principals d'escalabilitat d'un cercador Web

8. Coneixement de sistemes de recuperació multimèdia

9. Coneixement de sistemes de recuperació sobre text estructurat

10. Identificació dels elements crucials en diferents aplicacions de les tecnologies de cerca

11. Programació d'un cercador senzill però complet

  

4. Continguts

4.1  Blocs de contingut

1. Conceptes de recuperació de la informació
2. Índexs de cerca en text
3. Cercadors Web
4. Aplicacions de les tecnologies de cerca

4.2  Organització i concreció dels continguts

Bloc de contingut 1. - Conceptes de recuperació de la informació

Conceptes

Procediments

Actituds

1.   Models

2.   Processament del text i la consulta

3.   Avaluació

1. Realització de programes

1. Claredat i pulcritud en la realització de les pràctiques

 

Bloc de contingut 2. - Índexs

Conceptes

Procediments

Actituds

1. Construcció

2. Cerca

1. Realització de programes

1. Claredat i pulcritud en la realització de les pràctiques

 

Bloc de contingut 3. - Cercadors Web

Conceptes

Procediments

Actituds

1. Arquitectura d'un cercador Web

2. Jerarquització de pàgines Web

3. Escalabilitat

1. Realització de programes

2. Ús avanzat de cercadors Web

1. Claredat i pulcritud en la realització de les pràctiques

  

Bloc de contingut 4. - Aplicacions de les tecnologíes de cerca

Conceptes

Procediments

Actituds

1. Multimèdia

2. Text estructurat en XML

3. Dominis específics

1. Resolució de problemes a classe

1. Participació activa en els seminaris

 

5. Avaluació

Per superar l'assignatura cal aprovar l'examen de final de curs i realitzar 5 pràctiques de laboratori. Aquestes pràctiques seran revisades i puntuades pels professors durant les sessions de laboratori, i la puntuació només serà igual o superior a 5 si s'han fet de forma profitosa. Les pràctiques es realitzaran en grups de 3 alumnes.

En el cas que un grup no hagi pogut lliurar alguna de les pràctiques, l'avaluació es realitzarà en una entrevista personal amb el professor de laboratori, que cal concertar en hores de tutoria abans del període d'exàmens del trimestre.

Al final del trimestre es realitzarà un examen que inclourà la matèria corresponent de tot el trimestre, i cal treure un mínim de 4. L'examen de setembre tindrà la mateixa estructura que el de juny.

La nota final de l'assignatura serà la suma d'un 60% de la nota d'examen, un 30% de la nota de pràctiques i un 10% de la nota de seminaris. És imprescindible tenir 4 o més punts a les tres notes parcials per a poder superar l'assignatura, i més de 5 de nota mitjana.

Qualsevol de les notes es pot guardar fins a la convocatòria de setembre. En cap cas d'un curs per a un altre.

 

6. Bibliografia i recursos didàctics

6.1   Fonts d'informació per a l'aprenentatge. Bibliografia bàsica (suport paper i parcialmente digital)

BAEZA-YATES, Ricardo; RIBEIRO-NETO, Berthier: Modern Information Retrieval, segunda edición. Addison-Wesley, 2010. Pàgina Web: www.mir2ed.org.

6.2   Fonts d'informació per a l'aprenentatge. Bibliografia complementària (digital)

MANNING, Chris; RAGHAVAN, Prabhakar; SCHÜTZE, Heinrich: Introduction to Information Retrieval, Cambridge University Press. 2008.          Pàgina Web: www.informationretrieval.org

7. Metodologia

7.1   Enfocament metodològic de l'assignatura

A les sessions de teoria, totes en grup gran, s'introduiran els conceptes teòrics bàsics i es mostraran els procediments adequats per a la resolució dels problemes. A les sessions de seminari es discutiran les aplicacions dels conceptes teòrics introduïts. A les sessions de laboratori es realitzaran pràctiques de programació de diferents elements d'un cercador. L'objectiu és doble: per un cantó han de servir per entendre i consolidar els conceptes teòrics i per l'altre serveixen com a indicadors d'avaluació de l'assoliment de les competències relacionades amb les tecnologies de cerca.

Bloc de continguts

Gran grup

Laboratori

Seminari

Introducció

 

1. Conceptes de recuperació de la informació

 

2. Índexs de cerca en text

 

3. Cercadors Web

 

4. Aplicacions

 

T1

 

T1 T2 T3 T4

 

 

T5 T6

 

T7 T8 T9

 

 

 

 

P2 P4

 

 

P5

 

P1

 

P3

 

 

 

 

 

 

 

S4

 

S1 S2 S3

 

 

 

 

 

 

 

 

 

 

 

 

El treball fora de l'aula consistirà bàsicament en la recerca d'informació complementària, la resolució de problemes proposats, la preparació de les pràctiques i la realització d'estudis previs.

7.2   Organització temporal: sessions, activitats d'aprenentatge i temps estimat de dedicació

Les sessions presencials a l'aula s'organitzen així:

Els lliuraments previstos seran a les sessions de laboratori i a les sessions de seminari.

Les hores estimades de dedicació són:

 

Activitats dins de l'aula

Activitats fora de l'aula

Avaluació

 

Gran grup

Laboratori

Seminari

Preparació de pràctiques

Estudi personal I realització de problemes

Examen

Introducció

1

 

 

 

 

 

1. Conceptes de recuperació de la informació

7

4

 

6

12

 

2. Índexs

4

2

 

4

6

 

3. Cercadors Web

6

2

2

6

12

 

4. Aplicacions

 

2

6

4

8

 

 

 

 

 

 

 

 

Avaluació

 

 

 

 

3

3

Total

18

10

8

20

41

3

                                             Total: 100