Enginyeria en Informàtica (3371)
Tecnologies de la Informació(12459)
Objectius
Introducció als alumnes al coneixement de les diferències entre el model relacional, (o bases de dades transaccionals clàssiques) i les bases de dades documentals (i multimèdia en general). Comprensió del problema de classificació de documents i recerca aproximada per continguts. Estudi de les estructures de dades que permeten l'emmagatzematge i la recuperació de la informació.
Tema 1: Introducció (2h)
Recuperació de la informació versus Recuperació de dades.
Esquema general
Tema 2: Mètodes de recerca (4h)
Booleana
Vectors
Probabilístic
Tema 3: Avaluació del resultat
Tema 4: Refinament de les consultes
Realimentació a partir de les operacions de l'usuari
Anàlisi local automàtic
Anàlisi global automàtic
Tema 5: Processament del text
Estudi sintàctic
Paraules no rellevants
Diferents formes d'una mateixa paraula
Compressió
Tema 6: Índex i mètodes de recerca (4h)
Fitxers invertits
Arbres de sufixos
Tema 7: Llenguatges de consulta
Organització
A les sessions teòriques s'imparteix la teoria que cal aplicar per resoldre el projecte software que cal construir durant les sessions pràctiques.
Aplicacions
Biblioteques digitals Buscadors i metabuscadors WebTema 7: Indexació i recerca de documents multimèdia
Sistema d'avaluació
A través de les pràctiques i d'un examen.
Pràctiques
Les pràctiques, tenen tres apartats: Classificació de documents, emmagatzematge i recuperació de la informació
Bibliografia
Bibliografia bàsica:
RICARDO BAEZA-YATES, BERTHIER RIBEIRO-NIETO: Modern
Infomation Retrieval, Adisson Wesley 1999.
Bibliografia complementària:
MARK T. MAYBURY: Intelligent Multimedia Information
Retrieval, The MIT Press. 1997 ISBN 0-262-63179-2. INFORMATION
RETRIEVAL
C. J. van
RIJSBERGEN disponible en
http://www.dcs.gla.ac.uk/Keith/Preface.html
Managing Gigabytes. Ian H. Witten, Alistair Moffat, Timothy C.
Bell. Morgan Kaufmann Publishers. 1999 isbn 1-55860-570-3