Curs 2007-2008
Enginyeria en Informàtica
 
Processament del Senyal III (12477)
 

Descripció
En aquesta assignatura es presenten els diferents estàndards de compressió d'àudio i vídeo digital. A la primera part (temes 1 a 4) es presenten els conceptes i fonaments matemàtics en què es basen la codificació d'àudio i vídeo. A la segona part es presenten diversos estàndards d'àudio i vídeo (temes 5 a 7). En particular, a la part de codificació d'àudio es presentarà l'estàndard de codificació MPEG-1 Layer I, II i III. Aquest últim es més conegut amb el nom de MP3. A la part de imatge i vídeo es veuran estàndards com el JPEG, MPEG-1 o MPEG-4 ASP, també conegut com DivX. A l'últim tema d'aquesta assignatura (tema 8) es presenta l'estàndard MPEG-4 i MPEG-7, estàndards avançats de codificació i representació de contingut multimèdia.

Objectius
Introduir a l'alumne en els estàndards de compressió d'àudio i vídeo. L'alumne acabarà coneixent els principis matemàtics i algorísmics que hi ha al darrera d'aquests.

Temari

Tema 1. Introducció als sistemes d'àudio i vídeo

1.1. Sistema auditiu humà: resposta temporal
1.2. Sistema visual humà: resposta temporal
1.3. Breu descripció dels sistemes de vídeo analògics
1.4. Àudio i vídeo digital

Tema 2. Anàlisi d'imatges i seqüències de vídeo

2.1. Filtrat lineal d'imatges
2.2. Estimació de moviment
2.3. Aplicacions de l’estimació de moviment

Tema 3. Sistemes de compressió
d'àudio i vídeo

3.1. Esquema general de blocs d'un sistema de compressió
3.2. Escalabilitat
3.3. Mesures de compressió
3.4. Comitès d'estàndards (ISO, ITU) i estàndards d'àudio i vídeo

Tema 4. Sistemes Transformats

4.1. Transformada Discreta Cosinus 1D i 2D
4.2. Aplicació a la codificació

Tema 5. Codificació d'àudio

5.1. Motivació i principis
5.2. Bancs de filtres
5.3. Transformada Discreta Cosinus Modificada
5.4. Estàndard MPEG-1 Layer I, II i III (MP3)

Tema 6. Estàndard JPEG i altres formats d’imatge fixa

6.1. Motivació i principis
6.2. Estàndard JPEG
6.3. Comparació amb altres formats d’imatge (BMP, PNG, GIF)

Tema 7. Sistemes de codificació híbrids de vídeo

7.1. Motivació i principis
7.2. Estàndard H.261
7.3. Estàndard MPEG-1 i 2
7.4. Estàndards H.263, MPEG-4 SP i ASP (DivX), H.264 (MPEG-4 AVC)

Tema 8. Sistemes de codificació i representació basat en el contingut

8.1. Motivació i principis
8.2. Estàndard de codificació MPEG-4
8.3. Estandard representació MPEG-7

Organització
Les sessions teòriques pretenen donar a conèixer als alumnes cadascun dels estàndards i així establir els conceptes matemàtics més importants. Les pràctiques estan pensades per a complementar les pràctiques, i acostumen a tractar algun tema donat a classe de teoría.

Pràctiques
Les sessions de pràctiques previstes es faran amb ordinador. Les pràctiques es realitzaran sota el sistema Linux amb el programari Octave o bé un programari especific per a la tasca prevista.
0. Introducció: Revisió del tipus d'imatges MATLAB. Visualització d'imatges diferència. Imatges RGB i YUV.
1. Filtres lineals: Conceptes bàsics en el filtrat lineal. Estudi de diverses màscares de convolució.
2. Descomposició multiresolució: Eina de descomposició d'imatge útil per l'anàlisi i codificació d'imatge.
3. Estimació de moviment: Estudi de l'estimació de moviment per blocs.
4. DCT: Estudi de les propietats de la transformada DCT amb aplicació al JPEG.
5. Sistema JPEG: Compressió d’imatges JPEG amb diferents factors de compressió. Efecte sobre zones homogènies i texturitzades.
6. MPEG-1: Proves de codificació de seqüències amb diferents bitrates, estructures de GOP. Estudi del factor de compressió associat a les imatges I, P, B.
7. Watermarking: Implementació d'un sistema de watermarking senzill.
8. Segmentació: Estudi i anàlisi d'alguna tècnica de segmentació. Region growing.
9. Bases de dades: exemple de cerca d'imatges basat en el contingut.

Mètode d'avaluació
El mètode d'avaluació d'aquesta assignatura consistirà en un examen (30%), la entrega de les pràctiques realitzades setmanalment (30%) i un treball (40%). La nota de pràctiques estarà ponderada per el nombre de pràctiques a les quals s'assistit presenciament. En el cas de que no es pugui assistir a una pràctica, es podrà entregar amb un màxim de 3 setmanes de retard.

Bibliografia bàsica
A. K. Jain, “Fundamentals of Digital Image Processing”, Prentice Hall.
A. M. Tekalp, “Digital Video Processing”, Prentice Hall.
J. G. Gibson, "Digital Compression for Multimedia: Principles and Standards", Morgan Kaufman.
M. Bosi and R. E. Golberg, "Introduction to Digital Audio Coding and Standards", Kluwer Academic.

Bibliografia complementària
F. Pereira, T. Ebrahimi, "The MPEG-4 book", Prentice Hall.
B. S. Manjunath, P. Salembier, T. Sikora, "Introduction to MPEG-7 content description interface", John Wiley & Sons.
V. Bhaskaran, K. Konstantinides, “Image and Video Compression Standards”, Kluwer Academic Publishers.
L. Torres, E. Lleida, J. R. Casas, “Sistemas analógicos y digitales de televisión”, Edicions UPC.