2005-2006

Enginyeria en Informàtica (3371)


Processament del Senyal III(12477) 


Descripció

En aquesta assignatura es presenten els diferents estàndards de compressió d'àudio i vídeo digital. A la primera part (temes 1 a 4) es presenten els conceptes i fonaments matemàtics en què es basen la codificació d'àudio i vídeo. A la segona part es presenten diversos estàndards d'àudio i vídeo (temes 5 a 7). En particular, a la part de codificació d'àudio es presentarà l'estàndard de codificació MPEG-1 Layer I, II i III. Aquest últim es més conegut amb el nom de MP3. A la part de imatge i vídeo es veuran estàndards com el JPEG, MPEG-1 o MPEG-4 ASP, també conegut com DivX. A l'últim tema d'aquesta assignatura (tema 8) es presenta l'estàndard MPEG-4 i MPEG-7, estàndards avançats de codificació i representació de contingut multimèdia.

Objectius

Introduir a l'alumne en els estàndards de compressió d'àudio i vídeo. L'alumne acabarà coneixent els principis matemàtics i algorísmics que hi ha al darrera d'aquests.  

Temari

Tema 1. Introducció als sistemes d'àudio i vídeo

1.1. Sistema auditiu humà: resposta temporal
1.2. Sistema visual humà: resposta temporal
1.3. Breu descripció dels sistemes de vídeo analògics
1.4. Àudio i vídeo digital

Tema 2. Anàlisi d'imatges i seqüències de vídeo

2.1. Filtrat lineal d'imatges
2.2. Estimació de moviment
2.3. Aplicacions de l’estimació de moviment

Tema 3. Sistemes de compressió d'àudio i vídeo

3.1. Esquema general de blocs d'un sistema de compressió
3.2. Escalabilitat
3.3. Mesures de compressió
3.4. Comitès d'estàndards (ISO, ITU) i estàndards d'àudio i vídeo

Tema 4. Sistemes Transformats

4.1. Transformada Discreta Cosinus 1D i 2D
4.2. Aplicació a la codificació

Tema 5. Codificació d'àudio

5.1. Motivació i principis
5.2. Bancs de filtres
5.3. Transformada Discreta Cosinus Modificada
5.4. Estàndard MPEG-1 Layer I, II i III (MP3)

Tema 6. Estàndard JPEG i altres formats d’imatge fixa

6.1. Motivació i principis
6.2. Estàndard JPEG
6.3. Comparació amb altres formats d’imatge (BMP, PNG, GIF)

Tema 7. Sistemes de codificació híbrids de vídeo

7.1. Motivació i principis
7.2. Estàndard H.261
7.3. Estàndard MPEG-1 i 2
7.4. Estàndards H.263, MPEG-4 SP i ASP (DivX), H.264 (MPEG-4 AVC)

Tema 8. Sistemes de codificació i representació basat en el contingut

8.1. Motivació i principis
8.2. Estàndard de codificació MPEG-4
8.3. Estandard representació MPEG-7

Organització

Les sessions teòriques pretenen donar a conèixer als alumnes cadascun dels estàndards i així establir els conceptes matemàtics més importants. Les pràctiques estan pensades per a complementar les pràctiques, i acostumen a tractar algun tema donat a classe de teoría.

Pràctiques

Les sessions de pràctiques previstes es faran amb ordinador. Les pràctiques es realitzaran sota el sistema Linux amb el programari Octave o bé un programari especific per a la tasca prevista.

0. Introducció: Revisió del tipus d'imatges MATLAB. Visualització d'imatges diferència. Imatges RGB i YUV.

1. Filtres lineals: Conceptes bàsics en el filtrat lineal. Estudi de diverses màscares de convolució.

2. Descomposició multiresolució: Eina de descomposició d'imatge útil per l'anàlisi i codificació d'imatge.

3. Estimació de moviment: Estudi de l'estimació de moviment per blocs.

4. DCT: Estudi de les propietats de la transformada DCT amb aplicació al JPEG.

5. Sistema JPEG: Compressió d’imatges JPEG amb diferents factors de compressió. Efecte sobre zones homogènies i texturitzades.

6. MPEG-1: Proves de codificació de seqüències amb diferents bitrates, estructures de GOP. Estudi del factor de compressió associat a les imatges I, P, B.

7. Watermarking: Implementació d'un sistema de watermarking senzill.

8. Segmentació: Estudi i anàlisi d'alguna tècnica de segmentació. Region growing.

9. Bases de dades: exemple de cerca d'imatges basat en el contingut.  

Mètode d'avaluació

El mètode d'avaluació d'aquesta assignatura consistirà en un examen (30%), la entrega de les pràctiques realitzades setmanalment (30%) i un treball (40%). La nota de pràctiques estarà ponderada per el nombre de pràctiques a les quals s'assistit presenciament. En el cas de que no es pugui assistir a una pràctica, es podrà entregar amb un màxim de 3 setmanes de retard.  

Bibliografia

Bibliografia bàsica

A. K. Jain, “Fundamentals of Digital Image Processing”, Prentice Hall.

A. M. Tekalp, “Digital Video Processing”, Prentice Hall.

J. G. Gibson, "Digital Compression for Multimedia: Principles and Standards", Morgan Kaufman.

M. Bosi and R. E. Golberg, "Introduction to Digital Audio Coding and Standards", Kluwer Academic.

Bibliografia complementària

F. Pereira, T. Ebrahimi, "The MPEG-4 book", Prentice Hall.

B. S. Manjunath, P. Salembier, T. Sikora, "Introduction to MPEG-7 content description interface", John Wiley & Sons.

V. Bhaskaran, K. Konstantinides, “Image and Video Compression Standards”, Kluwer Academic Publishers.

L. Torres, E. Lleida, J. R. Casas, “Sistemas analógicos y digitales de televisión”, Edicions UPC.

 

Darrera actualització 24-11-2010
© Universitat Pompeu Fabra, Barcelona