Enginyeria en Informàtica (3371)
Processament del Senyal III(12477)
Descripció
En aquesta assignatura es presenten els diferents estàndards de compressió d'àudio i vídeo digital. A la primera part (temes 1 a 4) es presenten els conceptes i fonaments matemàtics en què es basen la codificació d'àudio i vídeo. A la segona part es presenten diversos estàndards d'àudio i vídeo (temes 5 a 7). En particular, a la part de codificació d'àudio es presentarà l'estàndard de codificació MPEG-1 Layer I, II i III. Aquest últim es més conegut amb el nom de MP3. A la part de imatge i vídeo es veuran estàndards com el JPEG, MPEG-1 o MPEG-4 ASP, també conegut com DivX. A l'últim tema d'aquesta assignatura (tema 8) es presenta l'estàndard MPEG-4 i MPEG-7, estàndards avançats de codificació i representació de contingut multimèdia.
Objectius
Introduir a l'alumne en els estàndards de compressió d'àudio i vídeo. L'alumne acabarà coneixent els principis matemàtics i algorísmics que hi ha al darrera d'aquests.
Temari
Tema 1. Introducció als sistemes d'àudio i vídeo
1.1. Sistema auditiu humà: resposta temporal
1.2. Sistema visual humà: resposta temporal
1.3. Breu descripció dels sistemes de vídeo analògics
1.4. Àudio i vídeo digital
Tema 2. Anàlisi d'imatges i seqüències de vídeo
2.1. Filtrat lineal d'imatges
2.2. Estimació de moviment
2.3. Aplicacions de l’estimació de moviment
Tema 3. Sistemes de compressió d'àudio i vídeo
3.1. Esquema general de blocs d'un sistema de compressió
3.2. Escalabilitat
3.3. Mesures de compressió
3.4. Comitès d'estàndards (ISO, ITU) i estàndards d'àudio i
vídeo
Tema 4. Sistemes Transformats
4.1. Transformada Discreta Cosinus 1D i 2D
4.2. Aplicació a la codificació
Tema 5. Codificació d'àudio
5.1. Motivació i principis
5.2. Bancs de filtres
5.3. Transformada Discreta Cosinus Modificada
5.4. Estàndard MPEG-1 Layer I, II i III (MP3)
Tema 6. Estàndard JPEG i altres formats d’imatge fixa
6.1. Motivació i principis
6.2. Estàndard JPEG
6.3. Comparació amb altres formats d’imatge (BMP, PNG,
GIF)
Tema 7. Sistemes de codificació híbrids de vídeo
7.1. Motivació i principis
7.2. Estàndard H.261
7.3. Estàndard MPEG-1 i 2
7.4. Estàndards H.263, MPEG-4 SP i ASP (DivX), H.264 (MPEG-4
AVC)
Tema 8. Sistemes de codificació i representació basat en el contingut
8.1. Motivació i principis
8.2. Estàndard de codificació MPEG-4
8.3. Estandard representació MPEG-7
Organització
Les sessions teòriques pretenen donar a conèixer als alumnes cadascun dels estàndards i així establir els conceptes matemàtics més importants. Les pràctiques estan pensades per a complementar les pràctiques, i acostumen a tractar algun tema donat a classe de teoría.
Pràctiques
Les sessions de pràctiques previstes es faran amb ordinador. Les
pràctiques es realitzaran sota el sistema Linux amb el programari
Octave o bé un programari especific per a la tasca prevista.
0. Introducció: Revisió del tipus d'imatges
MATLAB. Visualització d'imatges diferència. Imatges RGB i YUV.
1. Filtres lineals: Conceptes bàsics en el filtrat
lineal. Estudi de diverses màscares de convolució.
2. Descomposició multiresolució: Eina de
descomposició d'imatge útil per l'anàlisi i codificació d'imatge.
3. Estimació de moviment: Estudi de l'estimació de
moviment per blocs.
4. DCT: Estudi de les propietats de la
transformada DCT amb aplicació al JPEG.
5. Sistema JPEG: Compressió d’imatges JPEG
amb diferents factors de compressió. Efecte sobre zones homogènies
i texturitzades.
6. MPEG-1: Proves de codificació de seqüències amb
diferents bitrates, estructures de GOP. Estudi del factor de
compressió associat a les imatges I, P, B.
7. Watermarking: Implementació d'un sistema de
watermarking senzill.
8. Segmentació: Estudi i anàlisi d'alguna tècnica
de segmentació. Region growing.
9. Bases de dades: exemple de cerca d'imatges
basat en el contingut.
Mètode d'avaluació
El mètode d'avaluació d'aquesta assignatura consistirà en un examen (30%), la entrega de les pràctiques realitzades setmanalment (30%) i un treball (40%). La nota de pràctiques estarà ponderada per el nombre de pràctiques a les quals s'assistit presenciament. En el cas de que no es pugui assistir a una pràctica, es podrà entregar amb un màxim de 3 setmanes de retard.
Bibliografia
Bibliografia bàsica
A. K. Jain, “Fundamentals of Digital Image
Processing”, Prentice Hall.
A. M. Tekalp, “Digital Video Processing”,
Prentice Hall.
J. G. Gibson, "Digital Compression for Multimedia:
Principles and Standards", Morgan Kaufman.
M. Bosi and R. E. Golberg, "Introduction to Digital Audio
Coding and Standards", Kluwer Academic.
Bibliografia complementària
F. Pereira, T. Ebrahimi, "The MPEG-4 book", Prentice Hall.
B. S. Manjunath, P. Salembier, T. Sikora, "Introduction to
MPEG-7 content description interface", John Wiley & Sons.
V. Bhaskaran, K. Konstantinides, “Image and Video
Compression Standards”, Kluwer Academic Publishers.
L. Torres, E. Lleida, J. R. Casas, “Sistemas
analógicos y digitales de televisión”, Edicions
UPC.