Descripció
En aquesta assignatura es presenten els diferents
estàndards de compressió d'àudio i vídeo digital. A la primera
part (temes 1 a 4) es presenten els conceptes i fonaments matemàtics
en què es basen la codificació d'àudio i vídeo. A la segona part
es presenten diversos estàndards d'àudio i vídeo (temes 5 a 7).
En particular, a la part de codificació d'àudio es presentarà l'estàndard
de codificació MPEG-1 Layer I, II i III. Aquest últim es més
conegut amb el nom de MP3. A la part de imatge i vídeo es veuran
estàndards com el JPEG, MPEG-1 o MPEG-4 ASP, també conegut com DivX.
A l'últim tema d'aquesta assignatura (tema 8) es presenta l'estàndard
MPEG-4 i MPEG-7, estàndards avançats de codificació i representació
de contingut multimèdia.
Objectius
Introduir a l'alumne en els estàndards
de compressió d'àudio i vídeo. L'alumne acabarà coneixent
els principis matemàtics i algorísmics que hi ha al darrera
d'aquests.
Temari
Tema 1. Introducció als sistemes
d'àudio i vídeo
1.1. Sistema auditiu humà: resposta temporal
1.2. Sistema visual humà: resposta temporal
1.3. Breu descripció dels sistemes de vídeo analògics
1.4. Àudio i vídeo digital
Tema 2. Anàlisi d'imatges i seqüències de vídeo
2.1. Filtrat lineal d'imatges
2.2. Estimació de moviment
2.3. Aplicacions de l’estimació de moviment
Tema 3. Sistemes de compressió d'àudio
i vídeo
3.1. Esquema general de blocs d'un sistema de compressió
3.2. Escalabilitat
3.3. Mesures de compressió
3.4. Comitès d'estàndards (ISO, ITU) i estàndards d'àudio i vídeo
Tema 4. Sistemes Transformats
4.1. Transformada Discreta Cosinus 1D i 2D
4.2. Aplicació a la codificació
Tema 5. Codificació d'àudio
5.1. Motivació i principis
5.2. Bancs de filtres
5.3. Transformada Discreta Cosinus Modificada
5.4. Estàndard MPEG-1 Layer I, II i III (MP3)
Tema 6. Estàndard JPEG i altres formats d’imatge
fixa
6.1. Motivació i principis
6.2. Estàndard JPEG
6.3. Comparació amb altres formats d’imatge (BMP, PNG, GIF)
Tema 7. Sistemes de codificació híbrids de
vídeo
7.1. Motivació i principis
7.2. Estàndard H.261
7.3. Estàndard MPEG-1 i 2
7.4. Estàndards H.263, MPEG-4 SP i ASP (DivX), H.264 (MPEG-4 AVC)
Tema 8. Sistemes de codificació i representació
basat en el contingut
8.1. Motivació i principis
8.2. Estàndard de codificació MPEG-4
8.3. Estandard representació MPEG-7
Organització
Les sessions teòriques pretenen donar a conèixer
als alumnes cadascun dels estàndards i així establir els conceptes
matemàtics més importants. Les pràctiques estan pensades per a complementar
les pràctiques, i acostumen a tractar algun tema donat a classe
de teoría.
Pràctiques
Les sessions de pràctiques previstes es faran
amb ordinador. Les pràctiques es realitzaran sota el sistema Linux
amb el programari Octave o bé un programari especific per
a la tasca prevista.
0. Introducció: Revisió del tipus d'imatges MATLAB. Visualització
d'imatges diferència. Imatges RGB i YUV.
1. Filtres lineals: Conceptes bàsics en el filtrat lineal.
Estudi de diverses màscares de convolució.
2. Descomposició multiresolució: Eina de descomposició d'imatge
útil per l'anàlisi i codificació d'imatge.
3. Estimació de moviment: Estudi de l'estimació de moviment
per blocs.
4. DCT: Estudi de les propietats de la transformada DCT amb
aplicació al JPEG.
5. Sistema JPEG: Compressió d’imatges JPEG amb diferents
factors de compressió. Efecte sobre zones homogènies i texturitzades.
6. MPEG-1: Proves de codificació de seqüències amb diferents
bitrates, estructures de GOP. Estudi del factor de compressió associat
a les imatges I, P, B.
7. Watermarking: Implementació d'un sistema de watermarking
senzill.
8. Segmentació: Estudi i anàlisi d'alguna tècnica de segmentació.
Region growing.
9. Bases de dades: exemple de cerca d'imatges basat en el
contingut.
Mètode d'avaluació
El mètode d'avaluació d'aquesta assignatura
consistirà en un examen (30%), la entrega de les pràctiques realitzades
setmanalment (30%) i un treball (40%). La nota de pràctiques estarà
ponderada per el nombre de pràctiques a les quals s'assistit presenciament.
En el cas de que no es pugui assistir a una pràctica, es podrà entregar
amb un màxim de 3 setmanes de retard.
Bibliografia bàsica
A. K. Jain, “Fundamentals of Digital Image Processing”,
Prentice Hall.
A. M. Tekalp, “Digital Video Processing”, Prentice Hall.
J. G. Gibson, "Digital Compression for Multimedia: Principles and
Standards", Morgan Kaufman.
M. Bosi and R. E. Golberg, "Introduction to Digital Audio Coding
and Standards", Kluwer Academic.
Bibliografia complementària
F. Pereira, T. Ebrahimi, "The MPEG-4 book",
Prentice Hall.
B. S. Manjunath, P. Salembier, T. Sikora, "Introduction to MPEG-7
content description interface", John Wiley & Sons.
V. Bhaskaran, K. Konstantinides, “Image and Video Compression Standards”,
Kluwer Academic Publishers.
L. Torres, E. Lleida, J. R. Casas, “Sistemas analógicos y digitales
de televisión”, Edicions UPC.
|