curs 2012-2013
Enginyeria en Informàtica
Processament del Senyal III (12477)
Titulació / estudi: Enginyeria en Informàtica (EI) / Enginyeria Tècnica en Informàtica de Sistemes (ETIS)
Curs: 3er/4rt EI i 2on/3er ETIS
Període: 3r trimestre
Nombre ECTS: 4.40
Nombre total d'hores de dedicació: 110 hores
Llengua de docència: Català
1. Presentació de l'assignatura
L'assignatura de Processament del Senyal III és una assignatura de matemàtiques aplicades dintre dels estudis d'enginyeria informàtica que es poden cursar a la Universitat Pompeu Fabra. Aquesta assignatura es pot cursar tant des de la titulació d'Enginyeria en Informàtica (EI) com des de l'Enginyeria Tècnica en Informàtica de Sistemes (ETIS).
En concret, l'assignatura està centrada al voltant de les eines matemàtiques implicades en el procés de compressió d'imatge i vídeo. Tot i ésser una assignatura introductòria en aquest aspecte, permet assolir a l'alumne un grau de competència prou alt en aquest àmbit ja que els temes clau es treballen amb profunditat gràcies tant a les classes magistrals com al treball que haurà de fer l'alumne a classe de pràctiques i seminaris, essent l'enfocament centrat en la part pràctica.
Aquest curs cobreix els principals estàndards internacionals de compressió d'imatge i vídeo digital. A la primera part, es cobreixen els conceptes i fonaments matemàtics en el que els codificadors actuals es basen per comprimir la informació. A la segona part es presentaran els principals estàndards internacionals de compressió d'imatge i vídeo existents avui en dia, centrant-se en el JPEG, JPEG2000, H.261 i MPEG-1.
2. Prerequisits per al seguiment de l'itinerari formatiu
Per poder cursar aquest curs es necessari tenir coneixements de càlcul i anàlisi, en particular d'Anàlisi Matemàtica II (sèries i transformada de Fourier), així com l'assignatura de Processament del Senyal II.
3. Competències a assolir en l'assignatura
Competències generals
Instrumentals
1. Capacitat de comprendre i analitzar conceptes i fórmules matemàtiques.
2. Capacitat d'identificar la metodologia adequada per analitzar un problema i trobar-ne la solució.
3. Habilitat per expressar idees i conceptes matemàtics oralment de forma precisa i estructurada.
4. Habilitat per expressar idees i conceptes matemàtics escrita de forma precisa i estructurada.
Interpersonals
5. Capacitat de treball en equip.
Sistèmiques
6. Capacitat per interpretar resultats i extreure'n conclusions.
7. Capacitat per expressar amb un programa un algorisme o fórmula matemàtica.
Competències específiques
1. Entendre l'esquema i els principis bàsics de qualsevol codificador d'imatge o vídeo (inclús d'àudio).
2. Conèixer els comitès implicats en l'estandardització de codificadors d'imatge i vídeo, així com l'evolució històrica d'aquests i l'àmbit d'aplicació de cadascun.
3. Adquirir les nocions de les respostes espacials i temporals del sistema visual humà en que es basen els codificadors.
4. Familiaritzar-se amb els conceptes bàsics involucrats en qualsevol sistema de compressió d'imatge i vídeo com són les mesures de compressió per comparar aquests tipus de sistemes, l'escalabilitat, la redundància espacial i temporal, així com la quantització.
5. Adquirir els coneixements matemàtics que estan involucrats en la codificació de la imatge i vídeo com són el filtrat lineal, els sistemes transformats (transformada discreta cosinus i descomposició subbanda), i estimació de moviment per blocs.
6. Conèixer amb cert detall els estàndards JPEG, JPEG2000, H.261, i MPEG-1.
7. Comprendre els principis bàsics en els que estan basats altres estàndards com el DivX, l'H.264, l'MPEG-4 o MPEG-7.
4. Objectius d'aprenentatge
Tal i com s'ha comentat a la secció anterior, es vol que l'alumne adquireixi un conjunt de competències i capacitats que li permetin desenvolupar-se de forma satisfactòria en el món dels codificadors d'imatge i vídeo. En particular, l'objectiu és que l'alumne adquireixi els coneixements teòrics bàsics implicats en els codificadors estàndards d'imatge i vídeo, així com entendre com els codificadors fan servir aquestes eines matemàtiques per poder comprimir la informació. Per això, a la primera part de l'assignatura s'incideix a les eines matemàtiques (competències específiques 1 a 5) mentre que a la segona s'incideix en els estàndards (competències 6 i 7). En aquesta assignatura s'ha decidit incidir només en els estàndards més bàsics de codificació d'imatge i vídeo, ja que altres estàndards més complexes com DivX i H.264 són ampliacions millorades dels anteriors i es basen doncs en els mateixos principis matemàtics.
5. Avaluació
5.1. Criteris generals d'avaluació
Durant el transcurs del trimestre es farà una avaluació continuada a partir de dues activitats d'aprenentatge. Es pretén amb això ajudar a la verificació de l'adquisició per part de l'estudiant de les diferents competències esmentades a la secció 4.
Aquests mecanismes d'avaluació són:
• Pràctiques: durant el curs es realitzaran un total de cinc pràctiques d'ordinadors que s'hauran de realitzar presencialment i en grups de dues persones. A l'inici de cada sessió de pràctiques, l'alumne rebrà un document en el que es proposen diferents experiments a realitzar durant aquesta. Aquests experiments estan estretament relacionats amb el que s'ha impartit a classe de teoria. El document es molt guiat, és a dir, no requereix a l'alumne de programar sinó només de realitzar els experiments proposats. Sí que es demana a l'alumnat de ser capaç d'interpretar els resultats que s'obtenen en cadascun dels experiments realitzats.
Cada pràctica s'avalua tant presencialment (amb la capacitat i els coneixements que els alumnes mostren per desenvolupar la pràctica) com amb el document que s'ha d'entregar per cadascuna d'aquestes.
• Seminaris: durant el curs es realitzaran un total de cinc seminaris que es realitzaran amb ordinadors i que es faran presencialment en grups de dues persones, que tindran com objectiu el desenvolupament d'un simulador de codificador JPEG2000. A cada sessió de seminari s'entregarà un document en el que s'especifica el que els alumnes han de fer durant la setmana.
Els seminaris s'avaluen tant presencialment (amb la capacitat i els coneixements que els alumnes mostren per desenvolupar el projecte proposat) com amb dos lliurables que s'hauran de lliurar al llarg del curs. El pes de cadascun d'aquests a la nota final de seminaris és de 30% i 70% respectivament.
En cas que l'alumne s'assisteixi presencialment a un mínim de 4 sessions de pràctiques i 4 de seminaris, es considera que l'alumne serà avaluat segons l'itinerari A. En cas contrari serà avaluat segon l'itinerari B. Els detalls de cadascun s'expliquen a continuació:
• Itinerari A: En cas que tant la nota de pràctiques com la de seminaris sigui superior o igual a 7, l'alumne queda exempt de fer l'examen final de l'assignatura, i la nota final de l'assignatura es calcula com la mitja entre les dues notes (50% cada nota). En cas contrari, l'alumne haurà de realitzar un examen final, i la ponderació de les notes serà la següent: 35% pràctiques, 35% seminaris, i 30% l'examen final.
• Itinerari B: Per aquest segon itinerari l'alumne haurà de fer també un examen final (que serà el mateix que per l'itinerari A), i la ponderació de les notes obtingudes serà: 30% pràctiques, 30% seminaris i 40% de l'examen final. Caldrà obtenir una nota superior a 4 a l'examen final per poder aprovar l'assignatura.
NOTA: La nota final quedarà multiplicada per 0,8 si les pràctiques o els seminaris es realitzen sols, es a dir, sense realitzar-lo en equip.
5.2. Concreció per competències
Competències a assolir en l'assignatura, Indicador d'assoliment i Procediment d'avaluació
1. Capacitat de comprendre i analitzar conceptes i fórmules matemàtiques.
- Respondre de forma adequada a les preguntes del professor, documents (lliurables) entregats.
- Respondre de forma clara a les preguntes de professor, documents (lliurables) entregats.
2. Capacitat d'identificar la metodologia adequada per analitzar un problema i trobarne la solució.
- Respondre de forma adequada a les preguntes del professor, documents (lliurables) entregats.
- Respondre de forma clara a les preguntes de professor, documents (lliurables) entregats.
3. Habilitat per expressar idees i conceptes matemàtics oralment de forma precisa i estructurada.
- L'alumne ha de ser capaç de respondre de forma ordenada i clara a una qüestió.
- Respondre de forma clara a les preguntes del professor ja sigui a classe de teoria, pràctiques o seminaris.
4. Habilitat per expressar idees i conceptes matemàtics escrita de forma precisa i estructurada.
- La documentació entregada no ha de ser ambigua, i ha d'estar ben estructurada, clara i precisa.
- Documents (lliurables) entregats.
5. Capacitat de treball en equip. Treball en grup realitzat durant les sessions de seminaris i pràctiques.
- La nota final quedarà multiplicada per 0,8 en cas que que els lliurables siguin entregats de forma individual, i per 1,0 en cas contrari.
6. Capacitat per interpretar resultats i extreure'n conclusions.
- Treball en equip realitzat durant a les sessions de pràctiques i de seminaris.
- Respondre de forma clara a les preguntes de professor, documents (lliurables) entregats.
7. Capacitat per expressar amb un programa un algorisme o fórmula matemàtica.
- El programa desenvolupat a les sessions de seminaris ha de reflectir de forma clara i precisa l'expressió matemàtica donada a classe.
- Programa entregat
8. Competències específiques.
- Examen final, respondre de forma clara a les preguntes del professor, documents (lliurables) entregats.
6. Continguts
6.1. Blocs de contingut
Bloc de contingut 1. Introducció i Conceptes bàsics
Conceptes:
1. Esquema general d'un sistema de codificació d'imatge i vídeo.
2. Mesures de compressió, quantització, escalabilitat, redundància espacial i temporal, resposta espacial i temporal del sistema visual humà.
3. Comitès internacionals d'estandardització per codificació d'imatges i vídeo.
Procediments:
1. Classes teòriques.
2. Classes de pràctiques.
Actituds:
1. Ser capaç d'analitzar els experiments a realitzar durant les pràctiques i respondre a de forma precisa a les preguntes del professor (oral i escrita).
Bloc de contingut 2. Eines matemàtiques.
Conceptes:
1. Filtrat lineal en 2D.
2. Transformada discreta cosinus.
3. Descomposició subbanda.
4. Estimació de moviment per blocs.
Procediments:
1. Classes teòriques.
2. Classes pràctiques.
3. Classes de seminaris.
Actituds:
1. Ser capaç d'analitzar els experiments a realitzar durant les pràctiques i respondre a de forma precisa a les preguntes del professor (oral i escrita).
2. Ser capaç de programar alguna de les eines impartides.
Bloc de contingut 3. Estàndards internacionals de codificació.
Conceptes:
1. Estàndards de compressió d'imatge fixa JPEG i JPEG2000.
2. Estàndards de compressió de vídeo H.261 i MPEG-1.
3. Altres estàndards.
Procediments:
1. Classes teòriques.
2. Classes pràctiques.
3. Classes de seminaris.
Actituds:
1. Ser capaç d'analitzar els experiments a realitzar durant les pràctiques i respondre a de forma precisa a les preguntes del professor (oral i escrita).
2. Ser capaç de comparar els diferents estàndards entre sí mitjançant experimentació i simulació amb ordinador.
7. Metodologia
Enfocament metodològic de l'assignatura
El curs de Processament del Senyal III, al curs 2008-09, disposa només d'un grup de teoria. Aquest grup de teoria és el mateix a les sessions de pràctiques com les de seminari. El fet de diferenciar entre tres tipus de sessions ens permetrà potenciar i avaluar les diverses competències que pretenem que l'estudiant assoleixi al llarg del procés d'aprenentatge de l'assignatura. En això cal emfatitzar el fet que les sessions de seminaris afavoreixen fortament l'assoliment de competències transversals.
• Sessions plenàries (o de teoria)
Es tracta d'una activitat bàsica i presencial requerida a l'alumne per assolir les competències i capacitats previstes. Durant tot el trimstre es realitzaran deu sessions de dues hores de duració. El pes de la sessió el porta el professor que es dedicarà a explicar en pissarra i mitjançant projeccio - ja sigui amb diapositives o programari específica - els conceptes teòrics de l'assignatura per poder-los aplicar desprès a les sessions de pràctiques i de seminaris.
? Sessió 1. Sistemes de compressió de d'imatge i vídeo. Esquema general de blocs d'un sistema de compressió. Redundància espacial i temporal. Mesures de compressio i concepte d'escalabilitat
? Sessio 2. Comités estandaritzadors i història dels estàndards d'imatge i vídeo. Àmbit d'aplicació de cadascun dels estàndards. Resposta del sistema visual humà.
? Sessio 3. Filtrat linial d'imatges. Sistemes linials i invariants en dues dimensions, Convolució en dues dimensions, Filtrat en freqüència.
? Sessió 4. Transformada Discreta Cosinus. Propietats i aplicacions en la codificació d'imatge.
? Sessió 5. Descomposició subbanda d'una imatge. Propetats i aplicacions a la codificació d'imatge.
? Sessio 6. Estimació de moviment per blocs. Principis bàsics, algorismes i aplicacions a la codificació de vídeo.
? Sessió 7. Tècniques de control de flux/distorsió. Principis bàsics, eines matemàtiques i aplicacions a la codificació d'imatge i vídeo.
? Sessio 8. Codificador JPEG i JPEG2000. Motivació i principis. Estàndard JPEG i JPEG2000.
? Sessió 9. Codificador H.261. Sistemes de codificació de vídeo híbrids de vídeo. Principis bàsics de funcionament d'un codificador H.261.
? Sessió 10. Codificador MPEG-1. Principis bàsics de funcionament. Altres estàndards: MPEG-2, DivX, H.264.
• Sessions de pràctiques
Les sessions pràctiques són una activitat tant presencial com no presencial (amb un pes més gran a la part presencial). L'objectiu d'aquestes sessions pràctiques de la de reforçar els coneixements adquirits durant les sessions plenàries i, a la vegada, adquirir algunes de les competències i capacitats requerides per aquest curs. En total hi han cinc sessions pràctiques. El funcionament d'aquetes és el següent: al principi de la sessió, el professor entrega a cada grup (format per dos alumnes) una guia dels experiments que aquests han de realitzar amb l'ordinador durant la sessió. El professor ajudarà als alumnes a realitzar i interpretar de forma correcta els experiments proposats. A la guia s'inclouen un conjunt de preguntes i experiments adicionals que els alumnes hauran de respondre de forma escrita i entregar al professor al cap de com a màxim una setmana. Es proposen les següents sessions pràctiques:
? Pràctica 1: Experiments sobre mesures de compressió, quantització i escalabilitat.
? Pràctica 2: Experiments sobre la Transformada Discreta Cosinus amb i sense quantització, amb aplicació a la codificació d'imatge.
? Pràctica 3. Experiments de l'estimació de moviment per blocs, amb aplicació a la codificació de vídeo.
? Pràctica 4. Experimentació amb l'estàndard de codificació JPEG, amb un programari especialitzat.
? Pràctica 5. Experimentació amb l'estàndard de codificació MPEG-1, amb un programari especialitzat.
• Sessions de seminaris.
Aquestes sessions tenen una component més gran no presencial que presencial (mentre que a les sessions pràctiques és més gran la component presencial). Mitjançant aquestes sessions es pretèn reforçar i a la vegada aprofundir en els conceptes impartits a les sessions plenàries. Per fer això el model docent utilitzat en aquestes sessions es diferent de l'utilitzat a les sessions pràctiques. En particular, l'objectiu es desenvolupar, al llarg de les cinc sessions de seminaris que hi han en aquest curs, un miniprojecte d'un dels temes clau d'aquest curs. En aquest curs 2008-09 s'ha escollit que els alumnes implementin un simulador de codificador JPEG2000. Es demana doncs a l'alumne implementar les eines matemàtiques associades així com ser capaç de fer una comparació objectiva entre diferents mètodes existents. Per assolir això s'entregarà a l'inici de cada sessió una guia que l'alumne haurà de seguir per assolir els objectius i les competències previstes. En particular, es proposen les següents sessions de seminaris:
? Sessió 1. Introducció al projecte. Els alumnes s'han de familiaritzar amb l'entorn de programació. Implementació de la lectura i escriptura d'imatges en disc fent servir llibreries gràfiques conegudes.
? Sessió 2. Implementació de l'operació de filtrat linial per imatges. Experimentació amb diversos tipus de filtres lineals sobre les imatges per veure'n els efectes resultants.
? Sessió 3. Implementació de la descomposició subbanda d'una imatge. Reconstrucció de la imatge original a partir de la descomposició. Experimentació i primeres conclusions.
? Sessió 4. Implementació de la quantització dels coeficients de la desomposició subbanda i d'una tècnica senzilla de control de flux/distorsió. Efecte sobre la recontrucció de la imatge original.
? Sessió 5. Proves i conclusions finals. Comparació amb una implementació senzilla del codificador JPEG.
8. Fonts d'informació i recursos didàctics
8.1. Fonts d'informació per a l'aprenentatge. Bibliografia bàsica (suport paper i electrònic)
• L. Garrido, "Apunts de Processament del Senyal III", disponible al Moodle.
[Conté un resum general de tots els temes coberts a l'assignatura]
• A. K. Jain, "Fundamentals of Digital Image Processing", Prentice Hall.
[Conté la teoria associada a tractament d'imatge fix, en particular, el filtrat lineal i la transformada discreta cosinus]
• A.M. Tekalp, "Digital Video Processing", Prentice Hall.
[S'hi inclou la teoria de tractament de vídeo, en particular, l'estimació de moviment per blocs]
• Shi, Y., "Image and Video Compression for Multimedia Engineering: fundamentals, algorithms and standards", CRC Press.
[Aquest llibre inclou molta informació sobre els diversos estàndards de codificació d'imatge i vídeo]
• Taubman, D.S., "JPEG2000: Image Compression, Fundamentals, Standards and Practice", KAP.
8.2. Fonts d'informació per a l'aprenentatge. Bibliografia complementària (suport paper i electrònic)
• J.G. Gibson, "Digital Compression for Multimedia: Principles and Standards", Kluwer Academic Publishers.
[Una introducció sobre diversos estàndards de codificació d'imatge, vídeo i àudio]
• F. Pereira, "The MPEG-4 Book", Prentice Hall
[Un llibre molt complet sobre l'estàndard MPEG-4]
• B.S. Manjunath, "Introduction to MPEG-7 content description interface", John Wiley & Sons.
[La referència de l'estàndard MPEG-7]
• Pàgina web oficial d'MPEG: http://www.mpeg.org
• Pàgina web oficial de JPEG: http://www.jpeg.org