Curso 2014-15
Procesado de Imágenes
Titulación: | Código: | Tipo: |
Grado en Ingeniería Informática | 21482 | Optativa |
Grado en Ingeniería Telemática | 21763 | Optativa |
Grado en Ingeniería en Sistemas Audiovisuales | 21612 | Obligatoria 3º curso |
Créditos ECTS: | 4 | Dedicación: | 100 horas | Trimestre: | 1º |
Departamento: | Dpto. de Tecnologías de la Información y las Comunicaciones |
Coordinador: | Coloma Ballester |
Profesorado: | Coloma Ballester y Vadim Fedorov |
Idioma: | Inglés |
Horario: | |
Campus: | Campus de la Comunicación - Poblenou |
Procesamiento de Imágenes es una asignatura obligatoria de tercer curso del Grado en Ingeniería de Sistemas Audiovisuales, optativa en el Grado en Ingeniería en Informática y Grado en Ingeniería en Telemática, y está dedicada a una introducción a los fundamentos del procesamiento de imágenes.
El sistema visual humano y la información visual juegan un papel importante en nuestras vidas. Hoy en día, mucha de esta información es representada y procesada digitalmente. El objetivo de la asignatura es la comprensión y el desarrollo de todos los aspectos presentes en un modelo básico de adquisición de imágenes y los procesos que permiten pasar de una imagen analógica a una digital. De forma breve, estos procesos son: las deformaciones provocadas por la óptica, las correcciones de contraste de los sensores, el muestreo espacial (y temporal en el caso de vídeo) de la imagen, la cuantización de sus valores, y la presencia eventual de ruido. En el curso de procesamiento de imágenes estudiamos cada uno de estos procesos y los problemas que plantean de cara a la extracción de información sobre la escena presentes en una imagen. Cubriremos temas como muestreo y cuantización, color, operaciones puntuales, segmentación, procesamiento morfológico de la imagen, filtrado lineal y correlación, transformadas, multiresolución, reducción de ruido, y compresión de imágenes. En el curso se verán e implementarán diferentes aplicaciones que van desde un detector de piel, un detector de caras para el reconocimiento de caras, segmentación de imágenes, eliminación de ruido, por mencionar algunas.
Es altamente recomendable que el alumno parta de un conocimiento básicos en álgebra lineal, cálculo y métodos numéricos, la transformada de Fourier y su significado, conocimiento de los grafos y las estructuras de datos, conocimientos básicos sobre variables aleatorias. Estos conocimientos previos son una herramienta útil para comprender la asignatura. En alguna ocasión se hará un repaso durante el curso. En cualquier caso, es necesario haber cursado las asignaturas: Álgebra Lineal y Matemática Discreta, Cálculo y Métodos Numéricos, Señales y Sistemas y Probabilidad y procesos estocásticos.
La continuación natural de la asignatura Procesamiento de Imágenes es Procesamiento de Video, así como Sistemas de Codificación de Imagen y Vídeo y las asignaturas optativas del Bloque de Imagen y Vídeo.
Competencias transversales | Competencias específicas |
---|---|
Instrumentales G1. Capacidad de análisis y síntesis G2. Capacidad de organización y planificación G3. Capacidad para aplicar los conocimientos al análisis de situaciones y la resolución de problemas G4. Habilidad en la búsqueda y la gestión de la información G5. Habilidad en la toma de decisiones Interpersonales G8. Capacidad de trabajo en equipo Sistémicas G11. Capacidad de aplicar con flexibilidad y creatividad los conocimientos adquiridos y de adaptarse a contextos y situaciones nuevas G12. Capacidad para progresar en los procesos de formación y aprendizaje de manera autónoma y continua |
Competencias Específicas de Formación Básica B7-T. Comprender y utilizar los principios de la probabilidad, los conceptos de variable aleatoria, procesos estocásticos, procesos ergódicos y estacionarios y su aplicación a las telecomunicaciones. Competencias de tecnología específica: Sistemas Audiovisuales AU1. Capacidad de construir, explotar y gestionar servicios y aplicaciones de telecomunicaciones, entendidas éstas como sistemas de captación, tratamiento analógico y digital, codificación, transporte, representación, procesamiento, almacenamiento, reproducción, gestión y presentación de servicios audiovisuales e información multimedia. AU13. Adquirir los conocimientos básicos de funciones cerebrales asociadas a la percepción y cognición visual y auditiva. Estudiar las características fundamentales de la percepción acústica y visual. AU17. Adquirir los conocimientos básicos del procesamiento de imágenes: Adquisición, color, muestreo y cuantización, los métodos basados en transformadas, la morfología matemática. Conocer la teoría de la información y la compresión de imágenes. AU18 . Adquirir los conocimientos básicos sobre el análisis de imágenes. Adquirir los conocimientos básicos sobre la obtención de forma a partir del movimiento, de la visión estereoscópica, de la textura o de la intensidad. AU19. Adquirir los conocimientos sobre la estimación de parámetros de una cámara. Adquirir los conocimientos básicos sobre las relaciones geométricas entre varias vistas de una escena y la geometría de la escena a partir de imágenes. AU26. Conocer los fundamentos prácticos y teóricos de los equipos involucrados en la captura de vídeo, su reproducción así como su uso y aplicación en los sistemas audiovisuales más habituales hoy en día. E1. Adquirir los conocimientos básicos sobre el sistema visual humano. E2. Conocimiento básico de los sistemas de adquisición de imágenes. E3. Lograr una comprensión básica sobre el color y sus representaciones. E4. Alcanzar el conocimiento y comprensión de la transformada rápida de Fourier y su uso en procesamiento de imágenes. E5. Entender el problema del muestreo, herramienta básica para pasar del analógico al digital, así como la geometría del muestreo en dos dimensiones. E6. Adquirir nociones básicas sobre cuantización aplicadas a imágenes: otra herramienta básica para pasar del analógico al digital. E7. Ecualización del histograma de una imagen. Cambios de contraste, modelos de cambios de iluminación global. E8. Morfología matemática: una herramienta para el análisis de formas. E9. Segmentación de imágenes |
Competencias transversales: Aquellas que se requieren en el ejercicio de cualquier titulación o carrera (comunicación verbal y escrita, pensamiento analítico y sistémico, resolución de problemas, creatividad, etc.). Es clasifican en:
• Instrumentales: Incluyen habilidades cognitivas, metodológicas, tecnológicas y lingüísticas. (Ej:
capacidad de organizar y planificar, capacidad de comunicarse con propiedad de forma oral y escrita en
catalán, castellano y/o inglés, tanto ante audiencias expertas como inexpertas).
• Interpersonales: Se definen como habilidades que tienden a facilitar los procesos de interacción social
y cooperación. (Ej: capacidad para trabajar en grupo, expresión del compromiso ético/social).
• Sistémicas o integradoras: Suponen una combinación de comprensión, sensibilidad y conocimiento que permiten ver cómo se agrupan y se establecen relaciones entre las partes de un todo. estas competencias requieren, como base, la adquisición previa de competencias instrumentales y
interpersonales. (Ej: capacidad de adaptarse a nuevos contextos de aprendizaje)
Competencias específicas: Se relacionan con los conocimientos y prácticas concretas del grado. (Ej:
capacidad de describir, programar, validar y optimizar protocolos e interfaces de comunicación en los
diferentes niveles de una arquitectura de redes)
Criterios generales de evaluación
Los mecanismos de evaluación de las competencias serán:
· Pruebas de ejecución (no recuperable): cinco prácticas en los laboratorios de computadoras. La realización de las prácticas en las clases correspondientes es un requisito indispensable para aprobar la asignatura. Es necesario tener aprobadas el 60 por ciento de las prácticas. Las prácticas se entregan individualmente. Se evalúan mediante libremente de informe y código comentado y, eventualmente, una defensa oral individual. Se debe tener al menos una nota de 5 de media y en este caso la nota cuenta un 25% de la nota de la asignatura.
· Productos escritos (no recuperable): haremos una prueba individual o control para hacer un seguimiento de los conceptos explicados en las clases de teoría y las clases de prácticas y ejercicios. Esta prueba individual de seguimiento cuenta un 15%.
· Prueba escrita final individual (recuperable): sobre aspectos teóricos y ejercicios similares a los realizados en los seminarios o explicados en las clases teóricas y seminarios, o relacionados con las prácticas de la asignatura. Para poder realizar la prueba escrita, debe tener al menos un 5 en las pruebas de ejecución. Para aprobar la asignatura, la nota mínima obtenida en esta prueba escrita debe ser de 5. Por otra parte, si el estudiante ha obtenido una calificación mayor que 5 en el control escrito, no será necesario que en la prueba escrita final se examine los contenidos aprobados, y ambas pruebas le contarán un 65 %. En caso contrario, el estudiante deberá examinarse sobre todos los contenidos de la asignatura y entonces esta prueba cuenta un 50%.
· Prueba de validación de ejecución (recuperable): Prueba relacionada con las prácticas. Cuenta un 10%.
A modo de resumen, presentamos la siguiente tabla:
Elementos | Peso | Recuperable | |
---|---|---|---|
Prueba de ejecución |
Prácticas *Condición: mínimo de 60% aprobadas |
25% |
No recuperable |
Productos escritos |
Pruebas individuales de seguimento |
15% |
No recuperable |
Prueba escrita |
Prueba individual escrita * Condición para hacer la prueba: nota >=5 en las pruebas de ejecución * Condición sobre la prueba escrita: mínimo de >=5 |
50% (ver detalles en el texto) |
Recuperable |
Prueba de validación de ejecución |
Prueba relacionada con las pruebas de ejecución |
10% |
Recuperable |
Bloque de contenido 1. Introducción. El sistema visual humano. Algunas leyes perceptuales básicas. Fundamentos de color. Sistemas de representación del color.
Bloque de contenido 2. La transformada de Fourier y sus aplicaciones en el procesamiento de imágenes. El problema del muestreo. Aliasing. Wavelets.
Bloque de contenido 3. Cuantización de imágenes. Ecualización de imágenes. Conceptos de probabilidades aplicados a imágenes.
Bloque de contenido 4. Morfología matemática y los invariantes básicos por cambios de iluminación. Los operadores básicos de la morfología matemática. Filtros básicos. Eliminación de ruido. Análisis básico de formas.
Bloque de contenido 5. Segmentación de imágenes. Introducción al reconocimiento de formas.
Bloque de contenido 6. Introducción a la Compresión de imágenes.
Concreción por competencias:
Competencias a alcanzar en la asignatura | Indicador de logro | Procedimiento de evaluación | Temporalización |
---|---|---|---|
Capacidad de análisis y síntesis (G1). Habilidad en la búsqueda y la gestión de la información (G4). |
Resolución de |
Seminarios, prácticas, sesiones de teoría y pruebas individuales. |
Todo el trimestre. |
Capacidad para aplicar los conocimientos al análisis de situaciones ya la resolución de problemas (G3). Capacidad de organización y planificación (G2). Habilidad en la toma de decisiones (G5). |
Análisis |
Seminarios, |
Todo el trimestre. |
Capacidad de trabajar en equipo (G8). |
Participación |
Prácticas y seminarios. |
Todo el trimestre. |
Capacidad de aplicar con flexibilidad y creatividad los conocimientos adquiridos y de adaptarlos a contextos y situaciones nuevas (G11). | Trabajo en prácticas y seminarios. | Prácticas y seminarios. |
Todo el trimestre. |
Capacidad para progresar en los procesos de formación y aprendizaje de manera autónoma y continua (G12). | Calidad de las memorias de las prácticas (pruebas de ejecución), del resultado de seminarios y revisión del material de teoría. |
Teoria, prácticas y seminarios. |
Todo el trimestre. |
Competencias especificas: E1-E9. Competencias B7-T, AU1, AU13, AU17-19, AU26. |
Realizar correctamente las diferentes pruebas de la asignatura. |
Prácticas/pruebas de ejecución, productos escritos y prueba escrita final |
Todo el trimestre. |
La metodología de esta asignatura combina sesiones presenciales, trabajo individual y trabajo en grupo. Las sesiones presenciales serán tanto sesiones magistrales de explicación del profesor como sesiones de prácticas de laboratorio y sesiones de seminario, con trabajo individual y en grupo realizado por los alumnos. Las sesiones magistrales y de prácticas tendrán una duración de dos horas, mientras que las de seminario de una hora. De forma más detallada, el trabajo dentro y fuera del aula se ha organizado de la forma siguiente:
· Sesiones magistrales o de grupo grande: se trata de nueve sesiones en las que se introducen los conceptos teóricos y se muestran los procedimientos adecuados para la resolución de prácticas y problemas. El profesor explicará los conceptos teóricos básicos y se encargará de proponer y resolver ejemplos de problemas tipo para clarificar la teoría y para que los alumnos tengan una primera aproximación a lo que se encontrarán en la clase de seminarios. El peso de la sesión lo lleva el profesor y se espera de los alumnos que participen realizando preguntas y comentarios.
· Prácticas con ordenador: son 5 sesiones en grupo medio, de dos horas de duración. Previamente los alumnos dispondrán del enunciado y material necesario para preparar la sesión. La dinámica de estas sesiones es la siguiente: En primer lugar, el profesor hace una breve explicación de la práctica a desarrollar y después los alumnos trabajan para la realización de la práctica que entregarán al terminar la clase.
· Sesiones de seminario: son 8 sesiones en grupo pequeño, de una hora o dos de duración. En estas sesiones se resolverán ejercicios prácticos sobre el contenido del temario explicado en las clases de teoría. Previamente los alumnos dispondrán de los enunciados y material necesario para preparar la sesión.
Actividades en el aula | Horas fuera del aula | ||||
---|---|---|---|---|---|
Bloques de contenido | Grupo grande | Grupo mediano | Grup pequeño | ||
Bloc 1 |
4 |
2 |
1 |
11 |
|
Bloc 2 |
4 |
2 |
2 |
10 |
|
Bloc 3 |
3 |
2 |
1 |
10 |
|
Bloc 4 |
4 |
2 |
2 |
11 |
|
Bloc 5 |
2 |
2 |
1 |
8 |
|
Bloc 6 |
1 |
1 |
6 |
||
Prueba final individual |
8 |
||||
Total: |
18 |
10 |
8 |
64 |
Total: 100 |
Bibliografía básica:
· R.C. GONZALEZ and R.E. WOODS, Digital Image Processing, Addison-Wesley, 1992.
· K.R. Castleman, Digital Image Processing, Prentice Hall, 1996
· A. Rosenfeld and A. Kak. Digital Picture Processing, Academic Press, 1992.
· P. SOILLE, Morphological Image Analysis. Principles and Applications, Springer-Verlag
Bibliografía complementaria:
· Jean SIERRA, Image Analysis and Mathematical morphology. Academic Press, 1982
· M. VETTERLI and J. Kovacevic. Wavelets and subbanda coding. Prentice Hall, 1995.
· A. MURAT TEKALP. Digital Video Processing. Prentice hall 1995.
· Stephan Mazo. A wavelet tour to signal Processing. Academic Press 1999.
· Richard Szeliski, Computer Vision. Algorithms and Applications. Springer, 2011, DOI: 10.1007/978-1-84882-935-0 http://szeliski.org/Book/
Recursos didácticos y material docente:
En cada sesión presencial le corresponderá material docente que los profesores pondrán al alcance de los alumnos a través del aula moodle de la asignatura. Este material irá desde apuntes, textos complementarios, artículos, para las sesiones de teoría, hojas de ejercicios para las sesiones de seminario, guía práctica y fuentes de información diferentes para las sesiones de prácticas.