Curso 2014-15
Aplicaciones Inteligentes para la Web
Titulación: | Código: | Tipo: |
Grado en IngenierÃa Informática | 21449 | Optativa |
Grado en IngenierÃa Telemática | 22623 | Optativa |
Grado en IngenierÃa en Sistemas Audiovisuales | 21635 | Optativa |
Créditos ECTS: | 4 | Dedicación: | 100 horas | Trimestre: | 1º |
Departamento: | Dpto. de TecnologÃas de la Información y las Comunicaciones |
Coordinador: | Horacio Saggion |
Profesorado: | Horacio Saggion, Miguel Ballesteros, Francesco Barbieri |
Idioma: | Castellano e inglés (la mayoría de los temas se darán en castellano a excepción de los que se detallan abajo) Extracción de información (en inglés - material y explicación) Resumen automático (en inglés - material y explicación) Minería de opiniones (en inglés - material y explicación) |
Horario: | |
Campus: | Campus de la Comunicación - Poblenou |
En esta asignatura se estudiaran técnicas y algoritmos para el desarrollo de aplicaciones inteligentes para la Web.
Se estudiarán algoritmos tanto supervisados como no supervisados para el tratamiento de datos de la Web y se analizarán las ventajas y desventajas de los métodos presentados.
Asimismo se estudiarán aplicaciones como la extracción de información, la minería de textos y opiniones, y el resumen automático.
También se incluirán tópicos como el procesamiento de información en redes sociales (Twitter), repositorios semánticos y “linked data”.
Se requiere conocimiento de algoritmos y estructuras de datos y lógica para computación. Se requieren conocimientos de programación Java para el desarrollo de las prácticas y seminarios.
Conocimientos de Java, aprendizaje automático (deseable), procesamiento de lenguaje natural (deseable).
Competencias transversales | Competencias específicas |
---|---|
Instrumentales G1. Capacidad de análisis y síntesis G2. Capacidad de organización y planificación G3. Capacidad para aplicar los conocimientos al análisis de situaciones y la resolución de problemas G4. Habilidad en la búsqueda y la gestión de la información G5. Habilidad en la toma de decisiones G6. Capacidad de comunicarse con propiedad de forma oral y escrita en catalán y en castellano, tanto ante audiencias expertas como inexpertas. Interpersonales G8. Capacidad de trabajo en equipo Sistémicas G11. Capacidad de aplicar con flexibilidad y creatividad los conocimientos adquiridos y de adaptarse a contextos y situaciones nuevas G12. Capacidad para progresar en los procesos de formación y aprendizaje de manera autónoma y continua G14. Capacidad de motivación para tecnologías la calidad y por el logro G15. Capacidad de generación de nuevas ideas |
Competencias Específicas Profesionales AU37. Conocer las técnicas básicas |
Teóricas:
Trabajos teóricos (durante el curso): 20% de la nota final. Estos trabajos teóricos no se recuperan. Un 80% de los trabajos deberán ser entregados.
Prácticas:
Práctica 1 (una sesión), 15% de la nota final.
Práctica 2 (dos sesiones), 25% de la nota final.
Práctica 3 (dos sesiones), 20% de la nota final.
En cada una de las prácticas se debe obtener un 40% de la nota total de la práctica.
Al final del curso se realizará una entrevista con el grupo de prácticas para determinar el grado de participación y conocimientos adquiridos en el desarrollo de cada práctica. Esto nos permitirá evaluar individualmente a cada participante y ajustar la nota de manera apropiada.
NOTA: En caso de que en una y solo una de las prácticas se obtenga menos de un 40% de la nota se dará al estudiante la posibilidad de levantar la nota durante una sesión práctica al final del curso. Las prácticas no pueden recuperarse en el llamado de julio.
Seminarios:
20% de la nota final. Se realizarán entregas individuales en cada uno de los seminarios. En cada seminario se deberá obtener por lo menos un 40% de la nota. Los seminarios no pueden recuperarse en julio.
Bloque I: Manipulación de información en bases de datos textuales y la Web.
Bloque II: Aplicaciones con informaciones textuales.
Bloque III: Tópicos avanzados
La asignatura tiene clases teóricas, seminarios y laboratorios (prácticas). Cada clase teórica está apareada con una sesión de seminario o de práctica.
Los profesores presentarán las bases teóricas exponiendo los contenidos preparados a partir de la bibliografía sugerida y de artículos científicos pertinentes. Los alumnos deberán complementar los conceptos impartidos con lecturas sugeridas por los profesores. Durante alguna de las teóricas se entregará una serie de ejercicios de carácter teórico/práctico para que los estudiantes los desarrollen y entreguen para su evaluación.
La asignatura tiene cuatro sesiones de seminario, donde se seguirán tutoriales dirigidos para que los estudiantes pueda preparase para resolver la práctica que se dará en la semana siguiente o bien seminarios donde se desarrolla un tema visto en la teórica. En cada seminario se entregará el desarrollo de una o varias tareas.
La asignatura tiene cinco sesiones de prácticas, en las cuales se desarrollarán 3 prácticas que se podrán hacer en grupos de dos personas. Cada una de estas tres prácticas cuenta en la nota final de la asignatura. Para las prácticas se utilizarán herramientas (software) y datos libres.
Activitades en el aula | Activitades fuera del aula | ||||
---|---|---|---|---|---|
Temas | Grupo grande | Grupo mediano | Grupo pequeño | ||
Bloque I |
6 |
0 |
2 |
24 |
|
Bloque II | 8 | 6 | 6 | 30 | |
Bloque III |
4 |
4 |
0 |
24 |
|
Examen |
|
|
|
|
|
Total: |
18 |
10 |
8 |
68 |
Total: 104 |
Bibliografia básica:
Manning, C.D. Prabhakar Raghavan, Hinrich Schütze. Introduction to information retrieval. New York : Cambridge University Press, 2008
Haralambos Marmanis and Dmitry Babenko. Algorithms of the intelligent web. Manning Publications, 2009.
Segaran, programming collective intelligence : building smart web 2.0 applications. O'Reilly, 2007.
Bibliografia complementária
Ethem Alpaydin. 2010. Introduction to Machine Learning. Second Edition. MIT Press.
Baeza-Yates, R. thier Ribeiro-Neto. Modern information retrieval. Reading, Mass. : Addison-Wesley Longman, 1999
Bramer, M. Principles of Data Mining. Springer. 2007.
GATE user guide. Disponible en http://gate.ac.uk/sale/tao/split.html
Grigoris Antoniou and Frank van Harmelen. A Semantic Web primer. The MIT Press, 2008.
Jurafsky, Dan & Martin, James. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition, Upper Saddle River, N.J.: Pearson Prentice Hall, 2009
Mani, Inderjeet. Automatic Summarization. John Benjamins Publishing Company. 2001.
Manning, C.D. Prabhakar Raghavan, Hinrich Schütze. Introduction to information retrieval. New York: Cambridge University Press, 2008
Manning, Christopher D. & Schutze, H. Foundations of statistical natural language processing Cambridge, Mass.: MIT Press, 1999
Mitchell, Tom M. Machine learning. New York: McGraw-Hill, 1997.
Mitchell, Tom (2005) Generative and Discriminative Classifiers: Naive Bayes and Logistic Regression. Supplementary chapter for Mitchell, Tom (1997) Machine Learning. McGraw-Hill.
Pang, B. and Lillian Lee. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval 2(1-2), 2008.
Pazienza. M.T.. Information extraction: a multidisciplinary approach to an emerging information technology. Springer, 1997.
Ian H. Witten, Eibe Frank. Data mining : practical machine learning tools and techniques. Morgan Kaufman, 2005.
Otros recursos
Artículos científicos serán puestos a disposición de los alumnos a través del aula global.