Curso 2013-14
Aplicaciones Inteligentes para la Web
Titulación: | Código: | Tipo: |
Grado en Ingeniería Informática | 21449 | Optativa |
Grado en Ingeniería Telemática | 22623 | Optativa |
Grado en Ingeniería en Sistemas Audiovisuales | 21635 | Optativa |
Créditos ECTS: | 4 | Dedicación: | 100 horas | Trimestre: | 1º |
Departamento: | Dpto. de Tecnologías de la Información y las Comunicaciones |
Coordinador: | Horacio Saggion |
Profesorado: | Horacio Saggion & Miguel Ballesteros |
Idioma: | Castellano e inglés (la mayoría de los temas se darán en castellano a excepción de los que se detallan abajo) Extracción de información (en inglés - material y explicación) Resumen automático (en inglés - material y explicación) Minería de opiniones (en inglés - material y explicación) |
Horario: | |
Campus: | Campus de la Comunicación - Poblenou |
En esta asignatura se estudiaran técnicas y algoritmos para el desarrollo de aplicaciones inteligentes para la Web.
Se estudiarán algoritmos tanto supervisados como no supervisados para el tratamiento de datos de la Web y se analizarán las ventajasy desventajas de los métodos presentados.
Asimismo se estudiarán aplicaciones como la extracción de información, la minería de textos y opiniones, y el resumen automático.
También se incluirán tópicos avanzados como la simplificación de textos para la accesibilidad y los repositórios semánticos.
Se requiere conocimiento de algoritmos y estructuras de datos y lógica para computación. Se requieren conocimientos de programación Java para el desarrollo de las prácticas.
Conocimientos de Java, aprendizaje automático (deseable), procesamiento de lenguaje natural (deseable).
Competencias transversales | Competencias específicas |
---|---|
Instrumentales G1. Capacidad de análisis y síntesis G2. Capacidad de organización y planificación G3. Capacidad para aplicar los conocimientos al análisis de situaciones y la resolución de problemas G4. Habilidad en la búsqueda y la gestión de la información G5. Habilidad en la toma de decisiones G6. Capacidad de comunicarse con propiedad de forma oral y escrita en catalán y en castellano, tanto ante audiencias expertas como inexpertas. Interpersonales G8. Capacidad de trabajo en equipo Sistémicas G11. Capacidad de aplicar con flexibilidad y creatividad los conocimientos adquiridos y de adaptarse a contextos y situaciones nuevas G12. Capacidad para progresar en los procesos de formación y aprendizaje de manera autónoma y continua G14. Capacidad de motivación para tecnologías la calidad y por el logro G15. Capacidad de generación de nuevas ideas |
Competencias Específicas Profesionales AU37. Conocer las técnicas básicas |
Teóricas:
Trabajos teóricos (durante el curso): 15% de la nota final. Estos trabajos teoricos no se recuperan.
Prácticas:
Práctica 1 (una sesión), 15% de la nota final.
Práctica 2 (dos sesiones), 25% de la nota final.
Práctica 3 (dos sesiones), 25% de la nota final.
Hay que obtener por lo menos 40% de la nota en cada una de las prácticas para aprobar el curso.
Al final del curso se realizará una entrevista con el grupo de prácticas para determinal el grado de
participación y conocimientos adquiridos en el desarrollo de cada pràctica.
Esto permitira evaluar individualmente a cada participante y ajustar la nota de manera apropiada.
NOTA: En caso de que en una y solo una de las prácticas se obtenga menos de un 40% de la nota se dará al estudiante la posibilidad de
levantar la nota durante una sesión práctica. Las prácticas no pueden recuperarse en el llamado de julio.
Seminarios:
Presentación de artículos científicos: 20% de la nota final. Los seminarios no se pueden recuperar.
Bloque I: Manipulación de información en bases de datos textuales y la Web.
Bloque II: Aplicaciones con informaciones textuales.
Bloque III: Tópicos avanzados
La asignatura tiene clases teóricas, seminarios y laboratorios (prácticas). Cada clase teórica está apareada con una sesión de seminario o de práctica.
Los profesores presentarán las bases teóricas exponiendo los contenidos preparados a partir de la bibliografía sugerida y de artículos científicos pertinentes. Los alumnos deberán complementar los conceptos impartidos con lecturas sugeridas por los profesores. Durante alguna de las teóricas se entregará un ejercicio de caracter teórico para que los estudiantes los desarrollen y entreguen para su evaluación.
La asignatura tiene cuatro sesiones de seminario, donde se seguirán tutoriales dirigidos para que los estudiantes pueda preparase para resolver la pràctica que se dará en la semana siguiente. Durante una de las sesiones (última sesión de seminarios) los estudiantes presentarán un artículo científico, la presentación será por grupo. Los artículos serán asignados por los profesores a los grupos con antelación.
La asignatura tiene cinco sesiones de prácticas, en las cuales se desarrollarán 3 prácticas que se podrán hacer en grupos de dos personas. Cada una de estas tres prácticas cuenta en la nota final de la asignatura. Para las prácticas se utilizarán herramientas (software) y datos libres.
Activitades en el aula | Activitades fuera del aula | ||||
---|---|---|---|---|---|
Temas | Grupo grande | Grupo mediano | Grupo pequeño | ||
Bloque I |
8 |
6 |
2 |
35 |
|
Bloque II | 6 | 4 | 4 | 28 | |
Bloque III |
4 |
0 |
2 |
20 |
|
Examen |
|
|
|
|
|
Total: |
18 |
10 |
8 |
83 |
Total: 119 |
Bibliografia básica:
Manning, C.D. Prabhakar Raghavan, Hinrich Schütze. Introduction to information retrieval. New York : Cambridge University Press, 2008
Haralambos Marmanis and Dmitry Babenko. Algorithms of the intelligent web. Manning Publications, 2009.
Segaran, programming collective intelligence : building smart web 2.0 applications. O'Reilly, 2007.
Bibliografia complementária
Ethem Alpaydin. 2010. Introduction to Machine Learning. Second Edition. MIT Press.
Baeza-Yates, R. thier Ribeiro-Neto. Modern information retrieval. Reading, Mass. : Addison-Wesley Longman, 1999
Bramer, M. Principles of Data Mining. Springer. 2007.
GATE user guide. Disponible en http://gate.ac.uk/sale/tao/split.html
Grigoris Antoniou and Frank van Harmelen. A Semantic Web primer. The MIT Press, 2008.
Jurafsky, Dan & Martin, James. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition, Upper Saddle River, N.J.: Pearson Prentice Hall, 2009
Mani, Inderjeet. Automatic Summarization. John Benjamins Publishing Company. 2001.
Manning, C.D. Prabhakar Raghavan, Hinrich Schütze. Introduction to information retrieval. New York : Cambridge University Press, 2008
Manning, Christopher D. & Schutze, H. Foundations of statistical natural language processing Cambridge, Mass. : MIT Press, 1999
Mitchell, Tom M. Machine learning. New York : McGraw-Hill, 1997.
Mitchell, Tom (2005) Generative and Discriminative Classifiers: Naive Bayes and Logistic Regression. Supplementary chapter for Mitchell, Tom (1997) Machine Learning. McGraw-Hill.
Pang, B. and Lillian Lee. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval 2(1-2), 2008.
Pazienza. M.T.. Information extraction: a multidisciplinary approach to an emerging information technology. Springer, 1997.
Ian H. Witten, Eibe Frank. Data mining : practical machine learning tools and techniques. Morgan Kaufman, 2005.
Otros recursos
Artículos científicos serán puestos a disposición de los alumnos a través del aula global.