Curso 2014-15

Aplicaciones Inteligentes para la Web

Titulación: Código: Tipo:
Grado en Ingeniería Informática 21449 Optativa
Grado en Ingeniería Telemática 22623 Optativa
Grado en Ingeniería en Sistemas Audiovisuales 21635 Optativa

 

Créditos ECTS: 4 Dedicación: 100 horas Trimestre: 1º

 

Departamento: Dpto. de Tecnologías de la Información y las Comunicaciones
Coordinador: Horacio Saggion
Profesorado:

Horacio Saggion, Miguel Ballesteros, Francesco Barbieri

Idioma:

Castellano e inglés (la mayoría de los temas se darán en castellano a excepción de los que se detallan abajo)

Extracción de información (en inglés - material y explicación)

Resumen automático (en inglés - material y explicación)

Minería de opiniones (en inglés - material y explicación)

Horario:
Campus: Campus de la Comunicación - Poblenou

 

Presentación de la assignatura

En esta asignatura se estudiaran técnicas y algoritmos para el desarrollo de aplicaciones inteligentes para la Web. 

Se estudiarán algoritmos tanto supervisados como no supervisados para el tratamiento de datos de la Web y se analizarán las ventajas y  desventajas de los métodos presentados.

Asimismo se estudiarán aplicaciones como la extracción de información, la minería de textos y opiniones, y el resumen automático.

También se incluirán tópicos como el procesamiento de información en redes sociales (Twitter), repositorios semánticos y  “linked data”.

Se requiere conocimiento de algoritmos y estructuras de datos y  lógica para computación.  Se requieren conocimientos de programación Java para el desarrollo de las prácticas y seminarios.

 

Prerequisitos

Conocimientos de Java, aprendizaje automático (deseable), procesamiento de lenguaje natural (deseable).

 

Competencias

Competencias transversalesCompetencias específicas
Instrumentales

G1. Capacidad de análisis y síntesis

G2. Capacidad de organización y  planificación

G3. Capacidad para aplicar los conocimientos al análisis de situaciones y la resolución de problemas

G4. Habilidad en la búsqueda y la gestión
de la información

G5. Habilidad en la toma de decisiones

G6. Capacidad de comunicarse con propiedad de forma oral y
escrita en catalán y en castellano, tanto ante audiencias expertas como
inexpertas.

Interpersonales

G8. Capacidad de trabajo en equipo

Sistémicas

G11. Capacidad de aplicar con flexibilidad y creatividad los conocimientos adquiridos y
de adaptarse a contextos y situaciones nuevas

G12. Capacidad para progresar en los procesos de formación y
aprendizaje de manera
autónoma y continua

G14. Capacidad de motivación para tecnologías la calidad y por el logro

G15. Capacidad de generación de nuevas ideas

Competencias Específicas Profesionales

H1. Capacidad de concebir y llevar a cabo proyectos informáticos utilizando los
principios y metodologías propios de la ingeniería.

Competencias Específicas de Formación Básica

B16-A. Conocer los fundamentos teóricos
de la programación y utilizar de forma práctica los métodos y lenguajes de
programación para el desarrollo
de sistemas software.

Competencias Específicas de Ingeniería en Informática

IN16. Conocer el funcionamiento de las
redes de datos en general y de Internet en particular.

IN7. Conocer las estructuras de datos
básicas y los tipos abstractos de datos,
sus aplicaciones y propiedades, y ser capaz de determinar las más adecuadas para cada situación.

Competencias Específicas Comunes a la rama de Telecomunicación

T1. Capacidad de aprender de manera autónoma nuevos conocimientos y técnicas adecuados para la
concepción, el desarrollo o
la explotación de sistemas y servicios de telecomunicación.

Competencias de tecnología específica:
Ingeniería Telemática

TE3. Capacidad de construir, explotar y
gestionar servicios telemáticos, incluyendo
internet, web, diseño arquitectónico (datos y protocolos), ingeniería y
tecnologías software, etc

Competencias de tecnología específica:
Sistemas Audiovisuales

AU15. Adquirir los conocimientos básicos
sobre el análisis de datos, estudiando las
sus regularidades, técnicas de
predicción y algoritmos de clasificación.

AU36. Dominar los formalismos principales de la representación del contenido en la web y capacidad para implementar fragmentos del conocimiento de un dominio en estos
formalismos.

AU37. Conocer las técnicas básicas
de la minería de datos y textos en la web y capacidad para aplicarlas a problemas concretos.

AU38. Dominar las técnicas del resumen
automático multilingüe de la información
textual en la web en la teoría y en la
práctica.

AU39. Dominio de las técnicas avanzadas
de la búsqueda inteligente de información en la web

 

Evaluación

Teóricas:

Trabajos teóricos (durante el curso): 20% de la nota final. Estos trabajos teóricos no se recuperan. Un 80%  de los trabajos deberán ser entregados.


Prácticas:

 

  Práctica 1 (una sesión), 15% de la nota final.

  Práctica 2 (dos sesiones), 25% de la nota final.

  Práctica 3 (dos sesiones), 20% de la nota final.

En cada una de las prácticas se debe obtener un  40% de la nota total de la práctica.  

Al final del curso se realizará una entrevista con el grupo de prácticas para determinar el grado de participación y conocimientos adquiridos en el desarrollo de cada práctica. Esto nos  permitirá evaluar individualmente a cada participante y ajustar la nota de manera apropiada.

 

NOTA: En caso de que en una y solo una de las prácticas se obtenga menos de un 40% de la nota se dará al estudiante la posibilidad de levantar la nota durante una sesión práctica al final del curso. Las prácticas no pueden recuperarse en el llamado de julio.

 

 

Seminarios:

20% de la nota final. Se realizarán entregas individuales en cada uno de los seminarios. En cada seminario se deberá obtener por lo menos un 40% de la nota.  Los seminarios no pueden recuperarse en julio.

 

Contenidos

Bloque I: Manipulación de información en bases de datos textuales y la Web.

 

Bloque II: Aplicaciones con informaciones textuales.

 

Bloque III:  Tópicos avanzados

 

 

Metodología

La asignatura tiene clases teóricas, seminarios y laboratorios (prácticas). Cada clase teórica está apareada con una sesión de seminario o de práctica.

Los profesores presentarán las bases teóricas exponiendo los contenidos preparados a partir de la bibliografía sugerida y de artículos científicos pertinentes.  Los alumnos deberán complementar los conceptos impartidos con lecturas sugeridas por los profesores. Durante alguna de las teóricas se entregará  una serie de ejercicios de carácter teórico/práctico para que los estudiantes los desarrollen y entreguen para su evaluación.

La asignatura tiene cuatro sesiones de seminario, donde se seguirán tutoriales dirigidos para que los estudiantes pueda preparase para resolver la práctica  que se dará en la semana siguiente o bien seminarios donde se desarrolla un tema visto en la teórica. En cada seminario se entregará el desarrollo de una o varias tareas.

La asignatura tiene cinco sesiones de prácticas, en las cuales se desarrollarán 3 prácticas que se podrán hacer en grupos de dos personas. Cada una de estas tres prácticas cuenta en la nota final de la asignatura. Para las prácticas se utilizarán herramientas (software) y datos libres.

 

 Activitades en el aulaActivitades fuera del aula
TemasGrupo grandeGrupo medianoGrupo pequeño 

Bloque I

6

0

2

24

Bloque II 8 6 6 30

Bloque III

4

4

0

24

Examen 

 

 

 

 

Total:

18

10

8

68

Total:  104

 

Recursos

Bibliografia básica:

Manning,  C.D. Prabhakar Raghavan, Hinrich Schütze. Introduction to information retrieval. New York : Cambridge University Press, 2008

Haralambos Marmanis and Dmitry Babenko. Algorithms of the intelligent web. Manning Publications, 2009.

Segaran, programming collective intelligence : building smart web 2.0 applications. O'Reilly, 2007.

 

Bibliografia complementária

Ethem Alpaydin. 2010. Introduction to Machine Learning. Second Edition. MIT Press.

Baeza-Yates, R. thier Ribeiro-Neto. Modern information retrieval. Reading, Mass. : Addison-Wesley Longman, 1999

Bramer, M. Principles of Data Mining. Springer. 2007.

GATE user guide. Disponible en  http://gate.ac.uk/sale/tao/split.html

Grigoris Antoniou and Frank van Harmelen. A Semantic Web primer. The MIT Press, 2008.

Jurafsky, Dan & Martin, James. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition,  Upper Saddle River, N.J.: Pearson Prentice Hall,  2009

Mani, Inderjeet. Automatic Summarization. John Benjamins Publishing Company. 2001.

Manning,  C.D. Prabhakar Raghavan, Hinrich Schütze. Introduction to information retrieval. New York: Cambridge University Press, 2008

Manning, Christopher D.  & Schutze, H. Foundations of statistical natural language processing Cambridge, Mass.: MIT Press, 1999

Mitchell, Tom M. Machine learning. New York: McGraw-Hill, 1997.

Mitchell, Tom (2005) Generative and Discriminative Classifiers: Naive Bayes and Logistic Regression. Supplementary chapter for Mitchell, Tom (1997) Machine Learning. McGraw-Hill.

Pang, B.  and Lillian Lee. Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval 2(1-2), 2008.

Pazienza. M.T.. Information extraction: a multidisciplinary approach to an emerging information technology. Springer, 1997.

Ian H. Witten, Eibe Frank. Data mining : practical machine learning tools and techniques.  Morgan Kaufman, 2005.

 

Otros recursos

Artículos científicos serán puestos a disposición de los alumnos a través del aula global.