Ir a cuerpo Ir a Estudios, Gobernanza y organización
Logo UA
Realizar búsqueda
Guías docentes
 

38610 - EL INGLÉS Y EL ESPAÑOL EN LA LINGÜÍSTICA COMPUTACIONAL (2017-18)

Datos generales  

Código: 38610
Profesor/a responsable:
LLORET PASTOR, ELENA
Crdts. ECTS: 6,00
Créditos teóricos: 0,00
Créditos prácticos: 2,40
Carga no presencial: 3,60

Departamentos con docencia

Estudios en los que se imparte



Competencias y objetivos

Contexto de la asignatura para el curso 2017-18

La lingüística computacional es un área de investigación de la inteligencia artificial cuyo objetivo es modelar automáticamente la capacidad de comunicación lingüística del ser humano, es decir la lengua mediante la que nos comunicamos. Se trata por tanto, de un campo interdisciplinar, en el que participan lingüistas, informáticos, y matemáticos, entre otros, pero también son necesarios expertos en un dominio concreto, como por ejemplo, médicos, psicólogos, juristas, etc. para poder modelar de manera precisa las características específicas de un contexto especializado.

Esta asignatura se plantea como una introducción general a los aspectos básicos de la Lingüística Computacional. En ella, se estudiarán sus fundamentos, así como conceptos relacionados con la lingüística de corpus; recursos y herramientas para el modelado computacional de una lengua y realización de forma automática de diferentes tipos de análisis lingüístico sobre un texto (léxico, sintáctico y semántico). Además, se explicarán aplicaciones prácticas. En concreto la traducción automática, con una gran relevancia en la sociedad actual, ya no sólo debido a la gran cantidad de información existente, sino a que esta está presente en un gran número de idiomas.

La demanda de lingüistas computacionales ha aumentado en los últimos años. Con el aumento y disponibilidad de información no estructurada y en distintos idiomas, las empresas están buscando formas de procesar y comprender mejor dicha información. Empresas de gran prestigio internacional como Facebook, Yahoo, Google, Microsoft o IBM, por nombrar algunas de ellas, tienen departamentos especializados en Lingüística Computacional, donde expertos en esta materia con distintos perfiles crean y desarrollan nuevos recursos con el objetivo de mejorar la capacidad de comprensión y generación de un idioma de forma automática.

 

 

Competencias de la asignatura (verificadas por ANECA en grados y másteres oficiales)

Competencias específicas (CE)

  • CE1 : Conocer la terminología informática en aplicaciones y entornos específicos aplicados a los lenguajes de especialidad.
  • CE10 : Utilizar las perspectivas, los modelos, y las técnicas de análisis que son esenciales para la construcción del marco teórico de la Lingüística de la Computación.
  • CE11 : Utilizar las perspectivas, las teorías, y las técnicas de análisis que son esenciales para la construcción del marco teórico de la Lingüística Forense.
  • CE12 : Utilizar los programas y las herramientas informáticas específicas para el análisis de textos y la investigación en Lingüística de la Computación.
  • CE13 : Utilizar los programas y las herramientas informáticas específicas para el análisis de textos y la investigación en Lingüística Forense.
  • CE14 : Ser capaz de desentrañar los principales problemas del procesamiento lingüístico: la ambigüedad, las divergencias lingüísticas entre las lenguas, la generación de textos naturales o genuinos, o la necesidad de codificar y gestionar grandes cantidades de información para construir los procesadores.
  • CE15 : Ser capaz de sintetizar las fases de análisis de un sistema de tratamiento del lenguaje humano (morfoléxica, sintáctico-semántica y pragmática), los principales problemas, así como los principales métodos aplicados, y las herramientas desarrolladas para el IFE y el EFE.
  • CE18 : Ser capaz de controlar las sutilezas idiosincrásicas y las diferencias de orden cultural y social que son imprescindibles para la comunicación interpersonal en el ámbito académico y profesional (valores culturales, normas de cortesía, comunicación no verbal, etc.).
  • CE19 : Ser capaz de utilizar las técnicas comunicativas y discursivas comunes a la mayor parte de los discursos de especialidad, que sirven para conseguir los diferentes propósitos comunicativos (técnicas de argumentación, exposición, descripción, narración, explicación, etc.).
  • CE2 : Aplicar las teorías, los modelos, y las herramientas lingüísticas que son relevantes para el estudio e investigación del IFE.
  • CE21 : Ser capaz de analizar los discursos construidos mediante las lenguas de especialidad, en inglés y español, y establecer sus cualidades y carencias según los parámetros estudiados desde diferentes perspectivas lingüísticas.
  • CE23 : Ser capaz de identificar los rasgos determinativos de la voz de textos orales en inglés y en español.
  • CE24 : Ser capaz de redactar un informe y un dictamen pericial lingüístico.
  • CE25 : Ser capaz de utilizar los recursos existentes para la obtención, el manejo, la interpretación, la gestión, y la transmisión de información: bases de datos, corpus escritos y orales, Internet y las NTICS.
  • CE26 : Ser capaz de elaborar, gestionar, y controlar la calidad de las aplicaciones.
  • CE27 : Ser capaz de utilizar con soltura una estación de trabajo convencional y las aplicaciones más generales.
  • CE28 : Poder procesar amplias colecciones textuales utilizando el intérprete de órdenes (shell) y lenguajes de programación sencillos (awk).
  • CE29 : Ser capaz de utilizar herramientas avanzadas de procesamiento de las lenguas: analizadores morfológicosléxicos (part-of-speech tagger) y analizadores sintácticos (parsers), así como los principales recursos léxicosemánticos existentes (p. ej. Word Net).
  • CE3 : Aplicar las teorías, los modelos, y las herramientas lingüísticas que son relevantes para el estudio e investigación del EFE.
  • CE30 : Ser capaz de tratar corpus multilingües paralelos y comparables.
  • CE31 : Poder utilizar inteligentemente los traductores automáticos y los sistemas de traducción asistida, y saber evaluar su utilidad en contextos académicos y de investigación.
  • CE33 : Ser capaz de hacer una presentación académica oral en inglés y en español en entornos académicos y de investigación.
  • CE34 : Poder identificar problemas de investigación lingüística o interdisciplinaria relacionados con alguna variedad del IFE.
  • CE35 : Poder identificar problemas de investigación lingüística o interdisciplinaria relacionados con alguna variedad del EFE.
  • CE36 : Ser capaz de aplicar los conocimientos lingüísticos a la investigación de algún aspecto relacionado con las lenguas de especialidad (inglés y español).
  • CE37 : Ser capaz de aplicar los conocimientos adquiridos sobre TICS a la investigación de aspectos relacionados con las lenguas de especialidad (inglés y español).

 

Competencias Generales del Título:>>Instrumentales: Conceptuales o Cognitivas

  • CG1 : Saber aplicar las principales perspectivas, teorías, técnicas y modelos de análisis en el campo de investigación interdisciplinario de la lingüística aplicada al estudio del IFE.
  • CG2 : Saber aplicar las principales perspectivas, teorías, técnicas y modelos de análisis en el campo de investigación interdisciplinario de la lingüística aplicada al estudio del EFE.

 

Competencias Generales del Título:>>Instrumentales: Procedimentales o Metodológicas

  • CG3 : Poder aplicar los conocimientos adquiridos y resolver problemas en entornos nuevos o poco conocidos dentro de contextos más amplios o multidisciplinares relacionados con las lenguas de especialidad.
  • CG4 : Saber integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios en los entornos académicos e investigadores.
  • CG5 : Poseer la capacidad para poder desarrollar el autoaprendizaje en los entornos académicos y de investigación en los lenguajes de especialidad.
  • CG6 : Capacidad para elegir o diseñar el método de trabajo adecuado para obtener los objetivos propuestos de los entornos académicos e investigadores en los lenguajes de especialidad.
  • CG7 : Capacidad para comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados de un modo claro y sin ambigüedades en los entornos académicos e investigadores de los lenguajes de especialidad.

 

Competencias Generales del Título:>>Instrumentales: Tecnológicas

  • CG8 : Utilizar recursos tecnológicos para obtener, manejar, analizar, interpretar, y transmitir información: bases de datos, traductores, correctores, herramientas, procesadores de textos, presentaciones multimedia, etc.

 

Competencias Generales del Título:>>Actitudinales: Individuales

  • CG10 : Capacidad de trabajar en equipos interdisciplinarios en contextos académicos internacionales.
  • CG11 : Capacidad de adaptarse a nuevas situaciones.
  • CG12 : Compromiso ético.

 

Competencia exclusiva de la asignatura

Sin datos

Resultados de aprendizaje (Objetivos formativos)

  • Conocimiento de los fundamentos básicos y tecnologías disponibles, que capaciten para el aprendizaje y análisis de herramientas relacionadas con la Lingüística Computacional.
  • Capacidad para analizar y valorar herramientas de Lingüística Computacional con iniciativa, toma de decisiones, autonomía y creatividad.
  • Capacidad para recopilar y analizar corpus de datos con iniciativa, toma de decisiones, autonomía y creatividad.
  • Capacidad para saber comunicar y transmitir los conocimientos, habilidades y destrezas de las tareas propias de un Lingüista Computacional.

Conocimiento de los fundamentos básicos y tecnologías disponibles, que capaciten para el aprendizaje y análisis de herramientas relacionadas con la Lingüística Computacional.

Capacidad para analizar y valorar herramientas de Lingüística Computacional con iniciativa, toma de decisiones, autonomía y creatividad.

Capacidad para recopilar y analizar corpus de datos con iniciativa, toma de decisiones, autonomía y creatividad.

Capacidad para saber comunicar y transmitir los conocimientos, habilidades y destrezas de las tareas propias de un Lingüista Computacional.

Objetivos específicos indicados por el profesorado para el curso 2017-18

El objetivo de esta asignatura es que los estudiantes adquieran unos conocimientos mínimos y básicos sobre la Lingüística Computacional, desde una perspectiva fuertemente computacional centrada en análisis automático de corpus, modelado computacional del lenguaje natural, herramientas existentes y aplicaciones actuales, como la traducción automática, haciendo especial hincapié para los idiomas inglés y español.


Contenidos y bibliografía

Contenidos para el curso 2017-18

Los contenidos abordados en esta asignatura están estructurados de tal forma que, después de cursarla, los alumnos del máster serán capaces de recopilar, analizar y transformar textos mediante el uso de herramientas que les permiten conocer mejor un idioma y procesarlo de manera automática o semi-automática. De este modo pueden colaborar en tareas de análisis y generación de una lengua de forma automática, con el objetivo de extraer conocimiento adaptado a la finalidad que se persiga, sin importar el dominio o género textual al que pertenezca dicha información o idioma en la que esté escrita. Además también serán capaces de determinar la idoneidad o no de introducir la traducción automática para reducir coste de traducción sin que se vea comprometida la calidad de las traducciones.
En concreto, los temas impartidos en la asignatura son los que a continuación se detallan:

1. Fundamentos de la Lingüística Computacional
1.1. Introducción a la Lingüística Computacional y el Procesamiento del Lenguaje Natural
1.2. Módulos de un sistema de Lingüística Computacional y problemas derivados del tratamiento automático del lenguaje
2. Lingüística de corpus
2.1. Diseño y compilación de un corpus
2.2. Análisis automático de un corpus
2.3. Extracción automática de terminología de un corpus
2.4. Diseño y evaluación de expresiones regulares
2.5. Anotación de un corpus
3. Análisis computacional del lenguaje natural
3.1. Análisis léxico desde la perspectiva computacional
3.2. Análisis sintáctico desde la perspectiva computacional
3.3. Análisis semántico desde la perspectiva computacional
4. Aplicación práctica: Traducción Automática
4.1. Definición, usos y aplicaciones de la traducción automática
4.2. Evaluación de la traducción automática
4.3. Técnicas de traducción automática
5. Investigación en Lingüística Computacional: problemas abiertos
5.1. Áreas de investigación y disciplinas afines. Retos a resolver.

La asignatura tiene un carácter eminentemente práctico, ya que está estructurada en seminarios teórico-prácticos y clases con ordenador, con un mayor número de sesiones de ordenador para permitir que los alumnos pongan en práctica todos los conocimientos adquiridos.

 

Enlaces relacionados

http://www.nltk.org/book
Natural Language Processing with Python
https://www.aclweb.org/website/what-is-cl
Association for Computational Linguistics
http://www.sepln.org/
Sociedad Española Para el Procesamiento de Lenguaje Natural
http://transducens.dlsi.ua.es/
Transducens research group: Research on machine translation, digital libraries and computer-assisted education
https://gplsi.dlsi.ua.es/gplsi13/es
GPLSI research group: research on Natural Language Processing and Information Systems

 

Bibliografía

The HANDBOOK of Computational Linguistics and Natural Language Processing
Autor(es): CLARK, Alexander (ed.); FOX, Chris (ed.); LAPPIN, Shalom (ed.)
Edición: - : Wiley, 2010;
ISBN: 978-1-4051-5581-6
Categoría: Complementario

Speech and Language Processing
Autor(es): Jurafsky, Daniel , Martin, James H.
Edición: Upper Saddle River (New Jersey) : Prentice Hall, 2003;
ISBN: 0-13-122798-X
Categoría: Complementario

The Oxford handbook of computational linguistics
Autor(es): Mitkov, Ruslan
Edición: Oxford : Oxford University Press, 2004;
ISBN: 0-19-823882-7
Categoría: Complementario

Introducción al procesamiento del lenguaje natural
Autor(es): Moreno Boronat, Lidia
Edición: San Vicente del Raspeig : Universidad de Alicante, 1999;
ISBN: 84-7908-473-1
Categoría: Sin especificar

Guía rápida de análisis de corpus
Autor(es): Navarro Colorado, Borja
Edición: - : Recurso propio, 2016;
ISBN: No disponible
Categoría: Básico

Working with specialized language : a practical guide to using corpora
Autor(es): Lynne Bowker and Jennifer Pearson
Edición: London : Routledge, 2002;
ISBN: 0-415-23699-1 (pbk)
Categoría: Básico

Corpus Linguistics: Method, Theory and Practice
Autor(es): McENERY, Tony ; HARDIE, Andrew
Edición: Cambridge : Cambridge University Press, 2011;
ISBN: 978-0-521-83851-1
Categoría: Complementario

Corpus linguistics
Autor(es): MCENERY, Tony; WILSON, Andrew
Edición: Edinburgh : Edinburgh Univ., 2001;
ISBN: 978-0-7486-0482-1
Categoría: Básico

Manual de informática y de tecnologías para la traducción
Autor(es): FORCADA, Mikel L.
Edición: - : Universitat d`Alacant, 2016;
ISBN: -
Categoría: Básico

Natural language annotation for machine learning
Autor(es): Pustejovsky, James ; Stubbs, Amber
Edición: Sebastopol : O`Reilly, 2013;
ISBN: 1-4493-5976-0
Categoría: Complementario

Evaluación

Instrumentos y criterios de evaluación 2017-18

Todos los contenidos de la asignatura están fuertemente interrelacionados y conectados, de tal manera que lo que se aprenda en un tema servirá para aplicarlo en temas posteriores. Por tanto, la evaluación de la asignatura en la convocatoria ordinaria consistirá en la realización y entrega de un portafolios global con tres partes diferenciadas pero relacionadas entre sí, donde cada una de ellas tendrá un peso de un 30% de la nota global:


• Parte I. Lingüística de corpus (30%). En esta parte del trabajo, el alumno tendrá que recopilar y anotar un corpus y realizar análisis superficial (frecuencias, n-gramas, expresiones regulares, extracción de terminología, etc.)
• Parte II. Fundamentos de la Lingüística Computacional y análisis computacional del lenguaje (30%). En esta parte, el alumno utilizará el corpus desarrollado en la parte I y lo procesará con herramientas de lingüística computacional, valorando los resultados obtenidos y analizando en detalle los errores producidos.
• Parte III. Traducción Automática (30%). En esta parte, se evaluará un traductor automático a elección del alumno y se determinará su idoneidad para la traducción del corpus de la parte I. Además se analizarán los patrones de errores más habituales cometidos por el traductor automático elegido.

El portafolios supondrá el 90% de la nota final. El 10% restante se obtendrá mediante la entrega de un resumen de los contenidos de la asignatura en relación con el perfil de cada estudiante. La nota final de la asignatura se calculará de 0 a 10, siendo necesario al menos un 5 para aprobar.

En caso de suspenso o no presentado en la convocatoria ordinaria, la notal final de la asignatura para la convocatoria extraordinaria, calculada de 0 a 10, corresponderá únicamente a la evaluación del portafolios que los alumnos deberán entregar en la fecha que se les indique y que deberá incluir, además de los tres apartados anteriormente descritos, un apartado extra (Parte IV) con el resumen de los contenidos de la asignatura y una discusión relacionada con los problemas abiertos y retos existentes en la Lingüística computacional.

Para ambas convocatorias, los trabajos teórico/prácticos realizados han de ser originales. La detección de copia o plagio supondrá la calificación de "0" en la prueba correspondiente. Se informará la dirección de Departamento y de la facultad sobre esta incidencia. La reiteración en la conducta en esta u otra asignatura conllevará la notificación al vicerrectorado correspondiente de las faltas cometidas para que estudien el caso y sancionen según la legislación (Reglamento de disciplina académica de los Centros oficiales de Enseñanza Superior y de Enseñanza Técnica dependientes del Ministerio de Educación Nacional BOE 12/10/1954).

Descripción Criterio Tipo Ponderación
Entrega de un resumen sobre Lingüística Computacional

Se evaluará la entrega de un resumen de los contenidos de la asignatura en relación con el perfil de cada estudiante.

Actividad recuperable. Para la convocatoria extraordinaria, esta actividad se incorporará al portafolios como un apartado extra (apartado IV) que además de contener el resumen de la asignatura, deberá incluir una discusión relacionada con los problemas abiertos y retos existentes en la Lingüística computacional.

ACTIVIDADES DE EVALUACIÓN DURANTE EL SEMESTRE 10
Portafolios Lingüística Computacional

Se evaluará la entrega de un portafolios global con tres partes diferenciadas pero relacionadas entre sí,:

  • Parte I. Lingüística de corpus (30%). En esta parte del trabajo, el alumno tendrá que recopilar y anotar un corpus y realizar análisis superficial (frecuencias, n-gramas, expresiones regulares, extracción de terminología, etc.)
  • Parte II. Fundamentos de la Lingüística Computacional y análisis computacional del lenguaje (30%). En esta parte, el alumno utilizará el corpus desarrollado en la parte I y lo procesará con herramientas de lingüística computacional, valorando los resultados obtenidos y analizando en detalle los errores producidos.
  • Parte III. Traducción Automática (30%). En esta parte, se evaluará un traductor automático a elección del alumno y se determinará su idoneidad para la traducción del corpus de la parte I. Además se analizarán los patrones de errores más habituales cometidos por el traductor automático elegido.

 

Actividad recuperable. 



ACTIVIDADES DE EVALUACIÓN DURANTE EL SEMESTRE 90

 

Fechas de pruebas de evaluación oficiales para el curso 2017-18

Sin datos

 

 



Profesorado

LLORET PASTOR, ELENA
Profesor/a responsable

  • CLASE TEÓRICA: Grupos:
    • 1
  • PRÁCTICAS CON ORDENADOR: Grupos:
    • 1
  • SEMINARIO / TEÓRICO-PRÁCTICO / TALLER: Grupos:
    • 1

NAVARRO COLORADO, FRANCISCO DE BORJA

  • PRÁCTICAS CON ORDENADOR: Grupos:
    • 1
  • SEMINARIO / TEÓRICO-PRÁCTICO / TALLER: Grupos:
    • 1

SANCHEZ MARTINEZ, FELIPE

  • PRÁCTICAS CON ORDENADOR: Grupos:
    • 1
  • SEMINARIO / TEÓRICO-PRÁCTICO / TALLER: Grupos:
    • 1

 

Grupos

CLASE TEÓRICA

Grupo Semestre Turno Idioma Matriculados
Gr. 1 (CLASE TEÓRICA) : GRUPO 1 1S Mañana CAS 13


PRÁCTICAS CON ORDENADOR

Grupo Semestre Turno Idioma Matriculados
Gr. 1 (PRÁCTICAS CON ORDENADOR) : GRUPO 1 1S Mañana CAS 13


SEMINARIO / TEÓRICO-PRÁCTICO / TALLER

Grupo Semestre Turno Idioma Matriculados
Gr. 1 (SEMINARIO / TEÓRICO-PRÁCTICO / TALLER) : GRUPO 1 1S Mañana CAS 13




Horarios

PRÁCTICAS CON ORDENADOR

Grupo Fecha inicio Fecha fin Día Hora inicio Hora fin Aula
1 19/10/2017 19/10/2017 JUE 11:30 14:00 FI/0-LAB3  
1 23/10/2017 23/10/2017 LUN 09:00 11:30 GB/INF1  
1 30/10/2017 30/10/2017 LUN 09:00 11:30 GB/INF1  
1 02/11/2017 02/11/2017 JUE 11:30 14:00 FI/0-LAB3  
1 09/11/2017 09/11/2017 JUE 11:30 14:00 FI/0-LAB3  
1 13/11/2017 13/11/2017 LUN 09:00 11:30 BG/INF2  
1 20/11/2017 20/11/2017 LUN 09:00 11:30 GB/INF1  
1 23/11/2017 23/11/2017 JUE 11:30 14:00 FI/0-LAB3  
1 30/11/2017 30/11/2017 JUE 11:30 14:00 FI/0-LAB3  
1 04/12/2017 04/12/2017 LUN 09:00 11:30 GB/INF1  
1 11/12/2017 11/12/2017 LUN 09:00 11:30 GB/INF1  
1 14/12/2017 14/12/2017 JUE 11:30 14:00 FI/0-LAB3  
1 21/12/2017 21/12/2017 JUE 11:30 14:00 FI/0-LAB3  
1 08/01/2018 08/01/2018 LUN 09:00 11:30 GB/INF1  
1 15/01/2018 15/01/2018 LUN 09:00 11:30 GB/INF1  
1 18/01/2018 18/01/2018 JUE 11:30 14:00 FI/1-04I  

SEMINARIO / TEÓRICO-PRÁCTICO / TALLER

Grupo Fecha inicio Fecha fin Día Hora inicio Hora fin Aula
1 16/10/2017 16/10/2017 LUN 09:00 11:30 FI/1-04I  
1 26/10/2017 26/10/2017 JUE 11:30 14:00 FI/0-LAB3  
1 06/11/2017 06/11/2017 LUN 08:00 10:30 FI/1-04I  
1 16/11/2017 16/11/2017 JUE 11:30 14:00 FI/0-LAB3  
1 27/11/2017 27/11/2017 LUN 09:00 11:30 FI/1-04I  
1 07/12/2017 07/12/2017 JUE 11:30 14:00 FI/0-LAB3  
1 18/12/2017 18/12/2017 LUN 09:00 11:30 FI/1-04I  
1 11/01/2018 11/01/2018 JUE 11:30 14:00 FI/1-04I