5 research outputs found
ElectionMap: a geolocalized representation of voting intentions to political parties based on twitter's user comments
ElectionMap es una aplicación web que realiza un seguimiento a los comentarios publicados en Twitter en relación a entidades que refieren a partidos políticos. Las opiniones de los usuarios sobre estas entidades son clasificadas según su valoración y posteriormente representadas en un mapa geográfico para conocer la aceptación social sobre agrupaciones políticas en las distintas regiones de la geografía española.ElectionMap is a web application that follows, in Twitter, entities previously established and related to the politics. The user's opinions about the entities are classified according to its valuation by using sentiment analysis processes. Afterwards the opinions are represented in a geographic map that allows to know the social acceptance of Spanish political parties in different geographical areas.ElectionMap es una aplicación web desarrollada por el Grupo de Procesamiento del Lenguaje Natural y Sistemas de Información (GPLSI) de la Universidad de Alicante. Esta aplicación ha sido parcialmente financiada por el Gobierno Español y la Comisión Europea a través de los proyectos: ATTOS (TIN2012-38536-C03-03), LEGOLANG (TIN2012-31224), SAM (FP7-611312) y FIRST (FP7-287607) y por la Universidad de Alicante a través del proyecto emergente “Explotación y tratamiento de la información disponible en Internet para la anotación y generación de textos adaptados al usuario” (GRE13-15)
Natural Language Generation: Revision of the State of the Art
El ser humano se comunica y expresa a través del lenguaje. Para conseguirlo, ha de desarrollar una serie de habilidades de alto nivel cognitivo cuya complejidad se pone de manifiesto en la tarea de automatizar el proceso, tanto cuando se trata de producir lenguaje como de interpretarlo. Cuando la acción comunicativa ocurre entre una persona y un ordenador y éste último es el destinatario de la acción, se emplean lenguajes computacionales que, como norma general, están sujetos a un conjunto de reglas fuertemente tipadas, acotadas y sin ambigüedad. Sin embargo, cuando el sentido de la comunicación es el contrario y la máquina ha de transmitir información a la persona, si el mensaje se quiere transmitir en lenguaje natural, el procedimiento para generarlo debe lidiar con la flexibilidad y la ambigüedad que lo caracterizan, dando lugar a una tarea de alto nivel de complejidad. Para que las máquinas sean capaces de manejar el lenguaje humano se hacen necesarias técnicas de Lingüística Computacional. Dentro de esta disciplina, el campo que se encarga de crear textos en lenguaje natural se denomina Generación de Lenguaje Natural (GLN). En este artículo se va a hacer un recorrido exhaustivo de este campo. Se describen las fases en las que se suelen descomponer los sistemas de GLN junto a las técnicas que se aplican y se analiza con detalle la situación actual de esta área de investigación y su problemática, así como los recursos más relevantes y las técnicas que se están empleando para evaluar la calidad de los sistemas.Language is one of the highest cognitive skills developed by human beings and, therefore, one of the most complex tasks to be faced from the computational perspective. Human-computer communication processes imply two different degrees of difficulty depending on the nature of that communication. If the language used is oriented towards the domain of the machine, there is no place for ambiguity since it is restricted by rules. However, when the communication is in terms of natural language, its flexibility and ambiguity becomes unavoidable. Computational Linguistic techniques are mandatory for machines when it comes to process human language. Among them, the area of Natural Language Generation aims to automatical development of techniques to produce human utterances, text and speech. This paper presents a deep survey of this research area taking into account different points of view about the theories, methodologies, architectures, techniques and evaluation approaches, thus providing a review of the current situation and possible future research in the field.Esta investigación ha sido financiada por la Generalitat Valenciana a través del proyecto DIIM2.0: Desarrollo de técnicas Inteligentes e Interactivas de Minería y generación de información sobre la web 2.0 (PROMETEOII/2014/001). Además, ha sido parcialmente financiada por la Comisión Europea a través del proyecto SAM (FP7-611312); por el Ministerio de Economía y Competitividad del Gobierno de España mediante los proyectos: “Análisis de Tendencias Mediante Técnicas de Opinión Semántica” (TIN2012-38536-C03-03) y ‘Técnicas de Deconstrucción en la Tecnología del Lenguaje Humano” (TIN2012-31224); y finalmente, por la Universidad de Alicante a través del proyecto “Explotación y tratamiento de la información disponible en Internet para la anotación y generación de textos adaptados al usuario” (GRE13-15)
Aspectos didácticos en la formación de traductores basada en corpus
Este trabajo tiene que ver con uno de los objetivos perseguidos, en el marco del Proyecto Redes de Investigación en Docencia Universitaria del Instituto de Ciencias de la Educación de la Universidad de Alicante, por la red 3152 “Formación de traductores basada en corpus y desarrollo de COMENEGO (Corpus Multilingüe de Economía y Negocios)”, relacionado, en concreto, con el uso de corpus en la formación de traductores. Se presenta una síntesis de una serie de comunicaciones que se pronunciaron en el IV Congreso Internacional CULT (Corpus Use and Learning to Translate), celebrado en la Facultad de Filosofía y Letras de la Universidad de Alicante a finales de mayo de 2015
Socialising Around Media (SAM): Sindicación Dinámica de Contenido Social y Multimedia para Segundas Pantallas
Today's generation of Internet devices has changed how users are interacting with media, from passive and unidirectional users to proactive and interactive. Users can use these devices to comment or rate a TV show and search for related information regarding characters, facts or personalities. This phenomenon is known as second screen. This paper describes SAM, an EU-funded research project that focuses on developing an advanced digital media delivery platform based on second screen interaction and content syndication within a social media context, providing open and standardised ways of characterising, discovering and syndicating digital assets. This work provides an overview of the project and its main objectives, focusing on the NLP challenges to be faced and the technologies developed so far.La actual generación de dispositivos m oviles ha cambiado la forma en que los usuarios interactúan con los medios digitales, pasado de ser pasivos y unidireccionales a proactivos e interactivos. Los usuarios usan estos dispositivos para comentar y valorar programas televisivos, buscando información relacionada sobre personajes, hechos y celebridades. Este fenómeno se conoce con el nombre de segunda pantalla. En este artículo se describe SAM, un proyecto de investigación financiado por la EU y enfocado al desarrollo de una plataforma avanzada de distribución de contenidos digitales basada en segundas pantallas, usando la sindicación de contenidos en el contexto de los medios sociales para proporcionar maneras abiertas y estándares de caracterizar, descubrir y sindicar recursos digitales. Este trabajo resume las principales características y objetivos del proyecto, así como los retos de PLN a afrontar y las tecnologías desarrolladas para tal fin hasta el momento.This work has been partially funded by the European Commission under the Seventh Framework Programme (FP7-2007-2013) for Research and Technological Development through the SAM project (FP7-611312), and by the Spanish Government through the LEGOLANGUAGE project (TIN2012-31224)
Aspectos didácticos en la formación de traductores basada en corpus
Este trabajo tiene que ver con uno de los objetivos perseguidos, en el marco del Proyecto Redes de Investigación en Docencia Universitaria del Instituto de Ciencias de la Educación de la Universidad de Alicante, por la red 3152 “Formación de traductores basada en corpus y desarrollo de COMENEGO (Corpus Multilingüe de Economía y Negocios)”, relacionado, en concreto, con el uso de corpus en la formación de traductores. Se presenta una síntesis de una serie de comunicaciones que se pronunciaron en el IV Congreso Internacional CULT (Corpus Use and Learning to Translate), celebrado en la Facultad de Filosofía y Letras de la Universidad de Alicante a finales de mayo de 2015