6 research outputs found

    EmoLabel: Semi-Automatic Methodology for Emotion Annotation of Social Media Text

    Get PDF
    The exponential growth of the amount of subjective information on the Web 2.0. has caused an increasing interest from researchers willing to develop methods to extract emotion data from these new sources. One of the most important challenges in textual emotion detection is the gathering of data with emotion labels because of the subjectivity of assigning these labels. Basing on this rationale, the main objective of our research is to contribute to the resolution of this important challenge. This is tackled by proposing EmoLabel: a semi-automatic methodology based on pre-annotation, which consists of two main phases: (1) an automatic process to pre-annotate the unlabelled English sentences; and (2) a manual process of refinement where human annotators determine which is the dominant emotion. Our objective is to assess the influence of this automatic pre-annotation method on manual emotion annotation from two points of view: agreement and time needed for annotation. The evaluation performed demonstrates the benefits of pre-annotation processes since the results on annotation time show a gain of near 20% when the pre-annotation process is applied (Pre-ML) without reducing annotator performance. Moreover, the benefits of pre-annotation are higher in those contributors whose performance is low (inaccurate annotators).This research has been supported by the Spanish Government (ref. RTI2018-094653-B-C22) and the Valencian Government (grant no. PROMETEU/2018/089). It has also been funded by the FPI grant (BES-2013-065950) and the research stay grant (EEBB-I-17-12578) from the Spanish Ministry of Science and Innovation

    Resolución de obstáculos semánticos en castellano, inglés y búlgaro

    Get PDF
    Esta herramienta permite enriquecer textos mediante la detección de obstáculos semánticos en tres lenguas: castellano, inglés y búlgaro. En concreto, estos obstáculos son: palabras raras, palabras especializadas, palabras polisémicas, palabras largas. Para ello dispone de una utilidad de consola y un servicio web. El proceso es el siguiente: primero, se realiza un pre-proceso del texto donde se realiza un análisis morfológico, así como una desambiguación las palabras por el sentido más frecuente; después, se detectan los posibles obstáculos de un texto; y, como resultado, para cada uno de ellos ofrece su definición, sus sinónimos y su complejidad.Investigación realizada gracias a la financiación de los proyectos: FIRST: A Flexible Interactive Reading Support Tool (ACOMP/2013/067) de la Generalitat Valenciana; A FLEXIBLE INTERACTIVE READING SUPPORT TOOL (FP7-287607) de la Unión Europea

    Intensional Learning to Efficiently Build up Automatically Annotated Emotion Corpora

    Get PDF
    Textual emotion detection has a high impact on business, society, politics or education with applications such as, detecting depression or personality traits, suicide prevention or identifying cases of cyber-bulling. Given this context, the objective of our research is to contribute to the improvement of emotion recognition task through an automatic technique focused on reducing both the time and cost needed to develop emotion corpora. Our proposal is to exploit a bootstrapping approach based on intensional learning for automatic annotations with two main steps: 1) an initial similarity-based categorization where a set of seed sentences is created and extended by distributional semantic similarity (word vectors or word embeddings); 2) train a supervised classifier on the initially categorized set. The technique proposed allows us an efficient annotation of a large amount of emotion data with standards of reliability according to the evaluation results.This research has been supported by the FPI grant (BES-2013-065950) and the research stay grants (EEBB-I-15-10108 and EEBB-I-16-11174) from the Spanish Ministry of Science and Innovation. It has also funded by the Spanish Government (DIGITY ref. TIN2015-65136-C02-2-R and RESCATA ref. TIN2015-65100-R), the Valencian Government (grant no. PROMETEOII/ 2014/001), the University of Alicante (ref. GRE16-01) and BBVA Foundation (Análisis de Sentimientos Aplicado a la Prevención del Suicidio en las Redes Sociales (ASAP) project)

    Intelligent framework for retrieving, analysing and representing user generated content on Internet

    Get PDF
    Este proyecto viene motivado por la necesidad de definir una plataforma basada en Tecnologías del Lenguaje Humano que sea capaz de procesar la información de manera inteligente y de forma automática, combinando múltiples técnicas y herramientas. Dicha plataforma flexibilizará el modo de mostrar visualmente los datos resultantes para ser adaptados a las necesidades de los usuarios desde un punto de vista analítico. El avance científico de cada una de las tecnologías involucradas en la creación de la plataforma propuesta, así como su combinación e integración en una única infraestructura, supondrá un paso importante dentro de las tecnologías del lenguaje humano, siendo a su vez, de valiosa utilidad para la sociedad actual y futura.This project is motivated by the need of defining a platform based on Human Language Technologies capable of intelligently processing textual information, by combining multiple techniques and tools. In addition, the way of displaying the obtained results will be adapted to the users needs from an analytical point of view. The scientific progresses of each technology involved, as well as their combination and integration in a single infrastructure, will contribute to the progress of human language technologies, being in turn of valuable use for the current and future society.Este proyecto con referencia GRE16-01: Plataforma inteligente para recuperación, análisis y representación de la información generada por usuarios en Internet, está financiado por las Ayudas a Proyectos Emergentes de la Universidad de Alicante

    Tackling the Challenge of Emotion Annotation in Text

    Get PDF
    La creación de un conjunto de datos etiquetas para el Reconocimiento de Emociones (RE) en texto no es trivial, ya que la detección de emociones en texto puede ser difícil incluso para los seres humanos, porque los contextos personales de cada persona pueden influir en la interpretación de las emociones. Muchas de las investigaciones llevadas a cabo hasta el momento, han mostrado las dificultades relacionadas con esta tarea, como: la detección de un buen acuerdo entre anotadores o el tiempo necesario para su desarrollo. Teniendo en cuenta estas dificultades y con el fin de disminuir y contrarrestar el desafío de la anotación de emociones, esta disertación abarca el análisis de diferentes aproximaciones semiautomáticas con el objetivo de mejorar la anotación de emociones en texto escrito. Más específicamente, se han investigado dos técnicas cuya usabilidad y efectividad has sido demostrada en otras tareas de Procesamiento del Lenguaje Natural (PLN): bootstrapping basado en Intensional Learning y un proceso de pre-anotación. Nos centramos en la anotación de emociones en texto escrito en Inglés para cualquier género textual, a nivel de oraciones y empleando un conjunto de categorías emocionales como etiquetas

    Tackling the Challenge of Emotion Annotation in Text

    No full text
    La creación de un conjunto de datos etiquetas para el Reconocimiento de Emociones (RE) en texto no es trivial, ya que la detección de emociones en texto puede ser difícil incluso para los seres humanos, porque los contextos personales de cada persona pueden influir en la interpretación de las emociones. Muchas de las investigaciones llevadas a cabo hasta el momento, han mostrado las dificultades relacionadas con esta tarea, como: la detección de un buen acuerdo entre anotadores o el tiempo necesario para su desarrollo. Teniendo en cuenta estas dificultades y con el fin de disminuir y contrarrestar el desafío de la anotación de emociones, esta disertación abarca el análisis de diferentes aproximaciones semiautomáticas con el objetivo de mejorar la anotación de emociones en texto escrito. Más específicamente, se han investigado dos técnicas cuya usabilidad y efectividad has sido demostrada en otras tareas de Procesamiento del Lenguaje Natural (PLN): bootstrapping basado en Intensional Learning y un proceso de pre-anotación. Nos centramos en la anotación de emociones en texto escrito en Inglés para cualquier género textual, a nivel de oraciones y empleando un conjunto de categorías emocionales como etiquetas
    corecore