5 research outputs found

    El impacto de las emociones en el análisis de la polaridad en textos con lenguaje figurado en Twitter

    Full text link
    [EN] During the recent years we have seen how the rise of Web 2.0 and social media have caused users to take more and more prominence on the Internet, being a source of information generation that increases day by day. Focusing on the social network Twitter, one of the most complex challenges facing Natural Language Processing is to determine the polarity of a tweet (positive, negative or neutral) when in it appears figurative language. This work presents an exhaustive study about the capacity of different lexical resources of emotions to analyze the polarity of a set of data extracted from Twitter, detailing the impact of each one of the resources about different forms of figurative language such as irony and sarcasm we found profusely in this corpus. We start from the hypothesis that not all the available resources favor the detection of polarity with an equal measure, therefore we carry out a series of experiments to evaluate how they affect different lexical resources of emotions in the figurative language as in the literal one. Our methodology will be carried out in two phases: in the first one, we will study the impact of lexical resources on the training of classifiers that predict the polarity of the complete set of tweets of task 11 of SemEval2015. In the second, we will evaluate in detail the impact of each of the resources for the different typologies of figurative language present in this corpus. The obtained results show indications that the inclusion of information related to emotions helps to correctly classify polarity both globally and at the level of figurative or literal language. Therefore, it may be of big importance to develop techniques capable of representing the information in such a way that it is possible to classify the feeling that the user tries to transmit in a text.En los últimos años hemos visto como el auge de los medios sociales ha provocado que los usuarios tomen cada vez más protagonismo en Internet, siendo estos una fuente de generación de información que aumenta día tras día. Centrándonos en la red social Twitter, uno de los retos más complejos a los que se enfrenta el Procesamiento de Lenguaje Natural es el de determinar la polaridad de un tweet (positiva, negativa o neutra) cuando en éste aparece lenguaje figurado. Actualmente existe un gran interés en el estudio de las emociones en los textos, ya que se dispone de una multitud de plataformas en las que el usuario puede interactuar mostrando sus ideas, opiniones, comparaciones entre multitud de productos, etc. y de las que se puede extraer abundante información. Sin embargo, esta tarea es especialmente compleja cuando en el texto encontramos lenguaje figurado, puesto que nos enfrentamos con distintos significados debido al uso de la ironía, la metáfora o el sarcasmo, por lo tanto la polaridad del significado literal puede contrastar fuertemente con el sentimiento que pretende transmitir el sentido figurado. Este trabajo presenta un estudio exhaustivo sobre la capacidad de distintos recursos léxicos de emociones para analizar la polaridad de un conjunto de datos extraídos de Twitter, detallando el impacto de cada uno de los recursos sobre distintas formas de lenguaje figurado como pueden ser la ironía y el sarcasmo que encontramos profusamente en este corpus.Escortell Pérez, MA. (2017). El impacto de las emociones en el análisis de la polaridad en textos con lenguaje figurado en Twitter. http://hdl.handle.net/10251/86127TFG

    El impacto de las emociones en el análisis de la polaridad en textos con lenguaje figurado en Twitter

    Full text link
    [ES] Uno de los retos más complejos a los que se enfrenta el Procesamiento de Lenguaje Natural es el de determinar la polaridad de un tweet (positiva, negativa o neutra) cuando en éste aparece lenguaje figurado, es particularmente complejo en los textos cortos y agramaticales que podemos encontrar en las redes sociales. Este trabajo presenta un estudio exhaustivo sobre la capacidad de distintos recursos léxicos de emociones para analizar la polaridad de un conjunto de datos extraídos de Twitter, detallando el impacto de cada uno de los recursos sobre distintas formas de lenguaje figurado como pueden ser la ironía y el sarcasmo que encontramos profusamente en este corpus. Los resultados obtenidos muestran indicios que apuntan a que la inclusión de información relativa a las emociones ayuda a clasificar correctamente la polaridad tanto a nivel global como a nivel del lenguaje figurado o literal. Palabras clave: Análisis de sentimientos, emociones, lenguaje figurado, twitter, ironía, sarcasmo, semeval, polaridad[EN] One of the most challenging tasks in Natural Language Processing is to determine the polarity of a tweet (positive, negative or neutral) when figurative language is present, especially in the short and ungrammatical texts that can be found in social media. In this paper we present a comprehensive study of the capacity of several emotional lexicons for Sentiment Analysis of Figurative Language in Twitter, detailing how each resource impacts on different figurative language devices such as sarcasm and irony. There are indications in our results that suggest that using emotional information improves the performance of a Sentiment Analysis model regardless of the presence or not of figurative language in the texts analyzed.Este trabajo se ha desarrollado en el marco del proyecto de investigación SomEMBED (TIN2015-71147-C2-1-P) del Ministerio de Economía y Sostenibilidad (MINECO). Asimismo, el trabajo de la segunda autora ha sido financiado a través del Programa de Ayudas de Investigación y Desarrollo de la Universitat Politècnica de València (PAID 2015).Escortell Pérez, MA.; Gimenez Fayos, M.; Rosso, P. (2017). El impacto de las emociones en el análisis de la polaridad en textos con lenguaje figurado en Twitter. PROCESAMIENTO DEL LENGUAJE NATURAL. (58):85-92. http://hdl.handle.net/10251/103747S85925

    Uso del análisis de sentimientos de reseñas en restaurantes de comidas peruanas

    Get PDF
    Esta investigación planteo el uso del análisis de sentimientos de reseñas en restaurantes de comidas peruanas, debido a que está en auge las plataformas web y redes sociales, en las cuales se genera data, la cual con herramientas y procesos para el tratamiento de datos, se puede obtener información útil la cual ayuda a la toma de decisiones. El objetivo principal de la investigación es realizar el análisis de sentimientos de reseñas en restaurantes de comidas peruanas. Para ello se planteó una metodología de enfoque cuantitativo, de tipo aplicada, con un nivel descriptivo y diseño no experimental transeccional ya que se caracteriza por que se recolectaran datos respecto a la variable de estudio en un momento determinado. Como resultados se encontró que de las 774 reseñas procesadas, 436 son de nivel de calificación 5 en las cuales predomina la polaridad positiva, además se evidenció que el 95% de las reseñas tiene polaridad positiva, asimismo la emoción predominante es la confianza seguida de la alegría y finalmente las palabras más usadas en las reseñas son: buena, ambiente, lugar, platos y sazón. Esta investigación puede ser utilizada como base para el análisis de sentimientos en reseñas de restaurantes como en otros sectores

    Análisis de Sentimientos desde la influencia de Twitter en los procesos de pólizas de seguros del ámbito colombiano

    Get PDF
    Las redes sociales están jugando un papel importante en la sociedad siendo así un acontecimiento notable de la comunicación hoy en día. Esto permite que los diferentes usuarios puedan publicar una opinión acerca de un determinado tema haciéndolo a través de internet. Esto hace de estas plataformas una fuente para exploración de información que obliga a aprovechar dichos datos para poder interpretarlos con la ayuda de las opiniones realizadas y así con lo anterior llevado a cabo, poder tomar decisiones cruciales para determinar el camino de las aseguradoras en Colombia. Este proyecto busca desarrollar una visualización de datos que permita analizar el sentimiento (positivo, negativo y neutro) de las opiniones en Twitter, además de presentar el análisis de estos datos (Tweets) y el procedimiento con fines de investigación. Finalmente se proponen técnicas de aprendizaje automático y procesamiento del lenguaje natural aplicando procesamiento basado en texto con análisis de sentimientos.#Twitter#Análisis de sentimientosSocial networks are playing an important role in our society, thus being an important communication event today. This allows different users to publish an opinion about a certain topic by doing so through the internet. This makes these platforms a source for information exploration that forces us to take advantage of said data to be able to interpret them with the help of the opinions made and thus with the above carried out, to be able to make crucial decisions to determine the path of insurers in Colombia. This project seeks to develop a visualization of data that allows analyzing the sentiment (positive, negative and neutral) of the opinions on Twitter, in addition to presenting the analysis of this data (Tweets) and the procedure for research purposes. Finally, machine learning and natural language processing techniques are proposed applying text-based processing with sentiment analysis

    Natural Language Processing using Deep Learning in Social Media

    Full text link
    [ES] En los últimos años, los modelos de aprendizaje automático profundo (AP) han revolucionado los sistemas de procesamiento de lenguaje natural (PLN). Hemos sido testigos de un avance formidable en las capacidades de estos sistemas y actualmente podemos encontrar sistemas que integran modelos PLN de manera ubicua. Algunos ejemplos de estos modelos con los que interaccionamos a diario incluyen modelos que determinan la intención de la persona que escribió un texto, el sentimiento que pretende comunicar un tweet o nuestra ideología política a partir de lo que compartimos en redes sociales. En esta tesis se han propuestos distintos modelos de PNL que abordan tareas que estudian el texto que se comparte en redes sociales. En concreto, este trabajo se centra en dos tareas fundamentalmente: el análisis de sentimientos y el reconocimiento de la personalidad de la persona autora de un texto. La tarea de analizar el sentimiento expresado en un texto es uno de los problemas principales en el PNL y consiste en determinar la polaridad que un texto pretende comunicar. Se trata por lo tanto de una tarea estudiada en profundidad de la cual disponemos de una vasta cantidad de recursos y modelos. Por el contrario, el problema del reconocimiento de personalidad es una tarea revolucionaria que tiene como objetivo determinar la personalidad de los usuarios considerando su estilo de escritura. El estudio de esta tarea es más marginal por lo que disponemos de menos recursos para abordarla pero que no obstante presenta un gran potencial. A pesar de que el enfoque principal de este trabajo fue el desarrollo de modelos de aprendizaje profundo, también hemos propuesto modelos basados en recursos lingüísticos y modelos clásicos del aprendizaje automático. Estos últimos modelos nos han permitido explorar las sutilezas de distintos elementos lingüísticos como por ejemplo el impacto que tienen las emociones en la clasificación correcta del sentimiento expresado en un texto. Posteriormente, tras estos trabajos iniciales se desarrollaron modelos AP, en particular, Redes neuronales convolucionales (RNC) que fueron aplicadas a las tareas previamente citadas. En el caso del reconocimiento de la personalidad, se han comparado modelos clásicos del aprendizaje automático con modelos de aprendizaje profundo, pudiendo establecer una comparativa bajo las mismas premisas. Cabe destacar que el PNL ha evolucionado drásticamente en los últimos años gracias al desarrollo de campañas de evaluación pública, donde múltiples equipos de investigación comparan las capacidades de los modelos que proponen en las mismas condiciones. La mayoría de los modelos presentados en esta tesis fueron o bien evaluados mediante campañas de evaluación públicas, o bien emplearon la configuración de una campaña pública previamente celebrada. Siendo conscientes, por lo tanto, de la importancia de estas campañas para el avance del PNL, desarrollamos una campaña de evaluación pública cuyo objetivo era clasificar el tema tratado en un tweet, para lo cual recogimos y etiquetamos un nuevo conjunto de datos. A medida que avanzabamos en el desarrollo del trabajo de esta tesis, decidimos estudiar en profundidad como las RNC se aplicaban a las tareas de PNL. En este sentido, se exploraron dos líneas de trabajo. En primer lugar, propusimos un método de relleno semántico para RNC, que plantea una nueva manera de representar el texto para resolver tareas de PNL. Y en segundo lugar, se introdujo un marco teórico para abordar una de las críticas más frecuentes del aprendizaje profundo, el cual es la falta de interpretabilidad. Este marco busca visualizar qué patrones léxicos, si los hay, han sido aprendidos por la red para clasificar un texto.[CA] En els últims anys, els models d'aprenentatge automàtic profund (AP) han revolucionat els sistemes de processament de llenguatge natural (PLN). Hem estat testimonis d'un avanç formidable en les capacitats d'aquests sistemes i actualment podem trobar sistemes que integren models PLN de manera ubiqua. Alguns exemples d'aquests models amb els quals interaccionem diàriament inclouen models que determinen la intenció de la persona que va escriure un text, el sentiment que pretén comunicar un tweet o la nostra ideologia política a partir del que compartim en xarxes socials. En aquesta tesi s'han proposats diferents models de PNL que aborden tasques que estudien el text que es comparteix en xarxes socials. En concret, aquest treball se centra en dues tasques fonamentalment: l'anàlisi de sentiments i el reconeixement de la personalitat de la persona autora d'un text. La tasca d'analitzar el sentiment expressat en un text és un dels problemes principals en el PNL i consisteix a determinar la polaritat que un text pretén comunicar. Es tracta per tant d'una tasca estudiada en profunditat de la qual disposem d'una vasta quantitat de recursos i models. Per contra, el problema del reconeixement de la personalitat és una tasca revolucionària que té com a objectiu determinar la personalitat dels usuaris considerant el seu estil d'escriptura. L'estudi d'aquesta tasca és més marginal i en conseqüència disposem de menys recursos per abordar-la però no obstant i això presenta un gran potencial. Tot i que el fouc principal d'aquest treball va ser el desenvolupament de models d'aprenentatge profund, també hem proposat models basats en recursos lingüístics i models clàssics de l'aprenentatge automàtic. Aquests últims models ens han permès explorar les subtileses de diferents elements lingüístics com ara l'impacte que tenen les emocions en la classificació correcta del sentiment expressat en un text. Posteriorment, després d'aquests treballs inicials es van desenvolupar models AP, en particular, Xarxes neuronals convolucionals (XNC) que van ser aplicades a les tasques prèviament esmentades. En el cas de el reconeixement de la personalitat, s'han comparat models clàssics de l'aprenentatge automàtic amb models d'aprenentatge profund la qual cosa a permet establir una comparativa de les dos aproximacions sota les mateixes premisses. Cal remarcar que el PNL ha evolucionat dràsticament en els últims anys gràcies a el desenvolupament de campanyes d'avaluació pública on múltiples equips d'investigació comparen les capacitats dels models que proposen sota les mateixes condicions. La majoria dels models presentats en aquesta tesi van ser o bé avaluats mitjançant campanyes d'avaluació públiques, o bé s'ha emprat la configuració d'una campanya pública prèviament celebrada. Sent conscients, per tant, de la importància d'aquestes campanyes per a l'avanç del PNL, vam desenvolupar una campanya d'avaluació pública on l'objectiu era classificar el tema tractat en un tweet, per a la qual cosa vam recollir i etiquetar un nou conjunt de dades. A mesura que avançàvem en el desenvolupament del treball d'aquesta tesi, vam decidir estudiar en profunditat com les XNC s'apliquen a les tasques de PNL. En aquest sentit, es van explorar dues línies de treball.En primer lloc, vam proposar un mètode d'emplenament semàntic per RNC, que planteja una nova manera de representar el text per resoldre tasques de PNL. I en segon lloc, es va introduir un marc teòric per abordar una de les crítiques més freqüents de l'aprenentatge profund, el qual és la falta de interpretabilitat. Aquest marc cerca visualitzar quins patrons lèxics, si n'hi han, han estat apresos per la xarxa per classificar un text.[EN] In the last years, Deep Learning (DL) has revolutionised the potential of automatic systems that handle Natural Language Processing (NLP) tasks. We have witnessed a tremendous advance in the performance of these systems. Nowadays, we found embedded systems ubiquitously, determining the intent of the text we write, the sentiment of our tweets or our political views, for citing some examples. In this thesis, we proposed several NLP models for addressing tasks that deal with social media text. Concretely, this work is focused mainly on Sentiment Analysis and Personality Recognition tasks. Sentiment Analysis is one of the leading problems in NLP, consists of determining the polarity of a text, and it is a well-known task where the number of resources and models proposed is vast. In contrast, Personality Recognition is a breakthrough task that aims to determine the users' personality using their writing style, but it is more a niche task with fewer resources designed ad-hoc but with great potential. Despite the fact that the principal focus of this work was on the development of Deep Learning models, we have also proposed models based on linguistic resources and classical Machine Learning models. Moreover, in this more straightforward setup, we have explored the nuances of different language devices, such as the impact of emotions in the correct classification of the sentiment expressed in a text. Afterwards, DL models were developed, particularly Convolutional Neural Networks (CNNs), to address previously described tasks. In the case of Personality Recognition, we explored the two approaches, which allowed us to compare the models under the same circumstances. Noteworthy, NLP has evolved dramatically in the last years through the development of public evaluation campaigns, where multiple research teams compare the performance of their approaches under the same conditions. Most of the models here presented were either assessed in an evaluation task or either used their setup. Recognising the importance of this effort, we curated and developed an evaluation campaign for classifying political tweets. In addition, as we advanced in the development of this work, we decided to study in-depth CNNs applied to NLP tasks. Two lines of work were explored in this regard. Firstly, we proposed a semantic-based padding method for CNNs, which addresses how to represent text more appropriately for solving NLP tasks. Secondly, a theoretical framework was introduced for tackling one of the most frequent critics of Deep Learning: interpretability. This framework seeks to visualise what lexical patterns, if any, the CNN is learning in order to classify a sentence. In summary, the main achievements presented in this thesis are: - The organisation of an evaluation campaign for Topic Classification from texts gathered from social media. - The proposal of several Machine Learning models tackling the Sentiment Analysis task from social media. Besides, a study of the impact of linguistic devices such as figurative language in the task is presented. - The development of a model for inferring the personality of a developer provided the source code that they have written. - The study of Personality Recognition tasks from social media following two different approaches, models based on machine learning algorithms and handcrafted features, and models based on CNNs were proposed and compared both approaches. - The introduction of new semantic-based paddings for optimising how the text was represented in CNNs. - The definition of a theoretical framework to provide interpretable information to what CNNs were learning internally.Giménez Fayos, MT. (2021). Natural Language Processing using Deep Learning in Social Media [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/172164TESI
    corecore