    Analysis of the Association Between Topics in Online Documents and Stock Price Movements

    This paper aims at discovering the topics hidden in the newspaper articles that have an impact on movements of stock prices of the corresponding companies. Document topics are characterized by combinations of specific words in documents and are shared across a document collection. We describe the process of discovering the topics, the creation of a mapping of the topics to stock price movements, and quantifying and evaluating the results. As the method for finding and quantifying the association, we use machine learning-based classification. We achieved an accuracy of stock price movement predictions higher than 70 %. A feature selection procedure was applied to the features characterizing the topics in order to facilitate the process of assigning a label to the topic by a human expert.O

    A study on text-score disagreement in online reviews

    In this paper, we focus on online reviews and employ artificial intelligence tools, taken from the cognitive computing field, to help understanding the relationships between the textual part of the review and the assigned numerical score. We move from the intuitions that 1) a set of textual reviews expressing different sentiments may feature the same score (and vice-versa); and 2) detecting and analyzing the mismatches between the review content and the actual score may benefit both service providers and consumers, by highlighting specific factors of satisfaction (and dissatisfaction) in texts. To prove the intuitions, we adopt sentiment analysis techniques and we concentrate on hotel reviews, to find polarity mismatches therein. In particular, we first train a text classifier with a set of annotated hotel reviews, taken from the Booking website. Then, we analyze a large dataset, with around 160k hotel reviews collected from Tripadvisor, with the aim of detecting a polarity mismatch, indicating if the textual content of the review is in line, or not, with the associated score. Using well established artificial intelligence techniques and analyzing in depth the reviews featuring a mismatch between the text polarity and the score, we find that -on a scale of five stars- those reviews ranked with middle scores include a mixture of positive and negative aspects. The approach proposed here, beside acting as a polarity detector, provides an effective selection of reviews -on an initial very large dataset- that may allow both consumers and providers to focus directly on the review subset featuring a text/score disagreement, which conveniently convey to the user a summary of positive and negative features of the review target.Comment: This is the accepted version of the paper. The final version will be published in the Journal of Cognitive Computation, available at Springer via http://dx.doi.org/10.1007/s12559-017-9496-

    Developing resources for sentiment analysis of informal Arabic text in social media

    Natural Language Processing (NLP) applications such as text categorization, machine translation, sentiment analysis, etc., need annotated corpora and lexicons to check quality and performance. This paper describes the development of resources for sentiment analysis specifically for Arabic text in social media. A distinctive feature of the corpora and lexicons developed are that they are determined from informal Arabic that does not conform to grammatical or spelling standards. We refer to Arabic social media content of this sort as Dialectal Arabic (DA) - informal Arabic originating from and potentially mixing a range of different individual dialects. The paper describes the process adopted for developing corpora and sentiment lexicons for sentiment analysis within different social media and their resulting characteristics. The addition to providing useful NLP data sets for Dialectal Arabic the work also contributes to understanding the approach to developing corpora and lexicons

    Sentiment Analysis in Social Streams

    In this chapter, we review and discuss the state of the art on sentiment analysis in social streams—such as web forums, microblogging systems, and social networks, aiming to clarify how user opinions, affective states, and intended emo tional effects are extracted from user generated content, how they are modeled, and howthey could be finally exploited.We explainwhy sentiment analysistasks aremore difficult for social streams than for other textual sources, and entail going beyond classic text-based opinion mining techniques. We show, for example, that social streams may use vocabularies and expressions that exist outside the mainstream of standard, formal languages, and may reflect complex dynamics in the opinions and sentiments expressed by individuals and communities

    Exploring figurative language recognition: a comprehensive study of human and machine approaches

    Treballs Finals de Grau de Llengües i Literatures Modernes. Facultat de Filologia. Universitat de Barcelona. Curs: 2022-2023. Tutora: Elisabet Comelles Pujadas[eng] Figurative language (FL) plays a significant role in human communication. Understanding and interpreting FL is essential for humans to fully grasp the intended message, appreciate cultural nuances, and engage in effective interaction. For machines, comprehending FL presents a challenge due to its complexity and ambiguity. Enabling machines to understand FL has become increasingly important in sentiment analysis, text classification, and social media monitoring, for instance, benefits from accurately recognizing figurative expressions to capture subtle emotions and extract meaningful insights. Machine translation also requires the ability to accurately convey FL to ensure translations reflect the intended meaning and cultural nuances. Therefore, developing computational methods to enable machines to understand and interpret FL is crucial. By bridging the gap between human and machine understanding of FL, we can enhance communication, improve language-based applications, and unlock new possibilities in human-machine interactions. Keywords: figurative language, NLP, human-machine communication.[cat] El Llenguatge Figuratiu (LF) té un paper important en la comunicació humana. Per entendre completament els missatges, apreciar els matisos culturals i la interacció efectiva, és necessària la capacitat d'interpretar el LF. No obstant això, els ordinadors tenen dificultats per entendre la LF a causa de la seva complexitat i ambigüitat. És crític que els ordinadors siguin capaços de reconèixer el LF, especialment en àrees com l'anàlisi de sentiments, la classificació de textos i la supervisió de les xarxes socials. El reconeixement precís del LF permet capturar emocions i extreure idees semàntiques. La traducció automàtica també requereix una representació precisa del LF per reflectir el significat previst i els matisos culturals. Per tant, és rellevant desenvolupar mètodes computacionals que ajudin els ordinadors a comprendre i interpretar el LF. Fer un pont entre la comprensió humana i màquina del LF pot millorar la comunicació, desenvolupar aplicacions de llenguatge i obrir noves possibilitats per a la interacció home-màquina. Paraules clau: llenguatge figuratiu, processament del llenguatge natural, interacció home-màquina

    Англійська мова для навчання і роботи Т. 4. Професійне іншомовне письмо

    Get PDF
    Подано всі види діяльності студентів з вивчення англійської мови, спрямовані на розвиток мовної поведінки, необхідної для ефективного спілкування в академічному та професійному середовищах. Містить завдання і вправи, типові для різноманітних академічних та професійних сфер і ситуацій. Структура організації змісту – модульна, охоплює певні мовленнєві вміння залежно від мовної поведінки. Даний модуль має на меті розвиток у студентів умінь і навичок писемного спілкування, що пов’язане з майбутньою професією студентів, та основ медіації і письмового перекладу, які спрямовані на розвиток умінь писати тексти різних типів і жанрів, такі як резюме, листи, анотації тощо. Ресурси для самостійної роботи (частина ІІ) містять завдання та вправи для розвитку словникового запасу та розширення діапазону функціональних зразків, необхідних для виконання певних функцій, та завдання, які спрямовані на організацію самостійної роботи студентів. За допомогою засобів діагностики (частина ІІІ) студенти можуть самостійно перевірити засвоєння навчального матеріалу та оцінити свої досягнення. Граматичні явища і вправи для їх засвоєння наводяться в томі 5. Призначений для студентів технічних університетів гірничого профілю. Може використовуватися для викладання вибіркових курсів з англійської мови, а також для самостійного вивчення англійської мови викладачами, фахівцями і науковцями різних інженерних галузей