27 research outputs found

    Definición de un lenguaje controlado para el análisis de sentimientos en Twitter para mensajes en inglés

    El análisis de sentimientos, también conocido como minería de opinión, surge con el fin de determinar la polaridad de un texto dado. Es el campo de estudio que permite analizar la respuesta emocional de los usuarios en redes sociales, con el fin de ayudar en la toma de decisiones en ámbitos sociales, económicos, políticos, laborales y financieros. Una de las redes sociales que está ganando más popularidad en el análisis de sentimientos es Twitter, ya que es una herramienta de microblogging social que permite a los usuarios expresar opiniones e ideas en textos cortos (280 caracteres) y concisos, lo cual es ideal para extraer estadísticas de temas específicos. Sin embargo, el vocabulario que se utiliza en redes sociales posee problemas inherentes al lenguaje natural. Tradicionalmente, en lingüística computacional se solucionan estos problemas utilizando lenguajes controlados. Un lenguaje controlado es un subconjunto del lenguaje natural que posee restricciones en la terminología, lo cual permite reducir la ambigüedad y aporta precisión para posteriores análisis. Para entender el significado que tienen las palabras en un vocabulario, es necesario recurrir a los términos de connotación y denotación. La connotación de una palabra incluye elementos de carácter subjetivo e implica interpretación. Por su parte, la denotación, es la expresión formal y objetiva, es decir, el significado universal que se le da a una palabra. En lo relativo a la función que realizan las palabras dentro de una oración, el análisis sintáctico suministra apoyo en cuanto a describir cómo las palabras de la oración se relacionan y la categoría gramatical que tiene cada una de estas. Para realizar el análisis sintáctico se puede utilizar un árbol de constituyentes. Comúnmente, en la minería de opinión se utiliza el preprocesamiento de datos para eliminar ruidos y/o inconsistencias, con el fin de preparar los datos para un posterior análisis. Esta intervención y transformación se realiza mediante los siguientes pasos: tokenización, eliminación de datos ruidosos, eliminación de palabras de jerga, revisión ortográfica y, por último, stemming. En las aproximaciones encontradas en la literatura para el análisis de sentimientos se encuentran métodos basados en léxico, los cuales contienen enfoques basados en diccionarios. En esas aproximaciones se aprecian análisis de ciertos elementos de los corpus de diferentes redes sociales, pero, debido a la falta de un lenguaje controlado, requieren una mayor intervención y transformación del mensaje antes de definir su polaridad. Esto se debe a que el lenguaje natural utilizado en las redes sociales posee características como la polisemia y sinonimia que plantean desafíos en el análisis computacional y, además, tiene datos ruidosos como emoticones, hashtags, caracteres especiales, hipervínculos o etiquetas HTML. Debido a lo anterior, se pierde parte de la información que puede ser relevante a la hora de definir la polaridad de un mensaje. Adicionalmente, los enfoques basados en diccionarios fallan a la hora de relacionar términos y analizar el contexto en que las palabras se escriben. Por ello, en esta Tesis de Maestría se propone la definición de un lenguaje controlado para el análisis de sentimientos en Twitter para mensajes en inglés, el cual tiene como finalidad transformar las opiniones de los usuarios en una estructura que facilite su clasificación en polaridades negativas o positivas mediante reglas sintácticas, representando el lenguaje natural en textos controlados que se podrían utilizar para mejorar los métodos existentes en la literatura para el análisis de sentimientos. Una vez se implementa el lenguaje controlado, las palabras adquieren valor sintáctico, se estandariza la terminología y el formato de la información, por lo cual los mensajes son más precisos e inequívocos y, por consiguiente, son útiles como punto de partida para la automatización del razonamiento.Abstract: Sentiment analysis—SA, also known as opinion mining—is intended to determine the polarity of a given text. SA is the field of study for analyzing the emotional response of social network users in order to help decision making in social, economic, political, labor, and financial fields. One of the social networks gaining more popularity in sentiment analysis is Twitter, since it is a social microblogging tool which allows users for expressing their opinions and ideas in concise and short (280 characters) texts ideal to draw statistics from specific topics. The vocabulary used in social networks has inherent problems regarding natural language. Commonly, such problems are solved in computational linguistics by using controlled languages. A controlled language is a subset of natural language with restrictions in terminology for reducing ambiguity and providing accuracy to future analyses. Concepts of connotation and denotation are needed to understand the meaning words have in certain vocabulary. Connotation of a word includes subjective elements and it implies interpretation. On the other hand, denotation is defined as a formal and objective expression, i.e., the universal meaning a word. Related to the function of words within a text, the syntax analysis supports the way the words in a sentence are interrelated and the grammatical category of each word. Syntax trees can be used for carrying out a syntax analysis. In opinion mining, data pre-processing is commonly used for removing noise/inconsistencies in order to prepare data for a future analysis. Pre-processing has some steps: tokenization, deletion of noisy data, deletion of jargon words, spell checking, and finally stemming. Previous work about sentiment analysis includes lexicon-based methods with dictionary-based methods. In such methods, analysis of different corpus elements is estimated in some social networks, but it requires a greater intervention and transformation of the message before defining its polarity due to the lack of a controlled language. Also, natural language used in social networks has challenges in its computational analysis, because it presents polysemy and synonymy, and noisy data—e.g., emojis, hashtags, special characters, hyperlinks, and HTML tags. As a result, part of. the information relevant at the time of defining the polarity of a message is lost. In addition, dictionary-based methods fail in relating concepts and analyzing the context in which the words are written. For this reason, in this M.Sc. thesis we propose the definition of a controlled language for sentiment analysis in Twitter English messages. We intend to transform the user opinion into a structure for easing their classification into negative/positive polarities by using syntax rules. We represent natural language in controlled texts to be used for improving the existing sentiment analysis methods of the state of the art. Once controlled language is implemented, the words acquire syntactic value, the terminology and the format of the information are standardized, and consequently the messages are more precise and unambiguous. So, they are useful for the reasoning automation.Maestrí

    The short term effects of non-action video games on reading abilities in fist grade children of primary school

    openIl gioco è un’attività altamente gratificante che offre benefici di tipo fisico, emotivo, sociale e cognitivo. Tra gli aspetti più importanti dello sviluppo cognitivo viene evidenziata l’abilità di lettura, un processo dinamico basato sull’utilizzo dell’attenzione spazio-temporale e di movimenti oculari organizzati che ci permettono di favorire lo shift attentivo. Al giorno d’oggi, i videogiochi sono una delle forme di più gioco più diffuse al mondo, e in parallelo allo sviluppo di quest’industria è emersa l’indagine del loro impatto positivo sullo sviluppo emotivo, sociale e cognitivo. In questo studio sono stati esaminati 70 bambini al primo anno di scuola elementare, comparando la loro prestazione ad un video gioco d’azione (AVG), un video gioco non d’azione (NAVG) con una baseline, per comprendere come potessero impattare le loro abilità motorie, verbali e visuo-spaziali. I risultati ottenuti non evidenziano differenze significative nei profili neuropsicologici in baseline per la condizione NAVG, che non sembrerebbe quindi richiedere abilità cognitive particolari. Focalizzando l’attenzione sull’effetto dei NAVG sull’abilità di lettura, si osserva un aumento della velocità ma anche un aumento degli errori commessi, che rispecchierebbe un cambio di strategia piuttosto che un vero miglioramento della performance (effetto trade-off). In futuro sarebbe importante continuare ad esplorare il potenziale dei NAVG come forma d’intervento nei confronti di soggetti con diverse necessità e caratteristiche cognitive

    Environnement graphique, pratiques et attitudes linguistiques à l'hôpital de Saint-Laurent du Maroni

    Le but de cet article est d'interroger la politique linguistique de l'hôpital de Saint-Laurent - dans ses aspects explicites et implicites - en proposant une première description de l'usage public des langues à l'hôpital. Après avoir présenté quelques caractéristiques des populations (soignantes et soignées) en présence, on s'intéresse à l'environnement graphique de l'hôpital, aux pratiques écrites publiques, puis aux discours tenus par différents acteurs hospitaliers sur la prise en compte des langues des patients, enfin, on propose une description des pratiques orales présentes au sein de l'hôpital

    Nagyot mondó képviselők? : fokozás a politikai kommunikációban

    A politikai kommunikációban megjelenő érzelemkifejezés kutatása az utóbbi évtizedekben egyre nagyobb hangsúlyt kap. Dolgozatunkban azt vizsgáljuk, hogy a nyelvi fokozás milyen kvantitatív és kvalitatív sajátságokkal jelenik meg a politikai kommunikációban. A fokozó elemek csoportján belül külön figyelmet fordítunk az ún. negatív emotív fokozókra, amelyek prior szemantikai tartalma valamely negatív érzelemhez kapcsolódik, azonban fokozó elemekként funkcionálhatnak. Ezzel összefüggésben a szövegek szentimentjét is elemezzük: azt vizsgáljuk, hogy mely szentimentértékű szavak jelentését intenzifikálják a politikusok a fokozó szavak segítségével. Mindezek segítségével megmutatjuk, hogy milyen kvalitatív és kvantitatív sajátságok jellemzik a nyelvi fokozás tekintetében a kormánypárti és az ellenzéki kommunikációt, valamint, hogy hogyan befolyásolja mindezt a Covid19-járvány

    Modello Big Five di Personalità in adulti: Effetti di indicatori diversi di livello socio-culturale

    L’obiettivo della presente ricerca è stato quello di indagare l’influenza dei principali indicatori di livello socioculturale (LSC) sulle dimensioni del modello Big Five di Personalità in adulti. In particolare, si è voluto verificare se le dimensioni di personalità variassero in base a Status socioeconomico (SES, professione e livello d’istruzione), Capitale Culturale e Capitale Sociale dell'individuo. Per questo scopo, sono stati somministrati a genitori di studenti delle scuole superiori il Big Five Questionnaire-2 (BFQ-2), per indagare le dimensioni e sottodimensioni di personalità, e questionari specifici a ciascun indicatore del LSC. Dai risultati è emerso che SES, Capitale Culturale e Capitale Sociale dell'individuo hanno effetti differenziati sulle dimensioni (e sottodimensioni) del BFQ-2

    „Gefühl ist alles; Name ist Schall und Rauch.“ Der Einsatz von Sentiment Analysis in der quantitativen Dramenanalyse

    In der vorliegenden Masterarbeit wird ein mehrteiliges Projekt vorgestellt, das den Einsatz von Sentiment Analysis (SA) in der quantitativen Dramenanalyse exploriert. Als beispielhafter Untersuchungsgegenstand wird ein Korpus von 11 Dramen des Schriftstellers Gotthold Ephraim Lessing (1729 – 1782) verwendet. Die Arbeit stellt eine Erweiterung eines bestehenden Tools zur quantitativen Dramenanalyse (Katharsis) um eine SA-Komponente dar. Es wurden Python-Programme zur Durchführung der SA entwickelt. Als zentraler SA-Ansatz wird mangels annotierter Trainings-Korpora ein Lexikon-basierter Ansatz gewählt. Um ein optimiertes SA-Verfahren zu identifizieren, werden mehrere Optionen und Herangehensweisen für die SA implementiert und auf ihre Leistung für den spezifischen Anwendungsfall untersucht. Es werden fünf der bekanntesten deutschsprachigen SA-Lexika implementiert sowie eine kombinierte Gesamtversion dieser erstellt. Als weitere Optionen wird der Einfluss einer Lexikonerweiterung mit historischen linguistischen Varianten, von Lemmatisierung über zwei Lemmatisierer und drei Lemmatisierungsarten, von drei verschiedenen Stoppwortlisten und der Beachtung von Groß- und Kleinschreibung implementiert und untersucht. Es werden für alle kombinatorischen Möglichkeiten von Lexika und Optionen verschiedene Sentiment-Metriken auf verschiedenen Ebenen berechnet. Als Ebenen des Dramas werden Sentiment-Metriken für die strukturelle Ebene (Drama, Akt, Szene, Replik), die Sprecher-Ebene (pro Drama, Akt, Szene, Replik) und für Sprecherbeziehungen (pro Dra-ma, Akt, Szene, Replik) kalkuliert. Es werden unterschiedliche Metriken für die Polari-tät (positiv, negativ) und 8 Emotionskategorien auf diesen Ebenen berechnet. Es werden mehrere Evaluationsverfahren durchgeführt. In einer ersten informellen Evaluation wird der Anteil der Wörter der Lexika in Zusammenhang mit den genannten Optionen am Vokabular des Korpus untersucht und diskutiert. Zur Ausführung einer systematischen Evaluation wird ein Gold-Standard von annotierten Repliken erstellt. In einer Annotationsstudie beurteilen 5 Teilnehmer einen repräsentativen Korpus von 200 Repliken bezüglich Polarität und Emotionen. In einem anschließenden Fragebogen konnten Einsichten zu Probleme und Schwierigkeiten bei der Annotation erhoben werden. Die Ergebnisse der Annotation werden statistisch ausgewertet und hinsichtlich Annotationsverhalten untersucht. Als Hauptergebnisse stellt man einen grundsätzlich geringeren Übereinstimmungsgrad als bei anderen Untersuchungsgegenständen in der SA fest. Auffällig ist auch eine starke Ungleichverteilung der Polaritäten im Korpus. Es werden deutlich mehr Repliken als negativ denn als positiv wahr-genommen. Das finale Evaluations-Korpus (Gold Standard, GS) besteht aus 139 negativen und 61 positiven Repliken basierend auf der Mehrheitsentscheidung der Annotatoren. Über ein in Python entwickeltes Evaluationsframework wurde systematisch die SA-Leistung aller Lexika und Methoden hinsichtlich der Prädiktion der Polarität einer Replik untersucht. Verschieden Evaluations-Metriken wurden zur differenzierten Ana-lyse und Diskussion aller Ansätze berechnet. Es können Erkennungsraten von bis zu 70% festgestellt werden. Unter Analyse aller Evaluationsergebnisse wird das leistungsstärkste Verfahren bestimmt. Es setzt sich aus der Methoden-Kombination des Lexikons SentiWS, erweitert durch historische linguistische Varianten, mit einer Lemmatisierung auf Text- und Lexikon-Ebene über den pattern-Lemmatisierer, ohne Stoppwortiste und unter Beachtung von Groß- und Kleinschreibung im letzten Abgleichschritt, zusammen. Für das als am besten identifizierte Verfahren wird ein Front-End zur Visualisierung der SA-Metriken als Web-Anwendung implementiert. Es stehen interaktive Visualisierungen für Polaritäten und Emotionskategorien zur Verfügung. Es können Verteilungen und Verläufe auf Dramen-, Akt-, Szenen-, Replik-, Sprecher- und Sprecherbeziehungs (je pro Drama, Akt, Szene, Replik) exploriert werden. Der mögliche Einsatz in der Dramenanalyse wird anhand vereinzelter Fallbeispiele beschrieben. Ab-schließend werden die Ergebnisse des Gesamtprojekts im Kontext der Forschung diskutiert und mögliche Anknüpfungspunkte besprochen

    Avaliação do perfil factorial da personalidade de mulheres que sofreram um parto prematuro

    Tese de Doutoramento em Psicologia apresentada na Faculdade de Psicologia e de Ciências de Educação, Universidade do PortoDeterminar a estrutura da personalidade de mulheres que sofreram um parto prematuro consubstanciou a questão de investigação, operacionalizada num desenho metodológico de cariz exploratório, observacional e transversal. A amostra, recolhida em duas instituições de saúde na área da Grande Lisboa, foi constituída por 301 mães prematuras. O levantamento dos dados demográficos, clínicos e psicológicos baseou-se num protocolo de avaliação sustentado em dois instrumentos: Questionário de Caracterização da Amostra e Inventário da Personalidade NEO-Revisto (Modelo dos Cinco Factores). As variáveis clínicas e demográficas caracterizam as participantes da seguinte forma: média de 28,39 anos quando o filho prematuro nasceu; 67,12% primíparas; 79,07% de raça caucasiana; 86,05% casadas; 89,03% coabitavam com parceiro; 64,12% planearam, 95,68% desejaram e 95,59% vigiaram a gravidez; 23,23% tinha outro filho prematuro; 77,74% trabalhou durante a gravidez; 66,77% dos partos foram por cesariana; a criança prematura nasceu com uma média de 31,63 semanas de gestação e 1647,90 gramas. As variáveis psicológicas traçam um perfil de personalidade evidenciado pela elevada extroversão (E; p = 0,0001) e baixo neuroticismo (N; p = 0,0001). Assim, as participantes revelam ser pouco hostis (N2; p = 0,0001), pouco deprimidas (N3; p = 0,0001), pouco vulneráveis (N6; p = 0,02) e menos auto-conscientes (N4; p = 0,02). São mais assertivas (E3; p = 0,0001), mais activas (E4; p = 0,0001) e têm mais emoções positivas (E6 p = 0,0001). Valorizam pouco a estética (02; p = 0,01) e as acções (04; p = 0,02), mas revelam mais ideias (05; p = 0,0001) e mais valores (06; p = 0,04). São altruístas (A3; p = 0,04), com boa auto-disciplina (C5; p = 0,002) mas menos deliberadas (C6; p = 0,03) atribuindo pouca importância ao dever (C3; p = 0,0001). Consideradas fortemente femininas, elegem dimensões de afirmação e investimento pessoal e social que se podem revelar antagónicas ao processo de gestação emocional. A estrutura de personalidade da mãe prematura é objecto de reflexão à luz do que se entendem ser os constructos contemporâneos de "Feminino" e "Materno". ------ ABSTRACT ------ The main object of the study was to determine the personality structure of women who delivered prematurely. Based on an exploratory, observational and transversal research design, a sample of 301 premature mothers was obtained in 2 health institutions on the outskirts of Lisbon. The demographic, clinical and psychological data was collected through a research protocol based on the Revised NEO Personality Inventory (Five-Factor Model) and a Sample Questionnaire. The clinical and demographic variables portray the participant in the following manner: average 28,39 years when pre-term child was born; 67,12% were first time mothers; 79,07% were Caucasian; 86,05% were married; 89,03% lived with partner in family home; 64,12% planned, 95,68% desired and 95,59% monitored the pregnancy; 23,23% had previously given birth to another premature child; 77,74% worked during pregnancy; 66,77% of births were through cesarean section; neonates were born with mean gestational age 31,63 weeks and mean weight of 1647,90 grams. The psychological variables, when compared with normative values (Portuguese population) depict a personality profile high in Extroversion (E; p = 0,0001) and low in Neuroticism (N; p = 0,0001). The participants can be characterized as not being hostile (N2; p = 0,0001), vulnerable (N6; p = 0,02) depressed (N3; p = 0,0001) or self-conscious (N4; p = 0,02). Instead they are assertive (E3; p = 0,0001), active (E4; p = 0,0001) and have more positive emotions (E6 p = 0,0001). Although they do not appreciate aesthetics (02; p = 0,01) and actions (04; p = 0,02), they are prone to having more ideas (05; p = 0,0001) and values (06; p = 0,04). Altruistic (A3; p = 0,04), self-disciplined (C5; p = 0,002), less deliberate (C6; p = 0,03) they are not very committed to duty (C3; p = 0,0001). Being what the authors consider as very "feminine", their extroverted and active nature on both the personal and social level is analyzed in view of what is commonly expected of a mother-to-be in the process of "emotional gestation"