6 research outputs found

    Using syntactic rules to combine opinion elements in Chinese opinion mining systems

    Get PDF
    [[abstract]]Most Chinese opinion mining systems use the specific pattern and nearby approach to combine relevant opinion elements (feature words and opinion words) to express the opinion tendencies of authors. In this paper, we propose a rule-based ad hoc method to study the combination problem of Chinese opinion elements. We extracted the opinion elements of articles based on lexicons and then combined them with the different sentence patterns and grammars to analyze the authors’ opinions. Because the articles on the online communities such as blogs, wikis, online forums, etc. do not have a defined format, there are often opinion comments that do not refer to the topic, resulting in information loss and significantly reduced recall. Therefore, the “default topic” method is proposed to correct this type of problem. Additionally, there might be errors when using the nearby approach to combine opinion elements. Thus, we propose the concept of “clause priority” to increase precision. After 20 months of long-term tracking and analysis, the experimental result indicates that the method proposed in this paper had good precision, recall, and F1 of opinion tendency analysis for review articles.[[notice]]補正完畢[[journaltype]]國外[[ispeerreviewed]]Y[[booktype]]紙本[[booktype]]電子版[[countrycodes]]KO

    Sentiment analysis with limited training data

    Get PDF
    Sentiments are positive and negative emotions, evaluations and stances. This dissertation focuses on learning based systems for automatic analysis of sentiments and comparisons in natural language text. The proposed approach consists of three contributions: 1. Bag-of-opinions model: For predicting document-level polarity and intensity, we proposed the bag-of-opinions model by modeling each document as a bag of sentiments, which can explore the syntactic structures of sentiment-bearing phrases for improved rating prediction of online reviews. 2. Multi-experts model: Due to the sparsity of manually-labeled training data, we designed the multi-experts model for sentence-level analysis of sentiment polarity and intensity by fully exploiting any available sentiment indicators, such as phrase-level predictors and sentence similarity measures. 3. LSSVMrae model: To understand the sentiments regarding entities, we proposed LSSVMrae model for extracting sentiments and comparisons of entities at both sentence and subsentential level. Different granularity of analysis leads to different model complexity, the finer the more complex. All proposed models aim to minimize the use of hand-labeled data by maximizing the use of the freely available resources. These models explore also different feature representations to capture the compositional semantics inherent in sentiment-bearing expressions. Our experimental results on real-world data showed that all models significantly outperform the state-of-the-art methods on the respective tasks.Sentiments sind positive und negative Gefühle, Bewertungen und Einstellungen. Die Dissertation beschäftigt sich mit lernbasierten Systemen zur automatischen Analyse von Sentiments und Vergleichen in Texten in natürlicher Sprache. Die vorliegende Abeit leistet dazu drei Beiträge: 1. Bag-of-Opinions-Modell: Zur Vorhersage der Polarität und Intensität auf Dokumentenebene haben wir das Bag-of-Opinions-Modell vorgeschlagen, bei dem jedes Dokument als ein Beutel Sentiments dargestellt wird. Das Modell kann die syntaktischen Strukturen von subjektiven Ausdrücken untersuchen, um eine verbesserte Bewertungsvorhersage von Online-Rezensionen zu erzielen. 2. Multi-Experten-Modell: Wegen des Mangels an manuell annotierten Trainingsdaten haben wir das Multi-Experten-Modell entworfen, um die Sentimentpolarität und -intensität auf Satzebene zu analysieren. Das Modell kann alle möglichen Sentiment-Indikatoren verwenden, wie Prädiktoren auf Phrasenebene und Ähnlichkeitsmaße von Sätzen. 3. LSSVMrae-Modell: Um Sentiments von Entitäten zu verstehen, wir haben wir das LSSVMrae-Modell zur Extraktion von Sentiments und Vergleichen von Entitäten auf Satz- und Ausdrucksebene vorgeschlagen. Die unterschiedliche Granularität der Analyse führt zu unterschiedlicher Modellkomplexität; je feiner, desto komplexer. Alle vorgeschlagenen Modelle zielen darauf ab, möglichst wenige manuell annotierte Daten und möglichst viele frei verfügbare Ressourcen zu verwenden. Diese Modelle untersuchen auch verschiedene Merkmalsdarstellungen, um die Kompositionssemantik abzubilden, die subjektiven Ausdrücken inhärent ist. Die Ergebnisse unserer Experimente mit Realweltdaten haben gezeigt, dass alle Modelle für die jeweiligen Aufgaben deutlich bessere Leistungen erzielen als die modernsten Methoden

    Investigating and extending the methods in automated opinion analysis through improvements in phrase based analysis

    Get PDF
    Opinion analysis is an area of research which deals with the computational treatment of opinion statement and subjectivity in textual data. Opinion analysis has emerged over the past couple of decades as an active area of research, as it provides solutions to the issues raised by information overload. The problem of information overload has emerged with the advancements in communication technologies which gave rise to an exponential growth in user generated subjective data available online. Opinion analysis has a rich set of applications which are used to enable opportunities for organisations such as tracking user opinions about products, social issues in communities through to engagement in political participation etc.The opinion analysis area shows hyperactivity in recent years and research at different levels of granularity has, and is being undertaken. However it is observed that there are limitations in the state-of-the-art, especially as dealing with the level of granularities on their own does not solve current research issues. Therefore a novel sentence level opinion analysis approach utilising clause and phrase level analysis is proposed. This approach uses linguistic and syntactic analysis of sentences to understand the interdependence of words within sentences, and further uses rule based analysis for phrase level analysis to calculate the opinion at each hierarchical structure of a sentence. The proposed opinion analysis approach requires lexical and contextual resources for implementation. In the context of this Thesis the approach is further presented as part of an extended unifying framework for opinion analysis resulting in the design and construction of a novel corpus. The above contributions to the field (approach, framework and corpus) are evaluated within the Thesis and are found to make improvements on existing limitations in the field, particularly with regards to opinion analysis automation. Further work is required in integrating a mechanism for greater word sense disambiguation and in lexical resource development

    Method for Automatically Extracting of Tourism Destination Image from Chinese Social Networks. The case of Spain.

    Get PDF
    La creciente importancia de las redes sociales (RRSS) como fuente de información de opiniones turísticas y el auge del mercado chino son las dos razones que justifican este trabajo. Revisando los estudios de los últimos 10 años, nos pone de manifiesto interesantes huecos de estudio que son los que nos han inspirado los objetivos de este trabajo. En primer lugar, observamos el creciente uso de las RRSS por el parte de los turistas tanto como fuente de información como para la creación de contenido. También destacamos la siempre necesidad de profundizar en el estudio de la imagen de destino. En tercer lugar, debemos tener en cuenta la importancia que en el estudio de la imagen ésta no se puede valorar tan solo por los atributos sino que se debe contar también con los sentimientos de los turistas. Además, descubrimos la falta de una metodología automática que permita trabajar con grandes cantidades de información extraídas de las RRSS. En quinto lugar, no podemos pasar por alto la importancia y la diferencia de los mercados chino-parlantes. Por último, sentimos la necesidad de crear una metodología para trabajar correctamente con la lengua china. Por lo tanto, establecemos dos objetivos generales en esta Tesis. El primer objetivo general es el de diseñar un método de extracción automática que permita analizar la imagen de un destino que poseen los chino-parlantes a través de la información volcada en las RRSS. El segundo objetivo general se basa en poner a prueba el modelo propuesto para poder conocer la imagen entre los turistas chino-parlantes sobre un destino en concreto. Siguiendo los pasos del procesamiento del lenguaje natural, analizamos textos desorganizados en chino y conseguimos crear un método de extracción automática para detectar la imagen que posen los chino-parlantes a través de la información volcada en las redes sociales. Además, ponemos a prueba este modelo propuesto en el caso real de España. Descubrimos que los turistas chino-parlantes poseen generalmente una buena imagen sobre este destino. Los temas relacionados con la carretera, ciudad y pueblo, precio e información turística son los más comentados por los turistas chino-parlantes. En la Tesis se detalla más información sobre el resultado de este caso. Este método novedoso y automático de extracción y análisis de los comentarios en redes sociales sobre todo de los chino-parlantes es capaz de trabajar con gran cantidad de información en chino y detectar los atributos según el parámetro que determinamos a priori. Se trata de un método de trabaja de forma eficaz y capaz de ahorrar mucho tiempo en la tarea de recopilación de comentarios, la visualización de cada uno y la clasificación de palabras, evitando de este modo tareas tediosas. Esta propuesta de modelo es aplicable a cualquier destino pero siempre es necesario ajustarlo por poder adaptarlo al caso concreto
    corecore