2 research outputs found

    Метод межъязыкового аспектно-ориентированного анализа высказываний с использованием машинного обучение категоризационной модели.

    Get PDF
    Product reviews are the foremost source of information for customers and manufacturers to help them make appropriate purchasing and production decisions. Today, the Internet has become the largest source of consumer thought. Sentiment analysis and opinion mining is the field of study that analyzes people’s opinions, sentiments, evaluations, attitudes, and emotions from written language. In this paper, we present a study of aspect-based opinion mining using a lexicon-based approach and their adaptation to the processing of responses written in Ukrainian and English. This information helps to build systems to understand customer’s feedback and plan business strategies accordingly. This also helps in predicting the chances of product failure. In this paper, it is explained how machine learning can be used for opinion mining. The research methods used in the work are based on data mining methods, Web mining, machine learning, and information retrieval. The stages of the method of cross-language aspect-oriented analysis of statements are presented. The cross-language categorization of characteristics of goods is considered. The algorithm describes the model learning in cross-language virtual contextual documents.Відгуки про продукцію є головним джерелом інформації для клієнтів і виробників, щоб допомогти їм прийняти відповідні рішення щодо закупівель і виробництва. Сьогодні Інтернет став найбільшим джерелом споживчої думки. Аналіз настроїв і видобування думок є сферою дослідження, яка аналізує думки людей, почуття, оцінки, ставлення та емоції з природно-мовного тексту. У даній роботі представлено дослідження аспектно-орієнтованого видобування думок з використанням лексіконного підходу та його адаптація до обробки відповідей, написаних українською та англійською мовами. Ця інформація допомагає створювати системи для розуміння зворотного зв'язку клієнта та планування відповідних бізнес-стратегій. Це також допомагає прогнозувати шляхи запобігання невдач при просуванні на ринку продуктів. У цій роботі розглянуто використання машинного навчання для видобутку думок клієнтів. Методи дослідження, що використовуються в роботі, базуються на методах інтелектуального аналізу даних, веб-добуванні, машинному навчанні та пошуку інформації. Представлено етапи методу міжмовного аспектно-орієнтованого аналізу тверджень. Розглянуто перехресну категоризацію характеристик товарів. Алгоритм описує модель навчання на міжмовному віртуальному контекстному документі.Отзывы о продукции является главным источником информации для клиентов и производителей, чтобы помочь им принять соответствующие решения в части закупок и производства. Сегодня Интернет стал крупнейшим источником потребительского мнения. Анализ настроений и выявления мыслей является сферой исследования, которая анализирует мнения людей, чувства, оценки, отношения и эмоции с естественно-языкового текста. В данной работе представлено исследование аспектно-ориентированного выявления мыслей с использованием лексиконного подхода и его адаптация к обработки ответов, написанных на украинском и английском языках. Эта информация помогает создавать системы для понимания обратной связи клиента и планирования соответствующих бизнес-стратегий. Это также помогает прогнозировать пути предотвращения неудач при продвижении на рынке продуктов. В этой работе рассмотрено использование машинного обучения для выявления мнений клиентов. Методы исследования, используемые в работе, базируются на методах интеллектуального анализа данных, веб-добывании, машинном обучении и поиска информации. Представлены этапы метода межъязыкового аспектно-ориентированного анализа утверждений. Рассмотрена перекрестная категоризацию характеристик товаров. Алгоритм описывает модель обучения на межъязыковой виртуальном контекстном документе

    Korpusbasierte Verfahren zur Generierung lexikalischer Ressourcen für das Opinion Mining. Statistische Ansätze und deren Einsatzmöglichkeiten

    Get PDF
    Die ständig zunehmende Anzahl nutzergenerierter textueller Daten im World Wide Web, wie beispielsweise Kundenrezensionen, und die Begehrlichkeiten diese Daten hinsichtlich der darin ausgedrückten Meinungen zu Unternehmen, Produkten, Dienstleistungen etc. maschinell auszuwerten, erfordern gut funktionierende, angepasste Methoden des Opinion Mining. Die Grundlage für viele dieser Methoden bilden lexikalische Ressourcen in Form von Lexika meinungstragender Wörter und Phrasen. Diese Lexika existieren bisher allerdings nur für ausgewählte Sprachen, haben diverse inhaltliche Lücken, und sind automatisch (für verschiedene Sprachen) nur mit großem Aufwand zu erzeugen. In dieser Arbeit wird deshalb ein neues Verfahren vorgestellt, das dazu beitragen soll, die benannten Probleme – durch den Einsatz statistischer Methoden – zu überwinden. Zudem wurde, mittels dieses Verfahrens, der Prototyp eines neuen Lexikons mit meinungstragenden Wörtern und Phrasen für die deutsche Sprache generiert und anschließend evaluiert. Dafür wurde im Rahmen eines Experiments mit 20 Teilnehmern ein Basis-Referenzlexikon für die deutsche Sprache manuell erzeugt. Klassische Einsatzgebiete der Opinion Mining Algorithmen und Ressourcen, und damit des vorgestellten Verfahrens, sind Systeme zur Erfassung von Kundenmeinungen zu verschiedenen Unternehmensbereichen zur Unterstützung des Beschwerde- und Reputationsmanagements. Allerdings sind die Möglichkeiten des neu entwickelten Verfahrens nicht auf diese klassischen Anwendungsfelder begrenzt. Auch der interdisziplinäre Einsatz, z.B. zur Untersuchung von Sprachvarietäten im Forschungsfeld der Sprachstatistik, ist denkbar.The constantly increasing number of user-generated textual data on the World Wide Web, such as customer reviews, and the desire to automatically analyze this data with regard to the opinions expressed therein regarding companies, products, services, etc., require well-functioning, adapted opinion mining methods. Lexical resources – i.e. lexicons of opinion-bearing words and phrases – form the basis for many of these methods. However, these lexicons only exist for selected languages, have various content gaps, and can only be generated automatically (for different languages) with great effort. In this thesis a new method is presented to help overcome the above described problems by using statistical methods. In addition, the prototype of a new lexicon including opinion-bearing words and phrases for the German language was generated by using this method. In order to evaluate this automatically generated resource, an experiment with 20 participants was performed to manually create a reference lexicon for the German language. Traditional application areas of opinion mining algorithms and resources, and thus of the presented approach, are systems for recording customer opinions on various areas of companies in support of complaint and reputation management. However, the possibilities of the newly developed method are not limited to these classic fields of application. Interdisciplinary use, e.g. to study language varieties in the research field of language statistics, is also conceivable
    corecore