183 research outputs found

    Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español

    Get PDF
    Recientemente el análisis de sentimientos (AS) ha mostrado un alto interés debido a la producción a gran escala de opiniones por parte de usuarios en la Internet. Las empresas en general, necesitan saber la reputación que tienen ante sus usuarios en la Web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de AS que detectan el sentimiento global de una opinión escrita sobre una frase o un documento completo; estos sistemas resultan a veces incompletos ante la realidad de las organizaciones que quieren saber en detalle el comportamiento de sus productos. Resultados de esa necesidad, existen enfoques de AS dedicados a realizar un análisis más completo de grano fino, en donde se identifican las características o aspectos más importantes de una opinión para poder determinar el sentimiento de cada uno de los aspectos. Sin embargo, la mayoría de enfoques, no tienen en cuenta el concepto o significado de las palabras en el proceso de identificar los aspectos, por otra parte, se necesita un gran número de documentos etiquetados manualmente para determinar el sentimiento. Con el fin de dar solución a estos problemas, este trabajo de tesis doctoral, propone la construcción de un modelo para analizar sentimientos a nivel de aspectos en español, que permita extraer automáticamente las características de una opinión y determinar el sentimiento (polaridad) asociado. El modelo está basado en dos técnicas, la primera se basa en ontologías para detección aspectos explícitos e implícitos y la segunda, utiliza el aprendizaje de máquina no supervisado para determinar la polaridad sobre una estructura gramatical simple. Este modelo tiene en cuenta el significado de los aspectos en el momento de extracción, y es completamente no supervisado, lo que permite implementar un sistema que sea rápidamente escalable a cualquier idioma o dominio. Para la implementación del modelo, se desarrolló el prototipo AspectSA (elaborado en JAVA), que contiene componentes de software que permiten realizar el análisis de sentimientos a nivel de aspectos en los dominios de restaurante y hoteles. Adicionalmente, este prototipo se validó utilizando un conjunto de experimentos basados en corpus, desarrollados por SemEval 2016 en español. Los resultados obtenidos superaron a todos los participantes de SemEval y a los sistemas existentes para el lenguaje español.Abstract: Recently the sentiment analysis has shown a high interest due to large-scale production of opinions by users on the Internet. The companies generally need to know the reputation they have of their users on the Web. So far, the vast majority of research involving this systems that detect the overall sentiment of a written opinion on a phrase or an entire document. These systems are sometimes incomplete before the reality of organizations that want to know in detail the behavior of their products. Due to the above, there are some approaches dedicated to a more complete analysis offine grain, where the characteristics or most important aspects of an opinion are identified in order to determine the feeling of each one of the aspects. However, most approaches do not take into account the concept or meaning of words in the process of identifying aspects and also a large number of documents labeled manually is needed to determine the sentiment. In order to solve these problems, this doctoral thesis proposes the construction of a model to aspect-based sentiment analysis in Spanish that allows to automatically extract the characteristics of an opinion and determine the associated sentiment (polarity). The model is based on Ontologies for detection of characteristics (explicit and implicit aspects) and machine learning unsupervised to determine the polarity on a simple grammatical structure. This model takes into account the meaning of the aspects at the time of extraction and is completely unsupervised which allows to implement a system that is quickly scalable to any language or domain. For the implementation of the model was developed the prototype AspectSA (elaborated in JAVA), which contains software components that allow the aspect-based sentiment analysis in the domains of restaurants and hotels. In addition, this prototype was validated using a set of experiments based on the data set developed by SemEval 2016 in Spanish. The results obtained exceeded all SemEval participants and the existing systems for the Spanish language.Doctorad

    Aspect-based sentiment analysis using ontologies and machine learning

    Get PDF
    [EN] In this paper, we present an aspect-based sentiment analysis system that allows to automatically extract the characteristics of an opinion and to determine their associated polarity. The proposed system is based on a model that uses domain ontologies for the detection of aspects and a classifier based on the Support Vector Machines formalism for assigning the polarity to the detected aspects. The experimental work was conducted using the dataset developed for Task 5, Sentence-level ABSA in SemEval 2016 for Spanish. The proposed system has obtained a 73.07 in F1 in the aspect extraction subtask (slot2) and a 46.24 of F1 in the categorization and aspect extraction subtask (slot1,2) using an ontology-based approach. For the sentiment classification subtask (slot3) an 84.79% in terms of Accuracy has been obtained using an approach based on Support Vector Machines and polarity lexicons. These results are better than those reported in SemEval.[ES] En este artículo se presenta un sistema de análisis de sentimientos a nivel de aspecto que permite extraer automáticamente las características de una opinión y determinar la polaridad asociada. El sistema propuesto está basado en un modelo que utiliza ontologías de dominio para la detección de los aspectos y un clasificador basado en Máquinas de Soporte Vectorial para la asignación de la polaridad a los aspectos detectados. El trabajo experimental se ha realizado utilizando el conjunto de datos desarrollado para la Tarea 5, Sentence-level ABSA en SemEval 2016 para el español. El sistema propuesto ha obtenido un 73.07 en F1 en la extracción de aspectos (slot2) y un 46.24 de F1 en la subtarea conjunta de categorización y extracción de aspectos (slot1,2) utilizando una aproximación basada en ontologías. Para la subtarea de clasificación de sentimientos (slot3) se ha obtenido una Accuracy de 84.79 % utilizando una aproximación basada en el uso de Máquinas de Soporte Vectorial y lexicones de polaridad. Estos valores superan los mejores resultados obtenidos en SemEval.Este trabajo ha sido parcialmente subvencionado por el proyecto ASLP-MULAN: Audio, Speech and Language Processing for Multimedia Analytics (MINECO TIN2014-54288-C4-3-R y fondos FEDER). La estancia realizada, de enero a marzo de 2017, por Carlos Henríquez en la UPV, ha sido subvencionado por el programa Colciencias (convocatoria 727), Universidad Nacional de Medellín y Universidad Autónoma del Caribe Barran-quilla.Carlos Henríquez; Pla Santamaría, F.; Hurtado Oliver, LF.; Jaime Guzmán (2017). Análisis de sentimientos a nivel de aspecto usando ontologías y aprendizaje automático. PROCESAMIENTO DEL LENGUAJE NATURAL. (59):49-56. http://hdl.handle.net/10251/101450S49565

    Construcción de una ontología para un modelo socioecológico de gestión de playas: un enfoque preliminar

    Full text link
    [ES] En la literatura sobre el Procesamiento del Lenguaje Natural (PLN) existe una variedad de herramientas al respecto de los métodos más adecuados para procesar el uso natural de la lengua con herramientas informáticas. En esta investigación, se inicia un estudio sobre la creación de una ontología con el objetivo de que sea utilizada para la detección de cuestiones relativas a la gestión de playas. Por este motivo, se realiza una revisión de la bibliografía del uso de ontologías para el PLN y la detección de problemas medioambientales usando sensores sociales. Además, se analizan diferentes metodologías empleadas con fines diversos y se opta, de manera preliminar, por la metodología más adecuada a los objetivos de este estudio. Esta investigación surge de la necesidad de contribuir en el desarrollo de una ontología de estas características específicas en español.[EN] In the literature on Natural Language Processing (NLP) a diversity of tools is proposed regarding the most appropriate methods to process the natural use of language using technology. This research is the beginning of a study on the creation of an ontology in order to be used for the detection of issues related to beach management. For this reason, a review of the bibliography of the use of ontologies for the NLP and the detection of environmental problems using social sensors is carried out. In addition, different methodologies used for various purposes are analyzed and a preliminary choice of the most appropriate methodology for the objectives of this study is made. This research arises from the need to contribute with an ontology of these specific characteristics in Spanish.Zakhir Puig, S. (2021). Construcción de una ontología para un modelo socioecológico de gestión de playas: un enfoque preliminar. Universitat Politècnica de València. http://hdl.handle.net/10251/175203TFG

    Adopción y uso de sistemas de organización del conocimiento específicos de dominio: análisis y evaluación de factores limitantes

    Get PDF
    Los sistemas de organización del conocimiento (KOS – “Knowledge Organization Systems”) son una herramienta de gran ayuda de cara a la clasificación, organización y localización de información. La construcción de un KOS parte de una serie de términos, cuya selección en la mayor parte de los casos atiende a un dominio específico. Sobre estos términos se establecen distintas relaciones, como podría ser una relación jerárquica o una relación de equivalencia. La forma más elemental de uso de KOS consiste en valerse de los términos que los componen como palabras clave, mientras que las relaciones existentes permiten desarrollar funcionalidades avanzadas empleadas en áreas como la inteligencia artificial o la web semántica, entre otras. Los usuarios pueden beneficiarse de esta información de manera consciente mediante el empleo de interfaces que permiten operar con los términos y relaciones de un KOS, ya sea de manera textual o visual. La investigación relativa al desarrollo de estas interfaces tiene un largo recorrido y múltiples estudios muestran las potenciales ventajas que ofrecen para el usuario final. Sin embargo, a nivel práctico, su uso no está extendido en este sentido, contradiciendo los beneficios que resultan a nivel teórico. El presente trabajo persigue indagar en algunas de las posibles causas de este desuso y contribuir aportando metodologías que permitan evaluar su impacto, proporcionando información de utilidad para modificar un KOS de forma que se potencie su uso
    corecore