213 research outputs found

    Opinion Mining based on the Spanish adaptation of ANEW on hotel customer comments

    Get PDF
    La minería de opiniones (MO) ha mostrado una alta tendencia de investigación en los últimos años debido a la producción en gran escala de opiniones y comentarios por parte de usuarios activos en Internet. Las empresas y organizaciones en general están interesadas en conocer cuál es la reputación que tienen de sus usuarios en las redes sociales, blogs, wikis y otros sitios web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de MO en el idioma inglés. Por este motivo, la comunidad científica está interesada en trabajos diferentes a este lenguaje. En este artículo se muestra la construcción de un sistema de minería de opiniones en español sobre comentarios dados por clientes de diferentes hoteles. El sistema trabaja bajo el enfoque léxico utilizando la adaptación al español de las normas afectivas para las palabras en inglés (ANEW). Estas normas se basan en las evaluaciones que se realizaron en las dimensiones de valencia, excitación y el dominio. Para la construcción del sistema se tuvo en cuenta las fases de extracción, preprocesamiento de textos, identificación del sentimiento y la respectiva clasificación de la opinión utilizando ANEW. Los experimentos del sistema se hicieron sobre un corpus etiquetado proveniente de la versión en español de Tripadvisor. Como resultado final se obtuvo una precisión del 94% superando a sistemas similares.Recently, the Opinions Mining (OM) has shown a high tendency of research due to large-scale production of opinions and comments from users over the Internet. Companies and organizations, in general terms, are interested in knowing what is the reputation they have in social networks, blogs, wikis and other web sites. So far, the vast majority of research involving systems MO in English. For this reason, the scientific community is interested in researching different to this language. This article is about the construction of a mining system views in Spanish based on comments given by different clients and hotels. The system works on the lexical approach using Spanish adaptation of affective standards for English words (ANEW). These standards are based on evaluations conducted in the dimensions of valence, arousal and dominance. For the construction of the system took into account the phases of extraction, preprocessing of texts, identification of feelings and the respective ranking of the opinion using ANEW. System experiments were made on labeling a corpus from the Spanish version of Tripadvisor. As a result, precision exceeding 94% was obtained at similar systems

    Un modelo integrado de técnicas de aprendizaje de máquinas no supervisadas y ontologías para la detección automática de sentimientos desde una estructura gramatical simple en español

    Get PDF
    Recientemente el análisis de sentimientos (AS) ha mostrado un alto interés debido a la producción a gran escala de opiniones por parte de usuarios en la Internet. Las empresas en general, necesitan saber la reputación que tienen ante sus usuarios en la Web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de AS que detectan el sentimiento global de una opinión escrita sobre una frase o un documento completo; estos sistemas resultan a veces incompletos ante la realidad de las organizaciones que quieren saber en detalle el comportamiento de sus productos. Resultados de esa necesidad, existen enfoques de AS dedicados a realizar un análisis más completo de grano fino, en donde se identifican las características o aspectos más importantes de una opinión para poder determinar el sentimiento de cada uno de los aspectos. Sin embargo, la mayoría de enfoques, no tienen en cuenta el concepto o significado de las palabras en el proceso de identificar los aspectos, por otra parte, se necesita un gran número de documentos etiquetados manualmente para determinar el sentimiento. Con el fin de dar solución a estos problemas, este trabajo de tesis doctoral, propone la construcción de un modelo para analizar sentimientos a nivel de aspectos en español, que permita extraer automáticamente las características de una opinión y determinar el sentimiento (polaridad) asociado. El modelo está basado en dos técnicas, la primera se basa en ontologías para detección aspectos explícitos e implícitos y la segunda, utiliza el aprendizaje de máquina no supervisado para determinar la polaridad sobre una estructura gramatical simple. Este modelo tiene en cuenta el significado de los aspectos en el momento de extracción, y es completamente no supervisado, lo que permite implementar un sistema que sea rápidamente escalable a cualquier idioma o dominio. Para la implementación del modelo, se desarrolló el prototipo AspectSA (elaborado en JAVA), que contiene componentes de software que permiten realizar el análisis de sentimientos a nivel de aspectos en los dominios de restaurante y hoteles. Adicionalmente, este prototipo se validó utilizando un conjunto de experimentos basados en corpus, desarrollados por SemEval 2016 en español. Los resultados obtenidos superaron a todos los participantes de SemEval y a los sistemas existentes para el lenguaje español.Abstract: Recently the sentiment analysis has shown a high interest due to large-scale production of opinions by users on the Internet. The companies generally need to know the reputation they have of their users on the Web. So far, the vast majority of research involving this systems that detect the overall sentiment of a written opinion on a phrase or an entire document. These systems are sometimes incomplete before the reality of organizations that want to know in detail the behavior of their products. Due to the above, there are some approaches dedicated to a more complete analysis offine grain, where the characteristics or most important aspects of an opinion are identified in order to determine the feeling of each one of the aspects. However, most approaches do not take into account the concept or meaning of words in the process of identifying aspects and also a large number of documents labeled manually is needed to determine the sentiment. In order to solve these problems, this doctoral thesis proposes the construction of a model to aspect-based sentiment analysis in Spanish that allows to automatically extract the characteristics of an opinion and determine the associated sentiment (polarity). The model is based on Ontologies for detection of characteristics (explicit and implicit aspects) and machine learning unsupervised to determine the polarity on a simple grammatical structure. This model takes into account the meaning of the aspects at the time of extraction and is completely unsupervised which allows to implement a system that is quickly scalable to any language or domain. For the implementation of the model was developed the prototype AspectSA (elaborated in JAVA), which contains software components that allow the aspect-based sentiment analysis in the domains of restaurants and hotels. In addition, this prototype was validated using a set of experiments based on the data set developed by SemEval 2016 in Spanish. The results obtained exceeded all SemEval participants and the existing systems for the Spanish language.Doctorad

    Opinion mining based on the spanish adaptation of ANEW on hotel customer comments

    Get PDF
    La minería de opiniones (MO) ha mostrado una alta tendencia de investigación en los últimos años debido a la producción en gran escala de opiniones y comentarios por parte de usuarios activos en Internet. Las empresas y organizaciones en general están interesadas en conocer cuál es la reputación que tienen de sus usuarios en las redes sociales, blogs, wikis y otros sitios web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de MO en el idioma inglés. Por este motivo, la comunidad científica está interesada en trabajos diferentes a este lenguaje. En este artículo se muestra la construcción de un sistema de minería de opiniones en español sobre comentarios dados por clientes de diferentes hoteles. El sistema trabaja bajo el enfoque léxico utilizando la adaptación al español de las normas afectivas para las palabras en inglés (ANEW). Estas normas se basan en las evaluaciones que se realizaron en las dimensiones de valencia, excitación y el dominio. Para la construcción del sistema se tuvo en cuenta las fases de extracción, pre procesamiento de textos, identificación del sentimiento y la respectiva clasificación de la opinión utilizando ANEW. Los experimentos del sistema se hicieron sobre un corpus etiquetado proveniente de la versión en español de Tripadvisor. Como resultado final se obtuvo una precisión del 94% superando a sistemas similares.Receantly, the Opinions Mining (OM) has shown a high tendency of research due to large-scale production of opinions and comments from users over the Internet. Companies and organizations, in general terms, are interested in knowing what is the reputation they have in social networks, blogs, wikis and other web sites. So far, the vast majority of research involving systems MO in English. For this reason, the scientific community is interested in researching different to this language. This article is about the construction of a mining system views in Spanish based on comments given by different clients and hotels. The system works on the lexical approach using Spanish adaptation of affective standards for English words (ANEW). These standards are based on evaluations conducted in the dimensions of valence, arousal and dominance. For the construction of the system took into account the phases of extraction, preprocessing of texts, identification of feelings and the respective ranking of the opinion using ANEW. System experiments were made on labeling a corpus from the spanish version of Tripadvisor. As a result, precision exceeding 94% was obtained at similar systems

    Análisis de sentimiento a nivel aspectual en el dominio de la experiencia de usuario en aprendizaje virtual

    Full text link
    [ES] Las plataformas de aprendizaje virtual son una herramienta popular para realizar cursos que permitan ampliar los conocimientos de su alumnado y su evaluación está en un estado incipiente de investigación. A su vez el análisis de sentimiento es una disciplina del procesamiento del lenguaje natural que resulta de gran utilidad para conocer la opinión de los usuarios. Es por esto que en este trabajo se propone utilizar el análisis de sentimiento para evaluar la experiencia de usuario en el aprendizaje virtual. Para realizar este análisis se analizan todas las fases del proceso, comenzando por la elección de una plataforma de etiquetado para anotar el corpus, estudiando las herramientas de procesamiento de lenguaje natural existentes en el mercado, y continuando con la experimentación que abarca desde la creación de una ontología propia para abordar el problema hasta la detección automática de los aspectos y su polaridad. El trabajo finaliza con la presentación de dos dimensiones para el análisis de la experiencia de usuario y un análisis utilizando dichas dimensiones.[CA] Les plataformes d’aprenentatge virtual són una eina popular per a realitzar cursos que permeten ampliar els coneixements del seu alumnat i la seua avaluació està en un estat incipient d’investigació. Així mateix l’anàlisi de sentiment és una disciplina del processament del llenguatge natural que resulta de gran utilitat per a conèixer l’opinió dels usuaris. És per això que en aquest treball es proposa utilitzar l’anàlisi de sentiment per a avaluar l’experiència d’usuari en l’aprenentatge virtual. Per a realitzar aquesta anàlisi s’analitzen totes les fases del procés, començant per l’elecció d’una plataforma d’etiquetatge per a anotar el corpus, estudiant les eines de processament de llenguatge natural existents en el mercat, i continuant amb l’experimentació que abasta des de la creació d’una ontologia pròpia per a abordar el problema fins a la detecció automàtica dels aspectes i la seua polaritat. El treball finalitza amb la presentació de dues dimensions per a l’anàlisi de l’experiència d’usuari i una anàlisi utilitzant aquestes dimensions.[EN] Virtual learning platforms are a popular tool for conducting courses that allow students to expand their knowledge and their assessment is in an incipient state of research. Likewise, sentiment analysis is a discipline of natural language processing that is very useful to know the user opinion. That is why in this work it is proposed to use sentiment analysis to evaluate the user experience in virtual learning. To carry out this analysis, all the phases of the process are analyzed, starting with the choice of a labeling platform to annotate the corpus, studying the natural language processing tools existing in the market, and continuing with the experimentation that ranges from the creation of an own ontology to approach the problem until the automatic detection of the aspects and their polarity. The work ends with the presentation of two dimensions for the analysis of the user experience and an analysis using these dimensions.López Cuerva, L. (2021). Análisis de sentimiento a nivel aspectual en el dominio de la experiencia de usuario en aprendizaje virtual. Universitat Politècnica de València. http://hdl.handle.net/10251/171362TFG

    Construcción de una memoria organizacional a partir de textos no estructurados usando herramientas de minería de texto

    Get PDF
    Trabajo que tuvo como propósito construir una memoria organizacional de los Reportes de Proyectos de Aplicación Profesional (PAP) a partir de texto no estructurado usando herramientas de minería de texto. El objetivo fue brindar una herramienta a la Coordinación PAP para obtener estadísticas, información de interés, aprendizajes y experiencias plasmadas por los alumnos en sus reportes que ayuden a generar nuevo proyectos, mejorar existentes, facilitar la toma de decisiones, así como llevar un registro de las vinculaciones entre instituciones públicas y/o privadas y el ITESO.Consejo Nacional de Ciencia y Tecnologí

    Razonamiento basado en casos (RBC) para toma de decisiones en proyectos de implementación de sistemas ERP utilizando jColibri

    Get PDF
    Propone un Modelo de Razonamiento Basado en Casos (RBC) que permita contar con información oportuna, ágil y confiable para la gestión del conocimiento y la toma de decisiones en proyectos de Implementación de Sistemas ERP. Para realizar el presente trabajo se utilizará la herramienta jColibri la cual es un armazón o Framework orientado a objetos que facilita la construcción de sistemas de razonamiento basado en casos (RBC). La implementación del modelo incrementa la calidad de la información y reduce los tiempos utilizados en solucionar los problemas de toma de decisiones de estos proyectos.Trabajo de suficiencia profesiona

    Diseño de un Sistema Integrado de Gestión de Destinos Turísticos

    Get PDF
    El objetivo central de esta tesis es definir una arquitectura software que permita construir un sistema integrado de gestión de destino, que cubra todas las necesidades de información internas y externas de los modernos entes de gestión, que pueda integrarse con otros sistemas de destino ofreciendo una información de calidad y no redundante, que articule y facilite la comercialización de todos los proveedores del entorno y que sea capaz de tener en cuenta la opinión de los turistas de una forma eficaz y productiva. Una de las principales razones por las que se crean las organizaciones de gestión de destinos es conseguir que las labores de promoción se traduzcan en una conversión económica real que debe propagarse a todo el conjunto de proveedores de productos y servicios y desde estos, a sus trabajadores y distribuidores locales. Es decir, favorecer la comercialización del mismo. Para ello, el sistema debe ser capaz de aglutinar la oferta tanto de los proveedores que ya cuentan con un alto nivel de comercialización en sus propios sistemas como a los pequeños proveedores, que en general, carecen del nivel tecnológico suficiente para comercializar por sí mismos sus productos. La integración debe producirse tanto a nivel interno como externo del sistema. A nivel interno, los distintos subsistemas en los que se descompondrá la arquitectura deberán cooperar compartiendo información y procesos. A nivel externo, la integración debe producirse en varios niveles. Por un lado, debe lograrse la integración de la información compartida entre diferentes sistemas de destino de ámbito territorial superpuesto. Por otra parte, el subsistema de comercialización debe ser capaz de ofrecer integración a aquellos proveedores que ya dispongan de su propio sistema de comercialización, sin que suponga un esfuerzo excesivo para ellos. También es importante la integración con redes sociales a través de mecanismos de escucha activa. Como todo sistema de información, el sistema integrado de gestión de destino debe dar servicio a los usuarios a los que está destinado. En primer lugar, tenemos a los responsables del ente de gestión de destino. En otro nivel tendríamos a los técnicos de turismo y a los proveedores y profesionales que operan en el destino. En el último nivel estarían los propios turistas, que constituyen la razón de ser de la propia organización de destino. En el modelo propuesto se establecen las funcionalidades que debe satisfacer el sistema intergrado para cada grpo de usuarios. Como resultado se propone una arquitectura software que resuelva los problemas detectados y cumpla los objetivos planteados. Se plantea una descripción, con un alto nivel de abstracción, de los componentes (subsistemas) de información del sistema global y los mecanismos de comunicación (interfaces) entre ellos que permitan la cooperación entre los mismos para llevar a cabo las tareas (funcionalidades) para las que se diseña. Para validar la arquitectura resultante se propone un procedimiento de prueba empírica. Para ello, se ha aplicado el modelo propuesta a un sistema real, que es lo más parecido posible al ente de destino patrón, que se define previamente

    Realidad aumentada bajo tecnología móvil basada en el contexto aplicada a destinos turísticos

    Get PDF
    En este trabajo se define un marco para la personalización de contenidos turísticos mediante sistemas de recomendación contextuales en un sistema de realidad aumentada. La realidad aumentada ofrece la posibilidad de mostrar información de forma intuitiva, rápida, interactiva y atractiva. Estas características hacen que su aplicación en sectores como el turismo, patrimonio, cultura y publicidad esté creciendo considerablemente. Uno de los principales inconvenientes de los sistemas de realidad aumentada actuales es que suelen mostrar un número de POIs excesivamente alto, por lo que es obligatorio aplicar técnicas que permitan mostrar solo la información que realmente le interesa al turista, es decir, información personalizada. Por tanto, se hace necesario la aplicación de los sistemas de recomendación en los sistemas de realidad amentada aplicados al turismo. Además, otro de los inconvenientes de los sistemas de recomendación turísticos actuales es que no utilizan información contextual de los turistas, y no genera recomendaciones para grupos de turistas que viajan juntos. El objetivo del trabajo es definir un soporte teórico para la creación y configuración de un sistema de recomendación para una herramienta de realidad aumentada de un destino turístico, donde los usuarios puedan disponer de herramientas para planificar individualmente o en grupo visitas o rutas turísticas, teniendo en cuenta sus preferencias y contexto. Cualquier destino consolidado puede tener miles de puntos, por lo que la cantidad de operaciones a realizar para obtener una recomendación es muy elevada. Resulta por tanto de gran utilidad disponer de mecanismos que permitan realizar un filtrado que reduzca significativamente el número de puntos que serán la entrada a los motores de recomendación. Se propone como solución el uso combinado de diferentes motores de recomendación. El objetivo final es asegurar que los elementos recomendados se adecuen lo mejor posible al contexto, gustos y preferencias del turista. El marco propuesto se fundamenta teóricamente en la utilización de ontologías para representar la información, utilización de análisis formal de conceptos, enfoque lingüístico difuso, teoría de probabilidad y cadenas de Markov. Además, para la visitas en grupos se propone la utilización de aspectos relacionados con la personalidad de los miembros del grupo para ponderar las recomendaciones. En el desarrollo de la tesis se han establecido tres grande bloques: En el primero de ellos se ha realizado un estudio de las técnicas y arquitecturas de sistemas de realidad aumentada, su aplicación al ámbito turístico, así como las ventajas e inconvenientes que acarrea su utilización en un destino. Asimismo, se ha realizado un estudio de las principales técnicas de recomendación, así como de diferentes tipos de estructuras para organizar la información de un destino turístico. En el segundo boque, se ha descrito con detalle el marco propuesto desarrollando diferentes modelos de filtrado y recomendación. Concretamente se exponen los siguientes motores de filtrado y recomendación contextual: - Modelo de Pre-filtrado contextual basado en implicaciones lógicas. - Modelo de recomendación basado en contenido. - Modelo de recomendación colaborativo. - Modelo de recomendación demográfico. - Modelo de recomendación histórico. - Modelo de recomendación grupal. - Generador de rutas dinámicas. En el tercer bloque se recogen las conclusiones derivadas del estudio realizado y de la propuesta presentada, así como las líneas futuras de investigación. También se añaden dos anexos: uno sobre la ontología desarrollada y otro sobre las características de un prototipo para el destino turístico Costa del Sol Occidental. La bibliografía empleada está basada fundamentalmente en artículos de revistas de impacto y artículos de congresos relacionados con los siguientes temas: sistemas de recomendación, sistemas de realidad aumentada, representación de la información mediante ontologías, lógica difusa, análisis formal de conceptos, etc. También se han utilizado libros y estudios de aplicación de las tecnologías al ámbito turístico
    corecore