159 research outputs found
Generation of resources for Sentiment Analysis in Spanish
Tesis doctoral en Informática realizada por Mª Dolores Molina en la Universidad de Jaén (UJA) bajo la dirección de la doctora Mª Teresa Martín Valdivia (UJA). El acto de defensa de la tesis tuvo lugar en Jaén el 28 de noviembre de 2014 ante el tribunal formado por los doctores Luis Alfonso Ureña (UJA), Rafael Muñoz (UA) y Fermín Cruz (U. Sevilla). La calificación obtenida fue Sobresaliente Cum Laude por unanimidad.Ph.D. Thesis in Computer Science written by Mª Dolores Molina at the University of Jaén (UJA), under the supervision of Dr. Mª Teresa Martín (UJA). The author was examined on 28th of November 2014 at the University of Jaen by a commission composed by the doctors Luis Alfonso Ureña (UJA), Rafael Muñoz (UA) and Fermín Cruz (U. Sevilla). The unanimously awarded grade was Excellent Cum Laude
CRiSOL: Opinion Knowledge-base for Spanish
El presente trabajo se centra en la clasificación de polaridad de comentarios de hoteles en español (COAH) y presenta un nuevo recurso léxico, CRiSOL. Este nuevo recurso toma como base la lista de palabras de opinión iSOL, a la cual incluye los valores de polaridad de los synsets de SentiWordNet. Debido a que SentiWordNet no es un recurso para español, se ha tenido que usar como pivote la versión española de WordNet incluida en el Repositorio Central Multilingüe (MCR). Se ha desarrollado un clasificador de la polaridad no supervisada para evaluar la validez de CRiSOL. Los resultados obtenidos con CRiSOL superan los obtenidos por los lexicones base iSOL y SentiWordNet por separado, lo cual nos anima a seguir trabajando en esta línea.In this paper we focus on Spanish polarity classification in a corpus of hotel reviews (COAH) and we introduce a new lexical resource called CRiSOL. This new resource is built on the list of Spanish opinion words iSOL. CRiSOL appends to each word of iSOL the polarity value of the related synset of SentiWordNet. Due to the fact that SentiWordNet is not a Spanish linguistic resource, a Spanish version of WordNet had to be used. The Spanish version of WordNet chosen was Multilingual Central Repository (MCR). An unsupervised classifier has been developed with the aim of assessing the validity of CRiSOL. The results reached by CRiSOL are higher than the ones reached by iSOL and SentiWordNet, so that encourage us to continue this research line.Esta investigación ha sido parcialmente financiada por el Fondo Europeo de Desarrollo Regional (FEDER), el proyecto ATTOS (TIN2012-38536-C03-0) del Gobierno de España y el proyecto AORESCU (P11-TIC-7684 MO) del gobierno autonómico de la Junta de Andalucía. Por último, el proyecto CEATIC (CEATIC-2013-01) de la Universidad de Jaén también ha financiado parcialmente este artículo
Integrating Spanish lexical resources by meta-classifiers for polarity classification
In this paper we focus on unsupervised sentiment analysis in Spanish. The lack of resources for languages other than English, as for example Spanish, adds more complexity to the task. However, we take advantage of some good already existing lexical resources. We have carried out several experiments using different unsupervised approaches in order to compare the different methodologies for solving the problem of the Spanish polarity classification in a corpus of movie reviews. Among all these approaches, perhaps the newest one integrates SentiWordNet with the Multilingual Central Repository to tackle polarity detection directly over the Spanish corpus. However, the results obtained were not as promising as we expected, and so we carried out another group of experiments combining all the methods using meta-classifiers. The results obtained with stacking outperformed the individual experiments and encourage us to continue in this way
Negation Scope Identification in Spanish Reviews
El análisis de opiniones es una tarea a la que le quedan muchos frentes abiertos aún para que se pueda considerar resuelta. Entre ellos destaca el tratamiento de la negación, dado que una opinión negativa puede ser expresada con términos positivos negados. La negación es una característica particular de cada idioma, por lo que su tratamiento debe ajustarse a las singularidades del idioma en cuestión. En este artículo se presenta una aproximación lingüística para la identificación del ámbito de la negación en español, que se ha aplicado en un sistema de clasificación de la polaridad de opiniones sobre películas de cine.Sentiment Analysis is a task that still has several opened challenges. One of those challenges is the treatment of the negation, because a negative opinion can be built using negated positive words. Negation is a particular feature of each language, thus it must be considered differently per each language. In this article is shown a linguistic approach for the negation scope identification with the aim of integrating it in a polarity classification system in the domain of movie reviews.Este trabajo ha sido parcialmente financiado por el Fondo Europeo de Desarrollo Regional (FEDER), el proyecto ATTOS (TIN2012-38536-C03-0) del Gobierno de España, el proyecto AORESCU (TIC-07684) del Gobierno regional de la Junta de Andalucía y el proyecto CEATIC-2013-01 de la Universidad de Jaén
A Spanish Semantic Orientation Approach to Domain Adaptation for Polarity Classification
One of the problems of opinion mining is the domain adaptation of the sentiment classifiers. There are several approaches to tackling this problem. One of these is the integration of a list of opinion bearing words for the specific domain. This paper presents the generation of several resources for domain adaptation to polarity detection. On the other hand, the lack of resources in languages different from English has orientated our work towards developing sentiment lexicons for polarity classifiers in Spanish. The results show the validity of the new sentiment lexicons, which can be used as part of a polarity classifier
eSOLHotel: Building an Spanish opinion lexicon adapted to the tourism domain
Desde que la web 2.0 es el mayor contenedor de opiniones en todos los idiomas sobre distintos temas o asuntos, el estudio del Análisis de Sentimientos ha crecido exponencialmente. En este trabajo nos centramos en la clasificación de polaridad de opiniones en español y se presenta un nuevo recurso léxico adaptado al dominio turístico (eSOLHotel). Este nuevo lexicón usa el enfoque basado en corpus. Se han realizado varios experimentos usando una aproximación no supervisada para la clasificación de polaridad de las opiniones en la categoría de hoteles del corpus SFU. Los resultados obtenidos con el nuevo lexicón eSOLHotel superan los resultados obtenidos con otro lexicón de propósito general y nos animan a seguir trabajando en esta línea.Since Web 2.0 is the largest container for subjective expressions about different topics or issues expressed in all languages, the study of Sentiment Analysis has grown exponentially. In this work, we focus on Spanish polarity classification of hotel reviews and a new domain-dependent lexical resource (eSOLHotel) is presented. This new lexicon has been compiled following a corpus-based approach. We have carried out several experiments using an unsupervised approach for the polarity classification over the category of hotels from corpus SFU. The results obtained with the new lexicon eSOLHotel outperform the results with other general purpose lexicon.Esta investigación ha sido parcialmente financiada por el Fondo Europeo de Desarrollo Regional (FEDER), el proyecto ATTOS (TIN2012-38536-C03-0) del Gobierno de España y el proyecto AORESCU (P11-TIC-7684 MO) del gobierno autonómico de la Junta de Andalucía. Por último, el proyecto CEATIC (CEATIC-2013-01) de la Universidad de Jaén también ha financiado parcialmente este artículo
COPOS: Corpus de Opiniones de Pacientes en Español. Aplicación de Técnicas de Análisis de Sentimientos
Every day more users are interested in the opinion that other patients have about a physician or about health topics in general. According to a study in 2015, 62% of Spanish people access the Internet in order to be informed about topics related to health. This paper is focused on Spanish Sentiment Analysis in the medical domain. Although Sentiment Analysis has been studied for different domains, health issues have hardly been examined in Opinion Mining and even less with Spanish comments or opinions. Thus we have generated a corpus by crawling the website Masquemedicos with Spanish opinions about medical entities written by patients. We present this new resource, called COPOS (Corpus Of Patient Opinions in Spanish). To the best of our knowledge, this is the first attempt to deal with Spanish opinions written by patients about medical attention. In order to demonstrate the validity of the corpus presented, we have also carried out different experiments with the main methodologies applied in polarity classification (Semantic Orientation and Machine Learning). The results obtained encourage us to continue analysing and researching Opinion Mining in the medical domain.Cada día son más los usuarios interesados en la opinión que otros pacientes tienen sobre un médico o sobre temas de salud en general. De acuerdo con un estudio de 2015, el 62% de la población española consulta información en Internet acerca de temas relacionados con la salud. Este trabajo está centrado en el Análisis de Sentimientos en español aplicado al dominio médico. Aunque el Análisis de Sentimientos ha sido estudiado en diferentes dominios, el dominio de la salud apenas ha sido investigado, especialmente en opiniones escritas en español. Por ello, hemos generado un corpus en español con opiniones de pacientes sobre médicos a partir de la extracción de las mismas del portal web Masquemedicos. Este corpus ha sido denominado COPOS (Corpus Of Patient Opinions in Spanish - Corpus de Opiniones de Pacientes en Español). Hasta donde sabemos, es la primera vez que se intenta trabajar con opiniones en español sobre atención médica escritas por pacientes. Para demostrar la validez de este recurso, hemos realizado diferentes experimentos con las principales metodologías aplicadas en la tarea de clasificación de polaridad (Orientación Semántica y Aprendizaje Automático). Los resultados obtenidos nos animan a seguir investigando en el Análisis de Sentimientos en este dominio.This work has been partially supported by a grant from the Fondo Europeo de Desarrollo Regional (FEDER), REDES project (TIN2015-65136-C2-1-R) from the Spanish Government and by a Grant from the Ministerio de Educación Cultura y Deporte (MECD - scholarship FPU014/00983)
Improving Spanish Polarity Classification Combining Different Linguistic Resources
Sentiment analysis is a challenging task which is attracting
the attention of researchers. However, most of work is only focused on
English documents, perhaps due to the lack of linguistic resources for
other languages. In this paper, we present several Spanish opinion mining
resources in order to develop a polarity classification system. In addition,
we propose the combination of different features extracted from each
resource in order to train a classifier over two different opinion corpora.
We prove that the integration of knowledge from several resources can
improve the final Spanish polarity classification system. The good results
encourage us to continue developing sentiment resources for Spanish, and
studying the combination of features extracted from different resourcesMinisterio de Economía y Competitividad TIN2012-38536-C03-0Junta de Andalucía P11-TIC-7684Universidad de Jaén CEATIC-2013-0
Physical activity domains and risk of gastric adenocarcinoma in the MCC-Spain case-control study
[EN] Evidence for a protective role of physical activity against development of stomach cancer is yet inconclusive. We studied the association of domain-specific physical activity and the risk of gastric adenocarcinoma (GAC), by site and histology, in the MCC-Spain case-control study. 428 histologically confirmed GAC cases (67% men) including the gastro-esophageal region and 3225 controls were included. Cases were recruited in hospitals from 10 different Spanish regions, whereas population controls were randomly selected within the respective hospitals' catchment areas. A physical activity (PA) questionnaire was used to gather information on household and recreational activities, allowing estimation of PA volume (in metabolic equivalents (MET)-min/week). Participants also reported the intensity of working PA and daily sitting time. Questionnaire data on diet, lifestyles and clinical variables including Helicobacter pylori serology were available. Adjusted odds ratios (OR) of GAC were estimated for domains of physical activity, stratifying by sex, site (cardia vs. non-cardia), and Lauren classification (intestinal vs. diffuse).Household physical activity (HPA) showed a strong inverse association with GAC, observed for both cardia and non-cardia tumours. Risk of overall gastric cancer was 50% lower risk among participants in the highest HPA category (OR = 0.50, 95%CI: 0.38, 0.66). Recreational physical activity (RPA) was also associated with lower overall GAC risk (OR = 0.68, 95% CI: 0.52, 0.88), particularly at moderate levels of intensity such as walking (OR = 0.61, 95% CI: 0.46, 0.79). The protective effect of RPA was strongest for non-cardia tumours. Sedentary time was not related to GAC risk (p-trend = 0.392), but the potential protective effect of RPA was restricted to non-sedentary participants.Both household and recreational physical activities were independently related to lower GAC risk in the MCC-Spain study.S
Percepción de los alumnos de enfermería de las unidades especiales a través de sus diarios
Conocer la experiencia clínica vivida por los alumnos de 4º curso de enfermería en las unidades de cuidados intensivos y reanimación. Potenciar el diario de prácticas clínicas como herramienta de reflexión durante los procesos de enseñanza aprendizaje clínico en las unidades de cuidados especiales. Introducir al alumno de prácticas clínicas en la rehumanización de los cuidados en unidades especiales (contextos clínicos cerrados y de alta incidencia tecnológica). Metodológicamente se emplearán, por una parte, los diarios de prácticas clínicas enfocados al problema planteado en esta investigación; por otra, se realizarán sesiones con grupos focales para debatir procesualmente, el problema de investigación a la luz de las narrativas vertidas en los diarios. Los principales resultados obtenidos ponen de manifiesto las siguientes categorías:-el miedo y la angustia vivido por los alumnos al comienzo en este tipo de unidades. La relevancia del tutor en este entorno. La importante labor desarrollada por un equipo multidisciplinar. La influencia de la tecnificación sin desatender los cuidados básicos. Ganan seguridad y confianza con el paso de los días siendo conscientes de sus limitaciones
- …