    Opinion Mining based on the Spanish adaptation of ANEW on hotel customer comments

    La minería de opiniones (MO) ha mostrado una alta tendencia de investigación en los últimos años debido a la producción en gran escala de opiniones y comentarios por parte de usuarios activos en Internet. Las empresas y organizaciones en general están interesadas en conocer cuál es la reputación que tienen de sus usuarios en las redes sociales, blogs, wikis y otros sitios web. Hasta ahora, la gran mayoría de trabajos de investigación involucran sistemas de MO en el idioma inglés. Por este motivo, la comunidad científica está interesada en trabajos diferentes a este lenguaje. En este artículo se muestra la construcción de un sistema de minería de opiniones en español sobre comentarios dados por clientes de diferentes hoteles. El sistema trabaja bajo el enfoque léxico utilizando la adaptación al español de las normas afectivas para las palabras en inglés (ANEW). Estas normas se basan en las evaluaciones que se realizaron en las dimensiones de valencia, excitación y el dominio. Para la construcción del sistema se tuvo en cuenta las fases de extracción, preprocesamiento de textos, identificación del sentimiento y la respectiva clasificación de la opinión utilizando ANEW. Los experimentos del sistema se hicieron sobre un corpus etiquetado proveniente de la versión en español de Tripadvisor. Como resultado final se obtuvo una precisión del 94% superando a sistemas similares.Recently, the Opinions Mining (OM) has shown a high tendency of research due to large-scale production of opinions and comments from users over the Internet. Companies and organizations, in general terms, are interested in knowing what is the reputation they have in social networks, blogs, wikis and other web sites. So far, the vast majority of research involving systems MO in English. For this reason, the scientific community is interested in researching different to this language. This article is about the construction of a mining system views in Spanish based on comments given by different clients and hotels. The system works on the lexical approach using Spanish adaptation of affective standards for English words (ANEW). These standards are based on evaluations conducted in the dimensions of valence, arousal and dominance. For the construction of the system took into account the phases of extraction, preprocessing of texts, identification of feelings and the respective ranking of the opinion using ANEW. System experiments were made on labeling a corpus from the Spanish version of Tripadvisor. As a result, precision exceeding 94% was obtained at similar systems

    Psicología y lenguaje en política: Los candidatos a la Presidencia del Gobierno y su estilo lingüístico

    Se analizó el estilo lingüístico de los candidatos a la presidencia del gobierno de España de los principales partidos políticos, el Partido Popular (PP) y el Partido Socialista Obrero Español (PSOE) y posteriormente se calculó el LSM Language Style Matching que existía entre ellos. El LSM refleja cómo las personas implicadas en un diálogo igualan su estilo lingüístico mediante el uso que hacen de las palabras de función. En este caso se encontró que, a pesar de existir diferencias individuales, el estilo lingüístico que ambos candidatos emplearon es similar. Para el estudio del estilo lingüístico se empleó el programa LIWC Linguistic Inquiry and Word Count. Se discuten las posibles interpretaciones y se concluye señalando la utilidad del LSM y del LIWC como herramientas para el estudio de la interacción humana, aportando una alternativa al autoinforme

    Psychology and language in politics: Candidates for the Presidency of the Government and their linguistic style

    Se analizó el estilo lingüístico de los candidatos a la presidencia del gobierno de España de los principales partidos políticos, el Partido Popular (PP) y el Partido Socialista Obrero Español (PSOE) y posteriormente se calculó el LSM Language Style Matching que existía entre ellos. El LSM refleja cómo las personas implicadas en un diálogo igualan su estilo lingüístico mediante el uso que hacen de las palabras de función. En este caso se encontró que, a pesar de existir diferencias individuales, el estilo lingüístico que ambos candidatos emplearon es similar. Para el estudio del estilo lingüístico se empleó el programa LIWC Linguistic Inquiry and Word Count. Se discuten las posibles interpretaciones y se concluye señalando la utilidad del LSM y del LIWC como herramientas para el estudio de la interacción humana, aportando una alternativa al autoinforme.We analyzed the linguistic style of the candidates for president of government of Spain's main political parties, the Partido Popular (PP) and the Partido Socialista Obrero Español (PSOE). Then we calculated the LSM Language Style Matching between them. The LSM reflects how people involved in a dialogue match their linguistic style by their use of function words. In this case it was found that, despite the existence of individual differences, the language style used by both candidates is quite similar. For the study of linguistic style LIWC Linguistic Inquiry and Word Count program was used. The possible interpretations of this phenomenon are discussed. We conclude pointing out the usefulness of the LSM and LIWC as tools for studying human behavior and interaction, providing an alternative to self-report measure

    Identificación del grooming: análisis empírico de conversaciones con contenido pedófilo

    El grooming, conducta en auge desde el avance tecnológico, se produce cuando un victimario contacta con un menor, a través de Internet, con el fin de ganarse su confianza para conseguir imágenes de carácter sexual de la víctima, satisfacer sus necesidades sexuales con esta y si llega al extremo, abusar sexualmente de ella. Durante este trabajo se ha llevado a cabo una revisión bibliográfica e investigación cuantitativa acerca del grooming, de cómo identificarlo y como detectar la gravedad de las conversaciones pedófilas vía Internet, mediante la selección de categorías de palabras concretas y diferenciando las diversas etapas del proceso de grooming. Tras analizar las conversaciones y su gravedad se ha realizado una propuesta basada en la prevención del grooming mediante el uso de un software de aplicación.Grooming is a booming behavior since the technological advance, developed when an offender contacts with one or more children, through the Internet, to earn their confidence and get sexual images of the child, to satisfy their sexual needs with him and sometimes, when the situation is extreme, the child is sexually abused by the bloke. The research of this assignment consists how identify it and how detect the seriousness of pedophile conversations via Internet. To get this, a bibliographical review and a quantitative investigation have been carried out by selecting specific words categories and telling apart different stages of the grooming process. When the analysis has been finished, a proposal based on the prevention of grooming has been made using an application software

    Análisis de la eficacia y fiabilidad de la app Moodies para medir emociones

    [ES]Con la mejora en el campo de la tecnología se han creado una diversidad de aplicaciones destinadas a los teléfonos móviles, cada día más usadas entre la población en general. Muchas de éstas han sido destinadas al reconocimiento de emociones pero, ¿cómo de fiables son este tipo de apps? En el presente estudio, hemos analizado la fiabilidad y eficacia de Moodies, una aplicación que con 20 segundos del discurso del interlocutor analiza el estado emocional que desprende su voz. Para ello, sometemos a la app a un análisis de 35 escenas de diferentes películas empleadas para inducir emociones en cuatro idiomas, registrando el output que nos proporciona. A continuación se realizó un análisis lingüístico del mismo con la herramienta LIWC. Por último, volvimos a someter a la app en un segundo momento al análisis de las mismas 35 escenas. Los resultados obtenidos, sugieren que nos encontramos ante una aplicación con un alto índice de fiabilidad, además muestran que en general el idioma no es muy relevante para Moodies, algo que habla a favor de la app ya que analiza la prosodia. Con respecto a las emociones, a grandes rasgos la aplicación las cataloga bastante bien puesto que el output es analizado [EN]With the improvement in the field of technology they have created a variety of applications for mobile phones, most used among the general population every day. Many of these have been designed to recognize emotions but, how reliable are such app? In the present study, we analyzed the reliability and effectiveness of Moodies, an application with 20 seconds of speech interlocutor analyzes the emotional state that shows your voice. To that end, we submit the app to an analysis of 35 scenes from different movies in four languages, recording the output it provides. Performing a linguistic analysis of the LIWC same tool. The results suggest that we are facing an application with a high degree of reliability, also show that in general the language is not very relevant to Moodies, which speaks in favor of the app by analyzing prosody. With regard to emotions, roughly application catalogs them quite well because the output is analyzed by LIWC and classified within the corresponding emotions

    Suicidio y escritura: un análisis clínico-lingüístico de textos y notas suicidas

    La conducta suicida es uno de los principales problemas de salud pública a nivel mundial y en nuestro país su frecuencia va en aumento. Este trabajo se compone de tres estudios y analiza desde una doble perspectiva clínica y lingüística textos y notas suicidas de personas fallecidas por esa causa. Aplicamos la herramienta Linguistic Inquiry and Word Count (LIWC) a dichos textos hallando en el primer estudio indicadores de riesgo de suicidio. El análisis de una muestra española de personas muertas por suicidio muestra diferencias clínicas entre las personas que dejan nota y aquellas que no lo hacen. El análisis lingüístico de las notas suicidas muestra diferencias según el sexo o hábitat de sus autores. La comparación de estos resultados con el análisis de notas suicidas recogidas en Chile arroja resultados diferentes y muestra distintos perfiles según la presencia o ausencia en dichas notas de los factores de riesgo de suicidio de la Teoría Interpersonal del Suicidio de Joiner (2005), alguno de los cuales aparece en un 60% de las notas analizadas

    Psycholinguistic Patterns Detection for Analyzing the Subjective Language in Spanish

    Tesis doctoral titulada “Detección de patrones psicolingüísticos para el análisis de lenguaje subjetivo en español”, defendida por María del Pilar Salas Zárate en la Universidad de Murcia y elaborada bajo la dirección de los doctores Rafael Valencia García (Universidad de Murcia) y Miguel Ángel Rodríguez García (Universidad King Abdulah). La defensa tuvo lugar el 23 de mayo de 2017 ante el tribunal formado por los doctores Jesualdo Tomás Fernández Breis (Presidente, Universidad de Murcia), Alejandro Rodríguez González (Secretario, Universidad Politécnica de Madrid) y José Antonio Miñarro Giménez (Vocal, Medical University of Graz) y la tesis obtuvo la mención Cum Laude y Doctora Internacional.Ph.D. thesis entitled “Psycholinguistic patterns detection for analyzing the subjective language in Spanish” written by María del Pilar Salas Zárate at the University of Murcia under the supervision of the Ph.D. Rafael Valencia García (University of Murcia) and Ph.D. Miguel Ángel Rodríguez García (University). The viva voice was held on the 23rd may 2017 and the members of the commission were the Ph.D. Jesualdo Tomás Fernández Breis (President, University of Murcia), Ph.D. Alejandro Rodríguez González (Secretary, Polytechnic University of Madrid) and Ph.D. José Antonio Miñarro Giménez (Vocal, University of Graz) and the thesis obtained the mention Cum Laude and International Doctor

    Psicología, lenguaje y comunicación: análisis con la herramienta LIWC de los discursos y tweets de los candidatos a las elecciones gallegas de 2012

    Linguistic styles of the 7 major candidates for election to the Parliament of Galicia in 2012 were analyzed using the Spanish version of the Linguistic Inquiry and Word Count (LIWC) program.We analyzed the speeches of the opening and closing sessions of the campaign and the tweets posted during the 15-day official campaign period by the candidates.The Kruskal-Wallis test was used to determine differences in the percentage of use of categories of words in the texts of the seven candidates, resulting significant (p≤0.01) in 16 of the categories analyzed. Possible interpretations of these results are discussed, highlighting the usefulness of LIWC as a complementary strategy for the analysis of political texts.Se analizaron los mítines de las jornadas de apertura y cierre de las elecciones así como los tweets publicados, durante los 15 días de duración oficial de la campaña, por los candidatos. Se aplicó la prueba Kruskal-Wallis para la determinación de diferencias en el porcentaje de uso de categorías de palabras entre los textos de los siete candidatos, resultando significativas (p≤0,01) en 16 de las categorías analizadas.Se discuten las posibles interpretaciones de estos resultados, resaltando la utilidad del programa LIWC como estrategia complementaria para el análisis de textos en política