178 research outputs found

    Inteligencia Artificial como Alternativa en la Detección de Noticias Falsas: Artificial Intelligence as an alternative in the detection of false news

    Get PDF
    El objetivo del presente artículo es analizar cómo la Inteligencia Artificial ha servido como herramienta para la detección de noticias falsas. Se trata de un artículo de revisión bibliográfica, descriptivo, exploratorio cuya unidad de análisis está representada por artículos publicados en bases de datos tales como: Scielo, Dialnet, Science Direct y Scopus. Se obtuvo como resultado que existen distintos mecanismos de Inteligencia Artificial en el subcampo del Aprendizaje Automático, el Aprendizaje Profundo y Procesamiento de Lenguaje Natural (NLP), como el uso de máquinas de soporte vectorial, el clasificador Naive Bayes y distintos tipos de modelos de Redes de Neuronas Artificiales; como las Redes Neuronales Recurrentes (RNN), las Redes Neuronales Convolucionales (CNN), que son bastante populares en el Procesamiento de Lenguaje Natural, especialmente en el uso de Redes de Memoria a Corto y Largo Plazo (LSTM), las cuales permiten establecer mecanismos confiables y precisos para detectar patrones dentro de un objetivo con contenido textual

    El impacto de las emociones en el análisis de la polaridad en textos con lenguaje figurado en Twitter

    Full text link
    [EN] During the recent years we have seen how the rise of Web 2.0 and social media have caused users to take more and more prominence on the Internet, being a source of information generation that increases day by day. Focusing on the social network Twitter, one of the most complex challenges facing Natural Language Processing is to determine the polarity of a tweet (positive, negative or neutral) when in it appears figurative language. This work presents an exhaustive study about the capacity of different lexical resources of emotions to analyze the polarity of a set of data extracted from Twitter, detailing the impact of each one of the resources about different forms of figurative language such as irony and sarcasm we found profusely in this corpus. We start from the hypothesis that not all the available resources favor the detection of polarity with an equal measure, therefore we carry out a series of experiments to evaluate how they affect different lexical resources of emotions in the figurative language as in the literal one. Our methodology will be carried out in two phases: in the first one, we will study the impact of lexical resources on the training of classifiers that predict the polarity of the complete set of tweets of task 11 of SemEval2015. In the second, we will evaluate in detail the impact of each of the resources for the different typologies of figurative language present in this corpus. The obtained results show indications that the inclusion of information related to emotions helps to correctly classify polarity both globally and at the level of figurative or literal language. Therefore, it may be of big importance to develop techniques capable of representing the information in such a way that it is possible to classify the feeling that the user tries to transmit in a text.En los últimos años hemos visto como el auge de los medios sociales ha provocado que los usuarios tomen cada vez más protagonismo en Internet, siendo estos una fuente de generación de información que aumenta día tras día. Centrándonos en la red social Twitter, uno de los retos más complejos a los que se enfrenta el Procesamiento de Lenguaje Natural es el de determinar la polaridad de un tweet (positiva, negativa o neutra) cuando en éste aparece lenguaje figurado. Actualmente existe un gran interés en el estudio de las emociones en los textos, ya que se dispone de una multitud de plataformas en las que el usuario puede interactuar mostrando sus ideas, opiniones, comparaciones entre multitud de productos, etc. y de las que se puede extraer abundante información. Sin embargo, esta tarea es especialmente compleja cuando en el texto encontramos lenguaje figurado, puesto que nos enfrentamos con distintos significados debido al uso de la ironía, la metáfora o el sarcasmo, por lo tanto la polaridad del significado literal puede contrastar fuertemente con el sentimiento que pretende transmitir el sentido figurado. Este trabajo presenta un estudio exhaustivo sobre la capacidad de distintos recursos léxicos de emociones para analizar la polaridad de un conjunto de datos extraídos de Twitter, detallando el impacto de cada uno de los recursos sobre distintas formas de lenguaje figurado como pueden ser la ironía y el sarcasmo que encontramos profusamente en este corpus.Escortell Pérez, MA. (2017). El impacto de las emociones en el análisis de la polaridad en textos con lenguaje figurado en Twitter. http://hdl.handle.net/10251/86127TFG

    Cátedra abierta al servicio de la comunidad, dos miradas interdisciplinares

    Get PDF
    La Universidad Tecnológica de Pereira a través de la Vicerrectoría de Investigaciones, Innovación y Extensión tiene como propósito “Definir y direccionar los lineamientos para la investigación institucional que fortalezcan los grupos y semilleros de investigación, a través de la formación de investigadores, el desarrollo de programas o proyectos de ciencia, tecnología e innovación, así como la generación de redes y alianzas estratégicas que contribuyan a la creación y apropiación del conocimiento para la sociedad.” Y es por ello que, anualmente, entre otras se realiza la CONVOCATORIA PARA FOMENTAR LA PUBLICACIÓN DE CAPÍTULOS DE LIBRO RESULTADO DE INVESTIGACIÓN CATEDRÁTICOS AÑO 2022, en la cual pueden postular los resultados de los proyectos de investigación finalizados en los últimos cinco años. En esta oportunidad, se publicarán dos capítulos de las Facultades: Ciencias de la Educación y de Ingeniería Mecánica en los cuales se darán a conocer dos tesis de Maestría. Para la Vicerrectoría de Investigaciones, Innovación y Extensión es de suma importancia socializar por medio de este libro por capítulos el conocimiento, teniendo en cuenta que este debe transferirse a través de diferentes medios, puesto que no solo fortalece la academia sino también a la sociedad en general.CONTENIDO Introducción ..................................................................................................................5 Capitulo 1. Desarrollo de una metodología para la caracterización y clasificación de señales no estacionarias usando mediciones de Entropía de Permutación Multiescalar / Development of a methodology for the characterization and classification of non-stationary signals using Multiscalar Permutation Entropy measurements.................................9 Juan Camilo Mejía Hernández Capitulo 2. Reinaldo Arenas: escritura disidente y reescritura distópica / Reinaldo Arenas: dissident writing and dystopian rewrite......................................51 Diego Fernando Hernández Aria

    Sistema de minería de opiniones para la detección de sesgos sociales.

    Get PDF
    Trabajo de Fin de Grado. Grado en Ingeniería Informática. Curso académico 2021-2022.[ES]Como objetivo del proyecto planteado como trabajo de fin de grado, se desarrolla un sistema de minería de opiniones para la identificación de sesgos sociales. Se pretende identificar el sentimiento de odio, la discriminación racial y de género. Este trabajo abarca desde las etapas iniciales de diseño haciendo uso de las herramientas que aporta la Ingeniería de Software, hasta el desarrollo de un producto final y funcional desplegado. El producto final deberá de dar al usuario final una interfaz que permita visualizar el proceso que lleva a cabo el sistema de minería de opiniones para realizar un análisis sobre sus propios conjuntos de datos o utilizando los ya predefinidos en la aplicación. En este proyecto, se va a desarrollar un modelo de inteligencia artificial que implementa el análisis de sentimientos con información extraída de la red social Twitter. Por último, como ya se ha mencionado, la aplicación web se llevará a cabo utilizando la herramienta de visualización de datos Streamlit donde podremos desplegarla, de manera que sea accesible para cualquier usuario.[EN]As an objective of the project proposed as an end-of-degree work, the aim is to develop a system of opinion mining for the identification of social biases. The aim is to identify feelings of hatred, racial and gender discrimination. This work will cover from the initial stages of design making use of the tools provided by Software Engineering, to the development of a final and functional product deployed. The final product must give the end user an interface that allows visualizing the process carried out by the feedback mining system to be able to perform analyses on their own data sets or using those already predefined in the application. In this project, an artificial intelligence model will be developed to develop sentiment analysis with information extracted from the social network Twitter. Finally, as already mentioned, the web application will be carried out using the Streamlit data visualization tool where we can deploy it and that is accessible to any user

    Enriched Digital Edition: a Multilevel Annotation Model for Golden-Age Spanish Poetry

    Get PDF
    En este capítulo se presenta un modelo general para la anotación multinivel de corpora de texto literario. Por multinivel se hace referencia a la combinación, en un mismo corpus, de información de diferentes niveles de descripción lingüística o literaria, desde datos relacionados con palabras o sílabas, hasta cuestiones temáticas, textuales o pragmáticas. El objetivo final de un corpus de estas características es fijar un posible análisis literario, por lo que se considera como una edición digital enriquecida. Se defienden cuatro características que un corpus de texto literario debe cumplir: interoperabilidad, perspectivismo, unidad y claridad/sencillez. Se da cuenta de los principales problemas de formalización en un corpus multinivel de este tipo: la combinación de diferentes formalismos de representación y, en el caso de XML, el problema de un anidamiento incorrecto. Finalmente se propone un modelo para un corpus de poesía del Siglo de Oro.This paper presents a general model for the multilevel annotation of a literary corpus. Multilevel refers to the combination of information from different linguistic or literary levels in the same corpus: from word related data to thematic, textual or pragmatic questions. The objective is to fix a possible literary analysis. To be considered an enriched digital edition, an annotated corpus must meet four characteristics: interoperability, perspectivism, unity and clarity/simplicity. The main formalization problems are discussed: the combination of different representation formalisms and, in the case of XML, the improper nesting. Finally, a model for a corpus of poetry from the Spanish Golden-Age is proposed.Trabajo parcialmente financiado por el Ministerio de Ciencia e Innovación a través del proyecto “CORTEX: Conscious Text Generation” (PID2021-123956OB-I00): MCIN/AEI/10.13039/501100011033/ y “FEDER Una manera de hacer Europa”; y por la Generalitat Valenciana (Conselleria d’Educació, Investigació, Cultura i Esport) a través del Proyecto: NL4DISMIS: Tecnologías del Lenguaje Natural para lidiar con la desinformación (CIPROM/2021/021)

    Self-definition and modernization: Identity between individualism and globalization

    Get PDF
    [ES] Esta tesis doctoral explora la compleja interacción entre la autodefinición individual y los contextos socioculturales y macrosociales en la sociedad contemporánea, caracterizada por sus complejas dinámicas de modernización, individualización y globalización. Utilizando el Test de los Veinte Enunciados (TST o Twenty Statement Test) desarrollado por Kuhn y McPartland (1954) en una muestra de individuos de Chile, España, Sudáfrica, Estados Unidos y Reino Unido, se analiza cómo distintas variables sociodemográficas, así como el país de origen de las respuestas, influyen en la autodefinición de los individuos. Metodológicamente, la investigación enfrenta el desafío de codificar y analizar respuestas del TST, dado la naturaleza textual y abierta de sus respuestas. Se usa el sistema de codificación tridimensional para el TST propuesto por Escobar (1988), que clasifica el contenido de tres dimensiones: referencia, atributo y sentido, donde el sentido es entendido como el contenido de lo que expresan los individuos en sus enunciados, la referencia es el conjunto de entidad o conjunto de entidades mencionadas por el sujeto de forma explícita y la atribución es el conjunto de adjetivos calificativos que definen a la persona. Con el objetivo de explorar las ventajas y limitaciones de las distintas técnicas de codificación y clasificación de respuestas abiertas, se emplean técnicas como la codificación manual, semiautomática y automática, donde se compara la capacidad y calidad de los distintos métodos. Destaca la eficacia de la codificación semiautomática con diccionarios, que demuestra tener un desempeño para este tipo de respuestas. Los hallazgos empíricos indican que la individualización, modernización y globalización impactan en la forma en que los individuos se definen, sugiriendo una interacción compleja entre la autodefinición y el contexto macrosocial. Se observan diferencias notables en la autodefinición según el grado de individualización de los países, reflejando las tendencias de los individuos de países más individualizados–Reino Unido y Estados Unidos–hacia un menor número de autodefiniciones, siendo estas más cortas en su longitud y con una mayor propensión al uso de dudas, evasiones e indefiniciones en sus respuestas, mientras que, en Chile, España y Sudáfrica, las respuestas reflejan mayor referencia a roles familiares y sociales. Sin embargo, se subraya una tendencia a la autodefinición subconsensual en todos los países estudiados. De forma paralela, se observa cómo elementos como el género, el nivel de estudios, el tamaño del lugar de residencia o la edad juegan roles cruciales en la construcción de la identidad. Además, se examina la relación entre el entorno laboral y la autodefinición, enfatizando la importancia de las estructuras sociales en la formación de la identidad. Este estudio profundiza la comprensión de cómo los cambios socioeconómicos y culturales de la modernidad afectan la percepción del sí mismo, destacando la variabilidad de la autodefinición en distintos contextos culturales. Los resultados enfatizan la necesidad de enfoques integradores que consideren tanto influencias globales como locales en la construcción de la identidad. Esta investigación contribuye de manera significativa al entendimiento de la autodefinición en un contexto globalizado, ofreciendo perspectivas valiosas para campos como la sociología, la psicología social y la educación, y sentando las bases para futuras investigaciones en la intersección de estas disciplinas. [EN] This thesis examines the complex interaction between individual self-definition and sociocultural as well as macrosocial contexts in contemporary society, characterized by its intricate dynamics of modernization, individualization, and globalization. Employing the Twenty Statements Test (TST) developed by Kuhn and McPartland (1954) on a diverse sample of individuals from Chile, Spain, South Africa, the United States, and the United Kingdom, it analyzes how various sociodemographic variables, along with the country of origin of the responses, influence individuals' self-definitions. Methodologically, the research confronts the challenge of coding and analyzing responses from the TST, given the textual nature of its responses. It utilizes the three-dimensional coding system for the TST proposed by Escobar (1988), which classifies content across three dimensions: reference, attribute, and sense. Sense is understood as the content expressed by individuals in their statements, reference encompasses the set of entity or entities explicitly mentioned by the subject, and attribute comprises the set of descriptive adjectives defining the person. Aiming to explore the advantages and limitations of various coding and classification techniques for open-ended responses, methods such as manual, semi-automatic, and automatic coding are employed, and the capability and quality of the different methods are compared. The efficacy of semi-automatic coding with dictionaries stands out, demonstrating superior performance for this type of responses. The empirical findings indicate that individualization, modernization, and globalization impact the way individuals define themselves, suggesting a complex interaction between self-definition and the macrosocial context. Notable differences in self-definition are observed according to the degree of individualization of countries, reflecting the tendencies of individuals from more individualized countries –the United Kingdom and the United States– towards a lesser number of self-definitions, which are shorter in length and exhibit a greater propensity for doubts, evasions, and indecisiveness in their responses. In contrast, responses from Chile, Spain, and South Africa show a greater reference to family and social roles. However, a trend towards subconsensual self-definition is underscored across all observed countries. Concurrently, it is observed how elements such as gender, level of education, size of the place of residence, or age play crucial roles in identity construction. Additionally, the relationship between the work environment and self-definition is examined, highlighting the importance of social structures in identity formation. This study deepens the understanding of how socioeconomic and cultural changes of modernity affect self-perception, underscoring the variability of self-definition in different cultural contexts. The results emphasize the need for integrative approaches that consider both global and local influences in identity construction. This research significantly contributes to the understanding of self-definition in a globalized context, offering valuable perspectives for fields such as sociology, social psychology, and education, and laying the groundwork for future research at the intersection of these disciplines

    Sistema de detección automática de emociones de comunidades deportivas en textos de redes sociales

    Get PDF
    El auge de las redes sociales hoy en día las ha situado como uno de los principales medios de comunicación donde los usuarios expresan sus pensamientos, sentimientos u opiniones e interactúan con otros usuarios y comunidades. Uno de los ámbitos que genera en redes sociales una alta actividad de carácter emocional es el deportivo, por lo que este medio supone una fuente de información de alto valor para conocer la opinión o el estado emocional de sus seguidores o aficionados. Bajo la oportunidad de explotar dicha información surge el objetivo del presente proyecto, el cual consiste en el desarrollo de un sistema de detección automática de la emoción expresada en redes sociales de ciertas comunidades o aficionados durante el transcurso de eventos deportivos a través del análisis de sus publicaciones. Este proyecto surge dentro del acuerdo de colaboración entre RTVE y la UC3M, que conforma la cátedra RTVE-UC3M y que tiene como fin la investigación en el análisis de redes sociales y su aplicación en el sector audiovisual. El sistema propuesto pretende detectar la emoción expresada por aquellos seguidores y comunidades de interés, cuyas cuentas son monitorizadas, para así ofrecer dicha información a RTVE como soporte para la toma de decisiones o personalización de contenidos. El sistema, pese a ser diseñado para ser aplicado a diferentes ámbitos, tendrá como primer alcance el análisis de la emoción asociada a eventos deportivos en la liga 2B grupo IV de fútbol ya que dichos eventos no se encuentran recogidos en la información deportiva proporcionada actualmente por RTVE. En el presente documento se describe el análisis, diseño e implementación así como la evaluación del sistema propuesto, el cual emplea para el análisis de emociones un enfoque basado en conocimiento, conformado por una ontología y una serie de patrones, y ofrece al usuario una interfaz mediante la cual puede interactuar para la selección del equipo y jornada a analizar así como visualizar gráficamente la emoción global inferida y las publicaciones asociadas a dicha emoción.Doble Grado en Ingeniería Informática y Administración de Empresa

    Desarrollo de Modelos de "Oficina Inteligente" en la Superintendencia de Pensiones, Banco Central de Costa Rica

    Get PDF
    Proyecto de Graduación (Máster Profesional en Computación con énfasis en Sistemas de Información) Instituto Tecnológico de Costa Rica, Escuela de IngenierÌa en Computación, 2003.Este trabajo tiene su sustento en la importancia que ha tomado para las organizaciones la información que puede estar en diferentes tipos de datos y que están soportados por una diversidad de productos de software y hardware. En la gran mayoría de las oficinas nacionales tanto públicas como privadas, la información se concentra principalmente en papel y los computadores se usan primordialmente como procesador de texto, pero también existe información en archivos de hojas de cálculo, base de datos y otros papeles. Además, el manejo de la información en papel no esta integrada con la información computarizada. Los funcionarios de estas oficinas están constantemente bombardeados de diferentes fuentes de información: ! Mensajes de correo electrónico (interno y externo). ! Documentos electrónicos ! Bases de datos locales ! Bases de datos institucionales ! Archivos de textos ! Archivos de aplicaciones: procesadores de texto, hojas electrónicas, etc. ! Facsímiles ! Correos de voz ! Imágenes digitalizadas ! Información almacenadas en CD-ROM ! Libros, Artículos y otros recursos en papel De las fuentes de información anteriores se puede deducir lo siguiente: ! La información se presenta de muchas fuentes ! Existe una gran cantidad de información envuelta ! Hay muchos tipos heterogéneos de información: texto, gráficos, video, imágenes, voz, etc. ! La información se origina de fuentes heterogéneas: documentos electrónicos, correos de voz, papel, etc. ! La información se encuentra en papel, audio analógico, video analógico e en forma digital. La información puede estar en forma de tablas de bases de datos, datos alfanuméricos, datos en un procesador de texto, hojas electrónicas, imágenes o datos de voz digitalizada. ! La idea de que toda la información estará en forma computarizada es irreal. Ya que la información en papel tiene un rol muy importante en los ambientes laborales. La Superintendencia de Pensiones fue creada en 1995 con base en la ley 7523, y es la encargada de efectuar las labores de supervisión en dos grandes áreas: Operadoras y Fondos Administrados y los Fondos Complementarios Especiales y Fondos Básicos Substitutos. Debido a las funciones que realiza también esta imbuida en esta falta de integración de la información y su sobrecarga. Por lo cuál se desarrollo un Modelo de Oficina Inteligente en la Superintendencia de Pensiones, Banco Central de Costa Rica basada principalmente en las siguientes tecnologías: Modelo Orientado a Objetos, Interfaces gráficas (Servidores y Estaciones), Tipos de datos y Periféricos multimedia (Tipos de datos (Video, Audio, Imágenes)), Periféricos multimedia (Rastreadores de imágenes, Impresoras, Monitores), Groupware y workflow (Flujo de trabajo, Trabajo en grupo), Arquitectura Cliente/Servidor, Almacenamiento, Bases de datos y Recuperación de Información. El aporte principal del modelo propuesto es que refuerza una serie de aspectos: el modelo establece una serie de fases claramente definidas, se establecen responsables de actividades y productos que deben ser generados en cada etapa. Las cinco fases definidas son: • Enfoque del Proyecto o Formación del equipo de trabajo o Planificación inicial de actividades o Reunión de inicio del proyecto o Plan de comunicación del proyecto • Capturar la Dirección de la organización • Establecer la situación actual • Diseño del Escenario Objetivo • Instrumentalización del Plan Uno de los factores críticos de éxito definido en este proyecto es la transferencia de conocimiento al personal de la Superintendencia de Pensiones de los elementos metodológicos e instrumentos necesarios para establecer una Oficina Inteligente. Además del modelo propuesto, se realizan recomendaciones con el fin de mejorar algunos aspectos que la Superintendencia de Pensiones ha dejado de lado o no ha usado tales como: # Retomar lo relacionado con video y audio, puede ser que se puedan implementar aplicaciones muy provechosas para la institución, utilizando estos tipos de información. # Es importante que se utilicen otro tipo de almacenamiento, que no sea tan oneroso como el disco duro, y que le puede dar mejores capacidades de almacenamiento y velocidades aceptables de recuperación de información. # Se recomienda en el futuro implementar auditorias a los sistemas en uso. Para esto es necesario establecer en conjunto con la Auditoria Interna de la SUPEN, una forma de revisar los requerimientos de los sistemas con lo que realmente esta implementado

    Algoritmos, sentencias y derecho constitucional comparado : Explorando el uso de jurisprudencia extranjera en Colombia

    Get PDF
    27 páginasLos resultados de esta investigación son el producto de una exploración metodológica con la que se pretende abordar la detección automática de referencias a jurisprudencia extranjera en las sentencias de la Corte Constitucional de Colombia. Para esto se analizaron más de 6000 sentencias de constitucionalidad emitidas entre 1992 y 2020 con un enfoque de minería de datos, aplicando algoritmos de búsqueda de patrones de lenguaje, que fueron reforzados con asistencia humana. Las estadísticas (preliminares) que se presentan a continuación representan los primeros datos consolidados sobre esta práctica en el país y buscan aportar a la generación de conocimiento en el campo del derecho constitucional comparado.The results of this research are the product of a methodological exploration to address the automatic detection of references to foreign law in the judgments of the Constitutional Court of Colombia. More than 6000 constitutionality decisionsissued between1992 and 2020 were analyzed with a data mining approach, applying algorithms of semantic pattern matching, which were reinforced with human assistance. The data presented in this work are the first consolidated statistics about the use of foreign law in Colombia since the creation of Constitutional Court, over a period of 29 years. This effort aims to contribute to knowledge generation in the field of political science and comparative constitutional law, by allowing researchers to efficiently analyze extensive collections of unstructured data.Ciencias PolíticasPolitólog
    corecore