986 research outputs found

    La problemática autoría de Carlos Castaneda: Un estudio estilométrico de "candidato único"

    Full text link
    Tesis doctoral inédita leída en la Universidad Autónoma de Madrid, Facultad de Filosofía y Letras, Departamento de Lingüística, Lenguas Modernas, Lógica y Fª de la Ciencia y Tª de la Literatura y Literatura Comparada. Fecha de lectura: 26/03/201

    Estudio de un sistema de clasificación automática de textos según las emociones del texto y el perfil de los autores

    Get PDF
    Debido al gran volumen de información que hay disponible en Internet se hace necesario el desarrollo de técnicas para la clasificación de esta información de manera automática. Además de las clasificaciones típicas que consisten en dividir los documentos a clasificar según su temática o su autor, por el gran uso que se hace hoy en día de herramientas como las redes sociales o los blogs y la cantidad de opiniones o críticas que los usuarios publican en ellos resulta interesante el estudio de sistemas que permitan clasificar todos estos textos publicados en Internet según el perfil de los autores o según las emociones que los textos expresan, ya que ello permitiría a los usuarios, por ejemplo, detectar los comentarios malos sobre un determinado producto que están interesados en adquirir. Este Proyecto Fin de Carrera estudiará los diferentes algoritmos de clasificación y las características del lenguaje que es necesario tener en cuenta para el desarrollo de un sistema de clasificación automática de textos según el sentimiento que expresan o según el perfil de los autores, así como las fases de las que consta el diseño de estos sistemas. Por último, se presentarán los resultados de algunos trabajos llevados a cabo en este campo por diferentes grupos de investigación.Due to the large amount of information available on the Internet nowadays it is necessary to develop new methods that allow to classify this documents automatically. In addition to the classical classifications that consist on classifying the documents according to its theme or author it is interesting to study new systems that allow to classify the texts that the users publish on social networks or blogs according to their age or genre or according to the sentiments that express their opinions on this texts. These systems would help the users for detecting bad reviews about a product they are interested in. The aim of this project is the study of the different classification algorithms and the language characteristics that are necessary for the development of an automatic texts classification system according to the sentiments of the texts and according to the author’s profile, as well as the different steps for the design of these systems. Finally, the results of some studies carried out in this field by different research groups will be presented.Ingeniería de Telecomunicació

    Detección automática de texto engañoso mediante un modelo de espacio semántico continuo.

    Get PDF
    Este libro presenta un nuevo método para identificar el engaño en los textos mediante técnicas del procesamiento del lenguaje natural y algoritmos de aprendizaje automático. El proceso general que sigue el enfoque propuesto es el siguiente: mediante herramientas del procesamiento del lenguaje natural, los textos se convierten a un espacio vectorial, es decir, se generan vectores de características; después son aplicados diversos métodos de selección de atributos para discriminar aquellas características poco relevantes; por último, los vectores resultantes se envían a un algoritmo de clasificación supervisada que identifique si son engañosos o veraces.Una línea de estudio particular dentro de la inteligencia artificial es el procesamiento del lenguaje natural, el cual tiene como objetivo facilitar la comunicación entre la computadora y el lenguaje humano.Universidad Autónoma del Estado de Méxic

    La investigacion-acción participante. El Diagnóstico sobre el racismo en Guatemala

    Get PDF
    This article presents a participatory action research experience, undertaken with a group of qualified representatives and members of European and Guatemalan civil society of diverse sensibilities and tendencies, whose goal is to collect data and prepare reports which will serve as a basis to create public policy on ethnic and gender equality. Its qualitative and quantitative methodologies constitute relevant elements for action research. A highly useful glossary of concepts has been extracted by processing the dialogues and the search for consensus among the participants. The themes discussed in economic, legal, conceptual and discursive areas aim to seek the most relevant contributions and the terms upon which the majority of the players have agreed and, with those, create an agenda for public policies against racism and discrimination

    El ciberfeminismo y la transformación social en América Latina y El Caribe

    Get PDF
    Números monográficos con título distintivo catalogados individualmente.Los “Análisis Carolina” son textos centrados en asuntos de actualidad, tratando de desentrañar sus claves y ofrecer recomendaciones de política.Bibliograf.: 13-16Resumen: El objetivo de este análisis es, precisamente, revisar la evolución de dicho ciberfeminismo, muy ligado a la agenda feminista relacionada con la respuesta y prevención de violencias (específicamente en entornos tecnológicos y digitales), la seguridad y la privacidad, el empoderamiento de las mujeres y otros grupos minorizados, el uso político de Internet y las TIC, y las resistencias y resiliencias en un mundo cambiante y cada vez más tecnológico, en el que los retos y temas emergentes están también presentes

    Aplicación del aprendizaje automático en la clasificación de textos cortos: un caso de estudio en el conflicto armado colombiano

    Get PDF
    Trabajo de investigaciónColombia lleva alrededor de 50 años en guerra y aunque se realizo un proceso de paz, las disputas continúan entre los diferentes actores, un medio en donde se desarrollan las disputas son las redes sociales, los diferentes actores expresan sus opiniones, existen diferentes técnicas y algoritmos que permiten procesar estos textos con la finalidad de que el gobierno Colombiano tenga claridad de como se encuentra el conflicto en la actualidad y como debe proceder de una manera eficiente.RESUMEN INTRODUCCIÓN 1. GENERALIDADES 2. ANTECEDENTES 3. PLANTEAMIENTO DEL PROBLEMA 4. OBJETIVOS 5. JUSTIFICACIÓN 6. DELIMIETACIÓN 7. MARCO REFERENCIAL 8. ESTADO DEL ARTE 9. METODOLOGIA 10. PLATAFORMAS 11. ENTORNOS 12. ALGORITMOS 13. HISTORIAS DE USUARIO 14. DESARROLLO DEL COMPONENTE 15. RESULTADOS 16. CONCLUSIONES 17. TRABAJO FUTURO BIBLIOGRAFÍA ANEXOSPregradoIngeniero de Sistema

    Ampliación y perfeccionamiento de los métodos cuantitativos y leyes clásicas en recuperación de la información: desarrollo de un sistema de indización y segmentación automática para textos en español

    Full text link
    Se desarrolla e implementa un Sistema de Indización y Segmentación Automática para textos largos en español, contribuyendo a su categorización textual e indización automática. Para su desarrollo, se estudian y perfeccionan los métodos cuantitativos y leyes clásicas en Recuperación de Información, como son los modelos relativos al proceso de repetición de palabras (Zipf, 1949), (Mandelbrot, 1953) y al proceso de creación de vocabulario (Heaps, 1978). Se realiza una crítica de las circunstancias de aplicación de los modelos y se estudia la estabilidad de los parámetros de manera experimental mediante recuentos en textos y sus fragmentos. Se establecen recomendaciones a priori para los valores de sus parámetros, dependiendo de las circunstancias de aplicación y del tipo de texto analizado. Se observa el comportamiento de los parámetros de las fórmulas para vislumbrar una relación directa con la tipología de texto analizado. Se propone un nuevo modelo (Log-%) para la visualización de la distribución de frecuencias de las palabras de un texto. El objetivo final es detectar los cambios temáticos que se producen en un documento, para establecer su estructura temática y obtener la indización automática de cada una de sus partes. De este modo, se obtiene la categorización del texto o documento utilizando la enumeración de sus partes temáticas a modo de niveles o estructura arbórea. Una vez constituidas las partes temáticas del texto en sus niveles correspondientes con los términos indizados, estos se agrupan en bloques distribuidos jerárquicamente según se desglose el documento en cuestión. El bloque inicial describe el contenido global de todo el documento con una cantidad inicial de palabras o descriptores. Seguidamente este bloque inicial se subdivide en varios bloques, los cuales corresponden a distintas partes del documento total, cada uno de estos también contiene una serie de palabras que describe el contenido y así sucesivamente hasta poder formar las div....Rodríguez Luna, M. (2013). Ampliación y perfeccionamiento de los métodos cuantitativos y leyes clásicas en recuperación de la información: desarrollo de un sistema de indización y segmentación automática para textos en español [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/31517Palanci

    Literatura discontinua: la colección de textos y sus tensiones con el soporte y los habitus de lectura

    Get PDF
    Este es un estudio de la discontinuidad en la literatura, bajo el formato compositivo de la colección de textos, y sus implicaciones en la producción, la publicación en soporte, y la recepción del lector empírico, común o especializado, en el campo literario y cultural. Una noción general de colección de textos abarca tanto los conjuntos homogéneos (narrativos, ensayísticos, o poemarios) como las mezclas heterogéneas de estos, publicados tanto en compilaciones antológicas misceláneas, de autor y/o editor, como en obras cuyos textos poseen un número relevante de conexiones perceptibles, formales y semióticas, entre sí. Una colección es un conjunto finito de textos, definido por la propiedad de discontinuidad, en tanto mezcla o agregado, y las de espacialidad y permutación de los textos, adquiriendo el funcionamiento dinámico de lo múltiple yuxtapuesto. De la naturaleza misma de este múltiple discontinuo surge todo el sistema diferencial de propiedades estructurales y funcionales de la colección que analizamos en esta tesis. Ante la lectura, el primer parámetro determinante es la secuenciación de los textos en el tiempo. El conjunto múltiple debe ser dispuesto consecutivamente, de manera arbitraria, por lo que potencialmente se habilita una operación combinatoria en secuencias diferentes. Sin embargo, un segundo parámetro, la puesta en libro para su publicación, produce una restricción secuencial similar pero en el espacio, y de mucho mayor alcance ya que limita esa combinatoria posible a una sola permutación, la cual queda fijada y figura legalmente como de Autor, afectando eso de diversos modos a las instancias de producción y recepción.Facultad de Humanidades y Ciencias de la Educació

    Análisis de contenidos generados por usuarios mediante la integración de información estructurada y no estructurada

    Get PDF
    Los servicios de redes sociales han pasado a ser una parte fundamental del entramado social de los últimos años. Estas herramientas permiten a las personas crear, intercambiar o compartir información, ideas, imágenes y cualquier tipo de medio en comunidades virtuales y redes. El impacto de estos servicios de redes sociales sobre la sociedad ha sido tal, que han introducido cambios sustanciales sobre la comunicación a todos los niveles: individual, comunitaria, organizacional y empresarial. Todo este contenido generado por el usuario tiene un carácter viral del que carecen el resto de medios de comunicación, sirviendo como fuente de conocimiento para nuevas oportunidades de negocio. Es más, la simbiosis que existe entre los dispositivos móviles y estas redes sociales ha provocado que los contenidos generados por los usuarios incorporen nuevos factores como la localización del usuario y el momento exacto de creación y edición del mensaje o contenido en cuestión. Esto abre nuevos mercados potenciales que relacionan a las personas, las redes sociales, el mercado móvil y los eventos en tiempo real. Al abordar este nuevo tipo de contenido, hay que comprender que las redes sociales nos otorgan la oportunidad de combinar dos aspectos fundamentales que los mensajes contienen: información estructurada con la no estructurada en forma, fundamentalmente, de textos cortos. La información estructurada nos proporciona conocimiento adicional que permite analizar el mensaje y al usuario dentro de un contexto específico de carácter social, temporal y/o espacial. Combinar significativamente ambos tipos de información puede resultar fundamental para un tratamiento efectivo de los mensajes. En esta memoria de tesis, se explora la hipótesis consistente en que, al integrar el conocimiento proveniente de dos tipos de información de distinta naturaleza (estructurada y no estructurada) existentes en los mensajes de las redes sociales, se pueden resolver, de forma más efectiva y significativa, ciertas tareas relacionadas con el procesamiento de este tipo de contenidos. Para validar dicha hipótesis, se proponen una serie de tareas a resolver, siempre bajo el paradigma de la integración de ambos tipos de información: la recuperación temática de mensajes en redes de microblogging, clasificación de opinión sobre los mensajes de estas redes y la caracterización de grupos de usuarios dentro de un contexto específico. Cada tarea es tratada de forma individual, proporcionando una formalización para la misma, caracterizando los fenómenos más relevantes, proponiendo uno o varios métodos para abordarla, realizando una evaluación sobre ellos y explorando los resultados de forma consecuente. Las principales aportaciones se resumen en las siguientes propuestas: un método dinámico y adaptativo para generar consultas que son consumibles por un sistema de microblogging como Twitter, un sistema de normalización léxica altamente modular, un esquema de integración para combinar modelos de características provenientes de información estructurada y no estructurada, y una aproximación para la caracterización de grupos de usuarios de las redes dentro de un contexto específico
    corecore