258 research outputs found

    Exploratory Analysis of a New Corpus for Political Alignment Identification of Argentinian Journalists

    Get PDF
    Political alignment identification is an author profiling task that aims at identifying political bias/orientation in people’ writings. As usual in this kind of field, a key aspect is to have available adequate data sets so that the data mining and machine learning approaches can obtain reliable and informative results. This article takes a step in this direction by introducing a new corpus for the study of political alignment in documents of Argentinian journalists. The study also includes several kinds of analysis of documents of pro-government and opposition journalists such as sentiment analysis, topic modelling and the analysis of psycholinguistic indicators obtained from the Linguistic Inquiry and Word Count (LIWC) system. From the experimental results, interesting patterns could be observed such as the topics both types of journalists write about, how the sentiment polarities are distributed and how the writings of pro-government and opposition journalists differ in the distinct LIWC categories.XVI Workshop Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Exploratory Analysis of a New Corpus for Political Alignment Identification of Argentinian Journalists

    Get PDF
    Political alignment identification is an author profiling task that aims at identifying political bias/orientation in people’ writings. As usual in this kind of field, a key aspect is to have available adequate data sets so that the data mining and machine learning approaches can obtain reliable and informative results. This article takes a step in this direction by introducing a new corpus for the study of political alignment in documents of Argentinian journalists. The study also includes several kinds of analysis of documents of pro-government and opposition journalists such as sentiment analysis, topic modelling and the analysis of psycholinguistic indicators obtained from the Linguistic Inquiry and Word Count (LIWC) system. From the experimental results, interesting patterns could be observed such as the topics both types of journalists write about, how the sentiment polarities are distributed and how the writings of pro-government and opposition journalists differ in the distinct LIWC categories.XVI Workshop Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Exploratory Analysis of a New Corpus for Political Alignment Identification of Argentinian Journalists

    Get PDF
    Political alignment identification is an author profiling task that aims at identifying political bias/orientation in people’ writings. As usual in this kind of field, a key aspect is to have available adequate data sets so that the data mining and machine learning approaches can obtain reliable and informative results. This article takes a step in this direction by introducing a new corpus for the study of political alignment in documents of Argentinian journalists. The study also includes several kinds of analysis of documents of pro-government and opposition journalists such as sentiment analysis, topic modelling and the analysis of psycholinguistic indicators obtained from the Linguistic Inquiry and Word Count (LIWC) system. From the experimental results, interesting patterns could be observed such as the topics both types of journalists write about, how the sentiment polarities are distributed and how the writings of pro-government and opposition journalists differ in the distinct LIWC categories.XVI Workshop Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Applying CHC algorithms on radio network design for wireless communication

    Get PDF
    The diff usion of wireless communication services (telephone, internet, etc.) is continuously growing these days. Unfortunately, the cost of the equipment to provide the service with the appropriate quality is high. Thus, selecting a set of geographical points allowing optimum coverage of a radio frequency signal by minimizing the use of resources is essential. The above task is called the Radio Network Design (RND) and is a NP-hard problem, i.e., this can be approached by using metaheuristics techniques. Metaheuristics are methods comprising local improvement procedures and high-level strategies for a robust search in the problem space. In this work, different versions of the CHC algorithm with a fitness function based on the efficiency of resource use are proposed. The achieved results are encouraging in terms of efficiency and quality in all the analysed scenarios.XV Workshop de Agentes y Sistemas InteligentesRed de Universidades con Carreras de Informática (RedUNCI

    Applying CHC algorithms on radio network design for wireless communication

    Get PDF
    The diff usion of wireless communication services (telephone, internet, etc.) is continuously growing these days. Unfortunately, the cost of the equipment to provide the service with the appropriate quality is high. Thus, selecting a set of geographical points allowing optimum coverage of a radio frequency signal by minimizing the use of resources is essential. The above task is called the Radio Network Design (RND) and is a NP-hard problem, i.e., this can be approached by using metaheuristics techniques. Metaheuristics are methods comprising local improvement procedures and high-level strategies for a robust search in the problem space. In this work, different versions of the CHC algorithm with a fitness function based on the efficiency of resource use are proposed. The achieved results are encouraging in terms of efficiency and quality in all the analysed scenarios.XV Workshop de Agentes y Sistemas InteligentesRed de Universidades con Carreras de Informática (RedUNCI

    Hibridización de K-Means a través de técnicas metaheurísticas

    Get PDF
    En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos, debido básicamente al gran poder de procesamiento de las máquinas y a su bajo costo de almacenamiento. Sin embargo, dentro de estas enormes masas de datos existe una gran cantidad de información “oculta”, de gran importancia estratégica, a la que no se puede acceder por las técnicas clásicas de recuperación de la información. La Minería de Datos implica “escabar”en esa inmensidad de datos, en búsqueda de patrones, asociaciones o predicciones que permitan transformar esa maraña de datos en información útil. Una de las tareas utilizadas en minería de datos es el clustering (agrupamiento) y un algoritmo muy popular y simple usado en esta tarea es K-means. A pesar de su popularidad el mencionado algoritmo sufre de algunas dificultades. K-means requiere varias iteraciones sobre todo el conjunto de datos, lo cual puede hacerlo muy costoso computacionalmente cuando se lo aplica a grandes bases de datos, el número de clusters K debe ser suministrado por el usuario y la búsqueda es propensa a quedar atrapada en mínimos locales. Se pretende a través de esta línea de investigación desarrollar técnicas avanzadas o mejoradas de minería de datos, particularmente en la tarea de clustering y además, proponer mejoras al algoritmo de K-means basándose en la aplicación de técnicas Metaheurísticas.Eje: Agentes y Sistemas InteligentesRed de Universidades con Carreras en Informática (RedUNCI

    Selección de centroides para algoritmos de clustering a través de técnicas metaheurísticas

    Get PDF
    Los algoritmos de clustering de tipo c-means son sensibles a los valores de inicialización de los centroides y pueden quedar atrapados en extremos locales. Planteado en estos términos, el uso de enfoques aproximados para obtener los centroides más adecuados puede ser de gran utilidad como herramienta complementaria durante ciertas fases del proceso de minería de datos, y en particular dentro de las tareas típicas de minería de datos, entre ellas la de clustering o agrupamiento. En esta dirección, los Algoritmos Genéticos (AGs) y la Optimización Basada en Cúmulo de Partículas (PSO)1 son dos técnicas metaheurísticas poblacionales que podrían utilizarse en este ámbito, más aún cuando los problemas pueden ser planteados como de optimización. En este trabajo se analiza el uso estas dos técnicas metaheurísticas para optimizar la inicialización de los valores de centroides en las funciones aplicadas en los algoritmos de clustering tipo c-means. Los respectivos resultados son comparados usando varios conjuntos de datos generados artificialmente.The clustering algorithms like c-means are sensitive to the initialization values of the cluster centers and can be trapped by local extrema. In these terms, the use of estimated approaches to obtain the most appropriate cluster centers can be of great utility as a complementary tool during certain phases of the process of data mining; particulary, in some specific task of data mining, e.g., clustering. In this way, Genetic Algorithms (GA) and Particle Swarm Optimization (PSO) are two population metaheuristic approaches that could be considered as optimization. In this work the use of these two metaheuristic approaches is analyzed to optimize the initialization of the cluster centers values in the functions applied in the c-means algorithms. The respective results are compared using several datasets artificially generated.Red de Universidades con Carreras en Informática (RedUNCI

    Hibridización de K-Means a través de técnicas metaheurísticas

    Get PDF
    En los últimos años, ha existido un gran crecimiento en nuestras capacidades de generar y colectar datos, debido básicamente al gran poder de procesamiento de las máquinas y a su bajo costo de almacenamiento. Sin embargo, dentro de estas enormes masas de datos existe una gran cantidad de información “oculta”, de gran importancia estratégica, a la que no se puede acceder por las técnicas clásicas de recuperación de la información. La Minería de Datos implica “escabar”en esa inmensidad de datos, en búsqueda de patrones, asociaciones o predicciones que permitan transformar esa maraña de datos en información útil. Una de las tareas utilizadas en minería de datos es el clustering (agrupamiento) y un algoritmo muy popular y simple usado en esta tarea es K-means. A pesar de su popularidad el mencionado algoritmo sufre de algunas dificultades. K-means requiere varias iteraciones sobre todo el conjunto de datos, lo cual puede hacerlo muy costoso computacionalmente cuando se lo aplica a grandes bases de datos, el número de clusters K debe ser suministrado por el usuario y la búsqueda es propensa a quedar atrapada en mínimos locales. Se pretende a través de esta línea de investigación desarrollar técnicas avanzadas o mejoradas de minería de datos, particularmente en la tarea de clustering y además, proponer mejoras al algoritmo de K-means basándose en la aplicación de técnicas Metaheurísticas.Eje: Agentes y Sistemas InteligentesRed de Universidades con Carreras en Informática (RedUNCI

    Selección de centroides para algoritmos de clustering a través de técnicas metaheurísticas

    Get PDF
    Los algoritmos de clustering de tipo c-means son sensibles a los valores de inicialización de los centroides y pueden quedar atrapados en extremos locales. Planteado en estos términos, el uso de enfoques aproximados para obtener los centroides más adecuados puede ser de gran utilidad como herramienta complementaria durante ciertas fases del proceso de minería de datos, y en particular dentro de las tareas típicas de minería de datos, entre ellas la de clustering o agrupamiento. En esta dirección, los Algoritmos Genéticos (AGs) y la Optimización Basada en Cúmulo de Partículas (PSO)1 son dos técnicas metaheurísticas poblacionales que podrían utilizarse en este ámbito, más aún cuando los problemas pueden ser planteados como de optimización. En este trabajo se analiza el uso estas dos técnicas metaheurísticas para optimizar la inicialización de los valores de centroides en las funciones aplicadas en los algoritmos de clustering tipo c-means. Los respectivos resultados son comparados usando varios conjuntos de datos generados artificialmente.The clustering algorithms like c-means are sensitive to the initialization values of the cluster centers and can be trapped by local extrema. In these terms, the use of estimated approaches to obtain the most appropriate cluster centers can be of great utility as a complementary tool during certain phases of the process of data mining; particulary, in some specific task of data mining, e.g., clustering. In this way, Genetic Algorithms (GA) and Particle Swarm Optimization (PSO) are two population metaheuristic approaches that could be considered as optimization. In this work the use of these two metaheuristic approaches is analyzed to optimize the initialization of the cluster centers values in the functions applied in the c-means algorithms. The respective results are compared using several datasets artificially generated.Red de Universidades con Carreras en Informática (RedUNCI

    Optimización de rutas en el transporte de personas para la pequeña y mediana empresa

    Get PDF
    El transporte juega un papel importante en las tareas de logística de muchas compañías, ya que normalmente representa un alto porcentaje del valor añadido a los bienes. Por tanto, la utilización de métodos computacionales en el transporte suele producir ahorros sobre su costo total. Varias compañías de transporte utilizan métodos manuales, a veces basados en la experiencia de los expertos, para la planificación de sus operaciones. En otros casos se utilizan reglas heurísticas para mejorar la planificación manual. Sin embargo, solo el uso de modernas técnicas de optimización permite abordar problemas de alta complejidad. El diseño y optimización de rutas utilizando computación inteligente es ventajoso en cualquier ámbito y situación para cualquier tipo de usuario, en especial para las empresas de transporte cuyas pérdidas y ganancias se basan en la distribución óptima tanto del tiempo, como del combustible, que están directamente relacionadas con la distancia recorrida. En el presente trabajo se describe la investigación abordada en el campo de las metaheurísticas para resolver este problema principalmente aplicando algoritmos híbridos basados en el algoritmo genético celular (cGA) y en la optimización basada en colonia de hormigas (Ant Colony Optimization o sus siglas en inglés ACO).Eje: Agentes y Sistemas InteligenciasRed de Universidades con Carreras en Informática (RedUNCI
    corecore