15 research outputs found

    The machine learning in the prediction of elections

    Get PDF
    Resúmen: Este artículo de investigación presenta el análisis y comparación de tres algoritmos diferentes: A.- método de agrupamiento K-media, B.- expectativa de criterios de convergencia y C.- metodología de clasificación LAMDA usando dos softwares de clasificación, Weka y SALSA, como auxiliares para la predicción de las futuras elecciones en el estado de Quintana Roo. Cuando se trabaja con datos electorales, éstos son clasificados en forma cualitativa y cuantitativa, de tal virtud que al final de este artículo tendrá los elementos necesarios para decidir que software tiene un mejor desempeño para el aprendizaje de dicha clasificación. La principal razón para hacer este trabajo es demostrar la eficiencia de los algoritmos con diferentes tipos de datos. Al final se podrá decidir sobre el algoritmo con mejor desempeño para el manejo de información. Palabras clave: aprendizaje automático, lógica fuzzy, agrupamiento, Weka, SALSA, LAMDA, elecciones estatales, predicción

    SVM with a neutral class

    Get PDF
    In many real binary classification problems, in addition to the presence of positive and negative classes, we are also given the examples of third neutral class, i.e., the examples with uncertain or intermediate state between positive and negative. Although it is a common practice to ignore the neutral class in a learning process, its appropriate use can lead to the improvement in classification accuracy. In this paper, to include neutral examples in a training stage, we adapt two variants of Tri-Class SVM (proposed by Angulo et al. in Neural Process Lett 23(1):89–101, 2006), the method designed to solve three-class problems with a use of single learning model. In analogy to classical SVM, we look for such a hyperplane, which maximizes the margin between positive and negative instances and which is localized as close to the neutral class as possible. In addition to original Angulo’s paper, we give a new interpretation of the model and show that it can be easily implemented in the primal. Our experiments demonstrate that considered methods obtain better results in binary classification problems than classical SVM and semi-supervised SVM

    Análisis de sentimientos sobre un corpus en español: experimentación con un caso de estudio

    Get PDF
    En este artículo se presenta la investigación, evaluación y comparación experimental de técnicas de procesamiento de lenguaje natural para análisis de información subjetiva como opiniones, sentimientos y emociones en textos no estructurados en idioma español. Se implemento una herramienta para la extracción de opiniones de documentos con el objetivo de clasificarlos según polaridad de sentimientos (positivos o negativos) utilizando como corpus de datos la base de comentarios de un sitio de crítica gastronómica al que se le aplican distintas técnicas de preprocesamiento. La principal contribución de este artículo es la experimentación y evaluación de tecnificas de clasificación subjetiva de textos para el idioma español en función del tamaño de corpus, tipos de atributos extraídos y preprocesamientos aplicados.Sociedad Argentina de Informática e Investigación Operativ

    Análisis de sentimientos sobre un corpus en español: experimentación con un caso de estudio

    Get PDF
    En este artículo se presenta la investigación, evaluación y comparación experimental de técnicas de procesamiento de lenguaje natural para análisis de información subjetiva como opiniones, sentimientos y emociones en textos no estructurados en idioma español. Se implemento una herramienta para la extracción de opiniones de documentos con el objetivo de clasificarlos según polaridad de sentimientos (positivos o negativos) utilizando como corpus de datos la base de comentarios de un sitio de crítica gastronómica al que se le aplican distintas técnicas de preprocesamiento. La principal contribución de este artículo es la experimentación y evaluación de tecnificas de clasificación subjetiva de textos para el idioma español en función del tamaño de corpus, tipos de atributos extraídos y preprocesamientos aplicados.Sociedad Argentina de Informática e Investigación Operativ

    SISTEMA PARA EL MONITOREO DE OPINIÓN CENTRADO EN ENTIDADES A PARTIR DE TWITTER

    Get PDF
    ResumenEl análisis de la reputación en línea es una tarea que está atravesando un gran momento, debido a que actualmente existe un fuerte interés en la gran cantidad de opiniones publicadas, ya sea positivas o negativas, que se generan alrededor de un evento o entidad con el fin de conocer su prestigio en las redes sociales. La minería de opiniones se enfoca en determinar la polaridad de las publicaciones de una entidad con la finalidad de monitorear opiniones en línea. Este artículo presenta un sistema para el monitoreo de la opinión centrado en entidades utilizando textos de Twitter en español generados en línea. El proceso completo involucra, primero decidir la polaridad de un texto, determinando si el contenido tiene implicaciones positivas, negativas o neutras, después, obtener un monitoreo global (opinión colectiva) de una entidad. Se utiliza un promedio de las polaridades de cada palabra del mensaje, y luego, un promedio de las polaridades de los mensajes generados para una entidad.Palabras Clave: Análisis de opinión centrado en entidades, análisis de textos en español, minería de opiniones, monitoreo de medios. SYSTEM FOR THE MONITORING OF OPINION CENTERED ON ENTITIES FROM TWITTERAbstractOnline reputation is a very important task gaining a great interest because of the huge amount of opinions published, positive or negative, about a particular event or entity with the aim of knowing the status in social networks. Opinion mining is a research area focused in analyzing texts in order to determine its polarity in order to monitor the online opinions about entities. This paper presents a system for the monitoring of entity-centered opinion using Spanish twitter texts generated on line. The process is two-fold, first to decide the polarity of a text, verifying whether or not the content has positive, negative or neutral implications, thereafter, to determine the global monitoring (collective opinion) of an entity. The process requires to calculate the average of the message word polarities, and then, to obtain the average of the polarities of messages generated by a given entity. Keywords: Entity-centered, media monitoring, opinion analysis, opinion mining, Spanish text analysis

    ANÁLISIS DE LA POLARIDAD EN COMENTARIOS DE ESTUDIANTES UNIVERSITARIOS SOBRE EL DESEMPEÑO DE SUS PROFESORES (POLARITY ANALYSIS OF UNIVERSITY STUDENT COMMENTS ABOUT THEIR PROFESSORS PROFESIONAL PERFORMANCE)

    Get PDF
    El análisis de la polaridad, en cualquier tipo de comentario, es una tarea que está teniendo un gran auge, debido a que actualmente existe un fuerte interés en determinar automáticamente si las opiniones publicadas en medios públicos tienen un carácter positivo o negativo. La minería de opiniones se enfoca en determinar la polaridad de las publicaciones para, generalmente, dar seguimiento a la reputación de una entidad. Este artículo presenta los resultados obtenidos tras analizar la polaridad de comentarios emitidos por estudiantes universitarios en relación a su percepción sobre el desempeño de sus profesores frente a grupo. El enfoque del artículo es estudiar el rendimiento de diversos clasificadores supervisados en la tarea, anteriormente mencionada, con la finalidad de construir a mediano plazo un sistema para la clasificación automática de la polaridad de comentarios escritos por estudiantes universitarios. Los resultados obtenidos muestran que es posible crear un modelo de clasificación basado en máquinas de vectores de soporte que clasifique correctamente la polaridad de comentarios universitarios con un porcentaje de efectividad cercano al 92% usando un conjunto balanceado de 10,000 datos de entrada.Analysis of polarity, in any type of document, is a task that is having a great boom. Nowadays, there is a high interest in the construction of automatic methods for determining whether or not opinions published in public media have a positive or negative polarity. Opinion mining focuses on determining the polarity of publications, such as reviews or text comments, in order to analyze the reputation of a given entity. This paper presents the results obtained after analyzing the polarity of university student comments. The aim of this paper is to study the performance of different supervised classifiers in the aforementioned task in order to further construct a computational system for the automatic classification of comments polarity. The results obtained up to now show that it is possible to create a classification model based on support vector machines that correctly classifies the polarity of university student comments with a percentage close to 92%, using a balanced dataset of 10,000 samples

    Análisis de los comentarios en español de usuarios de Facebook para la clasificación de publicaciones utilizando técnicas inteligentes 

    Get PDF
    Actualmente, la interacción de las personas mediante redes sociales está crecimiento exponencialmente. Motivo por el cual se optó elegir una de ellas, como nuestra fuente de información, y a partir de la misma poder captar las espontáneas manifestaciones de sentimientos por parte de los usuarios. Los datos en cuestión fueron transformados, utilizando diversas técnicas de Procesamiento del Lenguaje Natural. Posteriormente se realizó el entrenamiento de algoritmos de Machine Learning, con el fin de ser utilizado para el Análisis de Sentimiento, llevando a cabo un estudio comparativo respecto de la performance de los mismos.Facultad de Informátic
    corecore