2,299 research outputs found

    Uma Introdução às Support Vector Machines

    Get PDF
    This paper presents an introduction to the Support Vector Machines (SVMs), a Machine Learning technique that has received increasing attention in the last years. The SVMs have been applied to several pattern recognition tasks, obtaining results superior to those of other learning techniques in various applications.Neste artigo é apresentada uma introdução às Máquinas de Vetores de Suporte (SVMs, do Inglês Support Vector Machines), técnica de Aprendizado de máquina que vem recebendo crescente atenção nos últimos anos. As SVMs vêm sendo utilizadas em diversas tarefas de reconhecimento de padrões, obtendo resultados superiores aos alcançados por outras técnicas de aprendizado em várias aplicações

    Classificação e reconhecimento de frutos por processamento digital de imagem para previsão da produção

    Get PDF
    The concept of Precision Agriculture is usually associated with the usage of high-end technology equipments (being hardware or software), to first evaluate or control the conditions of a determined portion of land, applying afterwards various factors of production accordingly, like seeds, fertilizers, phytopharmaceuticals, growing regulators, water, etc. The proposed theme of this dissertation aims to create an algorithm capable of analyse and process images to characterize trees, particularly peach trees, distinguish fruits and calculate it dimensions, like volume and weight. The recognition of peaches on their natural conditions, on trees, is complex and requires segmentation algorithms, also complex. The proposed algorithm applies image segmentation for extraction of characteristics such as colour and shape. These characteristics are then used to train a classification method through a support vector machine to improve the recognition rate of fruits, accomplishing results around 70%. The production prediction is obtained with the volume values already calculated for the recognised peaches, providing a prediction of 29.3 tons per hectare.O conceito de Agricultura de Precisão está normalmente associado à utilização de equipamento de alta tecnologia (seja hardware, no sentido genérico do termo, ou software) para avaliar, ou monitorizar, as condições numa determinada parcela de terreno, aplicando depois os diversos fatores de produção (sementes, fertilizantes, fitofármacos, reguladores de crescimento, água, etc.), em conformidade. O tema proposto na presente dissertação tem como objetivo criar um algoritmo de análise e processamento de imagem que caracterize uma árvore, em particular pessegueiro, distinga os frutos e calcule as suas dimensões, e/ou volume, e/ou peso. A distinção dos frutos em árvore, ou seja, em ambiente natural, é complexa e requer algoritmos de segmentação igualmente complexos. No presente estudo, a segmentação de imagem é aplicada de forma a extrair as características de cor e forma usadas para identificação dos frutos. Para melhorar este reconhecimento, um método de classificação com recurso a uma máquina de suporte vetorial é usado, atingindo uma taxa de reconhecimento a rondar 70%. A estimativa da previsão de produção é feita com recurso aos valores do volume calculados para os frutos reconhecidos, obtendo um valor estimado para a previsão de produção de 29,3 toneladas por hectare

    Potencial de técnicas de mineração de dados para modelos de alerta da ferrugem do cafeeiro.

    Get PDF
    Resumo. Este trabalho procurou avaliar o potencial de técnicas de mineração de dados no desenvolvimento de modelos de alerta da ferrugem do cafeeiro. Foram avaliadas quatro técnicas: Redes Neurais Artificiais, Árvores de Decisão, Support Vector Machines e Random Forest. A avaliação dos modelos gerados mostrou que as duas últimas técnicas geram modelos com maior taxa de acerto e melhores medidas de sensitividade e especificidade. As Redes Neurais Artificiais geraram modelos com alto valor de sensitividade, enquanto que as Árvores de Decisão obtiveram desempenho inferior quando comparadas às demais técnicas. O balanceamento de classes se mostrou um procedimento fundamental na melhora da taxa de acerto dos modelos.SBIAgro 2013

    Rock slope condition state identification through the application of advanced statistical tools

    Get PDF
    Neste trabalho é analisada a adequabilidade da utilização de ferramentas de data mining (DM) no desenvolvimento de um modelo de classificação do estado de condição de taludes em rocha da rede rodo e ferroviária. O modelo proposto utiliza informação recolhida durante inspeções de rotina, por norma de fácil obtenção, complementada com informação geométrica, geológica e geográfica do talude e atribui um nível/classe ao estado de condição ao talude em análise. O sistema proposto, desenvolvido através da aplicação de ferramentas de inteligência artificial, procura maximizar a informação disponível visando uma classificação realista do estado de condição do talude. Para a aprendizagem dos modelos foi utilizada uma base de dados de taludes em rocha da rede ferroviária britânica. Os resultados obtidos permitem analisar a capacidade de aprendizagem de algoritmos de DM na análise de problemas de elevada complexidade e inferir sobre a informação necessária para uma correta identificação do real estado de condição de taludes em rocha.In the present work it is analysed the suitability of data mining techniques in the development of a classification model of the condition state of rock slopes of the highway and railway network. The proposed model is fed with information taken from routine inspections, usually easy to obtain, as well as geometric, geologic and geographic information of the slope and labels it with a class according to its condition state. The proposed model, developed based on the application of artificial intelligent tools, intends to maximize all the available information towards a representative classification of the rock slope condition state. For model learning, a data base was used with rock slope data from the UK railway network. The achieved results allow assessing the learning capacity of DM algorithms when applied to the analysis of complex problems, as well as inferring about the information required for a correct identification of the real condition state of a rock slope.Este trabalho foi financiado pela FCT - “Fundação para a Ciência e a Tecnologia”, no âmbito do ISISE, projeto: UID/ECI/04029/2013 e no âmbito do projeto: UID/CEC/00319/2013, bem como através da bolsa de pós-doutoramento com a referência SFRH/BPD/94792/2013 (POCH e FSE). Este trabalho foi também financiado pelo COMPETE: POCI-01-0145-FEDER-007043

    Previsão do comportamento mecânico de formulações laboratoriais de solo-cimento para colunas de jet grouting com recurso a máquina de vetores de suporte

    Get PDF
    Atualmente, no âmbito dos métodos de tratamentos de solos, o jet grouting (JG) é uma das tecnologias mais utilizadas, nomeadamente em importantes obras geotécnicas, caracterizando-se pela sua grande versatilidade. No entanto, no que respeita à previsão das propriedades mecânicas do novo material resultante do tratamento, a heterogeneidade dos solos e o elevado número de parâmetros envolvidos são os fatores que mais condicionam a existência de modelos racionais e precisos. O presente trabalho visa contribuir para o desenvolvimento de abordagens racionais e precisas com vista à previsão da resistência à compressão uniaxial e respetivo módulo de deformabilidade de formulações laboratoriais de JG. Para o efeito, recorreu-se à aplicação de técnicas de data mining, particularmente do algoritmo máquinas de vetores de suporte. Foi ainda realizada uma análise de sensibilidade detalhada, visando identificar as variáveis chave e qual o seu efeito no estudo das propriedades mecânicas de formulações laboratoriais de JG

    Utilização de ferramentas de machine learning no diagnóstico de patologias da laringe

    Get PDF
    Este trabalho está relacionado com o estudo e utilização de um conjunto de ferramentas de machine learning, nomeadamente árvores de decisão, support vector machines (SVM’s), Deep-learning - Deep Neural Networks, com o prepósito de fazer a classificação entre fala patológica e fala normal, e identificar a patologia com estas ferramentas. As patologias utilizadas neste estudo são a laringite crónica, disfonia e paralisia das cordas vocais. Utilizou-se a base de dados Alemã Saarbrucken Voice Database (SVD), que se encontra disponível online de forma gratuita pelo Instituto de Fonética da Universidade de Saarland. Nesta base de dados é possível encontrar sinais de voz, entre saudáveis e patológicos de mais de 2000 sujeitos. Foram utilizados três grupos de parâmetros, o grupo I (a), contêm parâmetros como Jitter relativo, Shimmer relativo e Harmonic to Noise Ratio (HNR), determinados em segmentos de fala estacionária, onde se atingiu 80.7% de exatidão para distinguir saudáveis e patológicos com SVM. O grupo I (b), contêm os parâmetros do grupo I(a), Noise to Harmonic Ratio (NHR) e Autocorrelação determinados em segmentos de fala estacionária, onde se atingiu 79.2% de exatidão para distinguir saudáveis e patológicos com SVM. O grupo II é baseado em Mel Frequency Cepstral Coefficientes (MFCC’s), determinados nos segmentos de fala estacionários, onde se atingiu 83.3% de exatidão para distinguir saudáveis e laringite com SVM. O grupo III é formado por coeficientes MFCC’s extraídos de fala contínua onde se atingiu 71% de exatidão para distinguir saudáveis e patológicos com Redes Neuronais. Realizou-se uma análise estatística referente aos parâmetros do grupo I (b), com o propósito de identificar características únicas em determinados parâmetros, que permitissem diferenciar as patologias. No decorrer deste trabalho, embora não fosse objetivo inicial, deu-se início a elaboração de um “software” protótipo para fazer gravação de voz, extração de parâmetros e classificação da patologia.This work is related to the study and use of a set of machine learning tools, namely decision trees, Support Vector Machines (SVM's), Deep learning - Deep Neural Networks (neural networks), with the purpose of classifying speech pathological and normal speech, and to identify the pathology with these tools. The pathologies used in this study are chronic laryngitis, dysphonia and vocal cord paralysis. We use the database of the German Saarbrucken Voice Database (SVD), which is available online for free at the Institute of Phonetics at the University of Saarland. In this database it is possible to find voice signals between healthy and pathological of more than 2000 subjects. Three groups of parameters were used, the first one is the group I (a) contains parameters such as Relative Jitter, Relative Shimmer and Harmonic to Noise Ratio (HNR), determined in stationary speech segments, where 80.7% accuracy was achieved to distinguish healthy and pathologies. The group I (b), contain parameters like Relative Jitter, Relative Shimmer, HNR, Noise to Harmonic Ratio (NHR) and Autocorrelation determined in segments of stationary speech, where it obtained 79.2% accuracy to distinguish healthy and pathological patients with SVM. Group II is based on Mel Frequency Cepstral Coefficients (MFCC's), determined in stationary speech segments, where it obtained 83.3% accuracy to distinguish the healthy and laryngitis with SVM. Group III is formed by MFCC coefficients, extracted from continuous speech, where it reached 71% of accuracy to distinguish healthy and pathologies with Neuronal Networks. The statistical study concerning the parameters of group I (b) was performed, in which three 'a', 'i' and 'u' vowels were analyzed in three differents tones: high, low and normal. The statistical study was performed with the purpose of detecting unique characteristics in certain parameters, which allowed to distinguish the pathologies used in this dissertation. In the course of this work, although it was not an initial objective, Started the development of prototype software to make voice recording, parameter extraction and classification of the pathology.Este trabajo está relacionado con el estudio y utilización de un conjunto de herramientas de machine learning, dígase árboles de decisión, support vector machines, Deep learning- Deep Neural Networks (redes neuronales), con el propósito de hacer la clasificación entre habla patológica y habla normal e identificar la patología con estas herramientas. Las patologías utilizadas en este estudio son la laringitis crónica, disfonía y parálisis de las cuerdas vocales. Se ha utilizado la base de datos alemana Saarbrucken Voice Database (SVD), que se encuentra disponible online de forma gratuita por el Instituto de Fonética de la Universidad de Saarland. En esta base de datos es posible encontrar señales de voz, entre saludables y patológicos de más de 2000 sujetos. Se han analizado tres grupos de parámetros, el grupo I(a) contiene parámetros como Jitter relativo, Shimmer relativo, HNR, determinados en segmentos de habla estacionaria, alcanzaron una precisión del 80.7% para distinguir entre sano y patológico. El grupo I(b), contiene parámetros como Jitter relativo, Shimmer relativo, HNR, NHR y Autocorrelación, determinados en segmentos de habla estacionaria, donde se alcanzó una precisión del 79,2% para distinguir sanos y patológicos con la SVM. O grupo II está basado en coeficientes MFCC’s, determinados en segmentos de habla estacionaria, donde se logró una precisión del 83.3% para distinguir los sanos y la laringitis con SVM. El grupo III está formado por coeficientes MFCC extraídos del habla continua, que alcanzaron el 71% de precisión para distinguir los sanos y patológicas con Redes neuronales. Se ha realizado el estudio estadístico referente a los parámetros del grupo I(b), cuyas 3 vocales “a”, “i” y “u” en tres tonos disponibles alto, bajo y normal fueron analizadas. el estudio estadístico se ha realizado con el propósito de detectar características únicas en determinados parámetros, que permitieran diferenciar las patologías utilizadas en esta disertación. En el transcurso de este trabajo, aunque no fuera el objetivo inicial, se dió inicio a la elaboración de un “software” prototipo para hacer grabación de voz, extracción de parámetros y clasificación de la patología

    Avaliação do impacto das degradações no ruído pneu-pavimento

    Get PDF
    O ruído pneu-pavimento é a principal fonte de ruído nos veículos a velocidades superiores a 40 km/h, sendo de forma indireta um grande contribuinte para o ruído ambiental. Como as degradações existentes na superfície dos pavimentos provocam alterações nas suas características, torna-se importante o estudo da influência destas no ruído pneu-pavimento. Assim, neste estudo, recorrendo ao método da proximidade imediata (CPX) e a uma técnica de Data Mining, designada de Máquinas de Vetores de Suporte, para a modelação do ruído, avaliou-se a importância de degradações tais como o fendilhamento, a pele de corocodilo e a desagregação na geração do ruído pneu-pavimento. Confirmou-se assim que as patologias têm uma contribuição relevante para o ruído pneu-pavimento, o que justifica ter em conta o estado de degradação do pavimento quando se pretende estimar os níveis de ruído pneu-pavimento.Este artigo foi elaborado com o apoio da FCT – Fundação para a Ciência e Tecnologia e contém informação proveniente do projeto PEst-OE/ECI/UI4047/2014, financiado no âmbito do Programa Operacional Temático Fatores de Competitividade (COMPETE) e comparticipado pelo Fundo Comunitário Europeu FEDER. Também foi parcialmente financiado pelos fundos FEDER através do Programa Operacional Temático Fatores de Competitividade - COMPETE e por fundos nacionais através da FCT - Fundação para a Ciência e Tecnologia no âmbito do projeto POCI-01-0145-FEDER- 007633.info:eu-repo/semantics/publishedVersio

    Data mining via redes neuronais artificiais e máquinas de vectores de suporte

    Get PDF
    Este artigo pretende esclarecer quais as vantagens de dois modelos não lineares de Data Mining: as Redes Neuronais Artificiais (RNA) e as Máquinas de Vectores de Suporte (MVS). Em particular, pretende-se medir o desempenho destas técnicas quando aplicadas a tarefas de classificação e regressão, comparando-as com outras técnicas (i.e. Árvores de Decisão/Regressão). Assim, fez-se uma análise de ferramentas de software que implementam os modelos referidos, tendo-se escolhido duas aplicações de utilização livre (i.e. o ambiente R e o Weka) para conduzir as experiências efectuadas. Foram utilizados diversos problemas do mundo real, sendo que os resultados obtidos revelam que as MVS obtêm em geral melhores previsões, sendo seguidas pelas RNA.Este trabalho foi suportado pelo projecto FCT PTDC/EIA/64541/2006

    Predicting customer response to cross-market discounts using ensemble methods

    Get PDF
    A globalização dos mercados e o crescente número de empresas tem tornado a área do retalho extremamente competitiva. Esta realidade é transversal aos vários setores de retalho, como são exemplo o sector do vestuário, eletrodomésticos, alimentação, etc. Para se manterem competitivas, as empresas de retalho têm procurado novas formas de captar a atenção do público. Diferentes técnicas publicitárias e descontos são exemplos de estratégias utilizadas para atrair novos clientes e para preservar os atuais. Uma das novas técnicas utilizadas consiste no recurso aos denominados Cross-Market Discounts. Estes consistem em duas empresas, com um público-alvo semelhante, que oferecem descontos interligados, isto é, ao efetuar um transação na primeira empresa esta emitirá um cupão de desconto para ser utilizado numa transação na segunda empresa.O objetivo desta tese é construir modelos que permitam à empresa em estudo prever a resposta dos seus clientes a este tipo de campanhas. A empresa em estudo trata-se de uma empresa de retalho alimentar e que tem uma parceria com uma gasolineira. Os modelos serão suportados por diversas técnicas de data mining, e por forma a melhorar a performance destas técnicas, serão implementados métodos ensemble. O contributo desta tese passa pela implementação de métodos ensemble por forma a melhorar os modelos de previsão da adesão aos Cross-Market Discounts.The globalization of markets and the growing number of companies increased the competition between retail companies. This reality affects all sectores of retail, from clothing to grocery. New ways to keep and gain customers help the companies staying competitives. Diferent strategies like publicity and discounts are examples of tecnics used by the companies. One of the most recent tecniques is called cross-market discounts. This strategy consists of offering linked discounts in unrelated markets that have the same target customers but are not in direct competition with each other.The purpose of this thesis is to build models that allow the company predict the response of customers to the cross-market discounts. The company in study is a grocery retailer with a partnership with a gas company. The models will be supported by several data mining techniques and to enhace the performance, ensemble methods will be used.The contribution of this thesis is the implementation of ensemble methods in order to improve the models that predict the response to the cross-market discounts

    Support vector machines on mechanical behaviour prediction of soil-cement laboratory formulations to jet grouting columns

    Get PDF
    Fundação Para a Ciência e a Tecnologia (FCT) pelo apoio financeiro no âmbito do projeto PEst-OE/ECI/UI4047/2011 e pela bolsa de doutoramento SFRH/BD/45781/200
    corecore