143 research outputs found

    Estabilidade de Classificadores de Decisão em Árvore Binária para Dados Imagem em Alta Dimensão

    Get PDF
    This paper deals with the problem of classifying high-dimensional image data image data using a multiple stage classifier structured as a binary tree. The aim here consists in finding the optimal structure for the binary tree in the sense of achieving a stable accuracy. The advantage presented by a multiple stage classifier lies on the fact that only a sub-set of classes is considered at each stage, allowing a better selection of the features to be used at each node.  The binary tree is a particular case of a tree structured classifier, on which only two classes are considered at each node. This peculiarity makes possible the direct use of statistical distances for feature reduction (selection or extraction). In this study the criterion used for feature reduction at each node consists in optimizing the Bhattacharyya distance separating both classes in the node. The optimization of Bhattacharyya distance was based on the covariance matrices. Once the final set of features is obtained at each particular node, the classification is performed using the Gaussian Maximum Likelihood decision rule. Tests were performed using high-dimensional image data collected by the sensor system AVIRIS covering a test area. The criteria to evaluate the performance of the classifiers are: the final accuracy yielded by the classifier, its stability, and the required computer time.Neste trabalho é investigada uma abordagem para classificação de dados imagem em alta dimensão utilizando classificadores de decisão em árvore binária. O objetivo é selecionar uma estrutura binária que forneça a maior estabilidade possível em relação à acurácia média de classificação para dados imagem em alta dimensão. A utilização de um classificador hierárquico em estrutura binária, analisando pares de classes em múltiplas etapas ao invés do conjunto total de classes em uma única etapa, permite extrair variáveis mais adequadas para cada subconjunto particular de classes. Contudo, devido às múltiplas estruturas binárias que podem ser produzidas, a seleção de uma árvore binária que seja ótima no sentido de produzir resultados estáveis é uma tarefa complexa. Considerando somente duas classes em cada etapa do processo, é possível implementar a distância de Bhattacharyya para fins de estimação da separabilidade entre classes e também como critério para redução de dimensões. O critério de decisão utilizado no processo de classificação é o da Máxima Verossimilhança Gaussiana (MVG). Experimentos foram realizados utilizando dados imagem coletados pelo sensor AVIRIS, investigando o comportamento da acurácia da imagem temática produzida em função de diferentes valores para o limiar de classificação e para o número de variáveis utilizadas. A performance da metodologia proposta é avaliada segundo a complexidade da árvore de classificação, o tempo de processamento, a acurácia média final da imagem temática produzida e a estabilidade do classificador

    Classificação de imagens multiespectrais para elaboração de cartografia de base topográfica

    Get PDF
    Trabalho de projecto de mestrado, Engenharia Geoespacial, Universidade de Lisboa, Faculdade de Ciências, 2019O presente trabalho tem como objetivo avaliar a qualidade da cartografia topográfica de escala 1:25000, obtida a partir de imagens multiespectrais de satélites de elevada resolução espacial no âmbito do catálogo de objetos e especificações técnicas da cartografia do CIGeoE para a folha 1:25000, série M888, carta de base da cartografia Nacional. Será efetuado um estudo comparativo utilizando dois tipos de dados imagem, imagens multiespectrais do satélite GeoEye I e ortoimagens obtidas através de voo fotogramétrico, ambas com 4 bandas RGB+NIR. O projeto está dividido em três fases: classificação de imagem, filtragem de imagem e edição e generalização cartográfica. A primeira fase diz respeito à classificação de imagem, tendo-se usado os algoritmos de classificação Máxima Verosimilhança, Suport Vector Machine e Árvores de Decisão (AD). No caso das AD, para além das 4 bandas das imagens referidas foram inseridas 2 bandas adicionas através do cálculo de dois índices, NDVI e RRR. Após a classificação passamos à fase de filtragem onde são criadas máscaras binárias das classes a extrair e aplicados filtros espaciais e operadores morfológicos. Após a eliminação de grande parte do ruído passa-se à fase de generalização cartográfica de forma a regularizar a informação adquirida via classificação e equipará-la à adquirida via restituição fotogramétrica. Para efeitos de avaliação do processo de extração de informação cartográfica foi tomada como referência a informação adquirida por operadores fotogramétricos do CIGeoE aquando a elaboração da carta 1:25000 da área de estudo, definida pela zona urbana da região de Samora Correia e enquadrada pelas cartas nº 404 e 405 série M888 do CIGeoE. Todas as fases têm um processo de avaliação associado, sendo que apenas transitam para a fase seguinte os produtos com melhor resultado, na última fase avaliativa é efetuada uma adaptação ao STANAG 2215, com vista a avaliar se o melhor resultado obtido a nível de exatidão posicional é viável para produção de cartografia 1:25000 do CIGeoE. Foi concluído que embora os resultados obtidos sejam favoráveis à utilização de técnicas de deteção remota para elaboração de cartografia de base topográfica, deverá ser equacionado um controle de qualidade à informação adquirida assim como a disponibilização da informação a um operador fotogramétrico, de forma a verificar se esta se reveste numa mais valia para o restituidor, permitindo uma otimização do tempo de restituição da carta, o presente estudo deverá ainda ser alargado a todos os objetos constantes nas normas de aquisição

    Detecção de alterações em área urbana litorânea a partir de imagens Ikonos-ll de duas épocas utilizando uma abordagem híbrida

    Get PDF
    Orientadores : Prof. Dr. Jorge Antonio Silva CentenoDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências da Terra, Programa de Pós-Graduação em Ciências Geodésicas. Defesa: Curitiba, 23/02/2015Inclui referências : f. 71-78Resumo: As mudanças na paisagem podem ocorrer a partir de ações antrópicas ou naturais, imagens adquiridas a partir de plataformas orbitais, ou a partir de câmaras embarcadas em aviões, como também por Drones e VANT's (Veículos Aéreos Não Tripulados) mais atualmente, vêm sendo amplamente utilizadas a fim de que essas alterações possam ser compreendidas e representadas espacialmente na tomada de decisões, em relação a determinado fenômeno em estudo. Esta dissertação trata de desenvolver uma metodologia híbrida na detecção de alterações, ou seja, utilizando as abordagens: orientada a objeto na classificação de duas imagens com cobertura do solo urbana, e a abordagem orientada a pixel na comparação das alterações, no sentido de melhoria no processamento. Palavras-chave: Imagens de Alta Resolução Espacial, Detecção de Alterações, Abordagem Híbrida, Análise de Imagens Orientada a Objeto.Abstract: The changes occurred on the landscape could be derived by anthropological or natural processes, images acquired from imagery satellites, either from airborne cameras, or drones are largely used in order to understand and represent those changes spatially also for decision making based on spatial information depending on the study case. This master thesis is intended on developing a hybrid change detection methodology, which is developed using the two image processing approaches, object-based analysis for classifying the two images where the scene is basically formed by urban land cover and pixel approach in order to compare and identify the changes between the pair of images. Keywords: HRS Images, Change Detection, Hybrid Approach, Object-Based Image Analysis

    Previsão automática da mortalidade em UCI de doentes com síndrome da dificuldade respiratória aguda associada à COVID-19 utilizando radiografias de tórax e dados clínicos

    Get PDF
    Trabalho final de Mestrado para obtenção do grau de Mestre em Engenharia BiomédicaA síndrome da dificuldade respiratória aguda associada à COVID-19 (ARDS-COV19), é uma síndrome pulmonar grave que resulta em insuficiência respiratória aguda. A ARDS é complexa e heterogénea, exigindo frequentemente ventilação mecânica invasiva (VMI) em unidades de cuidados intensivos (UCI). A identificação de grupos de risco é crucial para a medicina de precisão, embora a falta de métodos de diagnóstico seja limitativo. A radiografia torácica é um exame imagiológico, qualitativo e acessível, utilizado na rotina das UCIs. É essencial o desenvolvimento de um classificador multivariado e quantitativo, baseado em radiomics, para a previsão da mortalidade destes doentes sob VMI. Para este efeito foram incluídos 110 doentes ARDS-COV19 de uma UCI, com uma idade média de 63,2 ± 11,92 anos, sendo 61,2% do sexo masculino. A mortalidade foi de 47,3%. Radiografias do 1º e 3º dia de VMI foram recolhidas, pré-processadas e concatenadas. Características de deep learning foram então extraídas, utilizando uma rede neuronal convolucional pré-treinada (CheXnet). Estas características foram acopladas a variáveis clínicas (VC), para a construção de dois modelos de aprendizagem automática, um de regressão logística (LogReg) e um perceptrão multicamada (MLP). A idade, a razão PaO2/FiO2 do 3º dia de VMI e uma característica de imagem (DLF_258) foram utilizadas nos modelos finais. Os modelos que incluíram a DLF_258, apresentaram 89% (LogReg) e 82% (MLP) de probabilidade de terem melhor exatidão, do que os modelos de VC. No grupo de teste interno (23 doentes), o modelo de LogReg obteve os melhores resultados e menor overfitting, com uma área under the ROC curve (AUC) de 0,862 95%CI [0.654, 0.969], uma exatidão de 0,783 95%CI [0.563, 0.926] e um score de F1 de 0,783 95%CI [0.563, 0.926]. Apesar dos resultados promissores, o número de amostras foi reduzido, não existindo um teste externo. A recolha de dados e posterior validação são assim essenciais.Acute respiratory distress syndrome associated with COVID-19 (ARDS-COV19) is a severe pulmonary syndrome leading to acute respiratory failure. ARDS is complex and heterogeneous, with patients frequently needing invasive mechanical ventilation (IMV) in intensive care units (ICUs). The identification of risk groups is crucial for precision medicine, although the lack of diagnostic methods can be limiting. Chest radiography is a qualitative and accessible imaging examination routinely used in ICU settings. The development of a multivariate and quantitative classifier based on radiomics is essential for predicting the mortality of patients under IMV. For this purpose, 110 ARDS-COV19 patients from an ICU, with an average age of 63.2 ± 11.92 years, of whom 61.2% were male, were included. The mortality rate was 47.3%. Chest X-rays from the 1st and 3rd days of IMV were collected, pre-processed, and concatenated. Deep learning features were then extracted using a pre-trained convolutional neural network (CheXnet). These features were combined with clinical variables (CV) to build two machine learning models: a logistic regression model (LogReg) and a multilayer perceptron (MLP). Age, the PaO2/FiO2 ratio on the 3rd day of IMV, and an image feature (DLF_258) were used in the final models. The models that included DLF_258 showed 89% (LogReg) and 82% (MLP) probability of having better accuracy than CV models. In the internal test group (23 patients), the LogReg model achieved the best results with lower overfitting, providing an area under the ROC curve (AUC) of 0.862, 95% CI [0.654, 0.969], an accuracy of 0.783, 95% CI [0.563, 0.926], and an F1 score of 0.783, 95% CI [0.563, 0.926]. Despite promising results, the sample size was limited, and external testing is lacking. Therefore, data collection and subsequent validation are essential.N/

    Google Earth™ search engine: classificação de imagens aéreas

    Get PDF
    O reconhecimento de padrões com recurso a redes neuronais é cada vez mais utilizado, numa tentativa de dotar as máquinas computacionais de inteligência e capacidade de aprendizagem. Neste trabalho pretende-se reconhecer determinados elementos naturais como ’água’, ’casas’ ou ’estradas’, em imagens aéreas provenientes do Google EarthTMe do Google MapsTM, recorrendo à utilizando redes neuronais para o efeito. Foram realizadas experiências com quatro conjuntos de imagens utilizados para o treino da rede neuronal, com variação de número de neurónios, e foram analisados os erros de classificação testando cinco novos conjuntos de imagens. Foram ainda realizadas diversas experiências quanto aos métodos de extração de características e à aplicação de operadores morfológicos com diferentes elementos estruturais visando o pós-processamento dos resultados obtidos.Pattern recognition using neural networks is increasingly used in an attempt to provid to machines computational intelligence and learning ability. This work aims to recognize certain natural elements like ’water’, ’house’ or ’roads’ in aerial images from Google Earth TMand Google Maps TM, resorting to using neural networks for the purpose. Experiments were performed with four sets of images used for training the neural network, with varying number of neurons, and analyzed the classification errors by testing five new sets of images. Were also carried out several experiments on methods of feature extraction and application of morphological operators with different structural elements aimed at the post-processing of results

    Redes neurais convolucionais para detecção do status do gene MGMT em pacientes com glioblastomas a partir de imagens de ressonância magnética

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2022.A automatização de diferentes processos médicos via aplicação de aprendizado de máquina vem ganhando destaque ao longo do tempo, devido a seus resultados equiparáveis aos de especialistas em diversas áreas. Nesse trabalho, técnicas de aprendizado de máquina são aplicadas na tarefa de classificação do status do gene MGMT em pacientes com glioblastomas, uma categoria de tumor cerebral com elevado nível de agressividade, com um tempo médio de sobrevida de cerca de 14,6 meses. Métodos cirúrgicos, complementados por tratamentos quimioterápicos, visam aumentar o tempo de sobrevida dos pacientes e melhorar seu bem-estar. O sucesso desses tratamentos está ligado a determinados marcadores genéticos, como o nível de metilação (silenciamento das atividades) do gene MGMT. Métodos invasivos são utilizados para identificação do status do gene, os quais acarretam riscos para o paciente, limitando sua aplicabilidade. Devido a isso, técnicas não-invasivas, baseadas na classificação de imagens de ressonância magnética por meio de aprendizado de máquina, vêm sendo desenvolvidas. Esse trabalho explora quatro técnicas para classificação do status do gene MGMT em pacientes com glioblastomas, visando a comparação dos resultados de cada método em uma base de dados pública, comum e de elevada qualidade. Especificamente, são investigadas abordagens baseadas em extração de features radiômicas e baseadas em redes neurais convolucionais, tanto para classificação 2D/3D quanto para segmentação semântica. Nenhuma das abordagens testadas demonstrou significativa capacidade de classificação automática do status do gene MGMT, todas tendo, em média, uma ROC-AUC (%) de 60% (±2,78%) no conjunto de teste utilizado para comparação dos resultados.Abstract: The automation of different medical processes via the application of machine learning has been gaining prominence over time, due to its results comparable to those of experts in various fields. In this work, machine learning techniques are applied to the task of classifying the status of the MGMT gene in patients with glioblastomas, a category of brain tumor with a high level of aggressiveness, with an average survival time of about 14.6 months. Surgical methods, complemented by chemotherapeutic treatments, aim to increase the survival time of patients and improve their well-being. The success of these treatments is linked to certain genetic markers, such as the level of methylation (silencing activities) of the MGMT gene. Invasive methods are used to identify the gene status, which carry risks for the patient that limit their applicability. Because of this, non-invasive techniques, based on classification of magnetic resonance images using machine learning, have been developed. This paper explores four techniques for classifying MGMT gene status in patients with glioblastomas, aiming to compare the results of each method on a common, high quality, public database. Specifically, radiomic feature extraction-based and convolutional neural network-based approaches for both 2D/3D classification and semantic segmentation are investigated. None of the approaches tested demonstrated much ability to automatically classify the status of the MGMT gene, all having, on average, an ROC-AUC (%) of 60% (±2,78%) on the test set used to compare results

    Avaliação do ritmo cardíaco em eletrocardiogramas de curta duração utilizando análise dos intervalos RR e aprendizado supervisionado

    Get PDF
    Atrial fibrillation is a condition that often does not show itself through symptoms and is strongly related to infarction and sudden cardiac death. This work aims at developing an algorithm that differentiates atrial fibrillation rhythm from noise, normal and other rhythms in single short ECG leads collected by a mobile device. A total of 36 features were collected mostly from the sequence of beat-to-beat intervals. Neighborhood component analysis (NCA) feature selection technique was applied, and several supervised learning algorithms were compared and optimized using cross validation approach. Performances were compared with an index F1 that considers both sensitivity and specificity. NCA allowed selecting 11 features. The classifier based on support vector machines gave the best overall result (F1 = 72,9%), were the best performance occurred for the atrial fibrillation class (F1 = 82,5)Fibrilação atrial é uma condição que frequentemente não exibe sintomas e está fortemente relacionada com infarto e morte súbita cardíaca. O objetivo deste trabalho foi desenvolver um algoritmo que diferencia fibrilação atrial de ritmo normal e outros ritmos presentes em sinais de curta duração e de derivação única, coletados por um dispositivo móvel. Um total de 36 características foram coletadas, principalmente da sequência de intervalos batimento-a-batimento. Seleção de características por análise de componentes vizinhos (ACV) foi aplicada e quatro algoritmos de aprendizado supervisionado foram comparados e otimizados, utilizando-se treinamento com validação cruzada. A comparação dos desempenhos foi realizada por meio de um índice F1 que leva em conta sensibilidade e especificidade. A ACV permitiu selecionar 11 variáveis do conjunto inicial. O classificador que utilizou máquina de vetores de suporte forneceu o melhor índice geral (F1 = 72,9), onde o melhor desempenho ocorreu na detecção de fibrilação atrial (F1 = 82,5)

    Métodos estatísticos em aprendizado de máquinas para problemas de classificação

    Get PDF
    Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018.As técnicas de aprendizado de máquina são amplamente utilizadas em tarefas de classificação de dados. Neste trabalho, são apresentados três métodos de aprendizagem supervisionadas que são adequadas à classificação de indivíduos. Estes métodos foram aplicados a dois conjuntos de dados, com características distintas, e realizados estudos de simulação para comparações entre os resultados. O método RDA destacou-se por obter o melhor desempenho de classificação em dados massivos e caso de n n p. Por sua vez, as técnicas FA e SVM obtiveram o melhor desempenho quando aplicadas ao conjunto de dados em que nop. As técnicas de validação cruzada (VC) são úteis para a definição dos valores ótimos dos hiper-parâmetros dos modelos. Neste trabalho utilizou-se três técnicas de VC: Stratified Cross Validate (SCV), Leave-One-Out Cross Validation (LOOCV) e Shuffle and Split (SS). Para as comparações entre os resultados foram realizadas diversas análises, dentre elas, gráficos das curvas ROC, taxas de má classificação e EQMs. A avaliação final, utilizada para a escolha do melhor método de classificação, deu-se por meio do Erro Médio de Teste (Average Test Error - AVTE). As simulações e análises foram realizadas utilizando o software R.Machine learning techniques are widely used in data classification tasks. In this paper, we present three supervised learning methods that are suitable for the classification of individuals. These methods were applied to two sets of data, with different characteristics, and simulation studies were carried out to compare the results. The RDA method was distinguished by obtaining the best performance of classification in massive data and case of n n p. On the other hand, the techniques FA and SVM obtained the best performance when applied to the dataset where n o p. Cross-validation (VC) techniques are useful for defining the optimum values of the hyper-parameters of the models. In this work three VC techniques were used: Stratified Cross Validate (SCV), Leave-One-Out Cross Validation (LOOCV) and Shuffle and Split (SS). For the comparisons between the results, several analyzes were carried out, among them, graphs of ROC curves, misclassification rates and EQMs. The final evaluation, used to choose the best classification method, was done through the Average Test Error (AVTE). Simulations and analyzes were performed using software R

    Detec??o de descontinuidades no processo de soldagem por eletrodo revestido por meio de intelig?ncia computacional.

    Get PDF
    Programa de P?s-Gradua??o em Engenharia de Materiais. Departamento de Engenharia Metal?rgica, Escola de Minas, Universidade Federal de Ouro Preto.Prop?e-se neste trabalho uma nova metodologia para a detec??o de descontinuidades no cord?o de solda aplicado em processos de soldagem por eletrodos revestidos (SMAW). Para a execu??o dos experimentos e otimiza??o de par?metros do processo, foi desenvolvida uma esta??o de soldagem robotizada. O sistema de detec??o baseia-se em dois sensores ? um microfone e um cristal piezoel?trico ? que adquirem as emiss?es ac?sticas geradas durante a soldagem. Os vetores de caracter?sticas extra?dos do conjunto de dados dos sensores s?o usados para construir os modelos dos classificadores. As abordagens baseadas nos classificadores de Rede Neural Artificial (RNA) e de M?quina de Vetor de Suporte (SVM) s?o capazes de identificar com alta acur?cia as tr?s classes propostas de cord?es de solda: cord?o de solda normal, e descontinuidades de cratera e de perfura??o. Os resultados experimentais ilustram a acur?cia do sistema, superior a 83% para cada classe. Uma nova estrutura de m?quinas de suporte hier?rquico (HSVM) ? proposta para viabilizar o uso deste sistema em ambientes industriais. Esta abordagem apresentou 96,6% de acur?cia global. Este sistema pode ser aplicado nas ind?strias metal-mec?nicas.One proposes in this work a new methodology for the detection of discontinuities in the weld bead applied in Shielded Metal Arc Welding (SMAW) processes. A robotized welding station was developed for the execution of the experiments and optimization of process parameters. The detection system is based on two sensors ? a microphone and piezoelectric ? that acquire acoustic emissions generated during the welding. The feature vectors extracted from the sensor dataset are used to construct classifier models. The approaches based on Artificial Neural Network (ANN) and Support Vector Machine (SVM) classifiers are able to identify with high accuracy the three proposed weld bead classes: desirable weld bead, shrinkage cavity and burn through discontinuities. Experimental results illustrate the system?s accuracy, greater than 83% for each class. A novel Hierarchical Support Vector Machine (HSVM) structure is proposed to make feasible the use of this system in industrial environments. This approach presented 96.6% overall accuracy. This system can be applied in the metal-mechanical industries
    corecore