17 research outputs found

    Determinantes do investimento das firmas industriais brasileiras: uma análise exploratória com modelos hierárquicos

    Get PDF
    The paper carries out an exploratory analysis of the determinants of the level of investment of manufacturing firms in Brazil, from 1996 to 2006. The exercise departed from the premise that investment responds both to internal and external factors, such as the sector in which each firm is embedded. From a simple accelerator model, pooled and panel data regressions were estimated to estimate the basic model, followed by hierarchical models with intercept-as-outcome that include two distinct analytical levels. The results confirmed the accelerator effect of investment, revealed the relevance of introduction of variables from the sectoral level, and stressed the importance of factors such as the degree of concentration as a determinant of investment levels.Investment, firms, manufacturing industry, accelerator, hierarchical models

    Modelos de regressão censurados com erros autorregressivos

    Get PDF
    Orientadores: Víctor Hugo Lachos Dávila, Filidor Edilfonso Vilca LabraDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação CientíficaResumo: Dados de séries temporais são facilmente encontrados em diversas áreas, incluindo monitoramento do meio ambiente, medicina, economia e ciências sociais, e muitas vezes apresentam autocorrelação. Uma complicação adicional surge quando as medições de séries temporais apresentam irregularidades, tais como observações submetidas a limites de detecção superiores ou inferiores, acima e abaixo dos quais as medições não são quantificáveis, e observações faltantes. Pesquisadores comumente desconsideram os casos censurados ou substituem estas observações por alguma função do limite de detecção, o que muitas vezes resulta em estimativas tendenciosas. Neste trabalho, nós estudamos alguns aspectos de estimação e análise de influência local em modelos de regressão censurados com erros autorregressivos de ordem p (modelos AR(p)-CR). As estimativas de máxima verossimilhança (ML) dos parâmetros são obtidas usando uma aproximação estocástica do algoritmo EM (SAEM). Esta abordagem nos permite estimar os parâmetros de interesse de forma eficiente. Como um subproduto, o algoritmo SAEM permite previsões dos valores não observáveis da variável resposta. A matriz de informação observada é derivada analiticamente para a obtenção dos erros padrões. Além disso, técnicas de diagnóstico de influência local são derivadas para modelos AR(p)-CR com base na função Q sob três esquemas de perturbação. O desempenho dos métodos em amostras finitas é avaliado por meio da análise de vários estudos de simulação e de aplicações em dois conjuntos de dados reais. O algoritmo e métodos propostos são implementados no novo pacote do R ARCensRegAbstract: Time series data are frequently encountered in diverse fields, including environmental monitoring, medicine, economics and social science, and they are often autocorrelated rather than independent. An additional complication arises when time series measurements are observed with data irregularities, such as observations subjected to upper or lower detection limits, below and above which they are not quantifiable, and missing observations. Practitioners commonly disregard censored data cases or replace these observations with some function of the limit of detection, which often results in biased estimates. In this work, we study some aspects of estimation and local influence analysis in censored regression models with autoregressive errors of order p (hereafter, AR(p)-CR models). The estimates of maximum likelihood (ML) of the parameters are obtained using a stochastic approximation of the EM (SAEM) algorithm. This approach allows for easy and fast estimation of the parameters of autoregressive models when censoring is present. As a byproduct, the SAEM algorithm enables predictions of unobservable values of the response variable. The observed information matrix is derived analytically to account for standard errors. Furthermore, local influence diagnostic measures are derived for the AR(p)-CR model on the basis of the Q-function under three usual perturbation schemes. The finite sample performance of the methods is evaluated through the analysis of several simulation studies and its applications to two real datasets. The proposed algorithm and methods are implemented in the new R package ARCensRegMestradoEstatisticaMestra em EstatísticaCAPE

    Taxa de câmbio e ajuste externo: uma investigação para economias emergentes do BRICS

    Get PDF
    The objective of this paper is to investigate whether the exchange rate played an important role in the external adjustment process the BRICS emerging economies: Brazil, Russia, India, China and South Africa, in the period from 1998 to 2015. To achieve this goal two linear models (ARDL) and two non-linear models (N-ARDL) were estimated in order to evaluate the role of the exchange rate in its three concepts: level, misalignment and volatility. Regarding the adjustment process in the long term, there is cointegration for Brazil and India in estimation models. For China, Russia and South Africa, depending on the estimated model, the cointegration was found or inconclusively results at significance levels of 10% or 5%. There was no model with no cointegration. In relation to the macroeconomic control variables used, there are asymmetries em terms of variables which were responsible for the Current Account the determination. For the ARDL models the significant variables for each country were: (i) Brazil: Net Foreign Assets, Degree of Trade openness and Financial Development; (ii) China: Degree of Trade openness; (iii) India: Real effective exchange rate, Financial Development and volatility terms of trade; (iv) Russia: Degree of Trade openness; (v) South Africa: Real effective exchange rate. For the N-ARDL models: (i) Brazil: Net Foreign Assets, Degree of Trade openness and Financial Development; (ii) China: Degree of Trade openness; (iii) India: Appreciation exchange rate, Depreciation Exchange rate, Financial Development and Volatility terms of trade; (iv) Russia: Degree of Trade openness and Financial Development; (v) South Africa: Appreciation Exchange rate, Depreciation Exchange rate, Misalignment, Financial Development and Volatility terms of trade. The highest speed of adjustment were found in the N-ARD models for India and Brazil. Finally, the results indicate a strong asymmetry regarding the role of the exchange rate in the short term adjustment process. Observing our variable of interest, for the models estimated with Exchange rate of misalignment, on all economies except India, it was statistically significant. On the other hand, for the models estimated with exchange rate volatility, only for Brazil it was significanc for the short-term adjustment in both estimated models.Dissertação (Mestrado)O objetivo deste trabalho consiste em investigar se a taxa de câmbio desempenhou um papel relevante no processo de ajuste externo nas economias emergentes pertencentes ao grupo BRICS: Brasil, Rússia, Índia, China e África do Sul, no período compreendido entre os anos de 1998 a 2015. Para atingir tal objetivo foram estimados dois modelos lineares (ARDL) e dois modelos não lineares (N-ARDL) a fim de avaliar o papel da taxa de câmbio em seus três conceitos: nível, desalinhamento e volatilidade. No que tange ao processo de ajuste no longo prazo, há presença de cointegração para Brasil e Índia em todos os modelos. Para China, Rússia e África do Sul, a depender do modelo estimado, a presença de cointegração é obtida de forma completa ou inconclusiva a níveis de significância de 10% ou 5%. Não houve nenhum modelo que registrasse a ausência de cointegração. Em relação as variáveis macroeconômicas de controle utilizadas, constata-se a presença de assimetria entre quais foram responsáveis pela determinação da Conta Corrente. Para os modelos ARDL as variáveis significativas para cada país foram: (i) Brasil: Ativos Externos Líquidos, Grau de Abertura Comercial e Desenvolvimento Financeiro; (ii) China: Grau de Abertura Comercial; (iii) Índia: Taxa de câmbio real efetiva, Desenvolvimento Financeiro e Volatilidade dos termos de troca; (iv) Rússia: Grau de Abertura; (v) África do Sul: Taxa de câmbio real efetiva. Para os modelos N-ARDL: (i) Brasil: Ativos Externos Líquidos, Grau de Abertura Comercial e Desenvolvimento Financeiro; (ii) China: Grau de Abertura Comercial; (iii) Índia: Apreciação cambial, Depreciação cambial, Desenvolvimento Financeiro e Volatilidade dos termos de troca; (iv) Rússia: Grau de Abertura Comercial e Desenvolvimento Financeiro; (v) África do Sul: Apreciação cambial, Depreciação cambial, Desalinhamento, Desenvolvimento Financeiro e Volatilidade dos termos de troca. As maiores velocidades de ajustamento ao equilíbrio foram obtidas nos modelos N-ARDL, para Índia e Brasil. Finalmente, os resultados indicam ainda uma forte assimetria em relação ao papel da taxa de câmbio no processo de ajuste no curto prazo. Observando nossa variável de interesse, para os modelos estimados com a presença do desalinhamento, em todas as economias, exceto Índia, este se mostrou estatisticamente significante. Em contrapartida, para os modelos estimados com a presença da variável volatilidade cambial, apenas para Brasil houve significância para o ajuste de curto prazo em ambos os modelos estimados

    Estimação robusta em modelos de regressão para dados censurados

    Get PDF
    Orientadores: Víctor Hugo Lachos Dávila, Aldo William Medina GarayDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação CientíficaResumo: Neste trabalho estudamos alguns aspectos de estimação e diagnóstico de influência global e local em modelos de regressão robustos com respostas censuradas sob a classe de distribuições de misturas de escala skew-normal (SMSN) (Lachos et al., 2010). A SMSN é uma classe atraente de distribuições assimétricas com caudas pesadas que inclui a skew-normal, skew-t, skew-slash, skew-normal contaminada e toda a família de distribuições de misturas de escala normal (SMN) como casos especiais. As estimativas de máxima verossimilhança (ML) dos parâmetros são obtidas utilizando uma aproximação estocástica do algoritmo EM (SAEM). Esta abordagem nos permite estimar os parâmetros de interesse de forma eficiente, assim como, obter os erros padrão, predições de valores não observados (censuras) e a função de log-verossimilhança. Para analisar o desempenho do modelo proposto, técnicas de deleção de casos e influência local são desenvolvidas para mostrar a robustez contra outlier e observações influentes. Os métodos propostos são verificados através da análise de vários estudos de simulação e aplicando em dois conjuntos de dados reaisAbstract: In this work, we study studied some aspects of estimation and diagnostics of global and local influence in robust regression models with censored responses under the class of scale mixtures of the skew-normal (SMSN) distribution (Lachos et al., 2010). The SMSN is an attractive class of asymmetrical heavy-tailed densities that includes the skew-normal, skew-t, skew-slash, skew-contaminated normal and the entire family of scale mixtures of normal (SMN) distributions as special cases. The estimates of maximum likelihood (ML)of the parameters are obtained using a stochastic approximation of the EM (SAEM) algorithm. This approach allows us to estimate the parameters of interest efficiently, as well as obtain standard errors, predictions of unobservable values (censoring) and the log-likelihood function. To examine the performance of the proposed model, case-deletion and local influence techniques are developed to show its robust aspect against outlying and influential observations. The proposed methods are verified through the analysis of several simulation studies and applying in two real datasetsMestradoEstatisticaMestre em EstatísticaCAPE

    Regressão quantílica para modelos de efeitos mistos

    Get PDF
    Orientador: Víctor Hugo Lachos DávilaDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação CientíficaResumo: Os dados longitudinais são frequentemente analisados usando modelos de efeitos mistos normais. Além disso, os métodos de estimação tradicionais baseiam-se em regressão na média da distribuição considerada, o que leva a estimação de parâmetros não robusta quando a distribuição do erro não é normal. Em comparação com a abordagem de regressão na média convencional, a regressão quantílica (RQ) pode caracterizar toda a distribuição condicional da variável de resposta e é mais robusta na presença de outliers e especificações erradas da distribuição do erro. Esta tese desenvolve uma abordagem baseada em verossimilhança para analisar modelos de RQ para dados longitudinais contínuos correlacionados através da distribuição Laplace assimétrica (DLA). Explorando a conveniente representação hierárquica da DLA, a nossa abordagem clássica segue a aproximação estocástica do algoritmo EM (SAEM) para derivar estimativas de máxima verossimilhança (MV) exatas dos efeitos fixos e componentes de variância em modelos lineares e não lineares de efeitos mistos. Nós avaliamos o desempenho do algoritmo em amostras finitas e as propriedades assintóticas das estimativas de MV através de experimentos empíricos e aplicações para quatro conjuntos de dados reais. Os algoritmos SAEMs propostos são implementados nos pacotes do R qrLMM() e qrNLMM() respectivamenteAbstract: Longitudinal data are frequently analyzed using normal mixed effects models. Moreover, the traditional estimation methods are based on mean regression, which leads to non-robust parameter estimation for non-normal error distributions. Compared to the conventional mean regression approach, quantile regression (QR) can characterize the entire conditional distribution of the outcome variable and is more robust to the presence of outliers and misspecification of the error distribution. This thesis develops a likelihood-based approach to analyzing QR models for correlated continuous longitudinal data via the asymmetric Laplace distribution (ALD). Exploiting the nice hierarchical representation of the ALD, our classical approach follows the stochastic Approximation of the EM (SAEM) algorithm for deriving exact maximum likelihood (ML) estimates of the fixed-effects and variance components in linear and nonlinear mixed effects models. We evaluate the finite sample performance of the algorithm and the asymptotic properties of the ML estimates through empirical experiments and applications to four real life datasets. The proposed SAEMs algorithms are implemented in the R packages qrLMM() and qrNLMM() respectivelyMestradoEstatisticaMestre em Estatístic

    Regressão de auto-modelagem e aplicações

    Get PDF
    Orientador: Aluísio de Souza PinheiroTese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação CientíficaResumo: Uma classe ampla de problemas nas ciências físicas dão origem aos experimentos nas quais a resposta observada é uma curva contínua. Esta é a situação em que, por exemplo, se estuda a resposta de audição, ou electrocardiogramas na população humana, ou quando são mensuradas curvas espectrofotométricas de um produto amostrado, ou observa-se curvas de reação em experimentos químicos planejados. A análise de tais experimentos impõe certos problemas porque a maior parte dos procedimentos estatísticos contém a análise de populações em que a variável física observada é um único valor numérico, ou um vetor de tais valores, em vez de uma curva inteira. Por esta razão, geralmente busca-se um modelo paramétrico para a população total de curvas. Ao utilizar o modelo mencionado, pode-se associar um vetor de valores de parâmetros para cada possível curva observável na população. Cada população tem sua própria forma de curva característica; Isso é, todas as curvas dentro de uma população parecem ter a mesma forma básica. Parece que todas as curvas em uma população determinada podem coincidir se fossem devidamente escaladas e deslocadas. Métodos para modelar os conjuntos de curvas complexas onde as curvas devem ser alinhadas no tempo (ou em outro preditor contínuo) são incluídos na classe geral de análise de dados funcionais e incluem procedimentos de regressão auto-modelagem. Regressão auto-modelagem, também conhecida como modelo de forma invariante, supõe que as curvas têm uma forma comum, modeladas de forma não paramétrica e diferenças específicas de cada curva em amplitude e tempo, tradicionalmente modeladas por transformações lineares. O presente trabalho tem por objetivo o uso de regressão auto-modelagem para a análise de dados ordinais quando as probabilidades cumulativas condicionais para uma categoria de um resultado têm uma relação com o modelo de forma invariante. Para ajustar as curvas individuais foi usado um modelo misto linear para transformar as escalas de tempo e da resposta. É demonstrado o caso quando os parâmetros podem ser modelados mediante de um modelo misto linear, a inferência para parâmetros pode proceder como se a função de forma fosse uma função de regressão conhecida. A curva de tempo da população é modelada por uma regressão \textit{spline} penalizada. Como uma aplicação a severidade da toxicidade gênito-urinária foi avaliada para pacientes com câncer de próstata que receberam diferentes doses de radiação. As respostas ordinais (severidade dos efeitos colaterais) foram registradas longitudinalmente junto com o estágio do câncer de um paciente. Vamos nos concentrar na questão de saber se o nível de dosagem da radiação afeta a severidade da toxicidade gênito-urinária (bexiga), o qual é um efeito colateral da terapia de radiação. Uma vez que usualmente há censura nos dados, também nos propusemos o uso do modelo longitudinal de auto-modelagem baseado em censura à direita. Em um estudo de recuperação pós-cirúrgica, consideramos o efeito de dose de anestesia sobre recuperação. Em particular, investigou-se a interação entre o efeito da dose e do tempo de acompanhamento. Em um estudo de medicina, pacientes com vários estágios da doença podem ser curados ou o estágio da doença deles pode ser mudado após o tratamento. Demonstramos um novo modelo de cura com alguns estágios de pacientes curados ou não curados ao contrário do modelo de cura comum com dois estágios. O modelo aloca a probabilidade destes estágios precisamente por regressão ordinal de auto-modelagem. Esquizofrenia como uma doença mental pode vir em várias formas com diferentes sintomas e resultados. Considerou-se o efeito de quatro medicações em pacientes com esquizofrenia no modelo de cura. No final, usamos o modelo binário de auto-modelagem no modelo de cura mistura de risco acelerada com efeitos aleatórios de tal modo que o modelo estendido pode ser aplicado para o tempo de ocorrência de um evento. Aplicamos o modelo para o conjunto de dados de doença respiratória. A técnica de maximização esperada de Monte Carlo é utilizada para estimar os parâmetros do modelo. Estudos de simulação também são realizadas para justificar as metodologias utilizadasAbstract: A large class of problems in the physical sciences give rise to experiments where observed response is a continuous curve. For instance, this situation occurs when one studies hearing response, or electrocardiograms in the human population, or when one measures spectrophotometric curves from sampled product, or observes reaction curves in designed chemical experiments. The analysis of such experiments poses certain problems because the bulk of the statistical procedures is concerned with the analysis of populations in which the physical observable is a single numerical value, or a vector of such values, rather than an entire curve. For this reason one has usually sought a parametric model for the total population of curves. By using such a model, one can associate a vector of parameter values with each possible observable curve in the population. Each population has its own characteristic curve shape; that is, the curves within a population all seem to have the same basic shape. It appears that all the curves in a given population might coincide if they were properly scaled and shifted. Methods for modeling sets of complex curves where the curves must be aligned in time (or in another continuous predictor) fall into the general class of functional data analysis and include self-modeling regression procedures. Self-modeling regression, also known as a shape invariant model, assumes the curves have a common shape, modeled non-parametrically, and curve-specific differences in amplitude and timing, traditionally modeled by linear transformations. This study proposed the use of self-modeling regression to analysis the data when the conditional probabilities for a category of an outcome has a relation with shape-invariant model. We use a linear mixed model for transformation of the time and response scales to fit the individual curves. It is demonstrated when the parameters can be modelled by a linear mixed model, the inference on the parameters can proceed as if shape function were a known regression function. The population time curve is modeled with a penalized regression spline. As an application, the severity of genito-urinary toxicity is assessed for prostate cancer patients who were given different doses of radiation. The ordinal responses (severity of side effects) are recorded longitudinally along with the cancer stage of a patient. We focus on the question of whether the dose level of radiation affects the severity of genito-urinary toxicity, which is a side effect of radiation therapy. Since there is often the censoring in the medical data, we also proposed the use of the longitudinal model of self-modeling based on the right censoring. In a post-surgical recovery study, the dose of anesthesia affects the recovery. In particular, we investigate the interaction between the dose effect and time to follow-up. In a medical study, patients with various stages of illness may be cured or the stage of their illness be changed after treatment. We demonstrate a new cure model with several stages of cured or uncured patients instead of the common cure model with two stages. The model allocates probability of these stages by self-modeling ordinal regression precisely. Schizophrenia as a mental illness can come in various forms with different symptoms and outcomes. We considered the effect of four medications on schizophrenia patients in the cure model. In the end, we used Self-Modeling binary model in the accelerated hazards mixture cure model with random effects such that the extended model can be applied to the time of occurrence of an event. We apply the model to the respiratory illness data set. Monte Carlo expectation maximization technique is used to estimate the parameters of the model. Simulation studies are also carried out to justify the methodologies usedDoutoradoEstatisticaDoutor em EstatísticaCAPE

    Classificação de padrões de escoamento bifásico líquido-gás baseada em séries temporais de fração de vazio e técnicas de aprendizagem de máquina.

    Get PDF
    The classification of the flow pattern is a fundamental step in many processes that involve multiphase flow, among them, estimation of mass and/or volumetric flow, calculation of void fraction, bubble size, slip factor and so on. In this work some approaches are proposed to classify liquid-gas vertical flow patterns that combine signal processing techniques and machine learning. Wire-Mesh sensor data were used to obtain the time series of void fraction. They are analyzed through statistical and time-frequency approaches, generating parameters that are later used as inputs to the algorithms based on the Support Vector Machine (SVM) and Linear Discriminant Analysis (LDA) to finally identify the pattern. The tests performed indicate that some of the proposed algorithms perform better than 90% of the correct identification. The data used are from vertical water-air flow in 51.2mm tubes.O escoamento multifásico é um fenômeno presente em várias aplicações industriais, como reatores químicos, geração de energia, e na exploração, produção e transporte de petróleo e gás natural. A classificação do padrão de escoamento é uma etapa fundamental nesse tipo processo, pois, influencia diversas medidas e subprocessos como estimação de vazão mássica e/ou volumétrica, cálculo de fração de vazio, tamanho de bolha, fator de escorregamento, etc. Neste trabalho são propostas algumas abordagens de classificação de padrões para escoamento vertical líquido-gás utilizando séries temporais de fração de vazio, técnicas de processamento de sinais e aprendizado de máquina. Uma vez obtidas as séries temporais, são utilizadas duas abordagens inéditas para o problema da classificação de padrões: a primeira é atualização de um modelo de mistura de gaussianas e o segundo é a utilização da transformada de Hilbrt-Huang em séries temporais de fração de vazio. A última abordagem utilizada faz o cálculo dos quatro primeiros momentos estatísticos para gerar parâmetros para um algoritmo de classificação, muito utilizada em combinação com redes neurais para os problemas em identificação de padrões em escoamento multifásico. Posteriormente, os dados gerados através das técnicas descritas são utilizados como entrada nos algoritmos baseados em máquina de vetores suporte (Support Vector Machine - SVM) e análise de discriminante linear (Linear Discriminante analysis - LDA) para enfim, efetuar a identificação do padrão. Os resultados obtidos indicam um ótimo potencial para aplicação em sistemas reais e experimentos in loco. Foram propostos doze métodos de classificação de padrões combinando as técnicas de processamento de sinais e os algoritmos de classificação. Em alguns dos casos, a taxa de acerto foi superior a 90% no conjunto de dados referente ao escoamento água-ar vertical em tubos de 51,2mm

    Explorando imagens adversárias em redes neurais profundas

    Get PDF
    Orientador: Eduardo Alves do Valle JuniorDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de ComputaçãoResumo: Exemplos adversários levantaram questões da robustez e segurança de redes neurais profundas. Neste trabalho nós formalizamos o problema de imagens adversárias dado um classificador pré-treinado, mostrando que mesmo em modelos lineares a otimização resultante é não-convexa. Nós geramos imagens adversárias utilizando classificadores rasos e profundos nas bases de dados de imagens MNIST e ImageNet. Nós sondamos o espaço dos pixels das imagens adversárias com ruído de intensidade e distribuição variável. Nós trazemos visualizações novas que mostram o fenômeno e sua alta variabilidade. Nós mostramos que imagens adversárias aparecem em regiões grandes no espaço de pixels, entretanto, para a mesma tarefa, um classificador raso parece mais robusto a imagens adversárias que uma rede convolucional profunda. Nós também propomos um novo ataque adversário a autoencoders variacionais. Nosso procedimento distorce uma imagem de entrada com o objetivo de confundir um autoencoder a reconstruir uma imagem alvo completamente diferente. Nós atacamos a representação interna e latente, com o objetivo de que a entrada adversária produza uma representação interna o mais similar possível da representação de uma imagem alvo. Nós verificamos que autoencoders são mais robustos ao ataque que classificadores: Apesar de alguns exemplos possuírem pequena distorção na entrada e similaridade razoável com a imagem alvo, há um compromisso quase linear entre esses objetivos. Nós demonstramos os resultados nas bases de dados MNIST e SVHN, e também testamos autoencoders determinísticos, chegando a conclusões similares em todos os casos. Finalmente, nós mostramos que o ataque adversário típico em classificadores, apesar de ser mais fácil, também apresenta uma relação proporcional entre a distorção da entrada e o erro da saída. No entanto, essa proporcionalidade é escondida pela normalização da saída, que mapeia uma camada linear em uma distribuição de probabilidadesAbstract: Adversarial examples have raised questions regarding the robustness and security of deep neural networks. In this work we formalize the problem of adversarial images given a pre-trained classifier, showing that even in the linear case the resulting optimization problem is nonconvex. We generate adversarial images using shallow and deep classifiers on the MNIST and ImageNet datasets. We probe the pixel space of adversarial images using noise of varying intensity and distribution. We bring novel visualizations that showcase the phenomenon and its high variability. We show that adversarial images appear in large regions in the pixel space, but that, for the same task, a shallow classifier seems more robust to adversarial images than a deep convolutional network. We also propose a novel adversarial attack for variational autoencoders. Our procedure distorts the input image to mislead the autoencoder in reconstructing a completely different target image. We attack the internal latent representations, attempting to make the adversarial input produce an internal representation as similar as possible as the target's. We find that autoencoders are much more robust to the attack than classifiers: while some examples have tolerably small input distortion, and reasonable similarity to the target image, there is a quasi-linear trade-off between those aims. We report results on MNIST and SVHN datasets, and also test regular deterministic autoencoders, reaching similar conclusions in all cases. Finally, we show that the usual adversarial attack for classifiers, while being much easier, also presents a direct proportion between distortion on the input, and misdirection on the output. That proportionality however is hidden by the normalization of the output, which maps a linear layer into a probability distributionMestradoEngenharia de ComputaçãoMestre em Engenharia Elétric
    corecore