Aspectos práticos da estimação do modelo de mistura via processo de Dirichlet

Abstract

Neste trabalho, analisamos os aspectos práticos de um modelo bayesiano não paramétrico conhecido como modelo de mistura por processo de Dirichlet. Procedemos a um estudo de simulação com o objetivo de investigar a performance do modelo, no que diz respeito à classi _cação de dados oriundo de populações heterogêneas, em subgrupos (ou componentes). Os dados em cada componente identificado são assumidos terem uma distribuição normal, de forma que os dados de todos os componentes, juntos são assumidos serem originados de uma mistura de distribuições normais. Para veri_car este desempenho, procedemos a uma análise para investigar dois aspectos. O primeiro aspecto considerado está relacionado a sensibilidade do modelo, quanto a escolha do parâmetro de locação da distribuição base adotada, normal-gama-invertida, para o processo de Dirichlet, o qual é usado como distribuição a priori para o modelo, como em um simples problema de Bayes. O segundo aspecto diz respeito à performance do modelo em relação ao afastamento dos parâmetros, média e variância, das distribuições dos componentes. Os resultados das simulações com estas misturas de distribui ções normais, indicam sensibilidade do método para a escolha do parâmetro de locação da distribuição base normal-gama-invertida e também indicam uma boa performance, mesmo quando os componentes com distribuições normais diferem entre si apenas na variabilidade dos dados. Finalmente, aplicamos este método para três conjuntos de dados reais, sendo o último uma aplicação em dados de mistura de modelos de regressão.We review the Dirichlet process mixture model and investigate its performance as a classification method. The first aspect considered is its sensibility to the choice of location parameter of the base distribution. The second aspect considers the performance of the model regarding the departure of the parameters of the component distributions. Simulation results with mixture of normal distributions indicate sensibility to location parameters choices, of the base distribution, and good performance even when components with normal distributions differ only in variances. Finally, we apply the method to three data sets

Similar works

Full text

thumbnail-image

RCAAP - Repositório Científico de Acesso Aberto de Portugal

redirect
Last time updated on 10/08/2016

Having an issue?

Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.