One of the main objectives of statistics is to make inference in a population or
phenomenon from a subset of data from this, called a sample. One way to make
inference is to perform hypothesis testing. In general, we can say that it is from a
sample of the population that we will establish a decision rule according to which we
will reject or not reject the proposed hypothesis, called null hypothesis. A general
procedure that produces reasonable tests is the Likelihood Ratio test (TRV). To
apply the TRV, we need to know the true distribution of the likelihood ratio λ∗(x)
which is generally not easy to obtain. However, it is known in the literature that the
RV = −2 log(λ∗(x)) statistic follows an approximate chi-square distribution when
the test is based on a large sample size. However, using the chi-square distribution as
an approximation to the true distribution of the RV statistic can lead to inaccurate
inferences when the sample size is small. The objective of this research is to improve
the TRV when the test is based on a small or moderate sample. For this, we make
use of new families of distributions, denoted sup and inf. Based on some properties
of the inf distribution family, we propose a new approach for the improvement of
TRV. Specifically, we used the chi-square inf distribution as a chi-square correction
distribution to obtain the quantile that determines the critical region of the test. In
addition, this work creates the computational package LikRatioTest, written in the
R language, with the objective of evaluating the performance of the improved TRV
(TRV∗) and comparing it with the classic asymptotic TRV. This package allows
you to do Monte Carlo simulations, imposing various scenarios, and thus, calculate
the rejection rate of the null hypothesis using the two approaches (classical and
improved). This package is open source and is available on GitHub for installation on R. To illustrate the usefulness of our proposal, we show two numerical examples
using real data sets.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUm dos principais objetivos da estatística é realizar inferência em uma população
ou fenômeno a partir de um subconjunto de dados desta, denominado de amostra.
Uma das maneiras de realizar inferência é realizando teste de hipóteses. De forma
geral, podemos dizer que é a partir de uma amostra da população que estabeleceremos
uma regra de decisão segundo a qual rejeitaremos ou não rejeitaremos a
hipótese proposta, denominada hipótese nula. Um procedimento geral que produz
testes razoáveis é o Teste da Razão de Verossimilhanças (TRV). Para aplicar o TRV,
precisamos conhecer a verdadeira distribuição da estatística da razão de verossimilhanças
λ∗(x) que, geralmente, não é fácil de ser obtida. Todavia, é conhecido
na literatura que a estatística RV = −2 log(λ∗(x)) segue distribuição aproximada
qui-quadrado quando o teste é baseado em uma amostra de tamanho grande. No
entanto, o uso da distribuição qui-quadrado como uma aproximação à verdadeira
distribuição da estatística RV pode levar a inferências imprecisas quando o tamanho
da amostra é pequeno. O objetivo desta pesquisa é aperfeiçoar o TRV quando o
teste for baseado em amostra de tamanho pequeno ou moderado. Para isso, fazemos
uso de novas famílias de distribuições, denotadas de sup e inf. A partir de algumas
propriedades da família inf de distribuições, propomos uma nova abordagem para o
aperfeiçoamento do TRV. Especificamente, utilizamos a distribuição qui-quadrado
inf como uma distribuição de correção da qui-quadrado para a obtenção do quantil
que determina a região crítica do teste. Além disso, neste trabalho é criado o pacote
computacional LikRatioTest, escrito na linguagem R, com o objetivo de avaliar
o desempenho do TRV aperfeiçoado (TRV∗) e compará-lo com o TRV assintótico
clássico. Este pacote permite fazer simulações de Monte Carlo, impondo vários cenários, e assim, calcular a taxa de rejeição da hipótese nula utilizando as duas
abordagens (clássica e aperfeiçoada). Tal pacote é open source e encontra-se disponível
no GitHub para instalação no R. Para ilustrar a utilidade da nossa proposta,
mostramos dois exemplos numéricos usando conjuntos de dados reais