Сравнение классических и робастных оценок параметров пороговой авторегрессии

Abstract

The study object is the first-order threshold auto-regression model with a single zero-located threshold. The model describes a stochastic temporal series with discrete time by means of a piecewise linear equation consisting of two linear classical first-order autoregressive equations. One of these equations is used to calculate a running value of the temporal series. A control variable that determines the choice between these two equations is the sign of the previous value of the same series.The first-order threshold autoregressive model with a single threshold depends on two real parameters that coincide with the coefficients of the piecewise linear threshold equation. These parameters are assumed to be unknown. The paper studies an estimate of the least squares, an estimate the least modules, and the M-estimates of these parameters. The aim of the paper is a comparative study of the accuracy of these estimates for the main probabilistic distributions of the updating process of the threshold autoregressive equation. These probability distributions were normal, contaminated normal, logistic, double-exponential distributions, a Student's distribution with different number of degrees of freedom, and a Cauchy distribution.As a measure of the accuracy of each estimate, was chosen its variance to measure the scattering of the estimate around the estimated parameter. An estimate with smaller variance made from the two estimates was considered to be the best. The variance was estimated by computer simulation. To estimate the smallest modules an iterative weighted least-squares method was used and the M-estimates were done by the method of a deformable polyhedron (the Nelder-Mead method). To calculate the least squares estimate, an explicit analytic expression was used.It turned out that the estimation of least squares is best only with the normal distribution of the updating process. For the logistic distribution and the Student's distribution with the large number of degrees of freedom, the M-estimate with the Huber rho-function exceeds the least squares estimate in the case of both distributions.For the Laplace distribution, the least squares estimate is the worst, and the least modulus estimate is the best among all estimates.For the Cauchy distribution, the least-squares estimate has incomparably low efficiency with respect to the remaining estimates.With decreasing number of degrees of freedom in the Student's distribution, the least squares estimate at first loses only the M-estimate with the Huber rho-function, then both M-estimates, and then the least moduli estimate.If the updating process has a contaminated normal distribution, then the M-estimate is a little bit lower than the least squares estimate only in case there is absolutely no contaminants.With increasing contamination share and level, relative effectiveness of the M-estimate with respect to the estimation of least squares grows, becoming above unit for typical contamination in practice.Объект исследования работы – модель пороговой авторегрессии первого порядка с одним порогом, расположенным в нуле. Эта модель описывает стохастический временной ряд с дискретным временем посредством кусочно-линейного уравнения, состоящего из двух линейных классических авторегрессионных уравнений первого порядка. Текущее значение временного ряда вычисляется при помощи одного из этих уравнений. Управляющей переменной, которая определяет выбор между этими двумя уравнениями, является знак предыдущего значения этого же ряда.Пороговая авторегрессионная модель первого порядка с одним порогом зависит от двух вещественных параметров, которые совпадают с коэффициентами кусочно-линейного порогового уравнения. Эти параметры предполагаются неизвестными. В работе изучаются оценка наименьших квадратов, оценка наименьших модулей и М-оценки указанных параметров. Целью работы является сравнительное исследование точности указанных оценок для основных вероятностных распределений обновляющего процесса порогового авторегрессионного уравнения. Этими распределениями вероятности были нормальное, загрязненное нормальное, логистическое, двойное-экспоненциальное распределения, распределение Стьюдента с различным числом степеней свободы и распределение Коши.В качестве меры точности каждой оценки была выбрана ее дисперсия, измеряющая величину рассеяния оценки вокруг оцениваемого параметра.  Из двух оценок лучшей считалась оценка с меньшей дисперсией. Дисперсия оценивалась методом компьютерного моделирования. Оценка наименьших модулей определялась при помощи итерационного взвешенного метода наименьших квадратов, М-оценки  находились  методом деформируемого многогранника (метода Нелдера – Мида). Для вычисления оценки наименьших квадратов использовалось явное аналитическое выражение.Оказалось, что оценка наименьших квадратов является лучшей только при нормальном распределении обновляющего процесса. Для логистического распределения и распределения Стьюдента с большим числом степеней свободы М-оценка с ро-функцией Хьюбера превосходит оценку наименьших квадратов в случае обоих распределений.Для распределения Лапласа оценка наименьших квадратов является наихудшей, а оценка наименьших модулей наилучшей среди всех оценок.Для распределения Коши оценка наименьших квадратов имеет несравнимо низкую эффективность по отношению к остальным оценкам.С уменьшением числа степеней свободы у распределения Стьюдента оценка наименьших квадратов сначала проигрывает только М-оценке с ро-функцией Хьюбера, потом обеим М-оценкам, а затем и оценке наименьших модулей.Если обновляющий процесс имеет загрязненное нормальное распределение, то М-оценка уступает, причем не намного, оценке наименьших квадратов только при практически полном отсутствии загрязнений.С ростом доли и уровня загрязнения относительная эффективность М-оценки по отношению к оценке наименьших квадратов  увеличивается, становясь больше единицы для типичного на практике загрязнения

    Similar works