Методы восстановления генерального распределения душевых денежных доходов населения на основе выборочных данных большого объема

Abstract

This paper provides an analysis of popular methods for correcting sample distribution of income per-capita and proposes a methodology for evaluating the parameters of a lognormal income distribution, taking into account unequal response rates between individuals with different income levels, income deciles - a result of survey design and the survey non-response rate. The authors propose the fitting of a lognormal distribution on the basis of comparing mean and boundary income levels for defined population intervals between the sample and general distribution, instead of the more common approach of frequency analysis between the two. The mean income value of a given interval, with enough observations, is less volatile than the individual frequencies on the interval. This is especially important in situations where individual frequencies in the sample distribution significantly differ from the population distribution itself. The authors examine two different criteria for estimating the optimal lognormal distribution parameters. The first method is similar to the methodology used in Russian statistics, and does not require preliminary information on the share of the poor population. The parameters are estimated using the condition of equality between the sample and population mean income, and the right-income boundary of the first income deciles. The second criterion is based on minimizing the squared sum of deviations between the mean income levels for the middle eight income deciles of the sample and population mean values. Neither of the two criteria uses the hypothesis of non-response rates increasing with households’ income growth, which allows one to assess the representative-value of the sample survey. The results of the calculations show that the method achieves the highest parity between sample and population distributions in the middle-part of the lognormal distribution, but suffers from underrepresentation in the lower part of the distribution, i.e. for poor households and individuals.В статье дается анализ популярных методов коррекции выборочного распределения душевых доходов населения и описывается методика оценки параметров логнормального распределения денежных доходов, учитывающая неравномерное представительство респондентов с разным уровнем доходов, в доходных децилях, которое зависит от дизайна выборки и доли отказов респондентов от участия в опросе. Ключевая идея работы состоит в выборе критерия для оценки параметров теоретического распределения, основанного не на сравнении групповых частот, а на сравнении границ и средних значений в теоретических децилях выборочных и искомых распределений. Средние значения в интервалах доходов, при достаточном количестве наблюдений, значительно меньше зависят от частоты представительности респондентов в интервалах. Это особенно важно, когда частотные характеристики выборки существенно отличаются от аналогичных показателей генеральной совокупности. Рассмотрены два критерия оптимального выбора параметров логнормального распределения. Первый близок по методике, используемой в российской статистике, но при этом не требуется предварительная информация о том, какую часть составляет бедное население. Параметры оцениваются исходя из условия выполнения равенства среднего генерального дохода и совпадения выборочных и теоретических границ первого децильного интервала. Во втором случае минимизируется сумма отклонений выборочных и теоретических средних, рассчитанных в теоретических децилях. Оба критерия построены без учета гипотезы о возрастании вероятности отказов населения от участия в опросе в связи с ростом дохода домохозяйства, что позволяет сделать оценки представительности генеральных данных в выборочной совокупности. Результаты конкретных расчетов показывают наибольшее представительство в средней части распределения и недостаточность наблюдений на концах, то есть и в группе бедных домохозяйств

    Similar works