к. ф.-м. н., факультет ВМК МГУ имени
МЕДИАННЫЙ ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ
И КВАНТИЛЬНАЯ РЕГРЕССИЯ
Аннотация
В данной работе, для случая сгруппированных данных с одинаковым числом наблюдений в условных распределениях, предлагается выбирать симметричные порядки квантилей из непараметрических доверительных интервалов для медианы условного распределения зависимой величины. Это позволяет внести дополнительную информацию в характеристику применяемых квантильных регрессий и улучшить интерпретируемость получаемых оценок параметров используемых моделей квантильной регрессии.
Ключевые слова: медианный доверительный интервал, квантильная регрессия
Keywords: median confidence interval, quantile regression
Введение. В последнее время наблюдается активное использование метода квантильной регрессии [1] в различных областях естествознания [2;3], как качественного дополнения к классической регрессии. Это связано прежде всего с возможностью квантильной регрессии оценить степень различия влияния факторов вдоль условных распределений зависимой переменной, идентифицировать гетероскедастичность, асимметрию распределения ошибок. При этом большинство исследователей в своих работах выбирают, как правило, симметричные классические порядки квантилей (процентиль, дециль, квартиль), что отражено и в алгоритмах по классической регрессии применяемых программных сред, таких как, MATLAB, SAS и R[4;5]. Воспользуемся обозначениями и результатами исследований предыдущих работ [6;7] при расчете медианных доверительных интервалов и кривых линейной и нелинейной квантильных регрессий на модельных данных.
Линейная модель. Выберем
натуральных значений независимой переменной
линейной
зависимости, интерпретируя их как реализации некоторой случайной величины
. Для каждого из
, независимо смоделируем
случайных значений
путем аддитивного внесения в
случайной ошибки
, распределенной по нормальному закону
с дисперсией равной 4. В результате получили облако из
значений
, изображенных в виде кружков на рис.1 слева, интерпретируемых как реализации с. в.
. При этом каждому
соответствует выборка объема
условной с. в.
, а значит (см. таблицу ниже) совпадают последовательности медианных доверительных интервалов и порядки квантилей их образуемые. Приведенные в таблице значения даны в виде целых частей процентов.
| 100 | 100 | 100 | 100 | 99 | 97 | 92 | 82 | 68 | 50 |
| 2 | 8 | 12 | 18 | 22 | 28 | 32 | 38 | 42 | 48 |
| 98 | 92 | 88 | 82 | 78 | 72 | 68 | 62 | 57 | 52 |
На рис.1. точечная линия соответствует медианной (LAD), сплошная — классической (OLS), а штрих — квантильной (QR) регрессиям, где для QR в круглых скобках отображаются вероятность доверительного интервала и квантильный порядок в виде
или
. На рис.1 справа изображен случай моделирования множества точек аналогичной линейной зависимости, но с ошибками, распределенными по закону
. Как видно на рис.1 непостоянство дисперсии (гетероскедастичность) хорошо иллюстрируется расходящимися прямыми квантильной регрессии, в отличие от предыдущего случая гомоскедастичности, где, как видно на рис.1 слева, эти прямые параллельны.
Нелинейная модель. На рис.2 отображено смоделированное множество


Рис.1
точек
для нелинейной зависимости
с параметрами
и мультипликативной ошибкой
, распределенной по нормальному закону
, где
характеризует асимптотику функции при
, при
значение функции равно половине асимптотики,
, а
— масштабный параметр значений
. Изображенные на рис.2 аналогичные квантильные кривые показывают начальную сильную изменчивость дисперсии ошибок с последующей их стабилизацией. На приведенных рисунках (рис.1-2) изображенные квантильные кривые дополнительно информируют о доверительной вероятности покрытия медианы симметричным квантильным интервалом в отдельной точке
. Так, например, область, ограниченная штрих-кривыми (97,72)% и (97,28)% с вероятностью 97% покрывает медианную кривую и ее границы соответствуют квантильным регрессиям порядка 72% и 28%. Последовательность рассчитанных
значений квантильных порядков
и
может быть также использована для анализа поведения квантильных оценок параметров модели в зависимости от порядка. Результаты такого исследования с использованием программы «summary. rq(object, se”rank,…”)» пакета «quantreg» [4] для линейной гомоскедастичной и гетероскедастичной

Рис.2
моделей изображены на рис.3 слева и справа, соответственно. Ломаная штрих-пунктирная линия соединяет квантильные оценки параметров
линейной зависимости
, а серая обрамляющая ее область изображает их 90%-доверительный интервал [1,91,188]. Сплошная линия соответствует оценке параметров OLS-методом, а штрих линии — 90%-довернительный интервал оценок. Рисунки показывают степень изменчивости оценок параметров и их доверительных областей от квантильного порядка, а для параметра
линейной модели могут быть интерпретированы как оценки условной квантильной функции распределения с. в.
.
Заключение. Непараметрический доверительный интервал для медианы может с успехом использоваться в квантильной регрессии для случая сгруппированных данных с одинаковым числом наблюдений в условных распределениях. Его применение позволяет дополнить симметрично построенные линии квантильной регрессии информацией о доверительной вероятности покрытия ограниченной ими областью медианной регрессии и тем самым контролировать границы изменения наблюдаемого процесса.


Рис.3
Литература:
1. R. Koenker. Quantile regression. Cambridge University Press, NY.—2005.— 368p.
2. B. Cade, B. Noon. A Gentle Introduction to Quantile Regression for Ecologists // Frontiers in Ecology and the Environment.—2003.—V.1.—P. 412-420.
3. R. Koenker, K. Hallock. Quantile Regression // Journal of Economic Perspectives.—2001.—V.15.—P. 143-156.
4. R. Koenker. Quantreg: Quantile Regression. R package version 4.71.—2011.
5. H. P.Wynn. An exact confidence band for one-dimensional polynomial regression // Biometrika.—1984.—V.71.—P. 375-379.
6. . Непараметрический медианный доверительный интервал // Проблемы развития науки и образования: теория и практика. Сборник научных трудов по материалам Международной научно-практической конференции. Часть I. М.: АР-Консалт.—2015.—C. 7-10.
7. . Сравнительный анализ медианных доверительных интервалов // Актуальные проблемы гуманитарных и естественных наук. Часть I. Москва.—2015.—№ 10(81).—С. 7-9.


