Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Задание № 3

В предыдущем задании мы исследовали распределение dt для каждого года отдельно. Теперь попытаемся сравнить, насколько одинаково они распределены в разные годы.

Критерий однородности двух выборок.

Пусть имеется 2 выборки x1, x2,…, xm и y1,…yn. Гипотеза Но, которую мы будем проверять, состоит в том, что обе выборки извлечены из одной и той же совокупности, т. е. их функции распределения одинаковы. Пусть Fm (x) и Gn(x) эмпирические функции распределения, построенные по этим выборкам.

В качестве статистики критерия для проверки Но берется величина . Известно, что

.

Правая часть этого выражения – т. н. функция Колмогорова.(При n и m порядка нескольких десятков приближение для практических нужд уже хорошее.) Таким образом, для решения задачи нужно определить выборочное значение статистики и определить р-значение по функции Колмогорова.

При этом возникают 2 проблемы:

1.  Как вычислить D.

2.  Как вычислить значение функции Колмогорова в заданной точке.

Решение.

1. (supremum, который мы ищем, достигается в одной из точек x1, x2,…, xm, y1,…yn(x-ы и y-и мы располагаем в возрастающем порядке, образуя вариационный ряд из двух выборок, поэтому они перемешаны). В предыдущем задании мы определяли эмпирич. ф. распределения в т. выборки. Здесь нам нужно задать эмп. ф.расп. F(x) не только в т. «своей выборки» x1, x2,…, xm, но и в т. y1,…yn (аналогично G(x) нужно задать еще и в т. x1, x2,…, xm).Поэтому во всех точках, где мы задаем F (те. в x1, x2,…, xm, y1,…yn ), приходится вместо “(k-1)/m”считать сколько элементов выборки x1, x2,…, xm предшествует данной точке. Для этого до сортировки мы каждую выборку снабжаем меткой (здесь предлагается первой выборке дать метку «1», второй «2»), а для подсчета числа элементов пользуемся функцией СЧЕТЕСЛИ). Для того, чтобы вычислить нужно знать значения Fm(x) и Gn(x) в точках x1, x2,…, xm, y1,…yn. (т. к. мы ищем supremum, то в точках разрыва эмпирических функций распределения нужно принимать во внимание оба значения: k/m и (k-1)/m).

НЕ нашли? Не то? Что вы ищете?

Расположим в столбце «В» последовательно эти выборки, а в столбце «А» поставим около x1, x2,…, xm - «1», а около y1,…yn - «2» (метки). Отсортируем выборки, захватывая при этом столбец с «1» и «2» (сортировать А и В по столбцу В). Пусть в первой строке записаны названия переменных и функций, а сами значения располагаются, начиная со 2-ой строки.

В столбцах C и D вычисляем значения Fm (x):

в столбце C в точках разрыва Fm (x) = (k-1)/m (назовем ее F1m (x)),

в столбце D Fm (x) = k/m ( назовем ее F2m (x)),

т. е. в строке, например № 10, F1m (x)=СЧЕТЕСЛИ($A$2:$A9;”=1”)/m (в строке №2 F1m и G1m равны 0, а в следующих строках уже действует предложенная формула),

а F2m (x)= СЧЕТЕСЛИ($A$2:$A10;”=1”)/m.

Аналогичным образом вычисляются G1m (x) и G 2m (x) в столбцах E и F соответственно.

В каждой точке x1, x2,…, xm, y1,…yn подсчитываем , который равен max{|infFm(x)-supGn(x)|; |supFm(x)-infGn(x)|} т. е. max{|F1m(x)-G2n(x)|;|F2m(x)-G1n(x)|} . Искомая величина Dm,n=max {D(x)} .

(В Excel модуль – функция ABS(…); максимум - МАКС(…).)

Дополнительно вычислить D’(x)=sup{Fm(x),Gn(x)}-inf{Fm(x),Gn(x)} и D’=max{D’(x)}.

ЗАМЕЧАНИЕ: D’(x) может отличаться от D(x) в точках, где xi совпадает с yk, однако отличие порядка величины ступеньки (1/n или 1/m).Поэтому D=max{D(x)} и D’=max{D’(x)} должны практически совпадать. Убедитесь в этом (этот результат нам нужен для следующего задания).

2. Для вычисления р-значения для полученной статистики можно воспользоваться статистическими таблицами, но, если их нет под руками, значение функции Колмогорова можно вычислить самостоятельно, организовав лист для счета, например, так:

А

В

Функция Колмогорова в 0 не определена (ряд расходится). Вблизи 0 ряд сходится медленно. Для значений аргумента, больших 0,05, достаточно взять 100 слагаемых, в чем нетрудно убедиться, сравнив значения в ячейках В2 и В3

1

z

0,05

2

K(z)

=1+СУММ(B$5:B104)

3

=1+СУММ(B$5:B250)

4

k

5

1

=((-1)^$A5)*2*EXP(-2*($A5*$A5)*(B$1*B$1))