
(***)
Тогда
(****)
Найдем оценку дисперсии групповых средних (*), учитывая (**) и (****) и заменяя
ее оценкой ![]()
(i)
Исходя из того, что статистика
имеем
распределение Стьюдента с
степенями свободы, можно построить доверительный интервал для условного математического ожидания
(ii)
где
стандартная ошибка групповой средней
.
|
Из формул (i) и (ii) видно, что величина доверительного интервала зависит от значения объясняющей переменой
при
она минимальная, а по мере удаления
от
величина доверительного интервала увеличивается (см. рис. 21). Таким образом, прогноз значений зависимой переменной
по уравненю регрессии оправдан, если значение объясняющей переменной не выходит за диапазон ее значений по выборке (причем тем более точный, чем ближе
к
) и ее использование вне пределов обследованного диапазона значений объясняющей переменной может привести к значительным погрешностям.
Рис. 21. Доверительные области условной средней линии регрессии
и индивидуальных значений
зависимой переменной
Построенная доверительная область для
(рис. 21) определяет местоположение модельной линии регрессии (т. е. условного математического ожидания), но не отдельных возможных значений зависимостей переменной, которые отклоняются от средней. Поэтому при определении доверительного интервала для индивидуальных значений
зависимой переменной необходимо учитывать учитывать еще один источник вариации – рассеяние вокруг линии регрессии, т. е. в оценку суммарной дисперсии
следует включить величину
- оценочную дисперсию возмущений. В результате оценка дисперсии индивидуальных значений
при
равна
, (iii)
а соответствующий доверительный интервал для прогнозов индивидуальных значений
будет определяться поформуле
![]()
9.3. Коэффициент корреляции
Показателем тесноты корреляционной зависимости между факторами (признаками) является коэффициент корреляции. Рассмотрим наиболее важный для практики и теории случай линейной зависимости вида (15)
.
В этом уравнении показателем тесноты связи
от
мог бы быть коэффициент регрессии
, т. к. он показывает, на сколько единиц в среднем изменяется
, когда
увеличивается на одну единицу. Но
зависит от единиц измерения переменных. Например, в полученной ранее зависимости он увеличится в 1000 раз, если величину основных производственных фондов
выразить не в млн руб., а в тыс. руб.
Для «исправления»
как показателя тесноты связи используется стандартная единица измерения, в которой данные по различным характеристикам становятся сравнимыми между собой. Такой единицей измерения переменной в статистике является среднее квадратическое отклонение ![]()
Представим уравнение (15) в эквивалентной форме

В этом выражении величина
(24) или учитывая (16) ![]()

(25)
показывает, на сколько величин
изменится в среднем
, когда
увеличится на одно ![]()
Величина
является показателем тесноты связи и называется выборочным коэффициентом корреляции (коэффициентом корреляции).
Из формулы (24) видно, что
совпадает по знаку с
, а значит и с
. Если ![]()
то корреляционная связь между переменными называется прямой, если ![]()
- обратной. При прямой (обратной) связи увеличение одной из переменных ведет к увеличению (уменьшению) условной (групповой) средней другой.
Формула (25) для
симметрична относительно двух переменных, т. е.
и
можно менять местами. Тогда аналогично (24) можно записать:
. (26)
Произведение обеих частей равенств (24) и (26) дает
или
, (27)
т. е. коэффициент корреляции
переменных
и
есть средняя геометрическая коэффициентов регрессии, имеющих их знак.
Пример 2. Вычислить коэффициент корреляции между величиной основных производственных фондов
и суточной выработкой продукции
(по данным табл.19 ).
Решение. Ранее получено
и
По формуле (27)
(корень берем со знаком +, т. к. коэффициенты
и ![]()
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |



