положительны). Итак, связь между рассматриваемыми переменными прямая и достаточно тесная, т. к.
близок к 1.
Свойства коэффициента корреляции (при достаточно большом объеме выборки
.
1. Коэффициент корреляции принимает значения на отрезке
т. е.
. (28)
В зависимости от того, насколько
приближается к 1, различают связь слабую, умеренную, заметную, достаточно тесную, тесную и весьма тесную, т. е. чем ближе к
к 1, тем теснее связь.
2. Если все значения переменных увеличить (уменьшить) на одно и то же число
или в одно и то же число раз, то величина коэффициента корреляции не изменится.
3. При
корреляционная связь представляет линейную функциональную
зависимость. При этом линии регрессии
по
и
по
совпадают и все наблюдаемые значения располагаются на общей прямой.
Найдем
между двумя прямыми с угловыми коэффициентами
и
используя соответствующую формулу аналитической геометрии
(29)
Из полученной формулы видно, что чем теснее связь и чем ближе
к 1. тем меньше угол
между прямыми регрессии, а при
и линии регрессии сливаются.
4. При
линейная корреляционная связь отсутствует. При этом групповые средние переменных совпадают с их общими средними (см. формулу (25)), а линии регрессии
по
и
по
параллельны осям координат.
Если
то
и линии регрессии (14) и (19) имеют вид
и ![]()
Равенство
говорит лишь о об отсутствии линейной корреляционной зависимости (некоррелированности переменных), но не вообще об отсутствии корреляционной, а тем более статистической, зависимости.
Выборочный коэффициент корреляции
является оценкой генерального коэффициента корреляции
, тем более точной, чем больше объем выборки ![]()
9.4. Проверка значимости уравнения регрессии и интервальная оценка параметров связи
Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.
Проверка значимости уравнения регрессии производится на основе дисперсионного анализа (будет рассмотрен далее как самостоятельный раздел). Здесь он применяется как вспомогательное средство для изучения качества регрессионной модели.
Согласно идее дисперсионного анализа вычислим сумму квадратов разностей между значениями
и их средними
:
(А)
или
(В) где
общая сумма квадратов отклонений зависимой переменной от средней,
и
соответственно сумма квадратов, обусловленная регрессией, и остаточная сумма квадратов, характеризующая влияние неучтенных факторов. Покажем, что пропущенная в (В) третье слагаемое
равно нулю.
Учитывая, что
, и ![]()
Тогда ![]()
с учетом 
Схема дисперсионного анализа имеет вид, представленный в таблице 20
Таблица 20
Компоненты дисперсии | Сумма квадратов | Число степеней свободы | Средние квадраты |
Регрессия Остаточная Общая |
|
|
|
В таблице средние квадраты
и
представляют собой несмещенные оценки дисперсий зависимой переменной, обусловленной соответственно регрессией или объясняющей (ими) переменной (ыми)
и воздействием неучтенных случайных факторов и ошибок;
- число оцениваемых параметров уравнения регрессии;
число наблюдений.
При отсутствии линейной зависимости между зависимой и объясняющей (ими) переменной (ыми) случайные величины
и
имеют
распределение соответственно с
степенями свободы, а их отношение -
распределение с теми же степенями свободы. Поэтому уравнение ренгрессии значимо на уровне
если фактически наблюдаемое значение статистики
(G)
где
табличное значение
критерия Фишера-Снедекора, определенное на уровне значимости
при
и
степенях свободы.
Учитывая смысл величин
и
можно сказать, что значение
показывает, в какой мере регрессия сучше оценивает значение зависимой переменной по сравнению с ее средней.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |


