95 5196

Известно, что рассеяние, определяемое средним квадратом отклонения, минимально, если его вычислять относительно центра рассеяния. Отсюда следует, что величина принимает свое минимальное значение. Другими словами, регрессия на является наилучшей (в смысле минимума среднего квадратичного отклонения) оценкой зависимости от .

Очевидно, что регрессия может служить оценкой зависимости, когда эта регрессия известна. Если регрессия неизвестна, то ищут оценку в некотором классе функций случайной величины и вместо (6.5) требуют минимума величины

.                        97 5298

Оценка случайной величины , принадлежащая определенному классу функций и доставляющая минимум величине , определяемой формулой (6.6), называется средней квадратичной регрессией на .

Будем, например, искать оценку среди класса линейных функций, т. е. . Коэффициенты и найдем из условия минимума , т. е. методом наименьших квадратов. Преобразуем сначала (6.6) следующим образом:

               99 53100

Здесь – корреляционный момент случайных величин и .

Необходимыми условиями минимума функции (6.7) являются

,

или

                               101 54102

Решая систему (6.8), найдем , и вместе с тем линейную оценку регрессии

                       10355104

НЕ нашли? Не то? Что вы ищете?

Здесь – коэффициент корреляции. Линия

                       105 56106

называется прямой линией регрессии на . Коэффициент

называется коэффициентом регрессии.

Аналогично можно получить прямую регрессии на

.                        107 57108

Прямые (6.10) и (6.11) не совпадают, но обе проходят через центр распределения . Коэффициент корреляции служит мерой линейной корреляционной связи между и . Если , то и связаны линейной функциональной зависимостью, если , то они не коррелированы. Прямые регрессии в этом случае параллельны осям координат.

Если числовые характеристики, входящие в уравнения регрессии, неизвестны, то их заменяют оценками ; ; ; ; ; ,

где

  ; ;                

;        10958110

  .

В результате получим эмпирические прямые регрессии

.                        111 59112

Задача нахождения регрессии тесно связана с задачей сглаживания экспериментально полученной зависимости по методу наименьших квадратов. В подтверждение этого можно сравнить формулы (6.13) и (1.9).

Если генеральная совокупность имеет нормальное распределение, то можно считать при выборочный коэффициент корреляции нормально распределенным: . Выборочные коэффициенты регрессии и также распределены нормально:

, .

Учитывая это, можно легко построить доверительные интервалы для , и .

Линейная регрессия имеет важное практическое значение, поскольку генеральная совокупность чаще всего распределена нормально. В противном случае возможна нелинейная регрессия, а при большом диапазоне изменения величин линеаризация регрессии неправомерна. В этом случае поступают следующим образом. Для каждого выборки вычисляют среднее значение . Наносят точки и соединяют их ломаной линией. По этой ломаной линии решают вопрос о виде нелинейной зависимости. Затем проводят сглаживание.

Следующие примеры демонстрируют применение методов нахождения регрессии. Для моделирования стохастической зависимости генерируется массив нормально распределенных значений и массив случайных величин с нулевым математическим ожиданием (помеха). Величина получается путем суммирования значений и помехи . Изменяя параметр для помехи , можно регулировать степень случайности связи величин x и y, что оценивается визуально по виду графика, на котором наносятся точки.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14