Изобразим в системе прямоугольных координат каждую пару значений точкой с координатами. Получим точечную диаграмму или поле корреляции (рис. 39).

В случае линейной корреляции все точки будут группироваться около прямой линии уравнения регрессии.

Величины – вычисленные по уравнению регрессии значения отклика Y для значений предиктора , т. е.

(94)

Все значения лежат на линии регрессии.

Выбираются такие значения параметров а и b, при которых сумма квадратов отклонений измеренных величин отклика от вычисленных в точках xi по уравнению регрессии , была бы минимальной, т. е.

(95)

Решением являются условия

,

которые позволяют получить оценки a и b.

Возьмем и – частные производные первого порядка по параметрам. Решая полученные уравнения относительно a и b, найдем

(96)

и запишем уравнение регрессии в числовом виде. Нанесем линию регрессии на график поля корреляции.

Для вычисления оценок a и b бывает удобнее пользоваться следующими выражениями:

Отметим, что точка с координатами лежит на линии регрессии.

2.4.5. Оценка точности регрессии (прогнозов)

Уравнение регрессии относится к осредненным условиям, поэтому прогнозы по нему не могут быть безошибочными. Точность подбора линии регрессии характеризуется остаточной дисперсией , которая может быть получена по формуле

(97)

где k – число параметров уравнения регрессии.

В рассматриваемом нами случае линейной регрессии , поэтому – остаточная дисперсия линейной регрессии

или

остаточное среднее квадратическое отклонение линейной регрессии, которое является оценкой точности регрессии и характеризует точность прогнозов по уравнению регрессии.

НЕ нашли? Не то? Что вы ищете?

Отметим, что, предполагая наличие линейной корреляционной связи между переменными X и Y, мы создаем математическую модель этой связи в виде уравнения регрессии, а любая математическая модель нуждается
в проверке адекватности, т. е. степени соответствия экспериментальным данным. Отметим также, что существуют критерии проверки адекватности математических моделей.

2.4.6. Оценка точности и значимости
коэффициентов регрессии

Для точечной оценки точности коэффициентов регрессии известны следующие формулы:

.

Эти значения средних квадратических отклонений укажут на точность определения оценок a и b соответственно.

Интервальная оценка точности состоит в построении доверительных интервалов для A и В по обычной схеме, т. е.

– доверительный интервал для A;

– доверительный интервал для В,

где – аргумент функции Лапласа, соответствующий принятой доверительной вероятности .

Оценка а нуждается в проверке значимости.

Проверить значимость оценки а коэффициента регрессии означает проверить нулевую гипотезу о незначимости А действительного коэффициента регрессии.

Критерий проверки – статистика имеет распределение Стьюдента с степенями свободы. Критическое значение находим в таблице распределения Стьюдента по и уровню значимости . Если , то нулевая гипотеза не отвергается. Если , то нулевая гипотеза отвергается и коэффициент регрессии А считается значимым.

3. Случайные процессы

3.1. Случайный процесс и случайная функция

На практике часто приходится иметь дело со случайными явлениями и случайными величинами, которые с течением времени непрерывно изменяются в процессе опыта. Например, траектория космического корабля в процессе полета непрерывно отклоняется от расчетной траектории; параметры состояния атмосферы в данной точке непрестанно меняются, т. е. происходит непрерывное колебание давления, температуры, влажности, скорости ветра и т. п. Во всех подобных случаях говорят о случайном процессе. Случайные процессы называются также стохастическими или вероятностными.

Для описания и изучения случайных процессов применяется аппарат теории случайных функций – специальной отрасли теории вероятностей. Понятие случайной функции вводится для обозначения зависимости случайного процесса от аргументов. Роль аргумента чаще всего играет время.

Случайной функцией называется такая, которая в результате опыта может принять тот или иной конкретный вид, неизвестно заранее, какой именно.

Если над случайной функцией провести серию повторных опытов, выполненных в одинаковых условиях, то получим группу или «семейство» реализаций случайной функции. Совокупность реализаций в какой-то степени характеризует свойства случайной функции, но лишь с той или иной степенью приближенности. Более подробную информацию о случайной функции дают ее числовые характеристики.

3.2. Основные числовые характеристики случайной функции.

Рассмотрим случайную функцию одного аргумента. Пусть над ней произведено n независимых опытов и получено n реализаций (рис. 40).

Каждая реализация случайной функции есть обычная неслучайная функция.

Зафиксируем некоторое значение аргумента и укажем n реализаций случайной функции для этого аргумента:

.

Эти значения называются сечением случайной функции при .

Сечение можно рассматривать как n значений, принятых случайной величиной - ординатой случайной функции при . Поэтому случайную функцию часто определяют как совокупность случайных величин – ординат функции при различных допустимых значениях ее аргумента.

Любая случайная величина полностью характеризуется законом распределения вероятностей, но задание случайной функции с помощью таких законов не всегда удобно вследствие их громоздкости. Поэтому для описания случайной функции чаще всего используются числовые характеристики, аналогичные числовым характеристикам случайной величины, которые в отличие от последних, являются не числами, а функциями. К ним относятся математическое ожидание, дисперсия и корреляционная функция случайной функции.

3.2.1. Математическое ожидание случайной функции

Определим математическое ожидание случайной функции.

Зафиксируем значение аргумента и рассмотрим сечение , В этом сечении мы имеем обычную случайную величину - ординату случайной функции при . Математическое ожидание этой случайной величины, т. е. математическое ожидание сечения случайной функции, в общем случае зависит от , и представляет некоторую функцию .

Математическим ожиданием случайной функции называется неслучайная функция , которая при каждом значении аргумента t равна математическому ожиданию соответствующего сечения случайной функции.

По смыслу математическое ожидание случайной функции есть некоторая средняя функция, около которой группируются и относительно которой колеблются возможные конкретные реализации случайной функции.

3.2.2. Дисперсия и среднее квадратическое отклонение
случайной функции

Аналогично определяется - дисперсия сечения случайной функции при и - дисперсия случайной функции. Таким образом, дисперсией случайной функции называется неслучайная функция , значение которой для каждого t равно дисперсии соответствующего сечения случайной функции.

Дисперсия при каждом значении t характеризует разброс возможных реализаций случайной функции относительно среднего, т. е. математического ожидания. Дисперсия – неотрицательная функция. Положительный корень квадратный из дисперсии называется средним квадратическим отклонением случайной функции

.

Математического ожидания и дисперсии случайной функции недостаточно для описания ее свойств, т. к. они не улавливают, а потому не отражают внутреннюю структуру случайного процесса, который описывается данной случайной функцией. Это видно из сравнения рис. 40 и рис. 41: у случайных функций, изображенных на этих рисунках и описывающих разные случайные процессы, - примерно одинаковые математические ожидания и дисперсия, но характер этих функций различен – на одном рисунке она изменяется плавно, а на другом изменения носят колебательный характер.

Эти различия улавливает специальная числовая характеристика – корреляционная (или автокорреляционная) функция.

3.2.3. Корреляционная (автокорреляционная) функция
случайной функции

Корреляционная функция характеризует степень зависимости между сечениями, относящимися к различным моментам времени t, например, и .

Корреляционной функцией случайной функции называется неслучайная функция двух аргументов, которая при каждой паре значений аргументов и равна корреляционному моменту соответствующих сечений и случайной функции, т. е.

,

где - центрированные значения случайных величин и , расположенных в двух сечениях и . случайной функции.

Отметим, что , т. е. корреляционная функция обладает свойством симметричности. При корреляционная функция обращается в дисперсию случайной функции.

Можно сказать, что корреляционная функция показывает качественную линейную связь между значениями процесса в выбранные моменты времени. Для количественной характеристики степени линейной зависимости применяется нормированная корреляционная (или нормированная автокорреляционная) функция :

,

которая при каждой паре допустимых значений аргументов и равна коэффициенту корреляции между сечениями и .

Коэффициент корреляции характеризует степень линейной зависимости между значениями случайного процесса в выбранные моменты времени.

Заметим, что математическое ожидание и корреляционная функция являются исчерпывающими характеристиками только для нормальной случайной функции, описывающей нормальные случайные процессы, т. е. такие, в которых для любого конечного множества сечений (моментов времени) случайные величины в этих сечениях имеют совместную нормальную плотность вероятностей. Для нормальных случайных процессов некоррелированность означает независимость. При линейных преобразованиях нормальных процессов получается тот же нормальный процесс.

3.3. Стационарный случайный процесс

Случайный процесс, протекающий во времени приблизительно однородно и имеющий вид непрерывных случайных колебаний около некоторого среднего значения, причем ни амплитуда, ни характер этих колебаний существенно не изменяются с течением времени, называется стационарным случайным процессом. Стационарный случайный процесс можно рассматривать, как продолжающийся во времени неопределенно долго.

При исследовании стационарного процесса в качестве начала отсчета можно выбрать любой момент времени. Исследуя стационарный процесс на любом участке времени, мы должны получать одни и те же его характеристики.

Нестационарный случайный процесс имеет тенденцию развития во времени. Его характеристики зависят от времени и от начала отсчета.

Для описания стационарных случайных процессов применяются стационарные случайные функции.

Случайная функция называется стационарной, если все ее вероятностные характеристики не зависят от времени , точнее, - не меняются при любом сдвиге аргументов, от которых они зависят, по оси .

Таким образом, для стационарной случайной функции:

·  математическое ожидание и дисперсия постоянны на протяжении всего периода ее наблюдения (не зависят от времени), т. е.

.

·  корреляционная функция не зависит от начала отсчета времени, а зависит только от разности аргументов т. е. от промежутка между двумя наблюдениями (сечениями):

.

На практике вместо корреляционной функции часто используется нормированная корреляционная функция

,

где - постоянная дисперсия стационарного процесса.

Функция - коэффициент корреляции между сечениями случайной функции, разделенными по времени интервалом ; .

3.4. Марковские случайные процессы

3.4.1. Марковский случайный процесс
с дискретными состояниями.

Пусть имеется некоторая система , состояние которой меняется случайным образом. Случайный процесс называется Марковским процессом, если для каждого момента времени вероятность любого будущего состояния системы зависит только от ее состояния в данный момент и не зависит от развития процесса в прошлом. Случайный процесс называется процессом с дискретными состояниями, если возможные состояния системы можно перечислить и переход системы из состояния в состояние происходит мгновенно в некоторые моменты времени.

Пример 1. Система состоит из двух подсистем , каждая из которых имеет два состояния: исправное и неисправное. При этих условиях возможны следующие состояния системы:

- обе подсистемы исправны;

* - первая подсистема неисправна, а вторая исправна;

- вторая подсистема неисправна, а первая исправна;

- обе подсистемы неисправны.

Возможные состояния системы и возможные переходы из состояния в состояние графически отображаются г р а ф о м с о с т о я н и й, на котором состояния изображаются точками, а переходы – стрелками. Граф состояний рассмотренной системы изображен на рис.42.

3.4.2. Случайные процессы с дискретным и непрерывным
временем. Марковская цепь.

Случайный процесс называется процессом с дискретным временем, если переходы из состояния в состояние возможны только в заранее фиксированные моменты времени и процессом с непрерывным временем, если эти моменты случайны и заранее неизвестны. Случайный процесс, происходящий в системе с дискретным временем, символически изображают последовательностью

,

описывающей очередность изменения состояний. Принято обозначать событие, состоящее в том, что после шагов система перейдет в состояние . Тогда процесс, происходящий в системе, можно представить в виде

.

Такая случайная последовательность называется Марковской цепью, если на каждом шаге вероятность перехода из любого состояния в любое состояние не зависит от того, когда и как система пришла в состояние .

При любом события

несовместны и образуют полную группу.

Для описания Марковской цепи применяют вероятности состояний.

Пусть после любого -го шага система может находиться в одном из состояний , т. е. осуществится одно из полной группы событий . Обозначим вероятности этих событий:

- вероятности после первого шага,

- вероятности после второго шага и т. д. после -го шага:

.

Очевидно, что , как сумма вероятностей несовместных событий, образующих полную группу. Вероятности называют вероятностями состояний системы. Определим вероятности состояний системы для любого .

Изобразим состояния системы в виде графа (рис.43), указывая стрелками возможные изменения состояний за один шаг.

Случайный процесс (Марковскую цепь) можно представить как точку, которая изображает систему , случайным образом блуждающую по графу состояний, перескакивая из состояния в состояние в моменты , а иногда и задерживаясь на некоторое число шагов в одном и том же состоянии. На каждом шаге существует некоторая вероятность перехода системы из любого состояния в любое другое состояние, а так же вероятность задержки системы в данном состоянии. Эти вероятности называют переходными вероятностями Марковской цепи.

Марковская цепь называется однородной, если переходные вероятности не зависят от номера шага или неоднородной в противоположном случае. Рассмотрим сначала однородную Марковскую цепь.

Пусть система имеет возможных состояний . Обозначим - вероятность перехода за один шаг из состояния в состояние . Составим матрицу переходных вероятностей:

Если за один шаг переход системы из состояния в состояние невозможен, то . Вероятность того, что система, находясь после - го шага в состоянии , перейдет за один шаг в состояние можно записать, как условную вероятность

.

На любом шаге события несовместны и образуют полную группу.

Следовательно, . Если на графе состояний у стрелок переходов поставить вероятности переходов, то получают граф, который называется размеченным графом состояний. Имея в распоряжении размеченный граф состояний (или матрицу переходных вероятностей) и зная начальное состояние системы, можно найти вероятности состояний системы после любого шага с номером .

Предположим, что в начальный момент (перед первым шагом) система находится в состоянии . Тогда для начального момента времени () имеем:

.

В результате первого шага система перейдет в состояния с вероятностями, записанными в строке с номером матрицы переходных вероятностей. Следовательно, после первого шага вероятности состояний

.

Вероятность состояния системы после второго шага вычисляется по формуле полной вероятности с учетом вероятностей гипотез о нахождении системы в состоянии после первого шага:

.

Эта формула обобщается на случай шага с номером в виде рекуррентной формулы

.

Запишем эти формулы в матричном виде. Пусть в начальный момент вектор состояний системы имеет вид

Тогда вектор состояний системы после первого шага найдем по формуле:

,

вектор состояний системы после второго шага - по формуле:

,

и, наконец, вектор состояний после шага с номером - по формуле

.

Пример. Пусть состояние системы задано размеченным графом (рис.44). Составим матрицу переходных вероятностей:

.

Так как в начальный момент система находилась в состоянии , то

.

После первого шага система перейдет в одно из возможных состояний с вероятностями, записанными в первой строке матрицы переходных вероятностей : .Таким образом, вектор возможных состояний системы после первого шага:

.

Вычислим вектор вероятностей состояний после второго шага:

.

После третьего шага:

.

И, наконец, после четвертого шага:

.

В неоднородной Марковской цепи вероятности перехода изменяются от шага к шагу. Обозначим - вероятность перехода системы из состояния в состояние на шаге с номером , т. е. условную вероятность . Если на каждом шаге известны матрицы вероятностей перехода , то вероятность того, что система после шагов будет находиться в состоянии , можно найти по формуле:

,

или в матричном виде по формуле , которая вполне аналогична формуле для однородной цепи Маркова.

3.4.3. Марковский процесс с дискретными состояниями
и непрерывным временем. Уравнения Колмогорова
для вероятностей состояний.

На практике значительно чаще встречаются системы, переход которых из состояния в состояние происходит не в фиксированные, а в случайные, заранее неизвестные моменты времени. Для описания таких процессов применяются Марковские случайные процессы с дискретными состояниями и непрерывным временем. Их называют непрерывной цепью Маркова.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13