где
;
. Если вычисленное значение F-статистики оказывается больше табличного значения F-распределения
, то гипотеза отвергается.
Значимость регрессора (степень влияния на значение отклика) характеризуется значением соответствующего параметра. Гипотеза о незначимости j-го регрессора записывается следующим образом: H0: иj = 0. Формула для вычисления F-статистики упрощается:
, где gjj – диагональный элемент матрицы G; если вычисленное значение больше
, то гипотеза отвергается – регрессор считается значимым.
Прогноз значения отклика. Когда вычислены оценки неизвестных параметров
, с их помощью можно «предсказать» значение отклика при интересующих значениях факторов. Обозначим соответствующие значения регрессоров:
. Оценка отклика (прогноз) вычисляется по формуле:
.
Поиск оптимального отклика. Когда вычислены оценки неизвестных параметров
, с их помощью можно определить оптимальное значение отклика и соответствующие ему значения факторов. Данная задача сводится к оптимизационной задаче на ограниченной области значений факторов Щ:
.
Качество модели. Степень соответствия модели исследуемому объекту характеризуется значением коэффициента детерминации R2. Поскольку уравнение модели можно условно записать:
, выборочная дисперсия имеет вид:
, где последнее слагаемое можно считать равным 0.
- разброс, объясняемый уравнением регрессии.
- дисперсия ошибки. Коэффициент детерминации вычисляется по формуле:
.Очевидно, что чем ближе R2 к 1, тем качественнее модель описывает поведение объекта.
Для проведения исследований, необходимых в данной лабораторной работе, могут быть использованы различные пакеты прикладных программ, предназначенные для анализа регрессионных моделей и решения оптимизационных задач.
Содержание работы
Выбрать предметную область. Определить цели и задачи исследования. Выбрать отклик и факторы. Собрать данные. Обработать данные с использованием нескольких моделей регрессии, линейных по параметрам. Выбрать модель, наиболее точно описывающую поведение исследуемой системы. Используя выбранную модель, построить прогноз отклика при интересующих значениях факторов. Найти оптимальное (минимальное или максимальное) значение отклика на интересующем интервале области значений факторов. Интерпретировать результаты, сделать рекомендации. Сформулировать выводы о проведенных исследованиях.Содержание отчета
Отчет должен отражать все этапы проделанной работы, указанные в пункте «Содержание работы».
Контрольные вопросы
Возможности применения регрессионного анализа в экспериментальных исследованиях. Цели и задачи регрессионного анализа. Модели регрессионного анализа. Выбор структуры модели регрессионного анализа. МНК-оценки параметров модели. Критерии проверки гипотез о незначимости факторов. Планирование регрессионного эксперимента.Лабораторная работа №3
«Исследование экономической или социологической системы
с использованием модели временного ряда»
В общем случае, дискретная линейная стационарная модель временного ряда описывается стохастическим разностным уравнением:
(3.1)
с процессом {w (⋅)} , имеющим нормальное распределение и удовлетворяющим условиям:
,
где y(⋅) – m-вектор эндогенных переменных,
u(⋅) – l1-вектор экзогенных (управляющих) переменных,
ψ(⋅) – l2-вектор известных детерминированных функций тренда,
D – оператор задержки на один шаг, т. е. D y(t)= y(t-1),
,
.
Модель (3.1) будем называть ARMAX-моделью [10], поскольку в ней представлена зависимость значения y(t) от предыдущих значений выходной переменной (AR-элементы), процесса скользящего среднего (MA - элементы) и от управляющих воздействий (X - элементы). Уравнение модели (3.1) можно представить в матричном виде:
,
где θ - вектор параметров, размерности n = m⋅ nz, n z = m⋅ (m1+m2) + l1⋅ m3 + l2 . Матрица наблюдений Z(t-1) имеет размерность m х n:
.
В вектор-строку zT (t-1) объединены наблюдения, необходимые для вычисления yi(t), i=1,2,...,m,:

Следует заметить, что составить вектор z (t-1) и, следовательно, матрицу z(t-1) возможно только начиная с некоторого момента времени, когда накопятся все необходимые наблюдения. Обозначим этот момент времени: nmax = max (m1, m2, m3) , где m1- число предыдущих значений выходной переменной, от которых зависит текущее значение y(t), m3 - число предыдущих значений входной переменной, от которых зависит y(t), m2 - глубина процесса скользящего среднего. Можно сказать, что nmax получает значение максимальной "заглубленности" модели.
Применение метода максимального правдоподобия для оценивания параметров для таких моделей в большенстве случаев невозможен из-за отсутсствия информации о распределении y(t), t=0,…, nmax-1. Поэтому для анализа ARMAX-моделей используют метод условного максимального правдоподобия (УМП), который позволяет вычислить оценку вектора параметров путем минимизации функционала
,
где
- функция условного максимального правдоподобия.
Программа UMP вычисляет оценки параметров θ и ковариационной матрицы оценок возмущений ρ методом условного максимального правдоподобия, реализуя следующий алгоритм:
Начать итерации с пары (θ1, ρ1), которая выбирается исходя из априорной информации о системе. k = 1. Используя величину θk, получаемую в результате k-й итерации, вычислить величины ∇θw(t,θ k ), t = nmax, ..., N. Оценки возмущений в начальные моменты времени t =0,1,..., nmax-1 выбираются равными математическому ожиданию векторов w(t), т. е. нулю. Используя величины, полученные на шаге II, вычислить для минимизируемого функционала градиент
,
.
Получить θ k+1 по формуле
.
Используя новую оценку θ k+1, вычислить оценку ковариационной матрицы ρ k+1
V. Остановить итерационный процесс, если абсолютное значение приращения оценки θ k+1 на очередной итерации меньше, чем заранее заданное малое число. Иначе повторить шаги II - IV.
Одношаговый прогноз вычисляется по формуле:
![]()
где
- матрица, составленная из векторов z(t-1), в которых возмущения w(j) заменены на их оценки w(j, θ) (j = t-1,…, t-m2).
Долгосрочный прогноз для выходного сигнала вычисляется по формуле:
![]()
где
- матрица, составленная из векторов z(t-1), в которых возмущения w(j) заменены на их оценки w(j, θ) (j = t-1,…, t-m2), и недостающие наблюдения y(t) заменены на оценки
.
Качество модели характеризуется средним квадратом ошибки:
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 |


