SSЩ = SSад + SSош, (1.5)
где
, (1.6)
N – число ячеек в плане Х (число различных экспериментов),
mi – число повторных опытов в i–ой ячейке плана Х,
yij – j-ое наблюдение в i-ой ячейке плана,
– среднее наблюденное значение отклика в i-ой ячейке плана.
SSад характеризует разброс наблюдений, вызванный неучтенными в модели источниками дисперсии. Сумму квадратов SSад и соответствующее ей число степеней свободы над используют при проверке гипотезы об адекватности модели.
. (1.7)
Выбранная модель неадекватна, если
, (1.8)
где число степеней свободы ошибки
. (1.9)
Вывод о неадекватности модели означает, что желательно продолжить исследования с введением в модель источников дисперсии (новых факторов, взаимодействий факторов и т. п.).
При наличии повторных опытов для проверки гипотезы о незначимости фактора F-статистика вычисляется по формуле:
. (1.10)
Гиротеза отвергается, если вычисленное значение F-статистики оказывается больше табличного значения F-распределения
(г1= r - rщ, г2 = нош).
Оценка дисперкии ошибки
При наличии повторных экспериментов
.
Если повторные наблюдения не проводились, то
.
Пример.
Проводилось исследование расходов двух семей на питание за три месяца 1 квартала 2001г. и 2002г. Фактор Х1 – год – изменялся на двух уровнях: 1 уровень соответствовал 2001 году, 2 уровень соответствовал 2002 году. Фактор Х2 – месяц – изменялся на трех уровнях: 1 уровень – январь, 2 уровень – февраль, 3 уровень – март.
Уравнение модели имело вид (1.1), где вектор неизвестных параметров
Т, матрица плана эксперимента Х соответствовала полному факторному эксперименту с двумя повторными наблюдениями в каждой точке плана.
, вектор отклика
.
Количество ячеек в плане N = 6; mi=2 для i=1,2,…6. Ранг матрицы X r = 4. Были получены МНК-оценки вектора и:
.
Гипотеза о незначимости фактора Х1 имеет вид : H 01:
.
Вычисляем сумму квадратов SSЩ по формуле (1.3). В соответствии с гипотезой H 01 преобразуем матрицу Х и вектор и к виду:
,
Т.
Были получены МНК-оценки вектора
:
Т.
Ранг rщ матрицы Хщ равен 3. Число степеней свободы фактора Х1 вычисляется как r– rщ =1. Вычисляем
по формуле (1.4). Величина
– SSЩ, равная 0.441, определяет сумму квадратов, обусловленную фактором Х1. Числитель F-статистики (1.10), соответствующей фактору Х1, называется средним квадратом и равен 0.441. Сама F-статистика, вычисленная по формуле (1.10), равна 17.060. Табличное значение F-распределения (Критерий Фишера) с уровнем значимости б = 0.05 и степенями свободы 1 и 6 равно 5.990. Поскольку значение F-статистики больше критерия Фишера, гипотеза H 01 не принимается, т. е. фактор Х1 считается значимым.
Результаты проверки гипотезы о незначимости фактора Х1 приведены в первой строке табл.1.
Аналогичным образом проверяется гипотеза о значимости фактора Х2 (результаты приведены во второй строке табл.1). Фактор Х2 считается незначимым.
Таблица 1
Таблица дисперсионного анализа
Фактор | Число степеней свободы | Сумма квадратов | Средний квадрат | F–статистика | Критерий Фишера | Значимость |
Х1 | 1 | 0.441 | 0.441 | 17.06 | 5.990 | Да |
Х2 | 2 | 0.007 | 0.0035 | 0.129 | 5.140 | Нет |
остаток | 2 | 0.007 | 0.0035 | 0.129 | 5.140 | Нет |
ошибка | 6 | 0.155 | 0.026 | |||
полная сумма квадратов | 11 | 0.610 |
Строка таблицы, соответствующая остатку, содержит результаты проверки адекватности модели. Число степеней свободы вычисляется по формуле (1.7). Сумма квадратов вычисляется по формуле (1.5). Средний квадрат соответствует числителю дроби в формуле (1.8). Число степеней свободы ошибки вычисляется по формуле (1.9). Сумма квадратов ошибки вычисляется по формуле (1.6). Средний квадрат соответствует знаменателю дроби в формуле (1.8). Гипотеза об адекватности модели не отвергается, т. е. модель адекватна.
Полная сумма квадратов вычисляется по формуле:
, где генеральное среднее
.
Поскольку полная сумма квадратов определяет разброс наблюдений относительно генерального среднего, число степеней свободы полной суммы квадратов на 1 меньше общего числа наблюдений и равна 12–1=11.
Оценка дисперсии у2 равна среднему квадрату ошибки:
=0.026.
Программное обеспечение задач дисперсионного анализа.
Для проведения исследований, необходимых в данной лабораторной работе, могут быть использованы различные пакеты прикладных программ, предназначенные для анализа дисперсионных моделей. На кафедре Прикладной математики разработаны программы disp_an. exe и dlim. exe (анализ моделей с ограничениями вида иd+1 = иd+2 =… =
=0, где d=1+I1+I2+…+Ij-1 ; j=1,…,m).
Входные данные.
Исходные данные записываются в файл input. dat, следующим образом:
В первой строке : m - количество факторов.
Во второй строке: N - количество различных экспериментов (ячеек плана).
В третьей строке: 0 или 1 – нет или есть взаимодействия факторов.
В четвертой строке: I1 I2 … Im – количество уровней для каждого фактора.
В пятой строке: n1 n2 … nN – количество экспериментов в каждой ячейке плана.
Начиная с шестой строки до (N +5) строки – данные об экспериментах.
Для j от 1 до N : Строка j+5 содержит данные о j-ой ячейке плана (m+nj) чисел:
первое число – номер уровня первого фактора;
второе число – номер уровня второго фактора, и т. д.;
с (m+1)-го до (m+nj)-го числа - значения откликов для каждого из экспериментов, проведенных в этой точке плана.
Значения откликов – вещественные, остальные числа – целые. Данные в строках разделяются пробелом.
Выходные данные.
Программа создает 5 файлов:
файл disp_an. res – содержит таблицу дисперсионного анализа. Для значимых факторов формируется таблица попарных сравнений влияния уровней факторов. файлы inf1.dat, inf2.dat, inf3.dat – содержат интерпретацию результатов проведенного анализа. файл out. dat – содержит вектор оценок параметров моделиСодержание работы
Выбрать предметную область. Определить цели и задачи исследования. Выбрать отклик и факторы. Собрать данные. Обработать данные с использованием нескольких моделей дисперсионного анализа. Выбрать модель, наиболее точно описывающую поведение исследуемой системы. Найти минимальное и максимальное значение отклика и соответствующие им значения факторов. Интерпретировать результаты, сделать рекомендации. Сформулировать выводы о проведенных исследованиях.Содержание отчета
Отчет должен отражать все этапы проделанной работы, указанные в пункте «Содержание работы».
Контрольные вопросы
Возможности применения дисперсионного анализа в экспериментальных исследованиях. Цели и задачи дисперсионного анализа. Модели дисперсионного анализа. Выбор структуры модели дисперсионного анализа. Планы дисперсионного анализа. МНК-оценки параметров модели. Функции, допускающие оценку. Критерии проверки гипотез о незначимости факторов. Критерии проверки гипотез о незначимости функций, допускающих оценку.Лабораторная работа №2
«Исследование экономической или социологической системы
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 |


