SSЩ = SSад + SSош,         (1.5) 

где        ,        (1.6)

       N – число ячеек в плане Х (число различных экспериментов),

       mi – число повторных опытов в i–ой ячейке плана Х,

yij – j-ое наблюдение в  i-ой ячейке плана,

– среднее наблюденное значение отклика в i-ой ячейке плана.

SSад характеризует разброс наблюдений, вызванный неучтенными в модели источниками дисперсии. Сумму квадратов SSад и соответствующее ей число степеней свободы над используют при проверке гипотезы об адекватности модели. .        (1.7)

Выбранная модель неадекватна, если  ,        (1.8)

где  число степеней свободы ошибки .        (1.9)

Вывод о неадекватности модели означает, что желательно продолжить исследования с введением в модель источников дисперсии (новых факторов, взаимодействий факторов и т. п.).

При наличии повторных опытов для проверки гипотезы о незначимости фактора F-статистика вычисляется по формуле:

       .         (1.10)

Гиротеза отвергается, если вычисленное значение F-статистики оказывается больше табличного значения F-распределения   (г1= r - rщ,  г2 = нош).

       Оценка дисперкии ошибки

       При наличии повторных экспериментов  .

НЕ нашли? Не то? Что вы ищете?

Если повторные наблюдения не проводились, то  .

       Пример.

       Проводилось исследование расходов двух семей на питание за три месяца 1 квартала 2001г.  и 2002г. Фактор Х1 – год – изменялся на  двух уровнях: 1 уровень соответствовал 2001 году, 2 уровень соответствовал 2002 году. Фактор Х2 – месяц – изменялся на  трех уровнях: 1 уровень – январь, 2 уровень – февраль, 3 уровень – март.

Уравнение модели имело вид (1.1), где вектор неизвестных параметров Т, матрица плана эксперимента Х соответствовала полному факторному эксперименту с двумя повторными наблюдениями в каждой точке плана.

, вектор отклика .

Количество ячеек в плане N = 6; mi=2 для i=1,2,…6. Ранг матрицы X  r = 4. Были получены МНК-оценки вектора и:

  .

Гипотеза о незначимости фактора Х1 имеет вид : H 01: .

Вычисляем сумму квадратов SSЩ по формуле (1.3). В соответствии с гипотезой H 01 преобразуем матрицу Х и вектор и к виду:

, Т.

Были получены МНК-оценки вектора : Т.

Ранг rщ матрицы Хщ  равен 3. Число степеней свободы фактора Х1 вычисляется как r– rщ =1. Вычисляем по формуле (1.4). Величина – SSЩ, равная 0.441, определяет сумму квадратов, обусловленную фактором Х1. Числитель F-статистики (1.10), соответствующей фактору Х1, называется средним квадратом и равен 0.441. Сама F-статистика, вычисленная по формуле (1.10), равна 17.060. Табличное значение F-распределения (Критерий Фишера) с уровнем значимости б = 0.05 и степенями свободы 1 и 6 равно 5.990. Поскольку значение F-статистики больше критерия Фишера, гипотеза H 01 не принимается, т. е. фактор Х1 считается значимым.

Результаты проверки гипотезы о незначимости фактора Х1  приведены в первой строке табл.1.

Аналогичным образом проверяется гипотеза о значимости фактора Х2  (результаты приведены во второй строке табл.1).  Фактор Х2 считается незначимым.

Таблица 1

Таблица дисперсионного анализа


Фактор

Число степеней свободы

Сумма квадратов

Средний квадрат

F–статистика

Критерий Фишера

Значимость

Х1

1

0.441

0.441

17.06

5.990

Да

Х2

2

0.007

0.0035

0.129

5.140

Нет

остаток

2

0.007

0.0035

0.129

5.140

Нет

ошибка

6

0.155

0.026

полная сумма квадратов

11

0.610


Строка таблицы, соответствующая остатку, содержит результаты проверки адекватности модели. Число степеней свободы вычисляется по формуле (1.7). Сумма квадратов вычисляется по формуле (1.5). Средний квадрат соответствует числителю дроби в формуле (1.8). Число степеней свободы ошибки вычисляется по формуле (1.9). Сумма квадратов ошибки вычисляется по формуле (1.6). Средний квадрат соответствует знаменателю дроби в формуле (1.8). Гипотеза об адекватности модели не отвергается, т. е. модель адекватна.

Полная сумма квадратов вычисляется по формуле:

, где  генеральное среднее .

Поскольку полная сумма квадратов определяет разброс наблюдений относительно генерального среднего, число степеней свободы полной суммы квадратов на 1 меньше  общего числа наблюдений  и равна 12–1=11.

       Оценка дисперсии у2 равна среднему квадрату ошибки: =0.026.

Программное обеспечение задач дисперсионного анализа. 

Для проведения исследований, необходимых в данной лабораторной работе, могут быть использованы различные пакеты прикладных программ, предназначенные для анализа дисперсионных моделей. На кафедре Прикладной математики разработаны программы disp_an. exe и dlim. exe (анализ моделей с ограничениями вида иd+1 = иd+2 =… = =0,  где d=1+I1+I2+…+Ij-1 ; j=1,…,m).

Входные данные.

Исходные данные записываются в файл input. dat, следующим образом:

В первой строке :  m -  количество факторов.

Во второй строке: N  - количество различных экспериментов (ячеек плана).

В третьей строке: 0 или 1 – нет или есть взаимодействия факторов.

В четвертой строке: I1  I2  … Im – количество уровней для каждого фактора.

В пятой строке: n1 n2 … nN  – количество экспериментов в каждой ячейке плана. 

Начиная с шестой строки до (N +5) строки – данные об экспериментах.

Для j от 1 до N : Строка  j+5 содержит данные о j-ой ячейке плана (m+nj) чисел:

первое число – номер уровня первого фактора;

второе число – номер уровня второго фактора, и т. д.;

с  (m+1)-го до (m+nj)-го числа  - значения откликов для каждого из экспериментов, проведенных в этой точке плана.

       Значения откликов – вещественные, остальные числа – целые. Данные в строках разделяются пробелом.

       Выходные данные.

       Программа создает 5 файлов:

файл disp_an. res – содержит таблицу дисперсионного анализа. Для значимых факторов формируется таблица попарных сравнений влияния уровней факторов. файлы inf1.dat, inf2.dat, inf3.dat – содержат интерпретацию результатов проведенного анализа. файл out. dat – содержит вектор оценок параметров модели .

Содержание работы

Выбрать предметную область. Определить цели и задачи исследования. Выбрать отклик и факторы. Собрать данные. Обработать данные с использованием нескольких моделей дисперсионного анализа. Выбрать модель, наиболее точно описывающую поведение исследуемой системы. Найти минимальное и максимальное значение отклика  и соответствующие им значения факторов. Интерпретировать результаты, сделать рекомендации. Сформулировать выводы о проведенных исследованиях.

Содержание отчета

       Отчет должен отражать все этапы проделанной работы, указанные в пункте  «Содержание работы».

Контрольные вопросы
Возможности применения дисперсионного анализа в экспериментальных исследованиях. Цели и задачи дисперсионного анализа. Модели дисперсионного анализа. Выбор структуры модели дисперсионного анализа. Планы дисперсионного анализа. МНК-оценки параметров модели. Функции, допускающие оценку. Критерии проверки гипотез о незначимости факторов. Критерии проверки гипотез о незначимости функций, допускающих оценку.

Лабораторная работа №2

«Исследование экономической или социологической  системы

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6