Литература. , «Модифицированный алгоритм построения многомерной полиномиальной регрессии по избыточному описанию»

Вестник НТУУ «ХПИ» « Системный анализ, управление и информационные технологии» - принято к печати 31.01.2012г. (г. Харьков)

Обобщения

1. Очевидно, что полученные результаты применимы для случая, когда выражение (6.19) вместо переменных содержит переменные , , где , и компонентами векторов являются компоненты вектора , а также множества компонент векторов , не пересекаются; – непрерывные функции, ограниченные при ограниченных значениях своих аргументов.

2. Задача построения многомерной регрессии очевидным образом обобщается на случай, когда при построении одномерных регрессий на модель действуют разные случайные величины ( – номер одномерной регрессии), В общем виде распределения случайных величин (при фиксированном ) могут не совпадать между собой. Анализ формул (6.9), (6.10), (6.18) показывает, что при построении одномерных регрессий в экспериментах на регрессионную модель аддитивно могут воздействовать независимые случайные величины с различными распределениями, имеющие нулевые математические ожидания и одинаковые дисперсии, для фиксированного . Для разных дисперсии могут быть различными.

6.1.3  Примеры

Пример 1 (одномерная регрессия)

Истинная модель имеет вид

(6.25)

Регрессионная модель всегда должна задаваться избыточной. В нашем примере исследователь знает, что регрессионная модель является полиномом не выше пятой степени. Случайная величина Е имеет нулевое математическое ожидание, равномерное распределение, Входные значения равномерно распределены по отрезку (–50, 50) с шагом .

Имитируются эксперименты с помощью реализаций случайной величины Е. Исходные данные ; – реализация случайной величины Е.

Для генерации случайных чисел использована часть библиотеки расширений для C++ boost – http://www. boost. org/doc/libs/1_36_0/libs/random/index. html.

Для восстановления зависимости (6.25), по формуле (6.8) строятся 6 нормированных ортогональных полиномов, а по формуле (6.15) оценки коэффициентов в линии регрессии (6.18). Результаты эксперимента показаны ниже.

НЕ нашли? Не то? Что вы ищете?

Одномерная регрессия, равномерное распределение . Исходные коэффициенты: (5,4,3,2,1,0); цифра в квадратных скобках – это количество чисел в круглых скобках.

Количество испытаний . Ортогональные полиномы:

[1] (0,316228)

[2] (0,0550482, 0,0110096)

[3] (–0,348155, 0,00435194, 0,000435194)

[4] (–0,12955, –0,0250104, 0,000269896, 1,79931·10–5)

[5] (0,336581, –0,0155824, –0,00148033, 1,55824·10–5, 7,79122·10–7)

[6] (0,214834, 0,0384315, –0,00134272, –8,35467·10–5, 8,95144·10–7, 3,58057·10–8)

Оценки коэффициентов:

[6] (8,21467, 4,40095, 2,99323, 1,99954, 1,1,00514·10–7)

Дисперсии коэффициентов:

[6] (1001,17, 6,21366, 0,0106413, 1,88666·10–5, 3,52078·10–9, 3,20513·10–12)

Количество испытаний . Ортогональные полиномы:

[1] (0,141421)

[2] (0,00489996, 0,00489996)

[3] (–0,158019, 0,000379853, 0,000189927)

[4] (–0,0112385, –0,0112235, 2,2513·10–5,7,50433·10–6)

[5] (0,15878, –0,00127706, –0,000637333, 1,19511·10–6, 2,98776·10–7)

[6] (0,0176422, 0,0175761, –9,91938·10–5, –3,29849·10–5, 5,97553·10–8, 1,19511·10–8)

Оценки коэффициентов:

[6] (5,15354, 3,91832, 3,00231, 2,00013, 0,999999, –3,05835·10–8)

Дисперсии коэффициентов:

[6] (176,607, 1,15167, 0,00113153, 2,86437·10–6, 2,32095·10–10, 3,57069·10–13)

В табл. 6.2 приведены оценки коэффициентов (точное значение которых равно 5, 4, 3, 2, 1, 0 соответственно) для числа испытаний 10; 50; 100; 200; 300; 500; 1000; 5000; 10000.

Таблица 6.2 – Оценки коэффициентов

n

θ0=5

θ1=4

θ2=3

θ3=2

θ4=1

θ5=0

10

8,21467

4,40095

2,99323

1,99954

1

1,1005×10–7

50

5,15354

3,91832

3,00231

2,00013

0,999999

–3,05835×10–8

100

4,13942

3,92085

3,00063

2,00003

0,999999

1,21093×10–8

200

4,5745

3,92143

3,00406

2,00005

0,999999

–2,61741×10–9

300

5,39774

3,89625

2,99871

2,00013

1

–3,14599×10–8

500

5,23945

4,03909

3,00081

1,99996

1

11189×10–8

1000

4,8637

4,00444

2,99924

2

1

–3,30327×10–9

5000

5,20518

4,01987

2,99942

1,99997

1

5823×10–9

10000

4,95045

3,98802

3,0003

2,00002

1

–8,36543×10–9

Из таблицы 6.2 видно, что для числа испытаний погрешность оценки коэффициентов не превышает: для ; .

Таким образом, в результате моделирования достаточного количества испытаний можно создать статистические таблицы, каждая из которых составлена для фиксированных концов отрезка принадлежности аргумента и содержит для ряда статистически обоснованных вероятностей значения погрешностей нахождения коэффициентов (зависящих от или ее верхней оценки ) для различного количества испытаний.

Такие таблицы позволят заранее определить минимально необходимое число испытаний, для которых оценки коэффициентов (кроме, возможно, ) находятся с приемлемой для практики точностью.

Примечание. Очевидно, чем больше длина интервала изменений аргумента х, тем меньше минимально необходимое число испытаний.

Пример 2 (многомерная регрессия)

Исходная модель линии регрессии задается в виде избыточного полинома:

(6.26)

Обозначим через коэффициенты линии регрессии, которые считаются неизвестными.

– случайная величина, имеющая нормальное распределение

В этом примере ; Аналогично определяются все

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15