Тема: Факторный анализ внешней среды объектов управления ВТ

Цели работы:

1. Выработка практических навыков факторного анализа ВНС ВТ.

2. Ввод в ЭВМ и отладка программы fac_an. pas [3, c. 55-66].

3. Анализ взаимосвязи признаков управленческой ситуации X={хij} .

Словесная постановка задачи

Имеется массив X={хi} наблюдений о факторах ВНС (рис. 3.1). Надо вычислить матрицу коэффициентов парной корреляции R, преобразовать ее алгоритмом центроидного метода и провести анализ связи признаков {хi}.

Задание нa лабораторную работу

1. Получить у преподавателя вариант и текст программы fac_an. pas.

2. Ввести в ЭВМ текст программы fac_an. pas и отладить её.

3. Выполнить анализ массива информации {Х} программой fac_an. pas.

4. Дать заключение о количестве и структуре групп однородных факторов.

Методические рекомендации

Факторный анализ (ФА) преобразует и изучает матрицы коэффициентов парной корреляции R={} большой размерности (рис. 3.2), которые нельзя анализировать визуально. ФА заменяет их меньшим числом качественных "факторов" - линейных комбинаций измеримых признаков xi, отображающих свойства ОУ [1, c. 37-67].

N | x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

1 |

2 | 2

3 | 1

4 | 11

5 | 9

6 |

7 |

8 |6

9 | 40

10 | 344

Рис. 3.1. Исходный массив информации X={хij}

Элементы главной диагонали R равны длине векторов переменных . Коэффициенты вне диагонали R - углам φх1x2 между векторами.

1.4 -0.-0. -0.943

-0.0.8 0. 0.958

-0.0.9 0. 0.337

К

-0.1.1 0. 0.927

R =

0.9 -0.-0. -0.965

К

0.9 -0.-0. -0.960

-0.0.9 1. 0.940

-0.0.2 0. 0.955

0.2 -0.-0. -0.953

-0.0.0 0. 1.000

Рис. 3.2. Матрица коэффициентов парной корреляции

НЕ нашли? Не то? Что вы ищете?

x1=a+bx2

 

x1

 
Если коэффициент парной корреляции (КПК) между x1 и x2 ≠ 1, связь x1=а+вx2 и x2=а'+в'x1, построенных по одной выборке, отображается углом φху (рис. 3.3). Так, если =1, то φх1x2=0o, а если rxy=0,то φх1x2 =90o.

Рис. 3.3. Геометрическая интерпретация корреляции Х и У

Если hx и hy вектора, то rxy можно оценить скалярным произведением

= hx hy Cos φxy, (3.1)

где hx, hy - длина Х и У;

Cos φxy - косинус угла между Х и У.

Если hx=1 и hy=1, то rxy =Cos φxy. Некоррелируемые факторы ортогональны (rxy =0 при φxy=90), а коррелируемые факторы – косоугольны (рис. 3.4).

Корреляции нет Линейная

│ зависимость

│ rxy =0 rxy=0.843 rxy =-0.5 rxy =-1 rxy =1

│ φxy=900 φxy=600 φxy=1200 г) φxy=1800 д) φxy=00

a)o─────── б)o────────── в) o──────── ──────0────── ═════════

Рис. 3.4. Иллюстрация векторной трактовки корреляции Х и У

ФА представляет хi в виде линейных комбинаций ортогональных факторов {Fi} - качественных признаков, характеризующих скрытые, качественные свойства ОУ. Каждый xi представляется некоторым числом общих и характерных факторов хi=a11F1+a22F2+...+aijFj+...+Fu1+...+Fun, (3.2)

где хi - вектор значений i-го параметра i=1,p;

p – количество параметров;

F1...Fj - общие факторы;

Ko - количество общих факторов;

факторные нагрузки i-го признака i=1, p на j-й фактор j=1,ko;

Fui...Fun - характерные факторы.

В матрице R={} скрыта конфигурация векторов признаков хi, которую помещают в систему ортогональных координат (факторов) единичной длины, выходящих из той же точки, что и векторы переменных (рис. 3.5).

F1 X2

X1 X4 X2 F1’ X4 F2’

X1

a21 X3 х3

a) F2 b) o F2

Рис. 3.5. Интерпретация факторного отображения R={}

Проекция вектора Xi на фактор j называется факторной нагрузкой аij. На рис. 3.5 (а) показана факторная нагрузка а21 признака X2 на фактор F1.

Cумма положительных проекций векторов xi на фактор Fi равна сумме отрицательных проекций на тот же фактор. Углы между F1 и F2 и векторами {xi} скрытыми в R, отображают корреляцию между факторами и признаками "факторными нагрузками" (ФН) аij - проекциям векторов хi на F1 и F2.

Чем больше аij, тем ближе к фактору расположен вектор xi и тем больше rxFj между xi и фактором Fj. Величины ФН колеблются от -1 до 1. Переменные xi с аij близкими к 1- линейно-зависимы. Искомыми в ФА являются: число ортогональных факторов и матрица факторных нагрузок А.

Теорема Терстоуна гласит, что матрица R может быть воспроизведена с помощью матрицы факторных нагрузок А и матрицы коэффициентов парной корреляции между факторами С R = A C A', (3.3)

где А - матрица ФН, равных rxFj между переменными хi и факторами Fj;

C - матрица КПК между факторами Fji.

Итогом решения задачи ФА является матрица факторных нагрузок A, с rxFj между xi и факторами. По aij судят о сути факторов F1 и F2 и о взаимосвязях между признаками xi. В А находятся aij каждого xi.

В табл. 3.1 представлена матрица A, вычисленная по данным рис. 3.2 центроидным методом за 94 итерации.

Таблица 3.1

Матрица факторных нагрузок А

N

F1 F2 F3 F4 F-дисп

1

-0

2

102 1.00

3

00

4

002 1.00

5

-008 1.04

6

-00

7

0

8

004 1.00

9

-00

10

00

Дисперсия

803 9.95

%Дисперсии

86%

Признаки с aij≈1 линейно зависимы и определяют свойства ОУ. Знак (+) при aij указывает на прямую связь между Fi и признаками xi, Знак (-) - на обратную связь. По смыслу xi, расположенных вокруг Fj с большими aij, трактуются качественные свойства ОУ.

Свойства матрицы А:

1) =- дисперсии i-го признака xi, отображаемой j-м Fj;

2) по строкам A равна дисперсии, с которой отображен xi;

3) если =1, то А воспроизвела все связи xi с выделенными Fj;

4) по столбцам A равна - дисперсии xi, отображенной Fj;

5) по Fj равна всей дисперсии A.

Признаки xi в факторах могут иметь большие (≈ по модулю к 1) и малые (≈ по модулю к 0) aij. В F1 большие aij имеют xi i={1,2,4,5,6,7,8,9,10,11}. В F2 - xi i={3,5,6,9}. Анализ R={} показывает, что xi с высокими aij в F1 имеют высокие между собой и низкие с xi, имеющими низкие aij в F2.

В табл. 3.1 xi i={2,4,7,8,10,11} в F1 имеют aij≈1. Это говорит о линейной, положительной корреляционной связи. Переменные i={1,5,6,9} в F1 имеют aij≈-1, что говорит о линейной, отрицательной корреляционной, связи между ними. Переменные i={5,6,9} в F2 имеют равные aij, что говорит о связи между ними.

На рис. 3.6 дана графическая интерпретация связи между 10-ти xi, по aij из табл. 3.1. Зная смысл xi, сгруппированных вокруг Fj, факторы интерпретируют.

F1 1.0┬ x8

x2 x7

.8┼

.6┼

.4┼ x3

.2┼

│ x4

├────┴────┴────┴────┴────┼────┴────┴────┴────┴────┤ F2

-:-.4 :-.2 │: 1.0

-.2┼

-.4┼

-.6┼

-.8┼ x9

│ x6

-1.0┴ x5

x10 x1

Рис. 3.6. Графическая интерпретация матрицы факторных нагрузок

Для вычисления aij испольуются алгоритмы [1, c. 52-63]: центроидного метода; метода максимального правдоподобия; метода главных компонент; метода потенциальных функций и т. д.

Алгоритм центроидного метода расчета ФН

Шаг 1. Вычислить точечные оценки (3.4)

где n - объем выборки;

j=1,p - текущий индекс переменной;

i=1,n - текущий индекс объектов в выборке;

- количественное значение j-го признака i-го объекта;

р - количество переменных.

Шаг 2. Вычислить значения матрицы R

(3.5)

Шаг 3. Вычислить начальные оценки общностей (диагональные элементы

редуцированной матрицы коэффициентов парной корреляции Rh), принимая их равными КПК каждого признака со всеми (h-1) остальными признаками

. (3.6)

где rjj - j-й диагональный элемент обращенной МКПК для j-го признака R-1.

Шаг 4. Вычислить факторные нагрузки первого фактора

(3.7)

где ∑j - сумма элементов j-го столбца матрицы R (с диагональю);

Т - сумма всех элементов матрицы Rh.

Шаг 5. Изменить знаки КПК ("отразить") для поиска следующего фактора, начиная со столбца, имеющего max число отрицательных коэффициентов. Перед "отражаемым" признаком после отражения ставится знак "минус". У отражаемого признака после "отражения" число минусов равно разности (p-1) и параметров. Подсчет минусов идет по табл. 3.2. Факторы "отражаются", пока в каждом столбце остаточной матрицы КПК станет не больше p/2 знаков (-).

Таблица 3.2

Правила отражения

Предшествующее

отражение

Элемент столбца

отражаемого признака

>0

Элемент столбца

отражаемого признака

<0

Ранее не отражался или

отражался четное число раз

Увеличить на 1

Уменьшить на 1

Ранее отражался 1 раз или отражался нечетное число раз

Увеличить на 1

Увеличить на 1

Шаг 6. После "отражения" проставить знаки в остаточной матрице: если оба признака xj и xk "отражались" или не "отражались", то знаки в исходной и остаточной матрице совпадают , (3.8)

где Znj=-1, если xj "отражался" и Znj=+1, если не "отражался".

Если отражался только один из них, то ставится противоположный знак

. (3.9)

Шаг 7. Коэффициенты при втором факторе , (3.10)

где - сумма элементов j-го столбца матрицы первых остаточных КПК;

Т - сумма всех элементов этой матрицы (знаки учитывают "отражение").

Шаг 8. Идти на шаг 5 и повторить расчет факторных нагрузок, причем:

1) если N факторов задано, вычислить компоненты факторов;

2) если N факторов не задано, их вычисляют до тех пор, пока все элементы диагонали остаточной матрицы КПК не будут равны=0.001 или =0.0001.

Далее необходимо вычислить:

Шаг 9. Матрицу Rh=A A'. (3.11)

Шаг 10. Матрицу остатков . (3.12)

Шаг 11. Общности всех параметров xj по всем факторам . (3.13)

Шаг 12. Вклады в суммарную дисперсию , где l=1,k. (3.14)

Шаг 13. Полный вклад всех общих факторов (3.15)

Шаг 14. Отклонение совокупности остатков по формуле

(3.16)

Шаг 15. Стандартное отклонение выборки с нулевой корреляцией

, (3.17)

где N - объем выборки.

Шаг 16. Оценить адекватность модели по правилу:

1) если Sign(r) значительно больше, чем Sign(r=0), то в модели учтены не все связи между признаками, и в ее структуре надо учесть нелинейность;

2) если Sign(r) значительно меньше, чем Sign(r=0), то на модель повлияли несущественные связи между признаками;

3) если Sign(r)=Sign(r=0),то факторная модель адекватна.

Шаг 17. Для уточнения групп линейно-зависимых векторов Fi матрица А, найденная центроидным методом, "вращается". После "вращения" меняются aij, а факторы отображают ту же суммарную дисперсию Fi. "Вращение" уточняет положение конфигурации в системе ортогональных факторов, а признаки xi получают самые высокие aij на один фактор и самые низкие aij на другой.

"Вращение" выполняется по критериям, например, критерию Н. Кайзера

. (3.18)

На рис. 3.5 показана геометрическая интерпретация вращения, суть которой заключается в повороте осей на некоторый угол , который определяется из системы уравнений a'1 = a1 Cos + a2 Sin; (3.19)

a'2 =-a1 Sin + a2 Cos.

Зная и можно вычисляют матрицу Т (3.20)

T

=

Cos

-Sin

Sin

Cos

Умножив справа матрицу А на Т, получаем матрицу А’ после вращения

А'=АТ. (3.21)

В табл. 3.3 приведены результаты вращения МФН табл. 3.1.

Таблица 3.3

Матрица А’ после вращения

N

F1 F2 F3 F4 F-дисп

1

-00

2

008 1.00

3

0

4

015 1.00

5

-00

6

-00

7

015 1.00

8

009 1.00

9

-00

10

0

Дисперсия

243 9.95

%Дисперсии

264%

Сравнение таблиц показывает, что системная дисперсия до и после вращения равна 9.95. Постоянен (%), отображенной факторами дисперсии- 99.53%, но видно изменение (%) отображаемой каждым фактором дисперсии признаков.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7