Если эта доля достаточно велика (более 80%), то компоненты с дисперсиями
могут не учитываться и совокупность будет адекватно представлена с помощью
первых компонент.
Если используется корреляционноая матрица
то
.
На практике должен быть сделан выбор, получать ли главные компоненты на основе ковариационной матрицы
или на основе корреляционной
Доля дисперсии, объясненная перывми главными компонентами, в обеих случаях будет различной. С помощью ковариационной матрицы
можно получить компоненты с большими дисперсиями просто в силу выбора шкалы измерений одного из
ов.
Подчеркнем, что ковариационная матрица
получется по центрированным значениям исходных векторов, а матрица
- по нормированным исходным векторам.
Схематично решение задачи методом главных компонент сводится к поэтапному преобразованию матрицы исходных данных ![]()

![]()
![]()
![]()
![]()
![]()
![]()
![]()
где
матрица исходных данных размерностью ![]()
число объектов наблюдения;
число измеряемых признаков;
матрица стандартизованных значений признаков, элементы матрицы вычисляются по формуле: ![]()
матрица парных корреляций: ![]()
Если предварительная стандартизация данных не проводилась, то на данном шаге получают матрицу
элементы матрицы
для расчета
будут центрированными величинами:
диагональная матрица собственных (характеристических) чисел:

Множество значений
находят решением характеристического уравнения
это характеристики вариации, точнее, показатели дисперсии гаждой главной компоненты. Суммарное значение
равняется сумме дисперсий элементарных признаков
При условии стандартизации исходных данных, когда дисперсия 
равна числу элементарных признаков
т. е. ![]()
- матрица собственный векторов корреляционной матрицы
или ковариационной матрицы
;
матрица нормированных собственных векторов. Число векторов
первоначально равно
т. е.
Получают
преобразованием ненормированных собственных векторов ![]()
![]()
где
норма вектора
т. е.
.
Матрица факторного отображения
вычислят по формуле ![]()
На завершающем этапе матрицу главных компонент исчисляется по формуле
![]()
12. 2. Факторный анализ
Факторный анализ связан с анализом главных компонент в том отношении, что в обеих случаях рассматриваются зависимости меджу
компонентами (переменными) вектора наблюдений
на основе анализа матрицы ковариаций или корреляций этих переменных. Однако вместо применения к вектору
линейного преобразования типа
, в факторном анализе предполагается, что векторная случайная величина
может быть представлена в виде некоторой линейной модели
, включающей случайные переменные
, известные как факторы, число которых существенно меньше, чем
, матрицу факторных нагрузок
Эта модель включает также и член
, связанный с ошибкой. Следовательно, корреляции между переменными
могут быть вычислены как корреляции между линейными комбинациями факторов, число которых много меньше, чем ![]()
Поскольку факторы ненаблюдаемы, анализ направлен на разложение ковариационной или корреляционной матрицы в предположении линейной модели.
Факторная модель
Предположим, что
мерная случайная величина
имеет среднее
и ковариационную матрицу
полного ранга ![]()
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |


