В рассматриваемом случае корреляционный коэффициент между рассчитанными значениями дискриминантной функции и реальной принадлежностью к группе, равный 0,565, является не очень удовлетворительным:
Собственные значения
Функция | Собственное значение | % объясненной дисперсии | Кумулятивный % | Каноническая корреляция |
1 | ,469a | 100,0 | 100,0 | ,565 |
a В анализе использовались первые 1 канонические дискриминантные функции.
Значение, выводимое под именем Собственное значение, характеризует «качество» дискриминантной функции. Большие собственные значения указывают на «хорошие» (удачно подобранные) дискриминантные функции.
Тест Лямбда Уилкса позволяет выяснять, насколько значимо отличаются друг от друга средние значения дискриминантной функции в обеих группах. Полученное в нашем примере значение р < 0,001, указывает на очень значимое различие.
Лямбда Уилкса
Проверка функции(й) | Лямбда Уилкса | Хи-квадрат | ст. св. | Знч. |
1 | ,681 | 362,842 | 4 | ,000 |
Затем приводятся стандартизированные коэффициенты дискриминантной функции и их корреляция с используемыми переменными. Таким образом можно исследовать, насколько сильно отдельные переменные, применяемые в дискриминантной функции, коррелируют со стандартизированными значениями этой дискриминантной функции. При этом корреляционные коэффициенты были рассчитаны в обеих группах по отдельности и затем усреднены:
Нормированные коэффициенты канонической дискриминантной функции
Функция | |
| 1 | |
Социально-экономический статус отца | ,264 |
Уровень школьного образования | ,536 |
Возраст | -,612 |
Профессиональное образование | ,070 |
Структурная матрица
Функция | |
| 1 | |
Уровень школьного образования | ,782 |
Возраст | -,730 |
Социально-экономический статус отца | ,435 |
Профессиональное образование | ,270 |
Объединенные внутригрупповые корреляции между дискриминантными переменными и нормированными каноническими дискриминантными функциями.
Переменные упорядочены по абсолютной величине корреляций внутри функции.
В следующей таблице приводятся сами коэффициенты дискриминантной функции:
Коэффициенты канонической дискриминантрой функции
Функция | |
| 1 | |
Социально-экономический статус отца | ,237 |
Уровень школьного образования | ,707 |
Возраст | -,560 |
Профессиональное образование | ,059 |
(Константа) | -1,369 |
Ненормированные коэффициенты
Здесь речь идёт о ненормированных (или нестандартизированных) коэффициентах – это множители при заданных значениях переменных, входящих в дискриминантную функцию. Стандартизированные коэффициенты, которые приводились ранее, основаны на стандартизированных значениях переменных, получаемых с помощью z-преобразования.
Таким образом, мы можем записать формулу дискриминантной функции:
d = 0,237*statpaps – 0,56*alter + 0,707*schule +0,059*ausbild – 1,369
Далее приводятся средние значения дискриминантной функции в обеих группах:
Функции в центроидах групп
Индекс Инглехарта (приоритет ценностей) | Функция |
| 1 | |
1. Постматериалисты | ,623 |
4. Материалисты | -,751 |
Ненормированные канонические дискриминантные функции вычислены в центроидах групп.
В заключении приводится классификационная таблица с указанием точности попадания прогнозов:
Результаты классификацииa
Индекс Инглехарта (приоритет ценностей) | Предсказанная принадлежность к группе | Итого | |||
1. Постматериалисты | 4. Материалисты | ||||
Исходные | Частота | 1. Постматериалисты | 409 | 109 | 518 |
| 4. Материалисты | 133 | 297 | 430 | ||
| % | 1. Постматериалисты | 79,0 | 21,0 | 100,0 | |
| 4. Материалисты | 30,9 | 69,1 | 100,0 |
a 74,5% исходных сгруппированных наблюдений классифицировано правильно.
Колонка таблицы "Total" (Сумма) указывает на общее количество наблюдений, которые фактически относятся к соответствующим группам. К группе постматериалистических типов относится 518 наблюдение, а к группе материалистических типов 430. Обе колонки, объединенные общим наименованием "Predicted Group Membership" (Прогнозируемая принадлежность к группе), указывают на фактическое количество наблюдений, относящихся к каждой из групп.
Первая колонка указывает на количество наблюдений, которые были отнесены к первой группе. Из 518 постматериалистических наблюдений корректно спрогнозированы были 409, это соответствует 79% всех наблюдений. 109 наблюдение (21% всех наблюдений) было по ошибке отнесено ко 2 группе.
Из 430 материалистических наблюдений по ошибке к группе 1 были отнесены 133 (30,9%), а 297 (69,1%) наблюдений были определены корректно.
В строке под таблицей приводится итоговый результат. 74,5% наблюдений были классифицированы корректно. Таким образом, конечным результатом является корректная идентификация наблюдений, равная 74,5%. Этот показатель может быть расценен как вполне приемлемый.
7.6. Пример из области медицины
Рассмотрим еще один пример – теперь на медицинскую тему.
Для этого воспользуемся данными обследования пациентов с нарушениями работы легких. Для тех, кто вопреки современной мировой тенденции продолжает сосредоточенно дымить, это актуально. Эти данные хранятся в файле lunge. sav. Приведем описание переменных, которые будут использованы в процессе при дискриминантного анализа:
Имя переменной | Значения переменной |
out | Исход |
0. Скончался | |
1. Выздоровел | |
alter | Возраст |
bzeit | Время проведения искусственного дыхания (в часах) |
kob | Концентрация кислорода в воздушной смеси для искусственного дыхания |
agg | Интенсивность искусственного дыхания |
geschl | Пол |
1. Мужской | |
2. Женский | |
gr | Рост |
Переменная out делит пациентов на две группы; на основании значений остальных переменных предстоит прогнозировать принадлежность к одной из групп.
Итак.
· Загрузите файл:
lunge. sav
· Выберите в меню команду:
Analyze (Анализ)
Classify (Классифицировать)
Discriminant... (Дискриминантный анализ)
Откроется диалоговое окно Discriminant Analysis (Дискриминантный анализ).
· Переместите переменную ingl_ind в поле для группирующей переменной
· Щёлкните на выключателе Define Range... (Определить диапазон) и в качестве минимального значения введите 0, а в качестве максимального значения 1
· Переместите переменные agg, alter, bzeit, geschl, gr и kob в список Independents (Независимые переменные)
· Оставьте метод ввода переменных Enter independents together (Вводить независимые переменные одновременно), установленный по умолчанию. Это значит, что в анализе одновременно будут участвовать все независимые переменные
· Нажмите кнопку Statistics... (Статистики)
Откроется диалоговое окно Discriminant Analysis: Statistics (Дискриминантный анализ: Статистики).
· Активируйте опции:
~ Means (Средние значения)
~ Univariate ANOVAs (Одномерные тесты ANOVA)
~ Unstandardized Function Coefficients (Нестандартизированные коэффициенты функции)
~ Within-groops Correlation Matrices (Корреляционная матрица внутри группы)
· Подтвердите нажатием кнопки Continue (Далее)
· В окне Discriminant Analysis (Дискриминантный анализ) нажмите кнопку Classify... (Классифицировать)
Откроется диалоговое окно Discriminant Analysis: Classification (Дискриминантный анализ: Классификация).
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 |


