Тема 7. Дискриминантный анализ (стр. 3 )

Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

В рассматриваемом случае корреляционный коэффициент между рассчитанными значениями дискриминантной функции и реальной принадлежностью к группе, равный 0,565, является не очень удовлетворительным:

Собственные значения

Функция	Собственное значение	% объясненной дисперсии	Кумулятивный %	Каноническая корреляция
1	,469a	100,0	100,0	,565

a В анализе использовались первые 1 канонические дискриминантные функции.

Значение, выводимое под именем Собственное значение, характеризует «качество» дискриминантной функции. Большие собственные значения указывают на «хорошие» (удачно подобранные) дискриминантные функции.

Тест Лямбда Уилкса позволяет выяснять, насколько значимо отличаются друг от друга средние значения дискриминантной функции в обеих группах. Полученное в нашем примере значение р < 0,001, указывает на очень значимое различие.

Лямбда Уилкса

Проверка функции(й)	Лямбда Уилкса	Хи-квадрат	ст. св.	Знч.
1	,681	362,842	4	,000

Затем приводятся стандартизированные коэффициенты дискриминантной функции и их корреляция с используемыми переменными. Таким образом можно исследовать, насколько сильно отдельные переменные, применяемые в дискриминантной функции, коррелируют со стандартизированными значениями этой дискриминантной функции. При этом корреляционные коэффициенты были рассчитаны в обеих группах по отдельности и затем усреднены:

Нормированные коэффициенты канонической дискриминантной функции

	Функция
1
Социально-экономический статус отца	,264
Уровень школьного образования	,536
Возраст	-,612
Профессиональное образование	,070

Структурная матрица

НЕ нашли? Не то? Что вы ищете?

	Функция
1
Уровень школьного образования	,782
Возраст	-,730
Социально-экономический статус отца	,435
Профессиональное образование	,270

Объединенные внутригрупповые корреляции между дискриминантными переменными и нормированными каноническими дискриминантными функциями.

Переменные упорядочены по абсолютной величине корреляций внутри функции.

В следующей таблице приводятся сами коэффициенты дискриминантной функции:

Коэффициенты канонической дискриминантрой функции

	Функция
1
Социально-экономический статус отца	,237
Уровень школьного образования	,707
Возраст	-,560
Профессиональное образование	,059
(Константа)	-1,369

Ненормированные коэффициенты

Здесь речь идёт о ненормированных (или нестандартизированных) коэффициентах – это множители при заданных значениях переменных, входящих в дискриминантную функцию. Стандартизированные коэффициенты, которые приводились ранее, основаны на стандартизированных значениях переменных, получаемых с помощью z-преобразования.

Таким образом, мы можем записать формулу дискриминантной функции:

d = 0,237*statpaps – 0,56*alter + 0,707*schule +0,059*ausbild – 1,369

Далее приводятся средние значения дискриминантной функции в обеих группах:

Функции в центроидах групп

Индекс Инглехарта (приоритет ценностей)	Функция
1
1. Постматериалисты	,623
4. Материалисты	-,751

Ненормированные канонические дискриминантные функции вычислены в центроидах групп.

В заключении приводится классификационная таблица с указанием точности попадания прогнозов:

Результаты классификацииa

		Индекс Инглехарта (приоритет ценностей)	Предсказанная принадлежность к группе	Итого
1. Постматериалисты	4. Материалисты
Исходные	Частота	1. Постматериалисты	409	109	518
4. Материалисты	133	297	430
%	1. Постматериалисты	79,0	21,0	100,0
4. Материалисты	30,9	69,1	100,0

a 74,5% исходных сгруппированных наблюдений классифицировано правильно.

Колонка таблицы "Total" (Сумма) указывает на общее количество наблюдений, которые фактически относятся к соответствующим группам. К группе постматериалистических типов относится 518 наблюдение, а к группе материалистических типов 430. Обе колонки, объединенные общим наименованием "Predicted Group Membership" (Прогнозируемая принадлежность к группе), указывают на фактическое количество наблюдений, относящихся к каждой из групп.

Первая колонка указывает на количество наблюдений, которые были отнесены к первой группе. Из 518 постматериалистических наблюдений корректно спрогнозированы были 409, это соответствует 79% всех наблюдений. 109 наблюдение (21% всех наблюдений) было по ошибке отнесено ко 2 группе.

Из 430 материалистических наблюдений по ошибке к группе 1 были отнесены 133 (30,9%), а 297 (69,1%) наблюдений были определены корректно.

В строке под таблицей приводится итоговый результат. 74,5% наблюдений были классифицированы корректно. Таким образом, конечным результатом является корректная идентификация наблюдений, равная 74,5%. Этот показатель может быть расценен как вполне приемлемый.

7.6. Пример из области медицины

Рассмотрим еще один пример – теперь на медицинскую тему.

Для этого воспользуемся данными обследования пациентов с нарушениями работы легких. Для тех, кто вопреки современной мировой тенденции продолжает сосредоточенно дымить, это актуально. Эти данные хранятся в файле lunge. sav. Приведем описание переменных, которые будут использованы в процессе при дискриминантного анализа:

Имя переменной	Значения переменной
out	Исход
	0. Скончался
	1. Выздоровел
alter	Возраст
bzeit	Время проведения искусственного дыхания (в часах)
kob	Концентрация кислорода в воздушной смеси для искусственного дыхания
agg	Интенсивность искусственного дыхания
geschl	Пол
	1. Мужской
	2. Женский
gr	Рост

Переменная out делит пациентов на две группы; на основании значений остальных переменных предстоит прогнозировать принадлежность к одной из групп.

Итак.

· Загрузите файл:

lunge. sav

· Выберите в меню команду:

Analyze (Анализ)

Classify (Классифицировать)

Discriminant... (Дискриминантный анализ)

Откроется диалоговое окно Discriminant Analysis (Дискриминантный анализ).

· Переместите переменную ingl_ind в поле для группирующей переменной

· Щёлкните на выключателе Define Range... (Определить диапазон) и в качестве минимального значения введите 0, а в качестве максимального значения 1

· Переместите переменные agg, alter, bzeit, geschl, gr и kob в список Independents (Независимые переменные)

· Оставьте метод ввода переменных Enter independents together (Вводить независимые переменные одновременно), установленный по умолчанию. Это значит, что в анализе одновременно будут участвовать все независимые переменные

· Нажмите кнопку Statistics... (Статистики)

Откроется диалоговое окно Discriminant Analysis: Statistics (Дискриминантный анализ: Статистики).

· Активируйте опции:

~ Means (Средние значения)

~ Univariate ANOVAs (Одномерные тесты ANOVA)

~ Unstandardized Function Coefficients (Нестандартизированные коэффициенты функции)

~ Within-groops Correlation Matrices (Корреляционная матрица внутри группы)

· Подтвердите нажатием кнопки Continue (Далее)

· В окне Discriminant Analysis (Дискриминантный анализ) нажмите кнопку Classify... (Классифицировать)

Откроется диалоговое окно Discriminant Analysis: Classification (Дискриминантный анализ: Классификация).

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5

Правила пользования Сайтом
Правила публикации материалов
Политика конфиденциальности и обработки персональных данных

При перепечатке материалов ссылка на pandia.org обязательна.
Минимальная ширина экрана монитора для комфортного просмотра сайта: 1200 пикселей.
Сайт не содержит автоматически сгенерированных данных и не принимает подобные материалы.

Мы признательны за найденные неточности в материалах, опечатки, некорректное отображение элементов на странице - отправляйте на [email protected]

Партнерка на США и Канаду по недвижимости, выплаты в крипто

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы