Классификация (стр. 9 )

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10

Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

Таблица 3.7

Имя
Жанибек	5	4	7	8	5	9
Нурадил	6	7	6	8	8	10
Айнагуль	8	5	7	6	5	8
Юля	9	9	10	8	7	6
Диана	10	10	9	8	9	7
Ольга	2	5	4	6	3	7

Все данные введены в программу Statistica и проведены расчеты.

При использовании математического пакета Statistica получены два кластера, которые изображены в виде вертикальной дендограммы. Дендограмма показана на рисунке 3.2

Рисунок 3.2

Вывод: Анализируя дендограмму видно, что в один кластер входят 2 студента (Диана и Юля), в другой 4 человека (Оля, Нурадил, Айнагуль, Жанибек). Разобраться в значении кластеров помогают кластерные профили, которые представляют собой средние значения переменных, которые включены в анализ, распределенные по кластерной принадлежности.

Определим средние значения всех переменных по каждому из выделенных кластеров. Средние значения наблюдений по тестам в кластерах показаны в таблице 3.8

Таблица 3.8

Предмет теста	Кластер 1	Кластер 2
Память на числа	9,5	5,25
Математические задачи	9,5	5,25
Находчивость	9,5	6
Сотрудничество	8	7
Логические задачи	8	5,25
Командный дух	6,5	8,5

В первый кластер вошли испытуемые, которые имеют высокие показатели в математических тестах. Во второй кластер вошли те, у кого высокий показатель на тесты по социальной компетентности (находчивость, сотрудничество, командный дух), но с низким показателем по тестам на логические и математические задачи.

НЕ нашли? Не то? Что вы ищете?

Ход данного исследования пошагово показан в приложении Б.

Решение задач методом K-средних

Необходимо рассмотреть малую группу из 9 учеников. Значения
- оценки учащихся за I четверть.

. Данные приведены в таблице 3.9

Таблица 3.9

Ученик/ Предмет
	3	3	5
	5	4	5
	4	4	4
	4	4	5
	5	4	5
	3	3	5
	4	4	5
	3	3	4
	5	5	5

В математическом пакете Statistica создаем таблицу с данными значениями. Выбираем пункт Mult/E[ploratory ?› Cluster.

Рисунок 3.3

Затем выбираем метод K-means.

Рисунок 3.4

Выбираем количество кластера. Количество кластера задается произвольно. В данном примере задано три кластера.

Рисунок 3.5

Выбираем пункт Graph of means.

Рисунок 3.6

Получено три кластера, представленных в виде трех графиков. Первый кластер обозначен синим цветом, второй – красным, третий – зеленым.

Рисунок 3.7

Чтобы понять, как произошло разбиение, достаточно посмотреть из чего состоят эти кластеры. В графе K-means clustering выбираем пункт members of each cluster and distances. Данный пункт показывает, какие ученики вошли в какой кластер, и высчитывает расстояние.

Рисунок 3.8

Видно, что в первый кластер вошли

Рисунок 3.9

Во второй кластер вошли:

Рисунок 3.1

В третий кластер вошли:

Рисунок 3.11

Рисунок 3.12

Вывод: Методом K-means получено три кластера. В первый кластер вошли ученики: данных учеников оценки по предметам « Алгебра» и « Геометрия» 4, по предмету информатика видно, что оценки лучше у всех членов трех кластеров.

Во второй кластер вошли данных учеников оценки по алгебре и информатике одинаковые, и выше чем по геометрии.

В третий кластер вошли них оценки по алгебре и геометрии низкие и равны оценке «3», но по информатике «4 и 5».

По полученным кластерам можно проследить динамику успеваемости учащихся с прогнозированием и их дальнейшего обучения с корректировкой тех дисциплин, в которых низкие баллы.

Пример 4.

В данном исследовании рассматривается 9 «В» класс школы-гимназии № 3 г. Костанай. Нужно сравнить три метода: Метод ближнего соседа, метод дальнего соседа и метод К-средних. В таблице В1 приведены оценки за первую четверть по трем предметам.

Таблица В1.

Биология	Геометрия	Информатика
	3	3	5
	4	4	5
	4	4	4
	4	4	5
	4	4	5
	4	3	5
	4	4	5
	4	4	5
	3	3	4
Киколенко Ю,	4	4	5
	4	4	5
	3	3	5
	4	4	4
	3	3	4
	4	3	5
	4	3	4
	4	4	5
	3	3	4
	4	3	4
	4	4	4
	3	3	4
	5	5	5
	4	4	4
	4	4	4
	4	4	4

Для решения практических задач часто используются такие программы как Statistica и Excel. Рассмотрим процедуру решения задачи кластерного анализа в программе STATISTICA. Среди переключателей модуля STATISTICA нужно открыть модуль Cluster Analysis (Кластерный Анализ).

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10

НЕ нашли? Не то? Что вы ищете?

Правила пользования Сайтом
Правила публикации материалов
Политика конфиденциальности и обработки персональных данных

При перепечатке материалов ссылка на pandia.org обязательна.
Минимальная ширина экрана монитора для комфортного просмотра сайта: 1200 пикселей.
Сайт не содержит автоматически сгенерированных данных и не принимает подобные материалы.

Мы признательны за найденные неточности в материалах, опечатки, некорректное отображение элементов на странице - отправляйте на [email protected]

Классификация (стр. 9 )

Партнерка на США и Канаду по недвижимости, выплаты в крипто

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы