Партнерка на США и Канаду по недвижимости, выплаты в крипто
- 30% recurring commission
- Выплаты в USDT
- Вывод каждую неделю
- Комиссия до 5 лет за каждого referral
Кластер-анализ
Пусть все m признаков являются количественными. Тогда каждый из n объектов может быть представлен точкой в m-мерном пространстве признаков.
Характер распределения этих точек в пространстве признаков определяет структуру сходства и различия объектов в заданной системе показателей. О сходстве объектов можно судить по расстоянию между соответствующими точками.
Содержательный смысл такого понятия сходства означает, что объекты тем более близки, похожи, чем меньше различий между значениями одноименных показателей.
Для определения близости пары точек (объектов i и j) в многомерном пространстве количественных признаков используется евклидово расстояние, равное корню квадратному из суммы квадратов разностей значений одноименных показателей, взятых для данной пары объектов.
Расстояние между объектами зависит от "масштаба" признаков: признаки, диапазон значений которых велик, играют большую роль при вычислении расстояния между объектами в отличие от признаков, диапазон изменения которых мал. Например, расстояния, выраженные в километрах, будут в тысячу раз меньше, чем в метрах.
По этой причине данные обычно нормализуют, т. е. все признаки приводят к стандартному виду со средним значением, равным нулю, и стандартным отклонением, равным единице.
После нормализации объекты на оси каждого признака сохраняют свое относительное положение, но "масштаб" измерения признаков становится единым.
Если подсчитать расстояния для всех пар объектов, получится квадратная таблица D размером m ´ m (матрицу расстояний); матрица расстояний, очевидно, симметрична, поскольку расстояние от объекта i до объекта j в точности такое же, как и расстояние от объекта j до объекта i.
Исходные данные
продукты | ||||
страны | мясо, кг | масло животное, кг | алкоголь, л | фрукты, кг |
x1 | x2 | x4 | x5 | |
Россия | 55 | 3,9 | 5 | 28 |
Австралия | 100 | 2,6 | 8,2 | 121 |
Австрия | 93 | 5,3 | 12 | 146 |
Азербайджан | 20 | 4,1 | 7,9 | 52 |
Армения | 20 | 3,7 | 6,5 | 72 |
Беларусь | 72 | 3,6 | 5,4 | 38 |
Бельгия | 85 | 6,9 | 11 | 83 |
Болгария | 65 | 3 | 9,5 | 92 |
Великобритания | 67 | 3,5 | 8,8 | 91 |
Венгрия | 73 | 1,7 | 10,9 | 73 |
Германия | 88 | 6,8 | 8,1 | 138 |
Греция | 83 | 1 | 8,8 | 99 |
Грузия | 21 | 3,8 | 9,8 | 55 |
Дания | 98 | 5 | 10,3 | 89 |
Ирландия | 99 | 3,3 | 9,6 | 87 |
Испания | 89 | 0,4 | 8,95 | 103 |
Италия | 84 | 2,2 | 9,6 | 169 |
Казахстан | 61 | 4,2 | 7,2 | 10 |
Канада | 98 | 3,1 | 7,4 | 123 |
Киргизия | 46 | 4,1 | 6,7 | 20 |


