Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Кластер-анализ

Пусть все m признаков являются количественными. Тогда каждый из n объектов может быть представлен точкой в m-мерном пространстве признаков.

Характер распределения этих точек в пространстве признаков определяет структуру сходства и различия объектов в заданной системе показателей. О сходстве объектов можно судить по расстоянию между соответствующими точками.

Содержательный смысл такого понятия сходства означает, что объекты тем более близки, похожи, чем меньше различий между значениями одноименных показателей.

Для определения близости пары точек (объектов i и j) в многомерном пространстве количественных признаков используется евклидово расстояние, равное корню квадратному из суммы квадратов разностей значений одноименных показателей, взятых для данной пары объектов.

Расстояние между объектами зависит от "масштаба" признаков: признаки, диапазон значений которых велик, играют большую роль при вычислении расстояния между объектами в отличие от признаков, диапазон изменения которых мал. Например, расстояния, выраженные в километрах, будут в тысячу раз меньше, чем в метрах.

По этой причине данные обычно нормализуют, т. е. все признаки приводят к стандартному виду со средним значением, равным нулю, и стандартным отклонением, равным единице.

После нормализации объекты на оси каждого признака сохраняют свое относительное положение, но "масштаб" измерения признаков становится единым.

Если подсчитать расстояния для всех пар объектов, получится квадратная таблица D размером m ´ m (матрицу расстояний); матрица расстояний, очевидно, симметрична, поскольку расстояние от объекта i до объекта j в точности такое же, как и расстояние от объекта j до объекта i.

Исходные данные

продукты

страны

мясо, кг

масло животное, кг

алкоголь, л

фрукты, кг

x1

x2

x4

x5

Россия

55

3,9

5

28

Австралия

100

2,6

8,2

121

Австрия

93

5,3

12

146

Азербайджан

20

4,1

7,9

52

Армения

20

3,7

6,5

72

Беларусь

72

3,6

5,4

38

Бельгия

85

6,9

11

83

Болгария

65

3

9,5

92

Великобритания

67

3,5

8,8

91

Венгрия

73

1,7

10,9

73

Германия

88

6,8

8,1

138

Греция

83

1

8,8

99

Грузия

21

3,8

9,8

55

Дания

98

5

10,3

89

Ирландия

99

3,3

9,6

87

Испания

89

0,4

8,95

103

Италия

84

2,2

9,6

169

Казахстан

61

4,2

7,2

10

Канада

98

3,1

7,4

123

Киргизия

46

4,1

6,7

20