КЛАССИФИКАЦИЯ СТРАН АФРИКИ ПО СОЦИАЛЬНО-ЭКОНОМИЧЕСКИМ ПОКАЗАТЕЛЯМ С ПОМОЩЬЮ КЛАСТЕРНОГО АНАЛИЗА

, Нотсиле Дубе

Российский университет дружбы народов, Москва, Россия

*****@***ru, *****@***com

C помощью кластерного анализа проведена классификация стран Африки по социально-экономическим показателям. В качестве показателей были рассмотрены данные о численности и  плотности  населения, степени урбанизации, средней продолжительности жизни, среднем количестве детей в семье, детской смертности и валовом внутреннем продукте на душу населения. Все данные получены на конец 2015 года. 

Ключевые слова: страны Африки, социально-экономические показатели, кластерный анализ, иерархическая кластеризация, кластеризация k-средними.

Введение

  Кластерный анализ – один из методов многомерного статистического анализа, позволяющий разбивать множество исследуемых объектов, характеризуемых совокупностью признаков, на однородные в соответствующем понимании группы [1]. В данной работе объектом исследования являются страны Африки, характеризуемые набором социально-экономических показателей. Задача состоит в разбиении стран на три группы: с относительно высоким, средним и низким уровнем жизни. 

Первичный анализ данных

  Наиболее важным показателем уровня жизни является величина валового внутреннего продукта (ВВП) на душу населения. Поэтому на первом этапе решения  задачи мы построили корреляционную матрицу для всех показателей и проанализировали степень зависимости ВВП от других показателей. В итоге мы пришли к выводу, что ВВП находится в прямо пропорциональной зависимости от средней продолжительности жизни и в обратно пропорциональной зависимости от среднего количества детей в семье и от показателя детской смертности. Корреляция ВВП с численностью и плотностью населения и степенью урбанизации оказалась незначительной, поэтому эти показатели мы исключили из дальнейшего анализа, т. к. их учет может привести только лишь к искажению результатов кластеризации.

НЕ нашли? Не то? Что вы ищете?

Результаты кластеризации

  Для проведения кластерного анализа мы использовали программные продукты пакета SPSS. Кластеризацию проводили двумя методами: иерархическим и методом k-средних. Исходные данные задачи вместе с результатами кластеризации представлены в табл. 1. В таблице используются следующие обозначения:

  ЧН – численность населения страны (чел.);

  ПН – плотность населения на 1 кв. км.;

  ГН – доля городского населения (%);

  СПЖМ – средняя продолжительность жизни мужчин;

  СПЖЖ – средняя продолжительность жизни женщин;

  ХДС - характеристика детской смертности (ХДС = 100 – ДС, где ДС – детская смертность на 1000 новорожденных);

  ВВП – величина валового внутреннего дохода на душу населения по данным МВФ ($);

  ХСКД – характеристика среднего количества детей в семье (ХСКД = 10 – СКД, где СКД – среднее количество детей в семье);

СТРАНА

ЧН

ПН

ГН

СПЖМ

СПЖЖ

ХДС

ВВП

ХСКД

№1

№2

Алжир

40633464

14

70

64

70

88

4345

7.2

1

3

Египет

84705681

71

43

69

74

80

3998

7.2

1

3

Ливия

6317080

3.1

78

73

77

89

4754

7.6

1

3

Марокко

33955157

70

60

69

73

76

3077

7.3

1

1

Танзания

37187939

39

31

59

63

65

969

4.8

1

1

Южный Судан

39613217

17

19

54

56

40

1083

5.1

1

1

Тунис

11116899

60

67

74

78

88

3985

4.7

1

3

Ангола

22137261

8.5

43

60

63

4

4062

4.1

1

3

Камерун

23393129

34

54

55

57

43

1234

5.2

1

1

Центральная Африка

4803082

5.8

40

52

59

8

339

5.6

1

1

Чад

13211146

8

22

50

52

15

1011

3.7

1

1

ДРК

71246355

24

42

55

59

25

478

4.1

1

1

Сан-Томе и Принсипи

202781

170

65

65

69

65

1350

5.9

1

1

Республика Конго

4671142

8.7

65

57

60

67

2031

5

1

1

Экваториальная Гвинея

799372

18

40

54

57

32

12541

5.2

2

2

Малави

10,701,824

90

16

63

60

57

353

4.6

1

1

Руанда

12428005

281

28

58

66

69

743

5.5

1

1

Уганда

40141262

105

16

57

59

62

625

4.1

1

1

Бенин

10879828

60

44

57

60

36

709

7.3

1

1

Буркина-Фасо

17914625

46

29

57

59

39

631

4

1

1

Кабо-Верде

508315

101

12

71

74

79

3127

7.7

1

1

Кот-д’Ивуар

21295284

52

53

52

54

33

1319

5.1

1

1

Габон

1751199

4.6

87

62

64

64

8581

5.9

3

3

Гамбия

1970081

129

59

59

63

52

384

4.2

1

1

Гана

26984328

85

53

61

64

57

1401

6.1

1

1

Гвинея

12347766

32

37

57

59

39

546

4.9

1

1

Гвинея-Бисау

1787793

37

49

53

56

40

582

5.1

1

1

Либерия

6317080

30

49

60

63

47

469

5.2

1

1

Мали

16258587

9.1

39

57

57

25

672

3.2

1

1

Мавритания

4080224

2.7

59

61

65

35

1262

5.3

1

1

Нигер

19268380

8.4

18

59

59

43

403

2.4

1

1

Нигерия

183523432

141

47

53

55

31

2758

4

1

1

Сенегал

14967446

54

43

63

66

58

985

5.1

1

1

Сьерра-Леоне

6318575

78

40

45

46

13

675

5.3

1

1

Того

7170797

93

39

57

59

48

578

5.4

1

1

Бурунди

10812619

281

12

54

57

46

315

7.7

1

1

Коморские острова

770058

283

28

60

63

45

737

5.3

1

1

Джибути

899658

21

77

60

63

46

1805

6.6

1

1

Эритрея

6737634

37

22

60

60

66

630

5.3

1

1

Эфиопия

98942102

60

19

62

65

59

702

5.5

1

1

Кения

46748617

53

25

59

62

64

1432

5.5

1

1

Мадагаскар

24235390

28

34

62

65

64

393

5.5

1

1

Сейшельские острова

93754

176

54

69

78

88

14466

7.6

2

2

Сомали

11122711

12

39

51

55

15

300

3.4

1

1

Судан

39613217

19

34

61

65

52

2194

5.6

1

1

Ботсвана

2056370

2.7

57

61

63

65

6150

7.4

1

3

Лесото

2120116

73

27

49

52

31

1063

7

1

1

Мозамбик

27121827

24

32

52

54

43

626

4.8

1

1

Замбия

15021002

13

40

55

60

57

1576

4.3

1

1

Зимбабве

14599325

29

33

56

58

53

1037

6.5

1

1

Маврикий

1253581

588

40

70

78

88

9187

8.6

3

3

Намибия

2392370

2.2

46

64

69

67

5787

6.9

1

3

Южная Африке

53491333

36

64

56

62

66

5784

7.6

1

3

Свазиленд

1285519

65

21

52

55

55

3848

6.7

1

3

Таблица 1. Результаты кластеризации  стран Африки с учетом их социально-экономических  показателей

  В двух последних столбцах таблицы указаны номера кластеров соответствующих стран (столбец №1 соответствует иерархическому методу, столбец №2 – методу k – средних). При этом кластер №2 объединяет страны с самым высоким уровнем жизни. Это Сейшельские острова и Экваториальная Гвинея. В кластер №3 вошли страны со средним уровнем жизни, а все остальные страны вошли в кластер №1. Следует заметить, что по первому методу в кластер №3 вошли только Габон и Маврикий, а по второму методу к этим двум странам добавились Алжир, Египет, Ливия, Тунис, Ангола, Ботсвана, Намибия, ЮАР и Свазиленд. Данное различие объясняется тем, что иерархический метод «не любит» принудительного назначения количества кластеров. В действительности предварительный анализ, проведенный иерархическим методом показал, что оптимальное количество кластеров должно  равняться семи.

Литература

  1. Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS: Учеб. пособие / Под. ред. . – М.: Вузовский учебник, 2014. – 310 с.

  CLASSIFICATION OF AFRICAN COUNTRIES BASED ON A SET OF SOCIO-ECONOMIC INDICATORS USING CLUSTER ANALYSIS

S. I. Matyushenko, Notsile Dube

Peoples’ Friendship University, Moscow, Russia

Using cluster analysis, the classification of African countries based on a set of socio-economic indicators, was conducted. This set of indicators includes: population and population density, degree of urbanization, average life expectancy, average number of children per family, infant mortality and gross domestic product per capita. All data was obtained from end of 2015.

Keywords: African countries, socio-economic indicators, cluster analysis, hierarchical clustering,  k-means clustering.