КЛАССИФИКАЦИЯ СТРАН АФРИКИ ПО СОЦИАЛЬНО-ЭКОНОМИЧЕСКИМ ПОКАЗАТЕЛЯМ С ПОМОЩЬЮ КЛАСТЕРНОГО АНАЛИЗА
, Нотсиле Дубе
Российский университет дружбы народов, Москва, Россия
*****@***ru, *****@***com
C помощью кластерного анализа проведена классификация стран Африки по социально-экономическим показателям. В качестве показателей были рассмотрены данные о численности и плотности населения, степени урбанизации, средней продолжительности жизни, среднем количестве детей в семье, детской смертности и валовом внутреннем продукте на душу населения. Все данные получены на конец 2015 года.
Ключевые слова: страны Африки, социально-экономические показатели, кластерный анализ, иерархическая кластеризация, кластеризация k-средними.
Введение
Кластерный анализ – один из методов многомерного статистического анализа, позволяющий разбивать множество исследуемых объектов, характеризуемых совокупностью признаков, на однородные в соответствующем понимании группы [1]. В данной работе объектом исследования являются страны Африки, характеризуемые набором социально-экономических показателей. Задача состоит в разбиении стран на три группы: с относительно высоким, средним и низким уровнем жизни.
Первичный анализ данных
Наиболее важным показателем уровня жизни является величина валового внутреннего продукта (ВВП) на душу населения. Поэтому на первом этапе решения задачи мы построили корреляционную матрицу для всех показателей и проанализировали степень зависимости ВВП от других показателей. В итоге мы пришли к выводу, что ВВП находится в прямо пропорциональной зависимости от средней продолжительности жизни и в обратно пропорциональной зависимости от среднего количества детей в семье и от показателя детской смертности. Корреляция ВВП с численностью и плотностью населения и степенью урбанизации оказалась незначительной, поэтому эти показатели мы исключили из дальнейшего анализа, т. к. их учет может привести только лишь к искажению результатов кластеризации.
Результаты кластеризации
Для проведения кластерного анализа мы использовали программные продукты пакета SPSS. Кластеризацию проводили двумя методами: иерархическим и методом k-средних. Исходные данные задачи вместе с результатами кластеризации представлены в табл. 1. В таблице используются следующие обозначения:
ЧН – численность населения страны (чел.);
ПН – плотность населения на 1 кв. км.;
ГН – доля городского населения (%);
СПЖМ – средняя продолжительность жизни мужчин;
СПЖЖ – средняя продолжительность жизни женщин;
ХДС - характеристика детской смертности (ХДС = 100 – ДС, где ДС – детская смертность на 1000 новорожденных);
ВВП – величина валового внутреннего дохода на душу населения по данным МВФ ($);
ХСКД – характеристика среднего количества детей в семье (ХСКД = 10 – СКД, где СКД – среднее количество детей в семье);
СТРАНА | ЧН | ПН | ГН | СПЖМ | СПЖЖ | ХДС | ВВП | ХСКД | №1 | №2 |
Алжир | 40633464 | 14 | 70 | 64 | 70 | 88 | 4345 | 7.2 | 1 | 3 |
Египет | 84705681 | 71 | 43 | 69 | 74 | 80 | 3998 | 7.2 | 1 | 3 |
Ливия | 6317080 | 3.1 | 78 | 73 | 77 | 89 | 4754 | 7.6 | 1 | 3 |
Марокко | 33955157 | 70 | 60 | 69 | 73 | 76 | 3077 | 7.3 | 1 | 1 |
Танзания | 37187939 | 39 | 31 | 59 | 63 | 65 | 969 | 4.8 | 1 | 1 |
Южный Судан | 39613217 | 17 | 19 | 54 | 56 | 40 | 1083 | 5.1 | 1 | 1 |
Тунис | 11116899 | 60 | 67 | 74 | 78 | 88 | 3985 | 4.7 | 1 | 3 |
Ангола | 22137261 | 8.5 | 43 | 60 | 63 | 4 | 4062 | 4.1 | 1 | 3 |
Камерун | 23393129 | 34 | 54 | 55 | 57 | 43 | 1234 | 5.2 | 1 | 1 |
Центральная Африка | 4803082 | 5.8 | 40 | 52 | 59 | 8 | 339 | 5.6 | 1 | 1 |
Чад | 13211146 | 8 | 22 | 50 | 52 | 15 | 1011 | 3.7 | 1 | 1 |
ДРК | 71246355 | 24 | 42 | 55 | 59 | 25 | 478 | 4.1 | 1 | 1 |
Сан-Томе и Принсипи | 202781 | 170 | 65 | 65 | 69 | 65 | 1350 | 5.9 | 1 | 1 |
Республика Конго | 4671142 | 8.7 | 65 | 57 | 60 | 67 | 2031 | 5 | 1 | 1 |
Экваториальная Гвинея | 799372 | 18 | 40 | 54 | 57 | 32 | 12541 | 5.2 | 2 | 2 |
Малави | 10,701,824 | 90 | 16 | 63 | 60 | 57 | 353 | 4.6 | 1 | 1 |
Руанда | 12428005 | 281 | 28 | 58 | 66 | 69 | 743 | 5.5 | 1 | 1 |
Уганда | 40141262 | 105 | 16 | 57 | 59 | 62 | 625 | 4.1 | 1 | 1 |
Бенин | 10879828 | 60 | 44 | 57 | 60 | 36 | 709 | 7.3 | 1 | 1 |
Буркина-Фасо | 17914625 | 46 | 29 | 57 | 59 | 39 | 631 | 4 | 1 | 1 |
Кабо-Верде | 508315 | 101 | 12 | 71 | 74 | 79 | 3127 | 7.7 | 1 | 1 |
Кот-д’Ивуар | 21295284 | 52 | 53 | 52 | 54 | 33 | 1319 | 5.1 | 1 | 1 |
Габон | 1751199 | 4.6 | 87 | 62 | 64 | 64 | 8581 | 5.9 | 3 | 3 |
Гамбия | 1970081 | 129 | 59 | 59 | 63 | 52 | 384 | 4.2 | 1 | 1 |
Гана | 26984328 | 85 | 53 | 61 | 64 | 57 | 1401 | 6.1 | 1 | 1 |
Гвинея | 12347766 | 32 | 37 | 57 | 59 | 39 | 546 | 4.9 | 1 | 1 |
Гвинея-Бисау | 1787793 | 37 | 49 | 53 | 56 | 40 | 582 | 5.1 | 1 | 1 |
Либерия | 6317080 | 30 | 49 | 60 | 63 | 47 | 469 | 5.2 | 1 | 1 |
Мали | 16258587 | 9.1 | 39 | 57 | 57 | 25 | 672 | 3.2 | 1 | 1 |
Мавритания | 4080224 | 2.7 | 59 | 61 | 65 | 35 | 1262 | 5.3 | 1 | 1 |
Нигер | 19268380 | 8.4 | 18 | 59 | 59 | 43 | 403 | 2.4 | 1 | 1 |
Нигерия | 183523432 | 141 | 47 | 53 | 55 | 31 | 2758 | 4 | 1 | 1 |
Сенегал | 14967446 | 54 | 43 | 63 | 66 | 58 | 985 | 5.1 | 1 | 1 |
Сьерра-Леоне | 6318575 | 78 | 40 | 45 | 46 | 13 | 675 | 5.3 | 1 | 1 |
Того | 7170797 | 93 | 39 | 57 | 59 | 48 | 578 | 5.4 | 1 | 1 |
Бурунди | 10812619 | 281 | 12 | 54 | 57 | 46 | 315 | 7.7 | 1 | 1 |
Коморские острова | 770058 | 283 | 28 | 60 | 63 | 45 | 737 | 5.3 | 1 | 1 |
Джибути | 899658 | 21 | 77 | 60 | 63 | 46 | 1805 | 6.6 | 1 | 1 |
Эритрея | 6737634 | 37 | 22 | 60 | 60 | 66 | 630 | 5.3 | 1 | 1 |
Эфиопия | 98942102 | 60 | 19 | 62 | 65 | 59 | 702 | 5.5 | 1 | 1 |
Кения | 46748617 | 53 | 25 | 59 | 62 | 64 | 1432 | 5.5 | 1 | 1 |
Мадагаскар | 24235390 | 28 | 34 | 62 | 65 | 64 | 393 | 5.5 | 1 | 1 |
Сейшельские острова | 93754 | 176 | 54 | 69 | 78 | 88 | 14466 | 7.6 | 2 | 2 |
Сомали | 11122711 | 12 | 39 | 51 | 55 | 15 | 300 | 3.4 | 1 | 1 |
Судан | 39613217 | 19 | 34 | 61 | 65 | 52 | 2194 | 5.6 | 1 | 1 |
Ботсвана | 2056370 | 2.7 | 57 | 61 | 63 | 65 | 6150 | 7.4 | 1 | 3 |
Лесото | 2120116 | 73 | 27 | 49 | 52 | 31 | 1063 | 7 | 1 | 1 |
Мозамбик | 27121827 | 24 | 32 | 52 | 54 | 43 | 626 | 4.8 | 1 | 1 |
Замбия | 15021002 | 13 | 40 | 55 | 60 | 57 | 1576 | 4.3 | 1 | 1 |
Зимбабве | 14599325 | 29 | 33 | 56 | 58 | 53 | 1037 | 6.5 | 1 | 1 |
Маврикий | 1253581 | 588 | 40 | 70 | 78 | 88 | 9187 | 8.6 | 3 | 3 |
Намибия | 2392370 | 2.2 | 46 | 64 | 69 | 67 | 5787 | 6.9 | 1 | 3 |
Южная Африке | 53491333 | 36 | 64 | 56 | 62 | 66 | 5784 | 7.6 | 1 | 3 |
Свазиленд | 1285519 | 65 | 21 | 52 | 55 | 55 | 3848 | 6.7 | 1 | 3 |
Таблица 1. Результаты кластеризации стран Африки с учетом их социально-экономических показателей
В двух последних столбцах таблицы указаны номера кластеров соответствующих стран (столбец №1 соответствует иерархическому методу, столбец №2 – методу k – средних). При этом кластер №2 объединяет страны с самым высоким уровнем жизни. Это Сейшельские острова и Экваториальная Гвинея. В кластер №3 вошли страны со средним уровнем жизни, а все остальные страны вошли в кластер №1. Следует заметить, что по первому методу в кластер №3 вошли только Габон и Маврикий, а по второму методу к этим двум странам добавились Алжир, Египет, Ливия, Тунис, Ангола, Ботсвана, Намибия, ЮАР и Свазиленд. Данное различие объясняется тем, что иерархический метод «не любит» принудительного назначения количества кластеров. В действительности предварительный анализ, проведенный иерархическим методом показал, что оптимальное количество кластеров должно равняться семи.
Литература
1. Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS: Учеб. пособие / Под. ред. . – М.: Вузовский учебник, 2014. – 310 с.
CLASSIFICATION OF AFRICAN COUNTRIES BASED ON A SET OF SOCIO-ECONOMIC INDICATORS USING CLUSTER ANALYSIS
S. I. Matyushenko, Notsile Dube
Peoples’ Friendship University, Moscow, Russia
Using cluster analysis, the classification of African countries based on a set of socio-economic indicators, was conducted. This set of indicators includes: population and population density, degree of urbanization, average life expectancy, average number of children per family, infant mortality and gross domestic product per capita. All data was obtained from end of 2015.
Keywords: African countries, socio-economic indicators, cluster analysis, hierarchical clustering, k-means clustering.


