Результаты анализа полученных парных коэффициентов корреляции представим в виде таблицы:
Таблица 1. Парные коэффициенты корреляции между занятостью в культурном секторе и различными показателями социально-экономического развития
Переменная | Значение коэф. корреляции | Значимость на уровне 0,05 | Значимость на уровне 0,01 | Вывод |
Реальный ВВП на душу населения | 0,359 | + | - | Значимая умеренная положительная взаимосвязь |
Государственные расходы на социальную защиту | 0,302 | - | - | Отсутствие значимой взаимосвязи (уровень значимости = 0,093) |
Уровень бедности | -0,409 | + | - | Значимая умеренная отрицательная взаимосвязь |
Развитие человеческого потенциала (индекс HDI) | 0,528 | + | + | Значимая сильная положительная взаимосвязь |
Инновационная активность (индекс GII) | 0,468 | + | + | Значимая умеренная положительная взаимосвязь |
Процент населения, имеющий доступ к Интернету | 0,708 | + | + | Значимая сильная положительная взаимосвязь |
По полученной таблице видно, что гипотеза о взаимосвязи развития сферы культуры с другими показателями социально-экономического развития в целом подтверждается. Из полученных коэффициентов корреляции незначимым получился только один – между занятостью в сфере культуры и государственными расходами на социальную защиту. Однако важно заметить, что уровень значимости коэффициента = 0,093, и при смене уровня значимости со стандартных 5% на 10%, которые также являются относительно приемлемыми для исследований, гипотеза о значимом отличии от нуля данного коэффициента корреляции также может быть принята.
В остальном же при анализе парных коэффициентов корреляции получаются легко интерпретируемые выводы – чем выше экономические показатели страны (реальный ВВП), чем ниже в ней уровень бедности, чем выше развит человеческий потенциал и чем более открытой для инноваций и модернизации является страна, тем активнее в ней развивается сфера культурных услуг. А так как коэффициент корреляции не показывает направление связи и причинно-следственные отношения между переменными, а показывает только знак и величину данной зависимости, то на данном этапе статистического анализа по крайней мере не отвергается гипотеза о том, что и развитие сферы культуры способно оказывать стимулирующее воздействие на социально-экономическое положение страны.
Однако при анализе парных коэффициентов корреляции видно, что и рассматриваемые показатели социально-экономического развития во многих случаях сильно и значимо связаны между собой. Возникает проблема мультиколлинерности данных, которая может существенно исказить выводы, полученные в ходе статистического анализа. Однако наличие тесной взаимосвязи между рассматриваемыми факторными переменными ожидаемо – в большинстве случаев высокий уровень какого-либо социально-экономического показателя говорит об общей развитости страны. В большинстве случаев ВВП, низкий уровень бедности, высокий уровень образования и распространение высоких технологий тесно связаны. Сильно взаимовлияние рассматриваемых факторов очевидно и, к сожалению, не может быть полностью устранено, так как мультиколлинеарность очевидно будет заложена в любом наборе переменных, характеризующих социально-экономическое развитие.
Далее проведём регрессионный анализ рассматриваемых переменных. Проверим выполнение предпосылок, необходимых для того, чтобы регрессионный анализ данных был применим. В сформированном наборе данных содержится 32 наблюдения (это больше необходимых 30). Все исследуемые переменные количественные. Для того, чтобы построение линейной регрессии было корректным, необходимым условием также является нормальное распределение рассматриваемого показателя. У зависимой переменной (занятость в сфере культуры) среднее, мода и медиана относительно близкие по значению (1,69; 1,7 и 2 соответственно), а коэффициенты асимметрии и эксцесс можно считать стремящимися к нулю (0,217 и 0,49 соответственно). На гистограмме, несмотря на некоторые отличия, в целом видно сходство с нормальной кривой.

Рисунок 2. Гистограмма с выведенной нормальной кривой
Использование одновыборочного критерия Колмогорова-Смирнова говорит о том, что в вероятностью 98% (двухсторонняя асимптотическая значимость=0,98) отклонения от нормального закона распределения можно считать незначительными.
Таким образом, ряд ключевых посылок регрессионного анализа выполняется и можно перейти к построению линейной регрессионной модели. Для моделирования и описания основных закономерностей удобнее всего именно линейная модель, так как она наиболее проста в интерпретации.
При построении регрессии на всех 6 рассматриваемых факторах уравнение регрессии значимо и на уровне значимости 0,05, и 0,01; коэффициент R2 = 0,678 (набор факторных переменных объясняет около 67,8% дисперсии зависимой переменной) и скорректированный R2 = 0,591. Это говорит о том, что рассматриваемые факторы имеют значимое влияние на зависимую переменную и объясняют существенную часть её дисперсии. Однако часть коэффициентов уравнения регрессии незначима. На 5% уровне значимости можно говорить о значимо отличных от нуля коэффициентах только перед такими переменными, как уровень бедности, расходы на социальную защиту, индекс человеческого развития и уровень доступа к Интернету. Коэффициенты перед такими переменными, как ВВП и глобальный инновационный индекс, незначимы на любом из приемлемых уровней. Также возникают проблемы при интерпретации модели - отрицательный коэффициент перед показателем расходов на социальную защиту, а также положительный коэффициент перед переменной уровня бедности не поддаются логическому объяснению. Однако на фоне значимости всего регрессионного уравнения можно сделать вывод о том, что коэффициенты уравнения могут быть сильно искажены из-за отмеченной ранее значительной мультиколлинеарности.
При удалении факторов, которые наиболее тесно связаны с прочими показателями модели, а также имеют наименьшие уровни значимости в исходном регрессионном уравнении (реальный ВВП и глобальный инновационный индекс) качество модели несколько повышается – все коэффициенты перед факторами становятся значимыми, а скорректированный коэффициент R2 повышается с 0,591 до 0,613 при лишь незначительном снижении простого коэффициента R2 (со значения 0,678 до 0,669). Всё уравнение регрессии также остаётся значимым.
Полученное уравнение регрессии имеет вид:
Y^ = -7,64 + 0,33*X1 – 0,95*X2 + 7,638*X3 + 0,41*X4
(2,95) (0,15) (0,267) (3,21) (0,007)
Y - процент работающих в сфере культуры от общего числа занятых
X1 - уровень бедности (процент населения, находящийся на грани бедности)
X2 - государственные расходы на социальную защиту (единица измерения – 10000 евро на душу населения)
X3 - индекс развития человеческого потенциала
X4 - процент населения, имеющий доступ к Интернету
Уравнение регрессии и все его компоненты значимы, однако часть коэффициентов, такие как положительный коэффициент перед уровнем бедности и отрицательный – перед расходами на социальную защиту, по-прежнему сложно поддаётся интерпретации и кажется не согласованной со здравым смыслом. Однако причина этого снова может заключаться в сильной мультиколлинеарности факторов – парные коэффициенты корреляции между всеми четырьмя рассматриваемыми признаками значимы на уровнях значимости 0,05 и 0,01 и составляют не менее 0,6, что говорит об очень сильной взаимосвязи. Таким образом, нарушается одно из основных условий построения корректного регрессионного уравнения – отсутствие взаимосвязи между факторными переменными.
Однако при любых комбинациях факторов при построении регрессионных уравнений значимым и относительно большим остаётся коэффициент перед переменной индекса человеческого потенциала. Регрессионное уравнение, где единственным фактором выступает данная переменная, значимо как в целом, так и по отдельным коэффициентам. Исходя из коэффициента R2 = 0,278 можно сделать вывод о том, что уравнение регрессии, в котором в качестве единственной факторной переменной выступает индекс развития человеческого потенциала, объясняет порядка 27,8% дисперсии зависимой переменной (занятости в сфере культуры).
Регрессионное уравнение, где единственным фактором выступает уровень бедности, также значимо на уровне 0,05 и коэффициент перед переменной уровня бедности значимый и отрицательный, что позволяет сделать вывод о том, что нельзя однозначно отвергнуть изначальное предположение о том, что между развитием области культуры и бедностью существует значительная отрицательная взаимосвязь.
Относительно высокие объясняющие свойства показывает модель, где единственной независимой переменной является процент людей, имеющих доступ к Интернету. Данная модель значима, а коэффициент R2 для неё равен = 0,502 Таким образом по существующим данным не отвергается гипотеза о том, что развитие сферы культуры характерно преимущественно для сильно модернизированных стран с развитой информационной экономикой.
Таким образом видно, что между отдельными переменными существуют сильные и логически интерпретируемые взаимосвязи, однако построение адекватного регрессионного уравнения невозможно из-за неустранимой и сильной мультиколлинеарности факторных переменных.
Для устранения явления мультиколлинеарности прибегнем к методу главных компонент (МГК). Уравнение регрессии, построенное на главных компонентах, не так просто в интерпретации, как линейное регрессионное уравнение, однако при использовании данного метода можно быть уверенным в том, что в модели будет полностью устранено искажающее воздействие взаимосвязи исходных факторов. Одно из ключевых свойств главных компонент состоит в том, что они некоррелированы между собой.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 |


