Результаты анализа полученных парных коэффициентов корреляции представим в виде таблицы:

Таблица 1. Парные коэффициенты корреляции между занятостью в культурном секторе и различными показателями социально-экономического развития

Переменная

Значение коэф. корреляции

Значимость на уровне 0,05

Значимость на уровне 0,01

Вывод

Реальный ВВП на душу населения

0,359

+

-

Значимая умеренная положительная взаимосвязь

Государственные расходы на социальную защиту

0,302

-

-

Отсутствие значимой взаимосвязи (уровень значимости = 0,093)

Уровень бедности

-0,409

+

-

Значимая умеренная отрицательная взаимосвязь

Развитие человеческого потенциала (индекс HDI)

0,528

+

+

Значимая сильная положительная взаимосвязь

Инновационная активность (индекс GII)

0,468

+

+

Значимая умеренная положительная взаимосвязь

Процент населения, имеющий доступ к Интернету

0,708

+

+

Значимая сильная положительная взаимосвязь

По полученной таблице видно, что гипотеза о взаимосвязи развития сферы культуры с другими показателями социально-экономического развития в целом подтверждается. Из полученных коэффициентов корреляции незначимым получился только один – между занятостью в сфере культуры и государственными расходами на социальную защиту. Однако важно заметить, что уровень значимости коэффициента = 0,093, и при смене уровня значимости со стандартных 5% на 10%, которые также являются относительно приемлемыми для исследований, гипотеза о значимом отличии от нуля данного коэффициента корреляции также может быть принята.

НЕ нашли? Не то? Что вы ищете?

В остальном же при анализе парных коэффициентов корреляции получаются легко интерпретируемые выводы – чем выше экономические показатели страны (реальный ВВП), чем ниже в ней уровень бедности, чем выше развит человеческий потенциал и чем более открытой для инноваций и модернизации является страна, тем активнее в ней развивается сфера культурных услуг. А так как коэффициент корреляции не показывает направление связи и причинно-следственные отношения между переменными, а показывает только знак и величину данной зависимости, то на данном этапе статистического анализа по крайней мере не отвергается гипотеза о том, что и развитие сферы культуры способно оказывать стимулирующее воздействие на социально-экономическое положение страны.

Однако при анализе парных коэффициентов корреляции видно, что и рассматриваемые показатели социально-экономического развития во многих случаях сильно и значимо связаны между собой. Возникает проблема мультиколлинерности данных, которая может существенно исказить выводы, полученные в ходе статистического анализа. Однако наличие тесной взаимосвязи между рассматриваемыми факторными переменными ожидаемо – в большинстве случаев высокий уровень какого-либо социально-экономического показателя говорит об общей развитости страны. В большинстве случаев ВВП, низкий уровень бедности, высокий уровень образования и распространение высоких технологий тесно связаны. Сильно взаимовлияние рассматриваемых факторов очевидно и, к сожалению, не может быть полностью устранено, так как мультиколлинеарность очевидно будет заложена в любом наборе переменных, характеризующих социально-экономическое развитие.

Далее проведём регрессионный анализ рассматриваемых переменных. Проверим выполнение предпосылок, необходимых для того, чтобы регрессионный анализ данных был применим. В сформированном наборе данных содержится 32 наблюдения (это больше необходимых 30). Все исследуемые переменные количественные. Для того, чтобы построение линейной регрессии было корректным, необходимым условием также является нормальное распределение рассматриваемого показателя. У зависимой переменной (занятость в сфере культуры) среднее, мода и медиана относительно близкие по значению (1,69; 1,7 и 2 соответственно), а коэффициенты асимметрии и эксцесс можно считать стремящимися к нулю (0,217 и 0,49 соответственно). На гистограмме, несмотря на некоторые отличия, в целом видно сходство с нормальной кривой.

Рисунок 2. Гистограмма с выведенной нормальной кривой

Использование одновыборочного критерия Колмогорова-Смирнова говорит о том, что в вероятностью 98% (двухсторонняя асимптотическая значимость=0,98) отклонения от нормального закона распределения можно считать незначительными.

Таким образом, ряд ключевых посылок регрессионного анализа выполняется и можно перейти к построению линейной регрессионной модели. Для моделирования и описания основных закономерностей удобнее всего именно линейная модель, так как она наиболее проста в интерпретации.

При построении регрессии на всех 6 рассматриваемых факторах уравнение регрессии значимо и на уровне значимости 0,05, и 0,01; коэффициент R2 = 0,678 (набор факторных переменных объясняет около 67,8% дисперсии зависимой переменной) и скорректированный R2 = 0,591. Это говорит о том, что рассматриваемые факторы имеют значимое влияние на зависимую переменную и объясняют существенную часть её дисперсии. Однако часть коэффициентов уравнения регрессии незначима. На 5% уровне значимости можно говорить о значимо отличных от нуля коэффициентах только перед такими переменными, как уровень бедности, расходы на социальную защиту, индекс человеческого развития и уровень доступа к Интернету. Коэффициенты перед такими переменными, как ВВП и глобальный инновационный индекс, незначимы на любом из приемлемых уровней. Также возникают проблемы при интерпретации модели - отрицательный коэффициент перед показателем расходов на социальную защиту, а также положительный коэффициент перед переменной уровня бедности не поддаются логическому объяснению. Однако на фоне значимости всего регрессионного уравнения можно сделать вывод о том, что коэффициенты уравнения могут быть сильно искажены из-за отмеченной ранее значительной мультиколлинеарности.

При удалении факторов, которые наиболее тесно связаны с прочими показателями модели, а также имеют наименьшие уровни значимости в исходном регрессионном уравнении (реальный ВВП и глобальный инновационный индекс) качество модели несколько повышается – все коэффициенты перед факторами становятся значимыми, а скорректированный коэффициент R2 повышается с 0,591 до 0,613 при лишь незначительном снижении простого коэффициента R2 (со значения 0,678 до 0,669). Всё уравнение регрессии также остаётся значимым.

Полученное уравнение регрессии имеет вид:

Y^ = -7,64 + 0,33*X1 – 0,95*X2 + 7,638*X3 + 0,41*X4

(2,95) (0,15) (0,267) (3,21) (0,007)

Y - процент работающих в сфере культуры от общего числа занятых

X1 - уровень бедности (процент населения, находящийся на грани бедности)

X2 - государственные расходы на социальную защиту (единица измерения – 10000 евро на душу населения)

X3 - индекс развития человеческого потенциала

X4 - процент населения, имеющий доступ к Интернету

Уравнение регрессии и все его компоненты значимы, однако часть коэффициентов, такие как положительный коэффициент перед уровнем бедности и отрицательный – перед расходами на социальную защиту, по-прежнему сложно поддаётся интерпретации и кажется не согласованной со здравым смыслом. Однако причина этого снова может заключаться в сильной мультиколлинеарности факторов – парные коэффициенты корреляции между всеми четырьмя рассматриваемыми признаками значимы на уровнях значимости 0,05 и 0,01 и составляют не менее 0,6, что говорит об очень сильной взаимосвязи. Таким образом, нарушается одно из основных условий построения корректного регрессионного уравнения – отсутствие взаимосвязи между факторными переменными.

Однако при любых комбинациях факторов при построении регрессионных уравнений значимым и относительно большим остаётся коэффициент перед переменной индекса человеческого потенциала. Регрессионное уравнение, где единственным фактором выступает данная переменная, значимо как в целом, так и по отдельным коэффициентам. Исходя из коэффициента R2 = 0,278 можно сделать вывод о том, что уравнение регрессии, в котором в качестве единственной факторной переменной выступает индекс развития человеческого потенциала, объясняет порядка 27,8% дисперсии зависимой переменной (занятости в сфере культуры).

Регрессионное уравнение, где единственным фактором выступает уровень бедности, также значимо на уровне 0,05 и коэффициент перед переменной уровня бедности значимый и отрицательный, что позволяет сделать вывод о том, что нельзя однозначно отвергнуть изначальное предположение о том, что между развитием области культуры и бедностью существует значительная отрицательная взаимосвязь.

Относительно высокие объясняющие свойства показывает модель, где единственной независимой переменной является процент людей, имеющих доступ к Интернету. Данная модель значима, а коэффициент R2 для неё равен = 0,502 Таким образом по существующим данным не отвергается гипотеза о том, что развитие сферы культуры характерно преимущественно для сильно модернизированных стран с развитой информационной экономикой.

Таким образом видно, что между отдельными переменными существуют сильные и логически интерпретируемые взаимосвязи, однако построение адекватного регрессионного уравнения невозможно из-за неустранимой и сильной мультиколлинеарности факторных переменных.

Для устранения явления мультиколлинеарности прибегнем к методу главных компонент (МГК). Уравнение регрессии, построенное на главных компонентах, не так просто в интерпретации, как линейное регрессионное уравнение, однако при использовании данного метода можно быть уверенным в том, что в модели будет полностью устранено искажающее воздействие взаимосвязи исходных факторов. Одно из ключевых свойств главных компонент состоит в том, что они некоррелированы между собой.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10