Магнитогорский государственный технический

университет им. , г. Магнитогорск

КЛАССИФИКАЦИЯ РЕГИОНОВ РОССИИ ПО УРОВНЮ ИНТЕГРАЦИОННОЙ АКТИВНОСТИ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ САМООРГАНИЗУЮЩИХСЯ КАРТ КОХОНЕНА

Ключевые слова: интеграционная активность, классификация, нейросетевые алгоритмы, карты Кохонена

Одним из подходов расширяющим инструментарий кластерного анализа является применение нейросетевых алгоритмов1, построенных на использовании самоорганизующихся карт, опирающихся на механизмы, основанные на ассоциативном правиле Хебба или конкурентном правиле Кохонена, наиболее часто используемом в настоящее время.

Самоорганизующиеся сети Кохонена относятся к методологии visual data mining, позволяющей обнаруживать в больших массивах многомерных данных скрытые свойства и закономерности путем их визуального анализа. Архитектура сети Кохонена представляет собой один входной слой, с числом нейронов равным числу входов, и выходной слой нейронов, организованный в виде топологической карты. Элементы топологической карты располагаются в некотором пространстве, как правило, двумерном.

В основе построения сети Кохонена лежит конкурентное обучение. Рассмотрим набор из m значение полей i-ой записи исходной выборки (n-число классифицируемых объектов) и текущий вектор весов j-го выходного нейрона (k-число выходных нейронов).

В обучении по Кохонену нейрон-победитель и нейроны, которые являются соседями нейрона-победителя, подстраивают свои веса, используя линейную комбинацию входных векторов и текущих векторов весов:

НЕ нашли? Не то? Что вы ищете?

, где

? – коэффициент скорости обучения ().

Согласно Кохонену, коэффициент скорости обучения ? должен быть уменьшающейся функцией от числа итераций (эпох). Поэтому процесс обучения можно разделить на 2 фазы:

    грубая подстройка (v1 эпох) – коэффициент скорости обучения ? велик и веса выходных нейронов корректируются значительно, что позволяет примерно настроить их в соответствии с распределением значений признаков в исходной выборке; точная подстройка (v2 эпох)  – коэффициент скорости обучения ? уменьшается, что позволяет подстраивать веса более точно [1].

Построение сети Кохонена можно представить в виде следующего алгоритма:

    инициализация сети – для выходных нейронов сети устанавливаются начальные веса (как правило, назначаются случайно, если отсутствуют априорные сведения о характере распределения признаков в исходной выборке), коэффициент скорости обучения и радиус обучения (радиус обучения максимален в начале процесса и по мере обучения уменьшается); возбуждение сети – на входной слой подается вектор воздействия ; конкуренция – для каждого выходного нейрона вычисляется расстояние между векторами весов всех нейронов выходного слоя и вектором входного воздействия (как правило, в качестве меры близости двух векторов выбирается евклидово расстояние). Тот нейрон t, для которого расстояние окажется наименьшим становится нейроном-победителем (наблюдение будет приписано t-ому выходному нейрону ); объединение – определяются нейроны, расположенные в пределах радиуса обучения относительно нейрона-победителя; подстройка – производится коррекция весов нейронов согласно выражению (1), расположенных в пределах радиуса обучения. шаги 1-5 выполняются (v1+v2) эпох.

При решении задач классификации в сети Кохонена используется порог доступа. В виду того, что в такой сети уровень активации нейрона есть расстояние от него до входного объекта, порог доступа играет роль максимального расстояния, на котором происходит распознавание.

После того, как сеть обучена распознаванию структуры данных, ее можно использовать как средство визуализации при анализе данных. С помощью частот выигрышей, которые вычисляются для каждого выходного нейрона и показывают сколько раз он выигрывал при обработке обучающих примеров, можно определить, разбивается ли типологическая карта на отдельные кластеры.

В данной работе классификация субъектов РФ по уровню интеграционной активности производилась в Statistica Neural Netwoks путем построения сети Кохонена на предварительно нормированных данных.

Грубая подстройка производилась в течение 100 эпох со скоростью обучения ? от 0,1 до 0,02 и радиусом обучения от 3 до 1; точная подстройка производилась в течение 1000 эпох со скоростью обучения ? от 0,1 до 0,01 и радиусом обучения равным 0. Новые веса нейронов перед обучением инициализировались согласно случайно-нормальному закону распределения.

Входной слой сети Кохонена состоит из 38 нейрона, на которые подаются значения 38 признаков, характеризующих уровень интеграционной активности 61 региона России (при проведении исследования был рассмотрен только 61 субъект РФ, поскольку только в этих субъектах наблюдались завершенные сделки стоимостью не ниже 5 млн. долл.  в 2003-2009гг.).

В результате построения сети Кохонена было выделено 4 кластера, представленных в табл.1.

Таблица 1

Результаты классификации регионов РФ по уровню интеграционной активности на основе сети Кохонена

Кластер

Количество объектов

Регион РФ

S1

1

г. Москва

S2

3

г. Санкт-Петербург, Тюменская область, Ханты-Мансийский автономный округ – Югра.

S3

29

Республики: Башкирия, Мордовия, Татарстан, Удмуртская, Чувашская, Хакасия, Якутия.

Край: Краснодарский, Красноярский.

Области: Московская область, Белгородская, Калужская, Липецкая, Тульская, Ярославская, Ленинградская, Новгородская, Оренбургская, Пензенская, Самарская, Саратовская, Ульяновская, Свердловская, Челябинская, Иркутская, Новосибирская, Томская, Амурская.

Автономные округа: Ямало-ненецкий.

S4

28

Республики: Карелия, Тыва.

Край: Ставропольский, Пермский, Алтайский, Забайкальский, Приморский, Хабаровский.

Области: Брянская, Владимирская, Воронежская, Костромская, Курская, Орловская, Смоленская, Тверская, Архангельская, Вологодская, Калининградская, Псковская, Астраханская, Волгоградская, Ростовская, Нижегородская, Кемеровская, Омская, Тамбовская,

Автономные округа: Чукотский.

Полученные результаты показывают, что данная классификация не противоречит результатам обобщенной ранговой оценки уровня региональной интеграционной активности, полученной автором ранее на основе построения интегрального индикатора.

Проведенный анализ может служить основой для отбора регионов, которым необходимо оказать государственную поддержку, путем реализации взаимосвязанных процедур по активизации интеграционной активности в минимальные сроки и с наибольшей эффективностью.

Список литературы

    Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных/ Под ред. . – 2-е изд., перераб. и доп. – М.: Горячая линия – Телеком, 2008. – 392 с.

1 Искусственная нейронная сеть представляет собой параллельно-распределенную систему нейронов, способную выполнять обработку данных, которая может настраивать свои параметры в ходе обучения на эмпирических данных. Накопленные знания нейронной сети сосредоточены в весах межэлементных связей.