АЛГОРИТМ ПОСТРОЕНИЯ ИЕРАРХИЧЕСКОГО НЕЙРОСЕТЕВОГО КОМПЛЕКСА ДЛЯ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ
И ЕГО ПРИМЕНЕНИЕ ПРИ ИССЛЕДОВАНИИ
СОЛНЕЧНО-ЗЕМНЫХ СВЯЗЕЙ1
2, 2, 2, 2
2 НИИ ядерной физики им. МГУ им. ,
119991, Москва, Ленинские горы, стр.2, НИИЯФ МГУ, *****@***sinp. msu. ru
В работе представлен алгоритм построения иерархического нейросетевого комплекса для анализа временных рядов. На первом уровне комплекса используется специализированный комитет искусственных нейронных сетей (ИНС), обучаемых на различных участках временного ряда. На втором уровне используется обобщающая ИНС, которая обучается прогнозировать итоговую вероятность события или непрерывное значение на основе локальных оценок, полученных комитетом. Такой подход позволил прогнозировать событие или непрерывную величину, а также автоматически определять и учитывать задержку между явлением-предвестником и событием. Алгоритм применен при исследовании солнечно-земных связей.
Введение
Задача анализа временных рядов представляет собой весьма актуальную проблему в различных областях науки и техники [1, 2]. В частности, задачей такого типа является прогнозирование бинарных событий или непрерывных значений временного ряда. При этом во многих задачах заданы лишь допустимые интервалы изменения задержки между прогнозируемым событием (или значением) и "явлением" - комбинацией признаков, вызывающей событие или предшествующей ему. Тем самым, необходим поиск корреляционных связей, причём он должен вестись в достаточно широком временном диапазоне. Другим осложняющим обстоятельством является невозможность воздействовать на объект исследования, т. е. варьировать входные условия и регистрировать соответствующий отклик. В качестве примера можно назвать задачу прогнозирования т. н. космической погоды и связанный с ней анализ влияния разных солнечных явлений на развитие геомагнитных бурь. Одной из задач этого ряда является прогнозирование параметров солнечного ветра (СВ) на околоземной орбите путем поиска тех явлений на Солнце, которые могут влиять на формирование потоков СВ. В настоящее время для прогнозирования параметров СВ в основном используются эмпирические модели [3], которые основаны на частичном понимании физических процессов, происходящих на Солнце. Детали формирования потоков СВ весьма сложны и являются предметом многих современных исследований [4]. Однако за многолетнюю историю наблюдений Солнца накоплено большое количество фактических данных, полученных со спутников и наземных обсерваторий. Одним из подходов для решения задач такого рода является применение ИНС. При решении сложных задач анализа многомерных временных рядов зачастую оказывается намного эффективнее использовать нейросетевые комплексы, в которых каждая нейронная сеть (НС) решает отдельную подзадачу, чем использовать одиночную НС. Такой подход разбивает процесс решения всей задачи на последовательность более простых этапов, что позволяет повысить качество прогнозирования и упростить интерпретацию результатов.
Иерархический нейросетевой комплекс для анализа многомерных временных рядов
На первом уровне иерархии используется комитет НС как для решения собственно задачи прогнозирования, так и для определения временного диапазона, в котором следует рассматривать значения входных признаков для осуществления наиболее эффективного прогнозирования. Рассмотрим временной ряд, содержащий значения величины, которую мы хотим прогнозировать. Назовем такую величину искомая величина (ИВ). В качестве входных данных рассмотрим многомерный временной ряд, который описывает изменение во времени значений каких-либо признаков, поведение которых связано с поведением объекта исследования.
Будем предполагать, что на формирование искомой величины влияет некое характерное поведение входных данных в течение некоторого времени, задаваемого из априорных соображений. Назовем такое характерное поведение входных данных явлением, а время, в течение которого оно длится, временем формирования ИВ.
Предположим также, что задан интервал поиска задержки между моментом, на который осуществляется прогнозирование ИВ, и возможным началом явления, влияющего на формирование ИВ. Будем предполагать, что время формирования ИВ много меньше длины интервала поиска.

Рис. 1 Схема алгоритма прогнозирования. Вверху – входные данные (суммарная площадь низкоширотных корональных дыр); внизу – ИВ (скорость солнечного ветра на орбите Земли)
При этом ставятся следующие задачи:
· нахождение внутри интервала поиска границ такого характерного поведения входных данных, которое влияет на формирование ИВ;
· прогнозирование самой ИВ.
Для решения этих задач анализируемый интервал поиска разбивается на перекрывающиеся сегменты длиной, равной времени формирования ИВ (Рис. 1). Для каждого такого сегмента строится отдельная НС, обучающаяся прогнозировать значение ИВ на основе признаков в данном сегменте. Сдвигая интервал поиска по оси времени и применяя набор нейронных сетей к соответствующим сегментам анализируемого ряда, мы можем прогнозировать искомую величину (на рис. 1 – скорость солнечного ветра). Обычно такая параллельная организация модулей называется комитетом или ансамблем, а участники – экспертами. В качестве критерия остановки при обучении НС обычно используется условие достижения минимума средней ошибки на тестовом наборе данных. При применении такого критерия все НС обучаются в течение разного количества эпох, в результате чего не используется дополнительное преимущество, состоящее в том, что НС, входные данные для которых содержат явление, обучаются быстрее. Для повышения контрастности общей картины на выходах НС системы в качестве критерия остановки обучения использовалось условие ‑ достижение максимума дисперсии (соответствующего максимуму энтропии) коэффициентов, характеризующих степень соответствия ответа каждой из нейронных сетей желаемому выходу. В качестве таких коэффициентов могут использоваться линейные коэффициенты корреляции, коэффициенты множественной детерминации (R-квадрат) и др. При применении этого критерия все нейронные сети обучаются параллельно, т. е. в течение одного и того же количества эпох.
По окончании обучения можно сделать вывод о том, что искомое характерное поведение входных данных (явление) наблюдается на участке той НС, которая по результатам обучения обеспечивает наиболее точный прогноз искомой величины.

Рис. 2 Формирование набора входных переменных для обобщающей нейронной сети на основе локальных прогнозов экспертов из комитета
Обычно не одна, а несколько НС из комитета обеспечивают достаточно высокий уровень прогноза, поэтому необходимо учитывать результаты работы нескольких, а иногда даже всех сетей комитета. Достаточно очевидным представляется использование НС для комбинирования ответов экспертов [5]. При этом набор ответов всех сетей из комитета для данного примера рассматривается как его новое представление в промежуточном пространстве признаков, и используется в качестве входных данных для обучения общей НС (рис. 2). В соответствии с этой идеей на втором уровне иерархии используется обобщающая НС (сеть-супервизор), которая обучается прогнозировать итоговое прогнозируемое значение на основе локальных оценок, полученных сетями специализированного комитета ИНС. Можно использовать как ответы всех НС из комитета, так и отбирать ответы только тех сетей, которые на тестовом наборе показали лучшие результаты прогнозирования (рис. 2). В результате работы сети-супервизора мы получаем окончательный прогноз.
Таким образом, модульный подход позволяет представить аппроксимируемую функцию в виде комбинации более простых функций. В результате обучение отдельных модулей проходит быстрее, чем, если бы одна НС обучалась аппроксимировать сложную функцию. Разбиение сложной задачи на набор более простых подзадач позволяет также упростить интерпретацию результатов в смысле анализа свойств, выделенных в скрытом слое конкретного модуля. На втором уровне иерархии с помощью обобщающей сети учитывается вклад каждого из участников комитета в формирование окончательного решения, что повышает качество прогнозирования.
Такой подход позволил прогнозировать непрерывную величину, а также автоматически определять и учитывать задержку между явлением и событием [6].
Результаты решения
задачи классификации
Среднесуточная скорость потоков солнечного ветра (СВ) прогнозировалась с помощью разработанной нейросетевой методики анализа временных рядов на основе информации о площадях корональных дыр (КД) и активных областей (АО), рассчитанных по изображениям, сделанных телескопом EIT/SOHO на длине волны 28,4 нм. [7]. Для обучения НС использовалась также информация об ежедневных значениях среднего магнитного поля на фотосфере, взятая с сайта обсерватории им. Дж. Вилкокса [8].
Для обучения нейронных сетей использовались данные за период с 1999 года по 2003 год, для тестирования - за 2004 год. В качестве экзаменационного набора использовались данные за 2005 год. Интервал поиска был равен 12 суткам, время формирования искомой величины - 3 суткам, а интервал перекрытия был равен 2 суткам. Таким образом одновременно обучались 10 сетей, каждая из которых прогнозировала значения скорости СВ на основе признаков в своем сегменте данных. На вход НС №1 подавались параметры, измеренные на Солнце за 12 - 10 дней до момента прогнозирования, а на вход НС № 10 подавались значения, измеренные за период от 3 дней до 1 дня. Для обучения обобщающей НС использовались локальные оценки, полученные нейронными сетями из комитета с № 4 по № 9. В результате работы обобщающей НС был получен окончательный прогноз на 2 дня вперед который на независимых данных за 2005 год улучшил прогноз лучших сетей из комитета на 12%. Прогноз среднесуточной скорости СВ, полученный обобщающей НС на независимых данных за 2005 год (черная кривая), представлен на рис. 3. Также на Рис. 3 для сравнения представлены измеренные значения скорости солнечного ветра (серая кривая). Рассчитанная на независимых данных за 2005 год величина коэффициента корреляции (КК) между измеренными и прогнозируемыми значениями скорости СВ для лучшей сети из комитета составила 0.53, для обобщающей сети - 0.60.

Рис. 3. Прогноз среднесуточной скорости СВ (черная кривая); измеренные значения скорости СВ (серая кривая)
В периоды, связанные с приходом к Земле периодических потоков СВ из КД, были получены значения КК за месяц, равные 0.65 - 0.75. Небольшое значение КК, равное 0.3, в мае 2005 года связано с тем, что в настоящее время при прогнозировании не учитывается информация о других источниках (предвестниках) активности Солнца, влияющих на формирование потоков СВ.
Предложенный подход может дополнить существующие методики прогноза параметров СВ [6, 9]. Полученные результаты прогнозирования в целом согласуются с общими представлениями о формировании высокоскоростных потоков СВ.
Заключение
Разработан алгоритм построения иерархических нейросетевых комплексов, предназначенный для анализа многомерных временных рядов. Предложенный подход к построению ИНК был успешно применен для решения задачи прогнозирования среднесуточных значений скорости потоков СВ на околоземной орбите на двое суток вперед. Рассчитанное на независимых данных за 2005 год значение КК между измеренными и прогнозируемыми значениями скорости СВ составило 0.6. Установлено, что добавление на второй уровень иерархии обобщающей нейронной сети позволяет улучшить величину КК на независимых данных на 12%. Полученные результаты позволили сделать вывод о работоспособности разработанного иерархического нейросетевого комплекса и перспективности его применения для решения задач прогнозирования.
Список литературы
1. A. B. Geva. ScaleNet - Multiscale Neural Network Architecture for Time Series Prediction // IEEE Trans. Neural Networks. - 1998. - V.9. №.6. - P.1471-1482.
2. A. S. Weigend and N. A. Gershenfeld, eds. Time Series Prediction: Forecasting the Future and Understanding the Past // - 1994. Addison-Wesley. Reading. MA. USA.
3. A. V. Belov, V. N. Obridko, and B. D. Shelting. Correlation between the Near-Earth Solar Wind Parameters and the Source Surface Magnetic Field // Geomagnetism and Aeronomy. - 2006. - V.46. №4. - P.430-437.
4. J. V. Hollweg. Origin of the fast solar wind: from an electron-driven wind to cyclotron resonances // Solar Wind Ten: Proc. of the Tenth Intern. Solar Wind Conf., AIP CP 679, Mellville, New York. - 2003, - P. 14-20.
5. D. Wolpert. Stacked Generalization // Neural Networks. - 1992. - V.5. No.2. - P.241-259.
6. , , . Нейросетевые алгоритмы прогнозирования событий и поиска предвестников в многомерных временных рядах // Нейрокомпьютеры: разработка, применение. - 2005. №1-2. - C.21-28.
7. I. G. Persiantsev, A. Yu. Ryazanov, Ju. S. Shugai. Automatic processing and analysis of sequential images of the sun // Pattern Recognition and Image Analysis. - 2006. - V.16. No.1. - P.29-32.
8. http://wso. stanford. edu/
1. P. Wintoft, H. Lundstedt. Neural network study of mapping from solar magnetic fields to the daily average solar wind velocity // Journal of Geophysical Research. - 1999. - V.104. A4. - P.6729-6736.
9.


