На правах рукописи

МНОГОКОМПОНЕНТНЫЕ МОДЕЛИ И АЛГОРИТМЫ АНАЛИЗА АНОМАЛЬНЫХ ГЕОФИЗИЧЕСКИХ СИГНАЛОВ

Специальность: 05.13.18 – математическое моделирование, численные

методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

доктора технических наук

Санкт-Петербург - 2009

Работа выполнена в Институте космофизических исследований и распространения радиоволн

Дальневосточное отделение Российской Академии наук (ИКИР ДВО РАН)

Официальные оппоненты:

доктор технических наук, профессор

доктор технических наук, профессор

доктор технических наук, профессор

Ведущая организация – ОАО "Концерн "Океанприбор"

Защита диссертации состоится "__" ______ 2009 г. в часов на заседании совета по защите докторских и кандидатских диссертаций Д 212.238.01 Санкт-Петербургского государственного электротехнического университета "ЛЭТИ" имени (Ленина) Санкт-Петербург, .

С диссертацией можно ознакомиться в библиотеке университета.

Автореферат разослан "__" _________ 2009 г.

Ученый секретарь совета

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Настоящая работа посвящена разработке математических моделей для аналитического описания природных сигналов со сложной структурой и построению автоматизированных систем моделирования и прогноза на их основе. Наличие модели природного сигнала, несущего информацию об исследуемом процессе либо явления природы, значительно расширяет возможности их изучения, и позволяет решать задачу предсказания их поведения во времени. Наряду с другими методами исследований, анализ временных рядов систем геофизического мониторинга, регистрирующих вариации геофизических полей, имеет крайне важное значение для решения целого ряда фундаментальных научных задач физики атмосферы, ионосферы, магнитосферы, распространения радиоволн и практических задач обеспечения, в конечном счете, безопасной жизнедеятельности на Земле. На основе прямых экспериментальных данных и на основе соответствующих модельных построений этот подход позволяет получить количественную оценку процессам, формирующимся в той или иной геосфере. Эта тема лежит в общем русле работ фундаментальных научных исследований в области мониторинга и прогнозирования состояния атмосферы, гидросферы и литосферы и технологии снижения риска и уменьшения последствий природных и техногенных катастроф.

НЕ нашли? Не то? Что вы ищете?

Состояние среды является суперпозицией очень большого количества взаимодействий между различными процессами и перед исследователем стоит задача найти способ уменьшить размерность системы и выявить структурные компоненты, наиболее полно описывающие исследуемый природный процесс. В настоящее время наблюдается рост сети станций регистрации геофизических сигналов и вследствие чего возникновение больших массивов статистических данных, развиваются методы их анализа. Это позволяет на принципиально новом уровне решить данную проблему.

В диссертации в первую очередь рассматривается класс задач, связанных с обнаружением и классификацией аномальных эффектов в сигналах регистрации геофизических параметров. Аномальное поведение регистрируемых сигналов может содержать резкие всплески, сопровождаться серией пиков, иметь ступенеобразный вид. Относительная величина и временная протяженность таких аномалий зависит от многих факторов. Эти аномальные особенности содержат полезную информацию об изучаемом процессе и должны быть отображены в модели. Сложная структура возникновения аномалии, а также наличие мешающих факторов различной природы делают невозможным непосредственное применение к ним существующих регрессионных и других статистических моделей временных рядов. Естественным и наиболее эффективным способом представления таких сигналов является построение нелинейных адаптивных аппроксимирующих схем на основе экстраполирующих фильтров. Инструментом, позволяющим реализовать такую процедуру для сигналов с подобными особенностями, является вейвлет-преобразование. В настоящее время ведутся интенсивные исследования по применению этого метода в различных прикладных задачах, связанных с анализом сложных сигналов, возникающих в физике, медицине, финансовом анализе
и др. областях. Несмотря на то, что данный метод в последнее время имеет распространение при обработке сигналов в геофизике, общей теории по применению этого аппарата в анализе регистрируемых природных сигналов нет. Данная диссертация восполняет ряд пробелов в этой области. Вейвлет-преобразование в работе является инструментом, лежащим в основе построения моделей сигналов со сложной структурой. Расширяя область традиционных методов моделирования, в диссертационной работе введены математические конструкции, позволяющие построить адаптивную многокомпонентную модель сигнала с учетом внутренней структуры исходных данных и выполнить отображение как характерных, так и изолированных особенностей его структуры. Это играет важную роль в задачах анализа сложных природных сигналов в геофизике, физике, геоэкологии и др. областях. Способы идентификации предложенных моделей основаны на совместном применении моделей авторегрессии-проинтегрированного скользящего среднего и методов нейронных сетей с вейвлет-преобразованием.

Цель работы заключается в разработке математических моделей для аналитического описания природных сигналов со сложной структурой, включающей локальные особенности различной формы и временной протяженности. Сигналы с такими особенностями имеют место в геофизике, физике, медицине, теории управления, финансовом анализе и др. областях.

Проведенные в работе исследования привели к созданию класса моделей, в основе которых лежит математическая конструкция, названная многокомпонентной моделью временного ряда, представляющая исходный временной ряд в виде разномасштабных компонент с различной формой и временной протяженностью. На основе данной конструкции построена общая теория построения модели временного ряда со сложной структурой. Разработаны методы идентификации и оценки моделей, описаны их свойства. Также разработан комплекс методов и алгоритмов обработки данных, основанный на предложенных моделях и служащий теоретической базой для построения автоматизированных систем анализа статистических данных и выполнения прогноза.

При этом решены следующие задачи:

1.  Разработана новая математическая конструкция – многокомпонентная модель временного ряда (ММВР), позволяющая идентифицировать локальные особенности различной формы и временной протяженности в структуре сложного сигнала.

2.  Разработаны способы идентификации ММВР для сигналов со сложной структурой, обеспечивающие выделение существенных компонентов структуры сигнала и эффективное вейвлетное подавление шума.

3.  Разработаны методы оценки параметров ММВР, основанные на совмещении методов авторегрессии-проинтегрированного скользящего среднего (АРПСС) и методов нейронных сетей с вейвлет-преобразованием.

4.  Разработаны численные методы и алгоритмы выявления и классификации изолированных особенностей в структуре сигнала и идентификации устойчивых характеристик временного ряда

5.  Построенный аппарат применен к исследованию геофизических сигналов с широким спектром флуктуаций различных масштабов.

6.  Предложено использование построенного аппарата для оценки плотности распределения случайной величины.

7.  Разработано программное обеспечение для автоматического обнаружения и классификации локальных аномальных особенностей в геофизических сигналах на базе ПЭВМ.

Методы исследований. В развитых автором подходах использовались классические работы по теории вейвлетов, опубликованные на рубеже 90х S. Mallat, L. K. Meyer, D. J. Lemarie, I. Daubechies, R. R. Chui и др., работы отечественных авторов, работы Donoho D. по минимаксным оценкам сигнала в смеси с шумом. В диссертационной работе также использовался аппарат теории случайных процессов, теории цифровой обработки сигналов, теории распознавания образов, теории построения математических моделей, методы вычислительной математики, основы функционального анализа. С целью проверки эффективности новых результатов и синтезируемых на их основе алгоритмов обработки данных, в среде МАТЛАБ выполнялись расчеты, и проводилось математическое моделирование с использованием реальных и модельных сигналов.

Научная новизна состоит в создании и исследовании класса моделей природных сигналов со сложной структурой, в основе которого лежит многокомпонентная модель временного ряда, представляющая исходный сигнал в виде разномасштабных компонент с различной формой и временной протяженностью, в частности:

На основе нелинейных аппроксимирующих схем разработаны методы идентификации структурных компонентов природного сигнала, содержащего изолированные особенности различной формы и временной протяженности. В качестве пространства-образа сигнала определено пространство вейвлет-коэффициентов, обеспечивающее отображение разномасштабных структурных компонентов сигнала в элементы модели. В качестве базовых конструкций, используемых для построения отображения, определены кратномасштабный анализ и вейвлет-пакеты.

2.  Разработаны методы выделения устойчивых характеристик структуры сигнала и изолированных особенностей.

3.  Разработаны численные методы и алгоритмы построения наилучшей аппроксимирующей схемы сложного природного сигнала, обеспечивающие выделение существенных компонентов структуры сигнала и эффективное вейвлетное подавление шума.

4.  Предложен способ оценки многокомпонентной модели временного ряда на основе минимаксного подхода, разработаны способы диагностики и оптимизации модели.

5.  Разработаны два способа оценки параметров модели сигнала: первый основан на совмещении методов АРПСС и вейвлет-преобразования – позволяет выполнить оценку параметров модели в случае, когда компоненты сигнала имеют линейную структуру; второй базируется на совмещении методов нейронных сетей и вейвлет-преобразования – позволяет построить аппроксимирующую функцию частного вида на дискретном множестве значений в случае, когда структура компонент сигнала существенно нелинейная.

А также:

1.  На основе построенной аппроксимирующей схемы сигнала разработана техника идентификации характерных элементов структуры сигнала и выделения редковстречающихся особенностей.

2.  Разработаны способы классификации выделенных локальных особенностей в структуре сигнала.

3.  Впервые предложен метод оценки плотности распределения случайной величины на основе вейвлет-преобразования.

Научная и практическая ценность работы заключается в том, что:

1.  созданы теоретические основы построения моделей сложных природных сигналов, содержащих локальные особенности различной формы и временной протяженности;

2.  разработаны конкретные модели природных сигналов;

3.  предложенный автором метод выделения изолированных особенностей в структуре сигнала стал заметным вкладом в компьютерные методы анализа сложных геофизических сигналов, применяемые в различных лабораториях;

4.  разработанные автором способы классификации локальных особенностей в структуре сигнала используются в программном обеспечении по обработке данных регистрации подпочвенного радона и сигнала критической частоты f0F2;

5.  на основе предложенных автором алгоритмов автоматического обнаружения изменения параметров модели построены системы по обработке ионосферных данных;

6.  разработанный автором метод оценки плотности распределения случайной величины на основе вейвлет-преобразования нашел применение в обработке данных регистрации сейсмического каталога и позволил выявить аномальные изменения в распределении сейсмических событий по глубине накануне сильных землетрясений на Камчатке;

7.  проведены экспериментальные исследования разработанных методов и алгоритмов на реальных и модельных сигналах, подтвердившие их эффективность при обработке сигналов со сложной структурой;

8.  разработанные методы значительно расширяют область применения традиционных методов анализа сложных сигналов, они позволяют идентифицировать те особенности структуры сигнала, которые не попадают в область этих методов, и могут быть использованы для широкого круга задач, в которых необходим анализ сигналов со сложной структурой.

Результаты научных исследований, выполненные автором и представленные в пунктах 1-5, включены в важные научные достижения ДВО РАН в период 2005 – 2007 гг.

Научные положения, выносимые на защиту:

1. Теоретические и методические основы построения многокомпонентной модели сложного природного сигнала, содержащего изолированные особенности различной формы и временной протяженности.

2. Численный метод построения наилучшей аппроксимирующей схемы сложного сигнала, лежащий в основе построения многокомпонентной модели.

3. Способ оценки параметров многокомпонентной модели сигнала на основе совмещения конструкции вейвлет-преобразования и регрессионных методов.

4. Способ оценки параметров многокомпонентной модели на основе совмещения конструкции вейвлет-преобразования и методов нейронных сетей.

5. Численные методы и алгоритмы классификации выделенных изолированных особенностей в структуре сложного сигнала.

6. Методики идентификации моделей природных сигналов применительно к задаче выделения и классификации аномальных особенностей в их структуре.

7. Метод оценки плотности распределения случайной величины на основе вейвлет-преобразования.

Внедрение результатов работы.

Работа выполнялась в рамках:

1.  Договора о научно-техническом сотрудничестве между Институтом вулканической геологии и геохимии ДВО РАН с одной стороны, Камчатским государственным техническим университетом, с другой стороны, и Санкт-Петербургским государственным электротехническим университетом, с третьей стороны по теме “Разработка алгоритмов и методов выделения средне и краткосрочных предвестников сильных землетрясений Петропавловск-Камчатского геодинамического полигона по данным геохимического мониторинга”. Тематика работы связана с программой ГНТП №16 «Безопасность населения и народно-хозяйственных объектов с учетом риска возникновения природных и техногенных катастроф», программа Президиума РАН «Изменение окружающей среды и климата: природные катастрофы».

2.  Договора о научно-техническом сотрудничестве между Институтом космофизических исследований и распространения радиоволн ДВО РАН с одной стороны и Санкт-Петербургским государственным электротехническим университетом, с другой стороны. Тематика работы связана с программами фундаментальных исследований Президиума РАН и находятся на пересечении трех направлений: научная программа № 18 «Теплофизика и механика интенсивных энергетических воздействий» в части «Солнечный ветер: генерация и взаимодействие с Землей и другими планетами», научная программа № 13 «Изменение окружающей среды и климата: природные катастрофы» и программа №30 «Солнечная активность и физические процессы в системе Солнце-Земля».

Работа была поддержана грантом РФФИ № «Выявление среднесрочных и краткосрочных предвестниковых аномалий перед сильными землетрясениями южной Камчатки с М>6 в вариациях динамики подпочвенного радона, водорода и пространственно – временных характеристик сейсмичности», грантом РФФИ для студентов, аспирантов и молодых ученых №а, грантом ДВО РАН №05-3-В-02-76 «Исследование механизмов ионосферного и литосферного взаимодействия», грантом ДВО РАН №06-3-В-02-059 «Исследование механизмов формирования вероятностной структуры распределения сейсмических событий на основе статистической модели сейсмического режима Камчатского региона».

Научные результаты и разработанное программное обеспечение внедрены в лаборатории ИКИР ДВО РАН, г. П.-Камчатский, а также используются в учебном процессе при проведении лабораторных и курсовых работ по курсу «Системы цифровой обработки сигналов», «Моделирование систем» для студентов специальностей «Управление и информатика в технических системах» и «Программное обеспечение вычислительной техники и автоматизированных систем» в КамчатГТУ.

Апробация полученных результатов. Основные положения и результаты работы докладывались и обсуждались на научно-технических конференциях КамчатГТУ в гг.; на Всероссийской научной конференции "Проектирование научных и инженерных приложений в среде Matlab".- Москва: ИПУ РАН 2002г; на Международной научно-практической конференции “Рыбохозяйственное образование Камчатки в XXI веке”. - Петропавловск-Камчатский, 15-16 октября 2002 г.; на Международной конференции по мягким вычислениям и измерениям, - С.-Петербург, 2003, г. г.; на III международной конференции «Солнечно-земные связи и электромагнитные предвестники землетрясений», - П.-Камчатский, 2004г.; на IV международном совещании «Солнечно-земные связи и предвестники землетрясений», с. Паратунка, Камчатский р-он, 2007г.; на 8ой международной конференции «Pattern recognition and image analysis: new information technologies», Йошкар-Ола, 2007г.; на 10ой международной научной конференции «Проблемы эволюции открытых систем», Казахстан, Алматы, 2008г.; на 5ой научной конференции «Управление и информационные технологии», (УИТ-2008), Санкт-Петербург, 2008г.

Материалы диссертации докладывались на семинарах в институте вулканической геологии и геохимии ДВО РАН (П.-Камчатский); институте космофизических исследований и распространения радиоволн ДВО РАН (П.-Камчатский).

Публикации. По теме диссертации опубликовано 37 печатных работ, из них - 17 статей (9 статей, рекомендованных в Перечне ВАК Минобрнауки России), 18 докладов на международных и всероссийских научно-технических конференциях и 2 монографии. 2 статьи, определенные ВАК, находятся в печати.

Структура и объем диссертации. Диссертация состоит из введения, шести глав, заключения и списка литературы, включающего 134 наименования и 3 приложения. Основная часть работы изложена на 270 страницах машинописного текста и содержит 91 рисунок и 18 таблиц.

СОДЕРЖАНИЕ И ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Во введении показана и обоснована актуальность работы, сформулированы основные цели и задачи, научная новизна и практическая ценность диссертационной работы.

Первая глава посвящена анализу основных подходов к построению модели временного ряда и постановке задачи. Приведены традиционные стохастические методы с указанием имеющихся недостатков и рассмотрен способ построения модели временного ряда с использованием нейронных сетей. Выполнен анализ современных методов аппроксимации сигналов, основанных на разложении функции по базису. Приводятся аргументы в пользу того, что нелинейные аппроксимирующие схемы в базисе вейвлетов является наиболее эффективным методом, позволяющим решить поставленную задачу. Введена новая математическая конструкция – многокомпонентная модель временного ряда, позволяющая выявить и исследовать те особенности структуры данных, которые не попадают в область традиционных методов.

Предметом исследований являются природные сигналы, которые содержат изолированные аномальные особенности различной формы и временной протяженности, возникающие в случайные моменты времени. Примером являются сигналы регистрации геофизических параметров, которые включают в себя различного характера аномальные эффекты, возникающие накануне сейсмических явлений, связанные с активностью Солнца и другими процессами различной природы. Время появления и интенсивность этих аномалий является полезной для исследователей информацией. Выделение аномалий в вариациях геопараметров является сложной задачей и сталкивается с серьезными трудностями. Это связано с большим разнообразием и достаточно сложной формой аномалий и с отсутствием адекватных математических моделей. Анализ основных подходов к построению модели геофизических данных показывает, что традиционно для решения данной задачи применяют процедуру сглаживания, которая позволяет отфильтровать шум и выделить регулярную составляющую. Причем регулярная составляющая рассматривается двух видов: либо тренд, либо сезонная составляющая. В случае отсутствия теоретических обоснований предположения о том, что поведение данных описывается некоторым полиномом, модель тренда теряет смысл. В области экстраполяции доверительные границы для построения оценки быстро расходятся и довольно сильно отклоняются от найденного полинома. Популярным методом анализа временных рядов также является метод авторегрессии-проинтегрированного скользящего среднего. Практика подтвердила его мощность и гибкость при решении многих прикладных задач. Но он тоже имеет ограничения как на возможность его использования для отдельных временных рядов, так и на выявляемые при этом закономерности. Допущение, что временной ряд может быть описан линейным стохастическим дифференциальным уравнением, не позволяет учитывать некоторые характеристики структуры данных, и влечет потерю и искажение важной информации. Недостатком перечисленных методов, по отношению к решаемой задаче, также является предположение, что сигналы имеют нормальное распределение, которое не всегда оправдано. Методы оценки параметров модели, а также ее диагностика и оптимизация полностью базируются на этом предположении, что автоматически исключает возможность отображения в модели изолированных локальных особенностей и делает непосредственное применение перечисленных методов неэффективным для решения поставленной задачи. Получающие развитие в настоящее время современные методы обработки сигналов, такие как вейвлет-преобразование и методы нейронных сетей, хотя и позволяют частично справиться с данной проблемой, но отсутствие общей теории по их применению для природных сигналов с подобными особенностями не дает возможность в полной мере использовать их аппарат.

Предложено представление сигнала в виде разномасштабных компонент с различной структурой:

. (1)

Когда коэффициенты коррелируют между собой, вывод о том, какие аппроксимирующие функции использовать, сделать достаточно трудно. Естественным путем решения является представление сигнала в виде ортонормированных компонент:

,. (2)

Поскольку функции в (1) имеют разную структуру, подверженную изменению в случайные моменты времени, наиболее эффективным способом их идентификации является применение методов аппроксимации, основанных на разложении функции по базису:

(3)

где, – базисные функции пространства .

С целью возможности построения моделей, адаптирующихся к структуре сигнала, автором предложено использовать здесь нелинейные аппроксимирующие схемы. В этом случае приближение выполняется M векторами, зависящими от структуры сигнала:

, (4)

где - множество индексов, определяемое свойствами функции .

Конструкция (1) с учетом свойств названа многокомпонентной моделью временного ряда.

Учитывая локальный характер анализируемых особенностей, их разномасштабность и разнообразие по форме, наиболее подходящим пространством для их представления является пространство, натянутое на базис смещенных функций или вейвлет-базис. Вейвлет-коэффициенты

, – ортонормированный вейвлет-базис,

рассматриваются как результат отображения в пространство с разрешением .

Предложенный подход к построению модели временного ряда со сложной структурой и использование вейвлет-преобразования в качестве метода идентификации его структурных компонентов предоставляет широкие возможности в задачах анализа природных сигналов. Некоторые общие вопросы и методы построения моделей природных сигналов на основе нелинейных аппроксимирующих схем в вейвлет-базисе подробно рассмотрены в монографиях [20, 31].

Задача исследования состоит в разработке

1.  теоретических и методических основ построения многокомпонентной модели сложного природного сигнала;

2.  численных методов и алгоритмов построения аппроксимирующей функции для сигнала с описанной структурой на основе нелинейной аппроксимирующей схемы в базисе вейвлетов;

3.  методов оценки модели;

4.  алгоритмов автоматического обнаружения изменения параметров модели применительно к задаче обнаружения аномального поведения геофизических компонентов;

5.  методов и алгоритмов классификации выделенных аномальных особенностей;

6.  методик построения модели природного сигнала на основе разработанного аппарата.

Во второй главе, основываясь на понятиях вейвлет-преобразования, автор определяет в качестве базовых конструкций, используемых для построения многокомпонентной модели сигнала - кратномасштабный анализ (КМА) и вейвлет-пакеты (ВП). Предложены критерии выбора базиса, обеспечивающие построение наилучшей аппроксимирующей схемы (НАС) сигнала, лежащей в основе построения многокомпонентной модели и обеспечивающей выделение существенных компонентов структуры сигнала. Разработаны способы идентификации устойчивых характеристик структуры сигнала и изолированных особенностей. Разработаны численные методы и алгоритмы построения НАС сигнала. Предложены методы диагностики и оптимизации полученной аппроксимирующей схемы сигнала.

В утверждении 1 диссертационной работы доказано, что конструкция дискретного вейвлет-преобразования (ДВП), осуществляет разложение функции на ортогональные компоненты и обеспечивает выполнение условия (2) ММВР, при условии, что , где - коэффициенты вейвлет-разложения.

Случайный сигнал представляет зависимость

,

где - истинное значение измеряемой величины, - ошибки измерений.

Вейвлет-образ случайной функции определен как

,, – базисный вейвлет.

Показано, что компоненты модели (1) в пространстве вейвлет-образов имеют вид

.

тогда вейвлет-образ функции определяется как

,

где .

Используя утверждение 1, доказано, структурные компоненты сигнала с шумом, принадлежащего пространству с разрешением

,

отображаются в компоненты ММВР вида

, где ,

Показано, на основе процедуры КМА, случайный сигнал в пространстве вейвлет-образов может быть представлен в виде:

, (5)

где , , , – белый шум, , , .

Каждая компонента (5) единственным образом определяется последовательностями коэффициентов , и : , и .

Этот способ идентификации компонентов модели (1) назван в работе конструкцией 1-го типа.

Конструкция 1-го типа построена на предположении, что полезная информация о сигнале находится в низкочастотной его составляющей. В случае необходимости идентификации различных типов частотно-временных структур более эффективным методом является конструкция вейвлет-пакетов (ВП).

В работе показано, аналогично конструкции 1-го типа, процедура разложения сигнала по базисам ВП позволяет идентифицировать компоненты ММВР. На основе конструкции ВП случайный сигнал имеет представление:

, (6)

где , , – пространства вейвлет-пакета.

Каждая компонента (6) единственным образом определяется последовательностями коэффициентов , и : , и .

Эта процедура идентификации компонентов ММВР названа в работе конструкцией 2-го типа.

Методы выделения изолированных особенностей в структуре сигнала построены на основе теоремы Жаффара. Используя эту теорему, в работе доказано утверждение 2:

Для случайной функции , имеющей вид (6), при уменьшении масштаба абсолютные значения коэффициентов , определяющих компоненту , являются малыми за исключением окрестностей, содержащих изолированные особенности структуры сигнала.

Постепенное уменьшение масштабного параметра позволяет фокусироваться на локальных структурах сложного сигнала и исследовать его структуру. Для каждого компонента дает локализованную частотно-временную информацию об в -й октаве (частотном диапазоне).

Метод выделения устойчивых характеристик в структуре случайного сигнала базируется на анализе компоненты . Скалярные произведения функции с функциями эквивалентны выполнению операции свертки с фильтром высоких частот. Когда функция имеет нулевых моментов и , то для вблизи

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4