Анализ сигналов мозговой активности с использованием символьной регрессии

К. М. СОНЬКИН, Л. А. СТАНКЕВИЧ

Санкт-Петербургский государственный политехнический университет

*****@***ru

АНАЛИЗ СИГНАЛОВ МОЗГОВОЙ АКТИВНОСТИ

С ИСПОЛЬЗОВАНИЕМ СИМВОЛЬНОЙ РЕГРЕССИИ

Рассматривается задача анализа электроэнцефалограмм с целью создания эффективных средств распознавания и категоризации. Реализован метод символьной регрессии на основе генетического программирования, ключевым преимуществом которого является автоматический подбор структуры регрессионной модели. Приведены результаты исследований, показывающие, что точность регрессионных моделей сигналов малой длительности составила в среднем 96 %. Это позволяет увеличить точность нейросетевых средств распознавания сигналов мозговой активности.

Ключевые слова: анализ сигналов ЭЭГ, символьная регрессия, интерфейс мозг-компьютер, нейронные сети

Введение

Системы анализа сигналов мозговой активности человека от неинвазивных источников, полученных в процессе электроэнцефалографии (ЭЭГ), являются основой интенсивно развивающегося междисциплинарного исследования по созданию интерфейса мозг-компьютер (ИМК). ИМК измеряет активность мозга и конвертирует ее в «искусственный выход мозга», который замещает или дополняет естественные выходы, и, соответственно, изменяет последующие взаимодействия между мозгом и окружающей средой [1]. Эта функция ИМК обусловливает его актуальность для людей с ограниченными возможностями, с тяжелыми двигательными нарушениями, а также в контексте развития исследований деятельности головного мозга.

Основными подходами в существующих системах неинвазивного анализа сигналов мозговой активности являются:

- регистрация вызванного потенциала P300 [2]; дальнейшее развитие данного подхода было осуществлено путем дополнительной регистрации негативной волны N1 [3];

- регистрация моторного воображения, представления движения на основе десинхронизации и синхронизации в α- и β-диапазонах;

- визуально вызванные потенциалы, внимание к мелькающему свету [4];

- категоризация паттернов мышления по типам решаемых задач [5].

Подавляющее большинство ИМК, основанных на различных подходах, имеет сходные этапы обработки сигналов ЭЭГ:

1) выделяются участки ЭЭГ в наблюдаемых каналах, на которых ожидается возникновение сигналов с характерными признаками;

2) осуществляется переход к спектральному анализу с помощью преобразования Фурье;

3) применяется нейросетевой подход для распознавания или категоризации паттернов.

Рассмотрим второй этап подробнее. Недостатком спектрального анализа является потеря информации о временной локализации частот и корреляции между характерными событиями во временной области.

Цель данной работы – создать эффективные средства анализа сигналов ЭЭГ, позволяющие решать задачи распознавания и категоризации наблюдаемых паттернов. Для этого предлагается использовать метод символьной регрессии [6], что позволяет, в определенной мере, устранить вышеуказанный недостаток. В результате получается регрессионная модель сигнала ЭЭГ в аналитическом виде, позволяющая осуществлять генерацию характерных признаков с использованием методов классического функционального анализа.

Для оценки эффективности предложенного подхода проведены модельные исследования. При этом в качестве исходных данных использовались записи ЭЭГ, полученные в лаборатории высшей нервной деятельности человека Института высшей нервной деятельности и нейрофизиологии РАН. Участки ЭЭГ записаны во время решения испытуемым когнитивных заданий различных типов.

Метод символьной регрессии

Задача отыскания оптимальной параметрической регрессионной модели является крайне актуальной в области распознавания образов, несмотря на большую историю исследований. Известен метод группового учета аргументов, согласно которому модель, доставляющая наилучшее приближение, отыскивается во множестве последовательно порождаемых моделей. [7]

В предлагаемой работе реализуется метод символьной регрессии. Символьная регрессия – метод построения регрессионных моделей путем перебора произвольных суперпозиций функций из некоторого заданного набора. Для построения суперпозиции функций и поиска оптимальной регрессионной модели используется генетическое программирование. При этом реализуется поиск моделей по итерационной схеме «порождение-выбор» в соответствии с определенными правилами порождения моделей и критерием их выбора. Последовательно порождаются наборы конкурирующих моделей, при этом каждая модель является суперпозицией элементов заданного множества гладких параметрических функций. Из набора выбираются лучшие модели для последующей модификации.

Поставим задачу нахождения символьной регрессионной модели нескольких свободных переменных следующим образом. Пусть имеется n независимых переменных , и одна зависимая переменная . Также задана выборка значений независимых случайных величин :

и вектор соответствующих значений зависимой случайной величины : .

Обозначим за множество входных данных множество .

Также задано множество гладких функций . Функции имеют конечное число аргументов, отличное от нуля. В качестве аргументов функций могут выступать как значения независимых переменных из матрицы , так и значения, являющиеся результатом вычисления другой функции (не обязательно должна быть отлична от g).

НЕ нашли? Не то? Что вы ищете?

Рассмотрим множество всевозможных суперпозиций из не более, чем функций :

Каждый элемент множества является гладкой функцией от вектора независимых переменных: . В общем случае, произвольная функция w может зависеть не от всех компонент вектора независимых переменных х.

Линейная (относительно вектора параметров ) регрессионная модель будет задаваться следующим образом:

где ; – вектор параметров регрессионной модели; – вектор независимых переменных; – вектор, компонентами которого являются суперпозиции гладких функций из множества .

Наконец, определим множество всех регрессионных моделей: .

Зададим функционал невязки регрессионной модели следующим образом:

где – строка матрицы Х значений независимых переменных; – компонента вектора – соответствующее значение зависимой переменной; – вектор оптимальных параметров для линейной регрессионной модели , найденный с помощью метода наименьших квадратов:

Итак, требуется найти такую регрессионную модель , которая доставляет минимум функционалу :

Реализация метода символьной регрессии для сигналов ЭЭГ

Практическая реализация вышеописанного метода выполнена с использованием генетического программирования. Генетическое программирование – модификация классического генетического алгоритма, состоящая в нестационарности длины хромосом, необходимой для описания суперпозиции гладких функций регрессионной модели. Специфика задачи потребовала также модификации стандартных функций рекомбинации и мутации, используемых в генетическом алгоритме.

Поиск оптимальной модели происходит на множестве порождаемых моделей на каждой итерации алгоритма. Перед работой алгоритма задается множество гладких функций , суперпозиции которых будут образовывать хромосомы элементов популяций, и, соответственно, элементы регрессионных моделей. Данное множество крайне важно для сходимости алгоритма и должно включать в себя базисные функции, учитывающие природу сигнала.

На первом шаге алгоритма задается начальный набор конкурирующих моделей , в котором каждая модель есть суперпозиция функций из .

Хромосомы элементов популяций хранят представления суперпозиций гладких функций в виде дерева. В узлах дерева находятся функции , которые входят в данную суперпозицию , на каждом конце дерева может располагаться либо один из компонентов вектора независимых переменных , либо числовая константа .

Далее выполняется последовательность шагов, приведенная ниже:

· вычисление оптимальных параметров каждой регрессионной модели методом наименьших квадратов;

· вычисление минимизируемого функционала невязки для каждой модели;

· сопоставление с условием останова, в случае недостижения последнего формирование следующей популяции (нового множества моделей).

Процесс вычислений останавливается, если выполнено заданное число итераций или достигнуто условие останова - нахождения регрессионной модели с заданным значением функционала невязки.

Генерация очередного множества моделей является ключевым этапом генетического программирования. Он состоит из действий, приведенных ниже.

1. Оператор выбора моделей. Выбор регрессионных моделей для дальнейшего изменения из множества осуществляется с помощью метода турнирной селекции, состоящего из двух этапов:

a) из множества моделей с равной вероятностью выбираются TS моделей: . Каждая модель может попасть в турнир только один раз.

b) Из полученного множества выбирается одна модель с наименьшим значением функционала невязки.

При выборе двух моделей и из множества , они исключаются из старого множества: .

2. Операторы порождения. После выбора двух моделей и из множества , к ним применяются операторы порождения новых моделей. Осуществляется выбор типа оператора порождения из трех возможных: оператор мутации, оператор кроссовера, оператор прямого переноса. Этот выбор осуществляется с заранее заданным распределением вероятности , где – вероятности операторов мутации, кроссовера и прямого переноса соответственно.

Оператор мутации применяется к случайно выбранному компоненту вектора . Выбирается один из реализованных механизмов мутации: мутация поддеревьев, приравнивание выбранной константы к нулю, к единице, замена случайно выбранной в константы на новое случайное значение.

Операторы кроссовера реализуют один из двух механизмов:

- у моделей и из множества выбираются поддеревья для обмена между моделями;

- для моделей и случайным образом выбираются числовые интервалы, в рамках которых происходит обмен группами компонентов между моделями.

После завершения формирования части нового множества моделей посредством применения стохастических операторов порождения моделей, необходимо выполнить копирование без изменений оставшегося числа моделей из множества . Выбор моделей осуществляется на основе анализа двух показателей: функционала оценки качества модели и сложности модели (которая характеризуется количеством узлов в деревьях, которые соответствуют данной модели). Приоритетным является первый показатель, дополнительным (при неопределенности в случае равенства функционалов) – второй.

В результате выполнения вышеописанного алгоритма определяется регрессионная модель, представленная аналитическом виде, доставляющая минимум функционалу невязки.

Результаты экспериментальных исследований

Символьная регрессия паттернов мозговой деятельности. Исследование, проведенное в Институте высшей нервной деятельности и нейрофизиологии РАН, показало, что при осуществлении когнитивной деятельности (решение в уме вербально-логических и пространственно-образных задач) в ЭЭГ человека устанавливаются ритмические паттерны, однозначно сопоставимые с характером мыслительного процесса. Была сформирована гипотеза о том, что вербально-логическое и пространственно-образное мышление имеют характерные ритмические признаки. [5]

Результаты символьной регрессии сигналов ЭЭГ центральных отведений, записанных в процессе решения задач, соответствующих различным типам когнитивной деятельности, приведены на рис. 1 и. 2. Длительность сигнала соответствует полному времени решения задачи.

Рис.1. Сигнал ЭЭГ с наложенным графиком полученной регрессионной модели, записанный при решении вербально-логической задачи

Аналитический вид полученной регрессионной модели сигнала ЭЭГ данного типа:

Рис. 2. Сигнал ЭЭГ с наложенным графиком полученной регрессионной модели, записанный при решении пространственно-образной задачи

Аналитический вид полученной регрессионной модели сигнала ЭЭГ данного типа:

Полученные модели в аналитическом виде делают возможным анализ структуры сигналов с применением методов функционального анализа. Кроме того, существенное снижение количества точек экстремумов, сохранение информации о временной локализации создают необходимые предпосылки для значительного увеличения точности средств категоризации, таких как нейронные сети.

Результатом данного этапа работы стало получение символьных регрессионных моделей, позволяющих выявить характерные признаки различения сигналов ЭЭГ при пространственном и вербально-логическом мышлении как численными, так и аналитическими методами.

Символьная регрессия как метод интерфейса мозг-компьютер. Символьная регрессия коротких участков сигналов ЭЭГ, соответствующих мысленным командам, рассматривается в качестве средства перехода от численных к аналитическим, функциональным методам анализа. Высокая точность полученных регрессионных моделей, составляющая, усреднено по выборке, 96%, позволяет учесть все характерные точки исходного сигнала, а широкий набор средств функционального анализа делает возможным формирование вектора признаков, соответствующего конкретным командам из определенного набора. Таким образом, целостный конструкт ритмов ЭЭГ ставится в соответствие целостному когнитивному процессу – мысленной команде.

Пример построенной регрессионной модели, соответствующей участку сигнала мозговой активности, приведен на рис. 3.

Рис. 3. Регрессионная модель участка сигнала ЭЭГ. Сплошной линией – исходный сигнал, пунктиром – регрессионная модель

Аналитический вид представленной регрессионной модели:

Результатом данного этапа работы стала методика получения символьных регрессионных моделей сигналов мозговой активности, соответствующих различным мысленным командам. Следующим шагом является реализация различения команд из определенного набора с помощью нейронной сети. Перспектива исследования этих моделей заключается в построении интерфейса мозг-компьютер, позволяющего управлять устройствами с помощью мысленных команд в реальном времени.

Заключение

В результате проведенных исследований установлено, что метод символьной регрессии применим для построения регрессионных моделей сигналов электроэнцефалограмм и анализа их во временной области. Ключевым достоинством является автоматический подбор структуры регрессионной модели. Полученные модели в аналитическом виде делают возможным применение методов функционального анализа для их исследования. Это позволяет выявить характерные признаки различения сигналов ЭЭГ при пространственном и вербально-логическом мышлении как численными, так и аналитическими методами.

Особый интерес представляют результаты применения регрессионных моделей для сигналов малой длительности, где точность модели составила в среднем 96%. Это создает необходимые предпосылки для значительного увеличения точности нейросетевых средств распознавания и категоризации сигналов мозговой активности, в частности, в интерфейсе мозг-компьютер, позволяющем управлять устройствами с помощью мысленных команд в реальном времени.

Список литературы

1. Jonathan R. Wolpaw. Brain–computer interfaces as new brain output pathways // J. Physiol, 20P 613–619.

2. Farwell L. A., Donchin E. Taking off the top of your head: toward a mental prosthesis utilizing event-related potentials // Electroencephalogr. Clin. Neurophysiol. 1988. V. 70. P. 510–523.

3. , , . Интерфейс мозг-компьютер на основе волны P300: волна N1 и проблема дистракторов // Материалы XV Междунар. конф. по нейрокибернетике “ICNC-09” (Ростов-на-Дону,сентября, 2009 г.).- Ростов-на-Дону: Изд-во ЮФУ, 2009. Т. 2. С. 30-33.

4. D. Zhu et al A Survey of Stimulation Methods Used in SSVEP-Based BCIs // Computational Intelligence and Neuroscience. 2010.

5. Иваницкий типа решаемой в уме задачи по нескольким секундам ЭЭГ с помощью обучаемого классификатора // Сборник научных трудов VIII Всероссийской научно-технической конференции "Нейроинформатика-2006". М.: МИФИ,2006. Т.3. С.217-224.

6. Поиск параметрической регрессионной модели в индуктивно заданном множестве // Журнал вычислительных технологий. 2007. № 1. С. 93-102.

7. Malada H. R., Ivakhnenko A. G. Inductive Learning Algorithms for Complex Systems Modeling // CRC Press, 1994.

Анализ сигналов мозговой активности с использованием символьной регрессии

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы