Т. Б. МАРТЫНЮК, Л. М. КУПЕРШТЕЙН, А. Г. БУДА,
А. В. КОЖЕМЯКО, В. В. ХОМЮК

Винницкий национальный технический университет, Украина

Винницкий финансово-экономический университет, Украина

*****@***ru

НОВЫЙ ПОДХОД К ОБРАБОТКЕ ДИСКРИМИНАНТНЫХ

ФУНКЦИЙ В КЛАССИФИКАТОРЕ

БИОМЕДИЦИНСКИХ СИГНАЛОВ

Рассматривается метод обработки по разностным срезам элементов дискриминантных функций (ДФ) в виде матрицы специального вида, что приводит к расширению функциональных возможностей классификатора и позволяет сформировать не только выходной вектор классификации, но и определить ранг каждой ДФ.

Ключевые слова: дискриминантная функция, распознавание образов, классификатор, разностный срез, матрица элементов дискриминантных функций, ранг дискриминантной функции

Введение

Одной из приоритетных областей применения процедуры классификации сигналов является медицинская диагностика [1-3]. При этом для диагностирования заболеваний в медицинской практике широко используется дискриминантный анализ (ДА) [4-6]. Это связано с тем, что применение методов ДА позволяет поставить предварительный диагноз, используя ограниченные статистические описания [4-6]. Вместе с тем, методы линейного ДА фиксируют «грубые» закономерности экспериментальных данных об объекте классификации, поскольку линейные модели адекватны простым геометрическим конфигурациям областей пространства признаков [5, 6]. Кроме того, при предварительном диагностировании желательно определять не только наиболее вероятный вариант заболевания (диагноз), но и ближайший к нему по симптоматике [4, 5].

НЕ нашли? Не то? Что вы ищете?

Приведенное выше позволяет обозначить цель исследования, которая заключается в расширении функциональных возможностей линейного метода ДА за счет нового подхода при обработке элементов дискриминатных функций (ДФ).

Классификатор биомедицинских сигналов

Наиболее известной схемой реализации классификации сигналов с использованием ДФ является схема, построенная на однослойном персептроне и блоке выбора максимума − детекторе максимума (рис. 1) [1].

Рис. 1. Модель процесса классификации с использованием ДФ

Такая схема используется, например, при распознавании биоэлектрических сигналов [6]. В этом случае однослойный персептрон формирует m ДФ вида [1, 6]:

(1)

где wij, qівесовые коэффициенты и пороги классификации соответственно, причем и m – количество классов, n – размерность входного вектора Х.

В результате детектор максимума реализует решающе правило вида [1,7]:

(2)

где С = {C1,, Cm} – множество классов; Р = {р1, …, рm} – выходной вектор классификации.

Таким образом, на выходе классификатора формируется выходной m-мерный вектор Р, в котором единичное значение его элемента pl указывает на принадлежность входного образа в виде n-мерного вектора признаков Х к l-му классу Сl.

В медицинской диагностике значения весовых коэффициентов wij как весов вхождения j-го компонента входного вектора Х в і-й класс Ci могут быть рассчитаны, например, с использованием F-критерия Фишера для отбора информативных симптомов [5], а также известного отношения меж - и внутриклассовой дисперсии, широко применяемого в задачах распознавания [6, 8]. При этом все расчеты значений wij и qі для ДФ gi (X) вида (1) можно выполнить с использованием пакета статистических программ Statistica for Windows [5].

Несмотря на хорошо разработанную методику вычисления и использования ДФ, которые в данном случае представляют собой линейные классификационные функции (ЛКФ), при диагностировании заболеваний предпочтение отдают кластерному анализу по каноническим линейным дискриминантным функциям [5]. Это объясняется, в первую очередь, соотношением объемов необходимых расчетов. В то же время, применив новый подход к обработке элементов ДФ, можно не только обойти необходимость формирования m сумм gi(Х) n слагаемых (wij×хj) с последующим выбором среди них максимальной суммы, но и сформировать ранги этих сумм, что позволит определить ближайшие суммы к максимальной, т. е. ближайшие классы.

Обработка элементов ДФ по разностным срезам

Введем обозначение для элементов ДФ gi(Х) в виде

аij = wij×хj, (3)

что позволит в дальнейшем рассматривать их как элементы матрицы А0 размерностью m´n вида

А0 (4)

строки Аі которой, где , будем рассматривать как массив чисел-слагаемых соответствующей ДФ gi(Х) вида (1).

В этом случае суть классификации n-мерного образа Х заключается в формировании пространства топологических признаков [1,2] таким образом, что каждой строке Аi исходной матрицы А0 (4) необходимо поставить в соответствие элемент рі вектора топологических признаков Р:

(5)

или исходной матрице А0 размерностью m´n поставить в соответствие вектор топологических признаков размерностью m:

. (6)

Соотношение (6) указывает на процесс сжатия входного двумерного пространства данных (матрица А0) в одномерное пространство признаков (вектор Р), что характерно для процесса распознавания образов [1, 2, 9].

В данной работе предлагается новый подход в преобразовании вида (6), который основан на параллельной обработке элементов векторного массива данных [10, 11]. Этот метод в дальнейшем адаптированный и названый методом разностных срезов (РС) использован для создания модели порогового нейрона [12-15].

Использование метода РС в процессе классификации предполагает параллельную обработку по столбцам текущей матрицы Аt ( где N − количество циклов обработки), которые в данном случае рассматриваются как векторные массивы одноименных элементов ДФ gi(Х). Это возможно из-за представления ДФ gi(Х) в виде суммы (1) слагаемых aij вида (3), что позволяет использовать в процессе обработки такие свойства суммы, как коммутативность, дистрибутивность и ассоциативность.

Перед началом обработки вектор Р содержит нулевые элементы рі, а итерационная обработка матрицы Аt, начиная с исходной матрицы А0, в каждом цикле предполагает выполнение трех операций [7]:

а) определение текущего порога обработки в каждом j-м столбце матрицы Аt-1 в виде минимального значащего элемента, т. е.

(7)

б) формирование текущего двумерного РС в виде матрицы , в которой каждый элемент j-го столбца вычисляется следующим образом

(8)

в) формирование упорядоченной матрицы Аt в результате транспозиции (продвижения) вправо к краю всех нулевых элементов в каждой і-й строке матрицы :

. (9)

Перед каждой транспозицией выполняется проверка наличия хотя бы одной нулевой строки

(10)

а также проверка условия обнуления всех строк матрицы

(11)

В первом случае при выполнении условия (10), которое является признаком минимальной суммы элементов і-й строки Аі0 исходной матрицы А0, остается нулевым соответствующий элемент рі вектора классификации Р, а нулевая строка в дальнейшем из обработки исключается.

Во втором случае при выполнении условия (11) для последней нулевой строки матрицы формируется соответствующий единичный элемент рl , т. е.

(12)

Особенностью обработки двумерного массива Аt по РС является то, что она позволяет одновременно с формированием выходного вектора классификации Р сформировать и вектор рангов R. В этом случае всем элементам ri вектора рангов R перед началом обработки элементов матрицы А0 присваивается единичное значение. При выполнении условия (10) в этом случае значения всех элементов вектора рангов R увеличиваются на единицу, кроме элемента ri, соответствующего обнуленной строке .

Последовательность выполнения таких действий приводит к тому, что в последнем N-м цикле обработки после обнуления всех строк текущей матрицы формируется вектор рангов R , элементы которого соответствуют отсортированным строкам А0і исходной матрицы А0, что соответствует, в свою очередь, ранжированию ДФ gi(Х). При этом минимальной ДФ соответствует ранг равный единице, а максимальной ДФ – ранг равный m.

Следовательно, местоположение единичного элемента рl в векторе классификации Р указывает на принадлежность входного образа Х к l-му классу, а местоположение рангов, ближайших по величине к максимальному рангу, указывает на ближайшие классы по отношению к выделенному классу.

Моделирование процесса классификации с обработкой по РС, выполненное в среде Microsoft Visual C++ 6.0, наглядно проиллюстрировало функциональные возможности и целесообразность такого подхода при обработке двумерных массивов данных. Кроме того, в результате имитационного моделирования были построены трехмерные графики временных характеристик для процесса обработки по РС элементов матриц, в которых показана зависимость количества циклов обработки от размерности матрицы и законов распределения элементов в двухмерном массиве (рассмотрены нормальный и равномерный законы).

Выводы

1. Предложенный метод обработки по РС элементов ДФ в виде матрицы специального вида позволяет отказаться от так называемого «выращивания» сумм взвешенных признаков в виде ДФ с последующим выбором среди них максимальной ДФ, а приступить к определению максимальной ДФ на уровне обработки сформированных взвешенных признаков входного образа.

2. Кроме того, данный метод позволяет сформировать не только выходной вектор классификации, но и вектор рангов ДФ, что значительно облегчит и сделает эффективнее диагностику заболеваний врачом.

Список литературы

1.  Нейронные сети для обработки информации./ Пер. с польск.
. М.: Финансы и статистика, 2002.

2.  Нейронные сети: полный курс. /Пер. с англ. М.: . Д. Вильямс». 2006.

3.  Нейронные сети в медицине // Открытые системы. 1997. №4. С. 34-37.

4.  Рангайян биомедицинских сигналов. Практический подход. Пер. с англ. . М.: ФИЗМАТЛИТ, 2007.

5.  , Григорьев -статистическая обработка данных медицинских исследований. СПб.: ВМедА, 2002.

6.  , Сушкова биоэлектрических сигналов // Зарубежная радиоэлектроника, 1996. №12. С. 47-51.

7.  , , Куперштейн биомедицинских сигналов // Искусственный интеллект, 2010. №3. С.88-95.

8.  , Скрипкин распознавания. 3-е изд. М.: Высшая школа, 1989.

9.  , Куссуль аппроксимация метода динамического программирования на основе классификатора с преобразованием входного пространства // Управляющие системы и машины, 2001. №1. С. 52-57.

10.Timchenko L., Grudin M., Martynyuk T., Kozhemyako A. Parallel Transformation // Управляющие системы и машины, 1998. №5. С.93-95.

11., , Загоруйко к организации многоуровневой схемы систолических вычислений // Электронное моделирование, 1998. Т.20. №5. С. 33-42.

12.Мартынюк порогового нейрона на основе параллельной обработки по разностным срезам // Кибернетика и системный анализ, 2005. №4. С. 78-89.

13., , Куперштейн реализация модели формального нейрона // Электронное моделирование, 2010. Т.32. №4. С. 35-47.

14., Хомюк массивов данных по разностным срезам // Кибернетика и системный анализ, 2011. №6. С.132-137.

15.Мартынюк А. В., Хомюк систолических массивов для обработки векторных данных по разностным срезам // Управляющие системы и машины, 2009. №5. С. 46-55.