Т. Б. МАРТЫНЮК, Л. М. КУПЕРШТЕЙН, А. Г. БУДА,
А. В. КОЖЕМЯКО, В. В. ХОМЮК
Винницкий национальный технический университет, Украина
Винницкий финансово-экономический университет, Украина
*****@***ru
НОВЫЙ ПОДХОД К ОБРАБОТКЕ ДИСКРИМИНАНТНЫХ
ФУНКЦИЙ В КЛАССИФИКАТОРЕ
БИОМЕДИЦИНСКИХ СИГНАЛОВ
Рассматривается метод обработки по разностным срезам элементов дискриминантных функций (ДФ) в виде матрицы специального вида, что приводит к расширению функциональных возможностей классификатора и позволяет сформировать не только выходной вектор классификации, но и определить ранг каждой ДФ.
Ключевые слова: дискриминантная функция, распознавание образов, классификатор, разностный срез, матрица элементов дискриминантных функций, ранг дискриминантной функции
Введение
Одной из приоритетных областей применения процедуры классификации сигналов является медицинская диагностика [1-3]. При этом для диагностирования заболеваний в медицинской практике широко используется дискриминантный анализ (ДА) [4-6]. Это связано с тем, что применение методов ДА позволяет поставить предварительный диагноз, используя ограниченные статистические описания [4-6]. Вместе с тем, методы линейного ДА фиксируют «грубые» закономерности экспериментальных данных об объекте классификации, поскольку линейные модели адекватны простым геометрическим конфигурациям областей пространства признаков [5, 6]. Кроме того, при предварительном диагностировании желательно определять не только наиболее вероятный вариант заболевания (диагноз), но и ближайший к нему по симптоматике [4, 5].
Приведенное выше позволяет обозначить цель исследования, которая заключается в расширении функциональных возможностей линейного метода ДА за счет нового подхода при обработке элементов дискриминатных функций (ДФ).
Классификатор биомедицинских сигналов
Наиболее известной схемой реализации классификации сигналов с использованием ДФ является схема, построенная на однослойном персептроне и блоке выбора максимума − детекторе максимума (рис. 1) [1].

Рис. 1. Модель процесса классификации с использованием ДФ
Такая схема используется, например, при распознавании биоэлектрических сигналов [6]. В этом случае однослойный персептрон формирует m ДФ вида [1, 6]:
(1)
где wij, qі – весовые коэффициенты и пороги классификации соответственно, причем и m – количество классов, n – размерность входного вектора Х.
В результате детектор максимума реализует решающе правило вида [1,7]:
(2)
где С = {C1, …, Cm} – множество классов; Р = {р1, …, рm} – выходной вектор классификации.
Таким образом, на выходе классификатора формируется выходной m-мерный вектор Р, в котором единичное значение его элемента pl указывает на принадлежность входного образа в виде n-мерного вектора признаков Х к l-му классу Сl.
В медицинской диагностике значения весовых коэффициентов wij как весов вхождения j-го компонента входного вектора Х в і-й класс Ci могут быть рассчитаны, например, с использованием F-критерия Фишера для отбора информативных симптомов [5], а также известного отношения меж - и внутриклассовой дисперсии, широко применяемого в задачах распознавания [6, 8]. При этом все расчеты значений wij и qі для ДФ gi (X) вида (1) можно выполнить с использованием пакета статистических программ Statistica for Windows [5].
Несмотря на хорошо разработанную методику вычисления и использования ДФ, которые в данном случае представляют собой линейные классификационные функции (ЛКФ), при диагностировании заболеваний предпочтение отдают кластерному анализу по каноническим линейным дискриминантным функциям [5]. Это объясняется, в первую очередь, соотношением объемов необходимых расчетов. В то же время, применив новый подход к обработке элементов ДФ, можно не только обойти необходимость формирования m сумм gi(Х) n слагаемых (wij×хj) с последующим выбором среди них максимальной суммы, но и сформировать ранги этих сумм, что позволит определить ближайшие суммы к максимальной, т. е. ближайшие классы.
Обработка элементов ДФ по разностным срезам
Введем обозначение для элементов ДФ gi(Х) в виде
аij = wij×хj, (3)
что позволит в дальнейшем рассматривать их как элементы матрицы А0 размерностью m´n вида
А0
(4)
строки Аі которой, где , будем рассматривать как массив чисел-слагаемых соответствующей ДФ gi(Х) вида (1).
В этом случае суть классификации n-мерного образа Х заключается в формировании пространства топологических признаков [1,2] таким образом, что каждой строке Аi исходной матрицы А0 (4) необходимо поставить в соответствие элемент рі вектора топологических признаков Р:
(5)
или исходной матрице А0 размерностью m´n поставить в соответствие вектор топологических признаков размерностью m:
. (6)
Соотношение (6) указывает на процесс сжатия входного двумерного пространства данных (матрица А0) в одномерное пространство признаков (вектор Р), что характерно для процесса распознавания образов [1, 2, 9].
В данной работе предлагается новый подход в преобразовании вида (6), который основан на параллельной обработке элементов векторного массива данных [10, 11]. Этот метод в дальнейшем адаптированный и названый методом разностных срезов (РС) использован для создания модели порогового нейрона [12-15].
Использование метода РС в процессе классификации предполагает параллельную обработку по столбцам текущей матрицы Аt ( где N − количество циклов обработки), которые в данном случае рассматриваются как векторные массивы одноименных элементов ДФ gi(Х). Это возможно из-за представления ДФ gi(Х) в виде суммы (1) слагаемых aij вида (3), что позволяет использовать в процессе обработки такие свойства суммы, как коммутативность, дистрибутивность и ассоциативность.
Перед началом обработки вектор Р содержит нулевые элементы рі, а итерационная обработка матрицы Аt, начиная с исходной матрицы А0, в каждом цикле предполагает выполнение трех операций [7]:
а) определение текущего порога обработки
в каждом j-м столбце матрицы Аt-1 в виде минимального значащего элемента, т. е.
(7)
б) формирование текущего двумерного РС в виде матрицы
, в которой каждый элемент j-го столбца вычисляется следующим образом
(8)
в) формирование упорядоченной матрицы Аt в результате транспозиции (продвижения) вправо к краю всех нулевых элементов в каждой і-й строке
матрицы
:
. (9)
Перед каждой транспозицией выполняется проверка наличия хотя бы одной нулевой строки ![]()
(10)
а также проверка условия обнуления всех строк матрицы ![]()
(11)
В первом случае при выполнении условия (10), которое является признаком минимальной суммы элементов і-й строки Аі0 исходной матрицы А0, остается нулевым соответствующий элемент рі вектора классификации Р, а нулевая строка
в дальнейшем из обработки исключается.
Во втором случае при выполнении условия (11) для последней нулевой строки
матрицы
формируется соответствующий единичный элемент рl , т. е.
(12)
Особенностью обработки двумерного массива Аt по РС является то, что она позволяет одновременно с формированием выходного вектора классификации Р сформировать и вектор рангов R. В этом случае всем элементам ri вектора рангов R перед началом обработки элементов матрицы А0 присваивается единичное значение. При выполнении условия (10) в этом случае значения всех элементов вектора рангов R увеличиваются на единицу, кроме элемента ri, соответствующего обнуленной строке
.
Последовательность выполнения таких действий приводит к тому, что в последнем N-м цикле обработки после обнуления всех строк текущей матрицы
формируется вектор рангов R , элементы которого соответствуют отсортированным строкам А0і исходной матрицы А0, что соответствует, в свою очередь, ранжированию ДФ gi(Х). При этом минимальной ДФ соответствует ранг равный единице, а максимальной ДФ – ранг равный m.
Следовательно, местоположение единичного элемента рl в векторе классификации Р указывает на принадлежность входного образа Х к l-му классу, а местоположение рангов, ближайших по величине к максимальному рангу, указывает на ближайшие классы по отношению к выделенному классу.
Моделирование процесса классификации с обработкой по РС, выполненное в среде Microsoft Visual C++ 6.0, наглядно проиллюстрировало функциональные возможности и целесообразность такого подхода при обработке двумерных массивов данных. Кроме того, в результате имитационного моделирования были построены трехмерные графики временных характеристик для процесса обработки по РС элементов матриц, в которых показана зависимость количества циклов обработки от размерности матрицы и законов распределения элементов в двухмерном массиве (рассмотрены нормальный и равномерный законы).
Выводы
1. Предложенный метод обработки по РС элементов ДФ в виде матрицы специального вида позволяет отказаться от так называемого «выращивания» сумм взвешенных признаков в виде ДФ с последующим выбором среди них максимальной ДФ, а приступить к определению максимальной ДФ на уровне обработки сформированных взвешенных признаков входного образа.
2. Кроме того, данный метод позволяет сформировать не только выходной вектор классификации, но и вектор рангов ДФ, что значительно облегчит и сделает эффективнее диагностику заболеваний врачом.
Список литературы
1. Нейронные сети для обработки информации./ Пер. с польск.
. М.: Финансы и статистика, 2002.
2. Нейронные сети: полный курс. /Пер. с англ. М.: . Д. Вильямс». 2006.
3. Нейронные сети в медицине // Открытые системы. 1997. №4. С. 34-37.
4. Рангайян биомедицинских сигналов. Практический подход. Пер. с англ. . М.: ФИЗМАТЛИТ, 2007.
5. , Григорьев -статистическая обработка данных медицинских исследований. СПб.: ВМедА, 2002.
6. , Сушкова биоэлектрических сигналов // Зарубежная радиоэлектроника, 1996. №12. С. 47-51.
7. , , Куперштейн биомедицинских сигналов // Искусственный интеллект, 2010. №3. С.88-95.
8. , Скрипкин распознавания. 3-е изд. М.: Высшая школа, 1989.
9. , Куссуль аппроксимация метода динамического программирования на основе классификатора с преобразованием входного пространства // Управляющие системы и машины, 2001. №1. С. 52-57.
10.Timchenko L., Grudin M., Martynyuk T., Kozhemyako A. Parallel Transformation // Управляющие системы и машины, 1998. №5. С.93-95.
11., , Загоруйко к организации многоуровневой схемы систолических вычислений // Электронное моделирование, 1998. Т.20. №5. С. 33-42.
12.Мартынюк порогового нейрона на основе параллельной обработки по разностным срезам // Кибернетика и системный анализ, 2005. №4. С. 78-89.
13., , Куперштейн реализация модели формального нейрона // Электронное моделирование, 2010. Т.32. №4. С. 35-47.
14., Хомюк массивов данных по разностным срезам // Кибернетика и системный анализ, 2011. №6. С.132-137.
15.Мартынюк А. В., Хомюк систолических массивов для обработки векторных данных по разностным срезам // Управляющие системы и машины, 2009. №5. С. 46-55.


