Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Н. Н. ФИЛАТОВА, Д. М. ХАНЕЕВ

Тверской государственный технический университет

*****@***ru

НЕЙРОПОДОБНЫЙ КЛАССИФИКАТОР ДЫХАТЕЛЬНЫХ ШУМОВ, ЗАДАННЫХ НЕЧЕТКИМИ ПРИЗНАКАМИ

Рассматривается построение нейроподобной сетевой структуры для классификации дыхательных шумов, заданных нечеткими признаками. Представленная сетевая структура относится к классу растущих пирамидальных сетей и позволяет работать с объектами, заданными нечеткими признаками или лежащими на пересечении классов. Описывается построение классификатора и продукционных правил, приведены результаты тестирования алгоритма на клинических данных.

Ключевые слова: классификация, дыхательные шумы, нечеткая логика, теория графов

Введение

Автоматическая классификация дыхательных шумов (ДШ), заданных дискретным набором признаков, отражающих спектральный состав шума и особенности дыхательного цикла, является актуальной задачей компьютерной пульмонологии. Так как характер ДШ во многом определяется индивидуальными особенностями органов дыхания, то разработка их формализованного математического описания будет всегда связана с определением нескольких индивидуально настраиваемых коэффициентов, что затрудняет их обобщение. Плохо формализуемые описания объектов наиболее удобно систематизировать с помощью нейросетевых моделей.

Известны решения по созданию нейросетевого классификатора спектров ДШ [1]. Описанный классификатор может работать на множестве объектов, заданных вектором счетных признаков. Размер описаний объектов может изменяться от 240 до 512 признаков. В основу алгоритма положена модель Кохонена. Алгоритм позволяет построить на основе выборки образцов ДШ нейронную сеть, классифицирующую спектры мощности шумов классов норма и патология с ошибкой не более 8% и выделяющую в отдельное множество нераспознанные объекты. Однако, использование модели Кохонена приводит к трудностям в создании обучающих выборок (разные стадии и степени проявления заболеваний) и интерпретации результатов классификации. В алгоритме [1] повышение точности классификации достигается с помощью 8-ми настроечных коэффициентов, которые приходится корректировать при изменении состава выборки. Алгоритм плохо приспособлен для анализа объектов, заданных нечеткими признаками, и объектов, лежащих на пересечении классов.

НЕ нашли? Не то? Что вы ищете?

Учитывая, что в работе [2] показана целесообразность использования нечетких признаков для описания как отдельных спектров ДШ, так и их классов, необходимо создание нового варианта сетевого классификатора, ориентированного на работу с нечеткими описаниями объектов обучающей выборки и дополненного лингвистическим интерпретатором результатов обобщения.

Постановка задачи

Имеется обучающая выборка LX, состоящая из описаний образцов дыхательных шумов, дополненных диагностическим признаком, который задает принадлежность образца к одному из классов («Норма» «Патология», «Патология 1 (Пневмония)», «Патология 2 (Бронхит)» и др.).

Принято допущение 1, что образцы шумов , зарегистрированные с корпуса одного пациента в двух разных точках и в разные моменты времени, при не больше трех минут, рассматриваются как независимые объекты (рис. 1).

Рис. 1. Спектры мощности ДШ из класса «Норма» и класса «Катаральный бронхит» (при регистрации в 3-х точках корпуса одного пациента)

Для описания ДШ можно использовать как однородный [1], так и неоднородный набор признаков [2]. Однако в обоих случаях необходимо принимать во внимание частотный состав шума. Для этого могут использоваться спектральные характеристики ДШ, рассчитанные с помощью быстрого преобразования Фурье. В докладе рассматриваются результаты, полученные с использованием окна преобразования Хемминга (ширина 1024), границы частотного диапазона от 0 до 2000 Гц.

Каждый объект выборки LX представляется вектором вида , где – значение i - го признака. В частности, в качестве может рассматриваться ордината спектра на частоте , характеризующая выделение энергии на интервале . Значение используем в качестве идентификатора класса объекта.

Учитывая нестационарный характер ДШ, все перечисленные признаки можно рассматривать как нечеткие переменные. Тогда описание каждого объекта выборки LX будет задано двумя векторами: XT и XF, характеризующими качественную оценку соответствующего признака. Причем,

(1)

и – значение i-го признака по лингвистической шкале, а и – значение функции принадлежности i-го признака.

На основе анализа обучающей выборки ДШ необходимо решить две взаимосвязанные задачи:

- построить такой алгоритм, который будет правильно классифицировать объекты вида (1) не входившие в исходный обучающий набор;

- создать процедуру автоматической генерации продукционных правил для классификации ДШ, заданных набором признаков вида (1).

Переход к нечетким признакам в описании объектов

Известная задача фазификации, связанная с переходом от количественных оценок признаков к качественным, в рассматриваемом случае заключается в переходе от вектора к векторам и .

Для оценки i-ого спектрального признака по качественной шкале введена лингвистическая переменная ЛПi :: «выделение энергии на частоте » с тремя термами: Т1::«Низкий», Т2::«Средний», Т3::«Высокий», определяющими три нечеткие переменные и соответствующие им качественные значения спектрального признака.

На первом этапе исследования для крайних термов выбраны трапецеидальные, а для среднего – треугольная формы функций принадлежности (рис. 2).

Рис. 2. Функции принадлежности термов ЛП «выделение энергии на частоте »

Границы базового множества ЛПi определяются с помощью наименьшего и наибольшего значений i-ого признака на множестве объектов ОВ: , где Kколичество объектов в ОВ, i порядковый номер признака, j – порядковый номер объекта в ОВ. Параметры функций принадлежности () определяются соотношениями:

; ;

; .

Построение классифицирующего алгоритма

Для построения классифицирующего алгоритма (КА) применяется нейроподобная иерархическая структура – пирамидальная сеть (ПС). Предложенная пирамидальная сеть является развитием идей растущих пирамидальный сетей [3, 4, 5] и представляет собой ориентированный ациклический граф в ярусно параллельной форме, не имеющий вершин с одной заходящей дугой, все дуги ориентированы от нижних уровней сети к верхним. Вершины сети разделены на два типа, вершины первого типа называются рецепторами, вершины второго типа – ассоциативными элементами. Рецепторы являются входами сети.

Каждый ассоциативный элемент ПС характеризуют параметры:

- уровень вершины в иерархии сети (ярус);

- состояние (возбужден или нет);

- класс объекта ОВ, породившего вершину;

- число рецепторов, от которых имеются пути к данному ассоциативному элементу;

- значения счетчиков возбуждений и , определяющих реакцию ассоциативного элемента на входные объекты ОВ классов соответственно, где k – количество классов, представленных в ОВ.

Необученная сеть состоит из рецепторов, соединенных исходящими дугами с заключительной вершины верхнего уровня Y, которая выполняет вспомогательную роль в процессе генерации структуры сети. Алгоритм построения ПС детально описывается в [6] и выполняется за два последовательных этапа.

На первом этапе формируется структура сети путем добавления новых ассоциативных элементов и связей между ними. Каждый ассоциативный элемент представляет собой конъюнктивную зависимость среди значений признаков, из которых имеется к нему путь. В результате построений первого этапа ассоциативные элементы, смежные с вершиной Y, образуют множество Vc, с каждым элементом которого ассоциируется объект из обучающей выборки с уникальными комбинациями значений нечетких признаков.

На втором этапе построений ПС на основе значений счетчиков и l из всех ассоциативных элементов сети выделяется множество контрольных элементов. Каждый контрольный элемент представляет собой ассоциативный элемент с наиболее часто встречающимся набором значений признаков, характерных для объектов определенного класса. Совокупность рецепторов, из которых существует путь в контрольный элемент, является паттерном, из чего следует что паттерн – устойчивое сочетание значений признаков, характерных для объектов одного класса вида , полученное в ходе индуктивного обобщения, где – признаки; n – количество признаков; ; k – количество термов лингвистической переменной признака.

Пример построенной в процессе обучения классификатора пирамидальной сети приведен на рис. 3. Вершины сети предпоследнего уровня, смежные с заключительной вершиной Y (U1 – U5) образуют множество Vc, и характеризуют группы близких объектов с одинаковой комбинацией значений признаков НПp. Ассоциативные элементы К1 и К2 являются контрольными вершинами классов c номерами 1 и 2 соответственно.

НП1, НП2, … НПp – нечеткие признаки, где – порядковый номер нечеткого признака, P – количество нечетких признаков. Значения нечетких признаков сопоставлены с рецепторами «н», «с», «в», которые соответствуют термам «низкий», «средний», «высокий» лингвистической переменной признака «выделение энергии на частоте ». В результате общее число рецепторов равно суммарному количеству термов среди всех ЛП нечетких признаков.

Структуру построенной пирамидальной сети можно конвертировать в набор продукционных правил. В результате для каждого класса, представленного в ОВ, получается не менее одного правила классификации.

Каждое правило имеет вид: IF антецедент THEN консеквент. Где антецедент есть конъюнктивно-дизъюнктивное высказывание вида ; консеквент – заключение об отнесении объекта к определенному классу вида «», где ; L – количество классов в обучающей выборке, с-й класс.

Рис. 3. Структура ПС классификатора после обучения

Применяя процедуру нечеткого вывода и полученные правила, можно генерировать высказывания о степени принадлежности объектов, не входивших в обучающую выборку, к описанным классам.

Тестирование классификатора

Описанный классификатор реализован программно на языке C# под среду исполнения 3.0. Программная реализация классификатора зарегистрирована в реестре программ для ЭВМ Российской Федерации [7]. Апробация классификатора произведена на записях дыхательных шумов, полученных с помощью устройства регистрации [8] в частотном диапазоне 0-2 кГц с частотой дискретизации 11025 Гц и разрешением 16 бит. Структура обучающей выборки (ОВ) и тестовой выборки (ТВ) приведена в табл. 1.

Таблица 1

Структура обучающей и тестовой выборок

Выборка

Кол-во объектов

всего

норма

патология

Обучающая выборка

148

121

27

Тестовая выборка

32

25

7

ПС классификатора, обученного на ОВ из табл. 1 с количеством признаков 180, содержит 1144 вершины, из которых 540 рецепторов, 33 контрольных элемента, 26 из которых являются контрольными вершинами класса «Норма», а 7 – класса «Патология».

В качестве основной гипотезы H0 примем утверждение «Объект принадлежит классу норма», следовательно, будем считать отнесение классификатором объекта с диагнозом «Норма» к классу «Патология» ошибкой 1-го рода, а отнесение объекта с диагнозом «Патология» к классу «Норма» – ошибкой 2-го рода. Результат классификации, представлен в табл. 2.

Таблица 2

Результаты распознавания выборок

Выборка

Количество ошибок 1 рода

Количество ошибок 2 рода

Обучающая выборка

0

1

Тестовая выборка

2

2

Выводы

Проведенные исследования и структурные особенности алгоритма показали, что для настройки разработанной программы классификации ДШ достаточно только характеристик обучающей выборки. Участие эксперта в этой процедуре сводится только к выбору формы функций принадлежности.

Результаты тестирования показали, что правильное распознавание объектов как ОВ и ТВ выполняется с функцией принадлежности не менее 0.6. Ошибки второго рода вызваны в основном принятием допущения 1. Ошибки первого рода связаны с включением в ТВ шумов с посторонними помехами.

Программа прошла апробацию на реальных клинических данных и показала приемлемую точность классификации спектров ДШ. Разработанный алгоритм является инвариантным к предметной области и может использоваться для классификации различных временных рядов.

Список литературы

1.  Нейросетевой алгоритм и модели нечеткой логики для задачи классификации , // Программные продукты и системы, 2008, № 4.

2.  Аль-Нажжар , алгоритмы и технические средства исследования и автоматического анализа дыхательных шумов // Автореферат диссертации на соискание ученой степени к. т.н., С.-Петербург. 2007.

3.  Гладун с компьютером. Киев: Port-Royal, 2000. С.17-44.

4.  Поспелов моделирование. Теория и практика. М.: Наука, 1986. С.174-182.

5.  Ефимов интеллектуальных задач. М.: Наука, 1982. С.256-274.

6.  Пирамидальная сеть для классификации объектов, представленных нечеткими признаками , // Известия ЮФУ. Технические науки. Тематический выпуск «Медицинские информационные системы», 2012. №9 (134). С. 45–49.

7.  , Ханеев о государственной регистрации программы «Программа автоматического построения понятий о классах дыхательных шумов» Программа для ЭВМ № .

8.  Устройство регистрации и анализ дыхательных шумов пат. 66174 Рос. Федерация: МПК А61В 5/08/ , Аль- заявитель и патентообладатель ГОУФПО Тверской гос. техн. у-нт. №/22; заявл. 10.04.2010; опубл. 10.09.2010.