Гиперплоскостью в некотором пространстве называется подпространство с размерностью, меньшей на 1, чем размерность самого пространства. Тогда в двумерном пространстве гиперплоскостью будет прямая. Можно построить несколько прямых, разделяющих два класса, как показано на рисунке. Идея метода заключается в том, что для решения задачи классификации лучше всего выбрать такую гиперплоскость (а в данном случае – прямую), чтобы расстояние от нее до ближайших элементов классов было максимально. Пример подобной оптимально разделяющей гиперплоскости можно увидеть на рисункеРис. 1. Это прямая, нарисованная красным цветом. Вектора, которые расположены ближе всего к разделяющей гиперплоскости, называют опорными векторами. На рисунке они отмечены с помощью кругов [11].

Не всегда наборы векторов являются линейно-разделимыми. На рисунке Рис. 2 показан пример, в котором невозможно найти прямую линию, которая бы разделяла два класса. В таком случае, можно использовать преобразование, которое бы переводило вектора в пространство большей размерности. Тогда, согласно теореме Ковера, после такого преобразования, с высокой долей вероятности можно получить линейно-разделенные классы [1].

svn_image_2.png

Рис. 2. Пример линейно-неразделимых классов

1.2 Нейронные сети

Нейронная сеть представляет собой математическую модель биологической нейронной сети. Она состоит из множества простых устройств – нейронов, соединенных между собой. Каждый нейрон принимает сигнал, преобразует его, и затем посылает преобразованный сигнал другим нейронам.

НЕ нашли? Не то? Что вы ищете?

Отличительной особенностью нейронных сетей является то, что они обучаются для решения некоторой определенной задачи. С математической точки зрения, в ходе обучения происходит задание коэффициентов связей между нейронами. Нейронная сеть способна в процессе обучения находить сложные взаимосвязи между элементами входных и выходных данных. Также, нейронные сети способны к обобщению, то есть выдавать правильный ответ на данных, которые не участвовали в обучение.

1.3 Байесовский классификатор

Это набор вероятностных методов классификации. Они основаны на теории, что если известны плотности распределения классов, то можно в явном виде выписать алгоритм классификации. Причем, при использовании этого алгоритма, вероятность ошибки будет минимальна. Принцип действия байесовского классификатора состоит из следующих шагов:

1 Вычислить для объекта функция правдоподобия каждого класса;

2 Вычислить апостериорные вероятности;

3 Отнести объект к тому класса, апостериорная вероятность которого оказалась самой высокой.

Если при решении задачи неизвестны плотности распределения классов, то их необходимо вычислить по обучающей выборке. Есть множество методов восстановления плотности распределения, и, вследствие этого, существует множество различные байесовских алгоритмов. Если предположить, что признаки, описывающие объект, являются независимыми, то можно упростить построение классификатора. Но, так как на практике, признаки редко бывают независимыми, это приведет к уменьшению точности классификации объектов [7].

1.4 Выводы по разделу

Рассмотрим описанные в данном разделе методы решения задачи классификации с точки зрения их применимости к решению задач классификации винно-водочных изделий. Исходные данные обладают следующими характеристиками:

·  Они разбиты на две группы: белые вина и красные вина. Неизвестно, насколько важен тип вина при определении уровня качества;

·  Имеется довольно большая выборка примеров, в сумме около 6 тыс.;

·  Каждый объект характеризуется 11 параметрами, что означает, что размерность пространства признаков невелика;

·  Данные представлены в числовом виде.

Метод опорных векторов обладает большой вычислительной сложностью, и для его использования желательно иметь большее пространство признаков, чем имеется в данной задаче.

Изначально отсутствует статистическая информация об исходных данных, что затрудняет использование байесовского классификатора.

Нейронные сети способны к решению задач классификации, наборы данных в которых являются линейно-неразделимыми. К тому же, нейронные сети показали способность к аппроксимации произвольной функции с любой желаемой точностью [2]. Вследствие этого, использование нейронных сетей для решения данной задачи является предпочтительным вариантом.

2 Искусственные нейронные сети

Сразу после своего рождения человек не обладает никакой информацией об окружающем мире. Но он способен получить ее с помощью своих органов чувств, таких как зрительная система или слуховой аппарат. Получая сигналы о мире, человек реагирует на них некоторым образом. Его реакция способна вызвать изменения в поступающих сигналах, что, в свою очередь, вызовет другую реакцию. Некоторые сигналы могут быть однозначно распознаны как негативные, например боль, другие же будут восприниматься как позитивные – приятный запах или чувство сытости. Обладая от природы способностью к сопоставлению своих действий и последующего результата, человек вырабатывает алгоритмы поведения для минимизации негативных сигналов и оптимизации позитивных. Подобная способность к самообучению является крайне интересной, так как ее понимание позволит решить множество задач, например, создавать алгоритмы обработки информации, которые автоматически подстраиваются под вводимые данные с целью улучшения результата. Человек обладает такой возможностью благодаря его мозгу – биологической нейронной сети огромных масштабов.

Интерес представляет не только способность к самообучению, но и то, какие алгоритмы созданы человеческим мозгом для решения ряда ежедневных задач, такие как распознавание образов (человек способен с высокой точностью отличать людей друг от друга или принятие решений, особенно в условиях недостатка информации). Для таких задач существуют различные математические методы их решения, но зачастую они проигрывают человеку в скорости работы и точности. Следовательно, можно предположить, что достаточно точная модель человеческого мозга покажет сходную эффективность в таких задачах. Также, исследование модели, успешно справляющейся с некоторым классом задач, позволит больше понять как о самой проблематике задачи, и ее способах решения, так и об алгоритмах человеческого мышления.

Искусственная нейронная сеть, как следует из названия, представляет собой попытку построить такую модель. Понятие нейронных сетей включает в себя широкий класс объектов, различия между которыми могут быть довольно велики, но все они строятся на основе следующих принципов:

·  информация в нейронной сети обрабатывается с помощью множества однотипных элементов. Такой элемент называется “нейрон”;

·  каждый нейрон обладает входом, выходом, и некоторой функцией, преобразующей вход в выход. Данная функция называется функцией активации нейрона;

·  выход любого нейрона может быть связан с входом одного или нескольких нейронов. Такая связь называется “синаптической”;

·  синаптическая связь при передаче сигнала некоторым образом преобразует его. Обычно каждой синаптической связи в соответствие проставляется некоторое число, и при передаче сигнала он просто перемножается с этим числом;

·  в случае если к входу одного нейрона присоединено несколько синаптических связей, то приходящие по ним сигналы некоторым образом преобразуются перед подачей в нейрон. Обычно они просто суммируются.

Искусственные нейронные сети, также как и биологические, обладают свойством отказоустойчивости, которое состоит из двух частей. Во-первых, нейронная сеть способна к обработке и распознаванию сигналов, отличающихся от тех, что ранее в нее поступали. Например, когда человек видит новую для себя модель автомобиля, он понимает, что это именно автомобиль, а не что-то другое. Такой вывод он способен сделать благодаря тому, что новый автомобиль похож, хоть и не полностью, на те, что он уже видел. Во-вторых, если по некоторой причине происходит повреждение нейронной сети, то она часто оказывается способной продолжить свою работу, пусть и зачастую с ухудшением качества результата [4].

Благодаря своим особенностям, нейронные сети нашли применение во многих областях, таких как:

·  Авиационно-космическая отрасль: автопилоты, тренажеры для пилотов, детекторы неисправностей для различных подсистем самолета;

·  Автомобильные системы автоматического управления;

·  Банковская сфера: системы для оценки кредитоспособности клиентов, для автоматического определения использования краденых карт по особенностям совершенных транзакций;

·  Армия: системы обнаружения, ведения цели, распознавание цели по радарному отклику;

·  Электроника: нелинейное моделирование, компьютерное зрение, распознавание и синтезирование речи.

2.1 Структура нейрона

Мозг человека состоит из миллионов базовых элементов – нейронов. С точки зрения моделирования работы мозга, каждый нейрон можно разделить на три части: дендрит, аксон, и тело нейрона. Дендриты представляют собой длинные сети, задача которых заключается в распространении электрических сигналов к телу нейрона. Тело, в свою очередь, каким-то образом обрабатывает полученный сигнал и выдает ответ с помощью аксона, который распространяет его вдоль себя. Нейроны работают не независимо друг от друга, дендриты каждого нейрона соединены с аксонами других нейронов. Таким образом, в биологическом мозге происходит распространение сигналов от одного нейрона к другим. На рисунке Рис. 3 изображена схематическая схема нейрона.

Рис. 3. Схема биологического нейрона

Часть структуры головного мозга закладывается при рождении и сохраняется в неизменном виде в течение всей жизни человека. Другие части мозга способны изменяться со временем. В ходе подобных изменений происходит изменение структуры связей между нейронами. Новые связи появляются, а старые исчезают. Какие-то связи усиливаются, в результате чего сигнал от одного нейрона до другого доходит почти в неизмененном виде. Другие связи могут ослабеть, и сигнал будет доходить плохо. Наиболее активно процесс формирования и изменения связей между нейронами происходит в начале жизни [6].

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10