ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Московский институт электроники и математики
РАЗРАБОТКА НЕЙРОСЕТЕВОГО АЛГОРИТМА ОПРЕДЕЛЕНИ КАЧЕСТВА
ВИННО-ВОДОЧНЫХ ИЗДЕЛИЙ ПО ХИМИЧЕСКОМУ СОСТАВУ
Выпускная квалификационная работа
по специальности 230401.65 _ Прикладная математика___
шифр наименование специальности
Студент
___________________ _
подпись
Рецензент д. ф-м. н., проф. ______ | Научный руководитель д. т. н., проф.
Консультант д. т. н., проф. _______ |
Москва 2015 г. |
Аннотация
В работе рассмотрена задача построения нейросетевого алгоритма определения качества винно-водочной продукции по ее составу. В ходе проведения исследований построен и реализован классификатор на основе многослойной сети прямого распространения, обучаемый с помощью модифицированного алгоритма обратного распространения. Результаты тестирования показывают возможность применения классификатора для определения качества вин, но требуются дополнительные исследования для повышения точности.
In this work, the neural network to determine the quality of wine by its chemical composition is developing. The classifier based on feed forward network and trained with modified back propagation algorithm is constructed. The results of test show the principal possibility to use neural networks to determine the quality of wine, but additional research to increase the accuracy is needed.
Оглавление
Введение. 5
1 Задача классификации. 8
1.1 Метод опорных векторов. 8
1.2 Нейронные сети. 10
1.3 Байесовский классификатор. 10
1.4 Выводы по разделу. 11
2 Искусственные нейронные сети. 12
2.1 Структура нейрона. 14
2.2 Структура слоя нейронной сети. 18
2.3 Нейросетевые парадигмы.. 19
2.3.1 Персептрон. 19
2.3.2 Многослойные сети прямого распространения. 24
2.3.3 Сеть радиально-базисных функций. 26
2.4 Обучение нейронной сети. 28
2.4.1 Алгоритм обучения Хэба. 31
2.4.2 Метод наименьшей квадратичной ошибки. 34
2.4.3 Алгоритм обратного распространения ошибки. 37
2.4.4 Методы задания начальных значений весов. 45
2.5 Кодирование классов. 46
2.6 Выводы по разделу. 46
3 Построение классификатора. 47
3.1 Постановка задачи. 47
3.2 Нормировка данных. 48
3.3 Кодирование классов. 50
3.4 Топология сети. 50
3.5 Начальное состояние нейронной сети. 51
4 Реализация классификатора. 52
4.1 Структура программного обеспечения. 52
4.2 Результаты обучения нейронной сети. 56
5 Анализ результатов. 59
Заключение. 61
Список использованных источников. 63
Введение
Когда-то вино было товаром роскоши, доступное лишь небольшой доле населения. Но благодаря развитию технологий производства и росту благосостояния среднестатистического жителя мира, каждый человек может купить бутылка вина и насладиться его вкусом.
Каждый производитель вина сталкивается с необходимостью его оценки и сертификации. Сертификации позволяет гарантировать, что вино соответствует стандартам и является безопасным для употребления продуктом. Оценка вина позволяет определить его качество с точки зрения человеком, то есть насколько хорош его вкус, запах и т. д. Ее результаты могут быть использованы для улучшения процесса производства, для распределения вин по брендам и определения их цены. Оценка иногда является частью процесса сертификации.
Существует два основных метода, которые используются при сертификации вина. Первый из них основывается на физико-химическом анализе. При этом проверяются, в частности, такие параметры, как цвет вина, наличие примесей, количество содержащегося алкоголя, сахаров и различных кислот. Вторым методом является сенсорный анализ. Он основан на использование в качестве оценочного прибора специально обученного человека – дегустатора. В процессе работы, дегустатор должен определить качество вина основываясь на своих знаниях и используя свои органы чувств.
Зависимость между физико-химическими свойствами вина и результатом дегустации является крайне сложной и запутанной, и в настоящее время она до конца не определена. Из этого следует, что с помощью физико-химического анализа сложно дать ответ на вопрос, насколько хорошо будет вино с точки зрения покупателя, и, следовательно, нельзя отнести вино к определенному бренду. С другой стороны, дегустатор определяет качество вина исходя из своих субъективных понятий о «хорошем» и «плохом» винах. Это приводит к тому, что вино, выигравшее некоторый конкурс, может не получить никаких наград в другом соревновании, а оценки разных дегустаторов, данные одному и тому же вину, могут сильно различаться. Подобные происшествия подрывают доверие к существующей системе оценивания вин, от чего могут пострадать как производители, которые не смогут разделить свою продукцию по уровню качества и, соответственно, цене. Так и потребители, которые потеряют возможность выбирать вино по качеству, и, по сути, будут приобретать «кота в мешке». Следовательно, в сфере производства винно-водочной продукции существует потребность в исследовании возможности создания некоторого классификатора, который бы мог определять качество вина по его химическому составу, руководствуясь лишь математическими алгоритмами.
Развитие информационных технологий привело к созданию ряда методов анализа данных. Подобные методы позволяют осуществлять поиск взаимосвязей между различными наборами данных. Как правило, работа идет с большими и сложными наборами информации, обработка которых требует больших вычислительных ресурсов. Появление данных методов дало толчок к развитию исследований в области создания классификаторов. В качестве примера можно привести работу 2007 года, в которой, используя вероятностную нейронную сеть, исследователи смогли с точностью в 94.77% правильно классифицировать год производства вина и место расположения виноградника [8]. В этой работе в качестве информации о вине использовались результаты хроматографии. В 2001 году нейронные сети использовались для определения трех сенсорных характеристик вина, произведенного в Калифорнии, основываясь на информации об уровне зрелости винограда и результатах химического анализа [12].
В данной работе исследуется возможность создания классификатора, основанного на нейронной сети и способного определять качество вина. В качестве данных для анализа используется информация о составе вин и оценках данных им дегустаторами. Набор данных охватывает вина, созданные в Португалии в провинции Минью с мая 2004 по февраль 2007 годов. Данные были предоставлены исследователями Paulo Cortez, Antonio Cerdeira, Fernando Almeida, Telmo Matos, Jose Reis в их статье «Modeling wine preferences by data mining from physicochemical properties» [9]. В ходе выполнения работы необходимо выполнить следующие пункты:
· Рассмотреть существующие математические методы классификации, и сравнить их с нейронными сетями применительно к данной задаче;
· Рассмотреть различные нейросетевые парадигмы, и оценить их с точки зрения задачи классификации;
· Построить математическую модель классификатора для решения данной задачи, реализовать и обучить его;
· Произвести анализ результатов.
В данной работе в первой главе рассматриваются различные методы решения задачи классификации, и оценивается их применимость к задаче классификации винно-водочных изделий. Во второй главе анализируются различные нейросетевые парадигмы, методы обучения нейронных сетей, возникающие при этом проблемы и пути их решения. В третьей главе описано построение классификатора с учетом особенностей решаемой задачи. В четвертой главе приведено описание программной реализации классификатора, его функциональные возможности и результаты обучения. В пятой главе содержится анализ результатов тестирования классификатора.
1 Задача классификации
Задача классификации заключается в определении, какому классу принадлежат наблюдаемые объекты, основываясь на некотором предварительно известном наборе пар, состоящих из описания объекта и класса, которому этот объект принадлежит. Описание объекта представляет собой набор измеренных характеристик.
Математическая постановка задачи выглядит следующим образом: есть множество непересекающихся классов
и множество описаний объектов
. Есть неизвестная зависимость между множествами
Есть также некоторый известный набор пар
, такой, что
. Требуется на основе этого набора найти функцию, способную классифицировать любой объект из X.
Существует множество различных методов классификации объектов. Выбор метода для решения поставленной задачи необходимо осуществлять исходя из особенностей предметной области.
1.1 Метод опорных векторов
Для решения задач классификации в 1963 году В. Вапник и А. Червоненкис предложили метод, названный ими методом опорных векторов. Метод основан на поиске гиперплоскости в пространстве признаков, оптимально разделяющей объекты на классы. Набор признаков, характеризующий один определенный объект, называется вектором. Допустим, мы имеем набор пар
, изображенный на рисункеРис. 1.

Рис. 1. Пример разделяющей гиперплоскости
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 |


