Сравнение метода опорных векторов и нейронной сети
при прогнозировании банкротства предприятий.
, д. э.н., проф. кафедры бухгалтерского учета и аудита Российского экономического университета имени (dontsovа.lv@gmail.com),
, аспирант факультета вычислительной математики и кибернетики Московского государственного университета
им. (*****@***com)
Настоящая работа посвящена применению методов data-mining для прогнозирования финансового состояния предприятия на основе данных, представленных в его финансовых отчетах и других документах.
Методика анализа финансовой отчетности состоит из трех больших взаимосвязанных блоков [1]:
· анализ финансового положения и деловой активности;
· анализ финансовых результатов
· оценка возможных перспектив развития организации
Анализ финансовой отчетности является неотъемлемой частью большинства принимаемых решений, касающихся кредитования, инвестирования и др. Основными задачами, решаемыми в рамках данной работы, являются именно прогнозирование банкротства предприятия. Для достижения этой цели, необходимо изучить финансовые показатели предприятия, представленные в его финансовых отчетах и других документах. Количественные значения показателей для проведения исследования брались непосредственно из финансовой отчетности 42-х государственных унитарных предприятий и 70-ти акционерных обществ за 2006-2008 года. Для решения данной задачи, автор разработал программный комплекс, а также провел предварительную обработку показателей финансово-хозяйственной деятельности предприятий.
Задача прогнозирования формулируется следующим образом: Даны k коэффициентов из финансового отчета предприятия
xi1, xi2, …, xik
Необходимо найти функцию, переводящую данный вектор в число, характеризующее класс банкротства предприятия за следующий отчетный период i
yi+1 = f(xi1, xi2, …, xik)
Для решения поставленной задачи предлагается использовать подходы теории Data Mining – метод опорных векторов, нейронные сети.
При работе методами Data Mining необходимо решить задачу классификации предприятий, т. е. отнести объекты к одному из ранее известных классов. В данном случае постановка задачи машинного обучения является, по существу, задачей обучения с учителем.
В работе рассматривались несколько вариантов классификации финансового состояния предприятий по сводным критериям оценки бухгалтерского баланса. Первым рассмотрена система показателей для оценки финансового состояния предприятия с целью диагностики банкротства предложенная финансовым аналитиком Уильямом Бивером. Второй метод определения банкротства применяется собственником имущества г. Москвы (СПМ) и основывается на аналитической информации из бухгалтерской отчетности предприятий. Третий метод классификации финансового состояния предприятий предложен в учебнике для ВУЗов «Анализ финансовой отчетности» и [1].
Механизм нейронной сети
Первым механизмом для проведения прогноза была выбрана двухслойная нейронная сеть обратного распространения ошибки [2]. Для использования нейронной сети в нашем случае, ее не обходимо «обучить». Целью обучения сети является такая подстройка ее весов, чтобы приложение некоторого множества входов приводило к требуемому множеству выходов. Для краткости эти множества входов и выходов будут называться векторами. При обучении предполагается, что для каждого входного вектора существует парный ему целевой вектор, задающий требуемый выход. Вместе они называются обучающей парой.
Обучение сети продолжается до тех пор, пока не будет достигнута заданная погрешность выходного сигнала, либо проведено определенное количество итераций обучения. Обучение сети также можно считать оконченным, когда процесс подстройки весов изменяет их на малое значение.
Метод нейронной сети
Вторым методом классификации, который предлагается применить в настоящей работе является метод опорных векторов [3], или Support Vector Machine – SVM [4]. Нейросеть находит лишь один из возможных способов разделения классов, который, не является оптимальным, а метод опорных векторов заключается в построении разделяющей поверхности, наиболее удаленной от всех разделяемых точек. Таким образом, можно предположить, что качество распознавания новых примеров у SVM должно быть выше, чем у нейронной сети. Критерий останова для обучения нейронной сети – нулевая ошибка на обучающем множестве, а критерий останова для метода опорных векторов – близость построенной разделяющей гиперплоскости к оптимальной.
Основное отличие SVM от нейросетей заключается в том, что для нейросети количество настраиваемых коэффициентов должно априорно задаваться пользователем на основании некоторых эвристических соображений. В методе опорных векторов количество настраиваемых параметров автоматически определяется во время настройки и обычно меньше, чем число векторов в обучающей последовательности. Ненулевыми остаются коэффициенты у опорных векторов, с помощью которых строится разделяющая гиперплоскость.
Метод опорных векторов позволяет получить функцию классификации с минимальной верхней оценкой ожидаемого риска (уровня ошибки классификации); Он также делает возможным использовать линейный классификатор для работы с нелинейно разделяемыми данными [5].
Недостатком метода опорных векторов является неустойчивость по отношению к шуму в исходных данных. Шумовые выбросы обучающей выборки будут существенным образом учтены при построении разделяющей гиперплоскости [4].
Основной идеей метода опорных векторов или SVM, является то, что он находит линейное разделение двух множеств таким образом, чтобы расстояние между этими множествами и гиперплоскостью было максимальным [6][7]. Такая гиперплоскость называется оптимальной разделяющей гиперплоскостью. В отличие от гиперплоскости, которую можно получить с помощью нейронных сетей, и которая обеспечивает лишь разделение классов, не оценивая при этом расстояния между множествами.
Прогнозирование финансового состояния
Для решения задачи прогнозирования финансового состояния предприятия написан программный комплекс. Программное обеспечение написано на языке программирования C++ с использованием библиотеки QT [8]. Данное расширение позволяет компилировать программы как в ОС Windows, так и в Linux, без изменений в исходном коде. Программа позволяет обрабатывать таблицы отчетов о финансово-хозяйственном состоянии предприятий, проводить предварительную подготовку данных для использования методов Data-mining, а также осуществлять прогнозирование. Для поиска опорных векторов была использована программа TestSVM. Для преобразования данных из экономических отчетов и реализации нейронной сети был написан программный комплекс Company analyzer на языке C++ с использованием библиотеки QT.
Исследование проводилось на основании отчетной информации о финансово-хозяйственной деятельности 122 предприятий г. Москвы за 2006–2008 гг. В работе использованы три подхода к классификации предприятий: методика, используемая собственником предприятий Москвы (СПМ), метод Донцовой – Никифоровой и метод Бивера.
Обучающая выборка: Во множестве предприятий по методике, используемой СПМ, получено 19 компаний с признаками банкротства, 103 – без его признаков. Классификация предприятий по методу Донцовой – Никифоровой следующая: 56 предприятий – I класса, 27 – II и III, 7 предприятий – IV и 5 – V класса. Классификация по методу Бивера: 102 предприятия – I класса, 3 предприятия – II и 17 – III класса.
Тестовое множество: 17 компаний, классифицированных по методике СПМ, и 45 предприятий, классифицированных по методам Бивера и Донцовой – Никифоровой за 2007 г.
Прогнозирование при помощи нейронной сети
Обучение нейронной сети: входные данные – классификация за 2006 г. и 2007 г. Коррекция весов нейронной сети проходила после предъявления каждого примера из обучающего множества. Скорость обучения равна 0,5.
Прогнозирование: входные данные – тестовое множество. Выходные данные – число от 0 до 1, характеризующее вероятность принадлежности компании к одному из классов банкротства в 2008 г. Далее данные сравнивались с классификацией на 2008г.
Прогнозирование при помощи метода опорных векторов
Построение векторов осуществлялось на основе тестового множества. После применения полученных векторов, они были применены к тестовому множеству предприятий для получения прогноза классов.
Совпадение результата применения метода опорных векторов к тестовому множеству с классификациями представлены на рис. 1.

Рис. 1. Результаты прогнозирования классов предприятий методом SVM.
Процентное совпадение прогноза метода опорных векторов и нейронной сети с обучающим множеством показано в табл. 1.
Табл. 1. Совпадение прогноза метода опорных векторов с обучающим множеством, %
Метод Бивера | Метод Донцовой – Никифоровой | Метод СПМ | |||||||
I | II | III | I | II | III | IV | V | – | |
SVM Л* | 80,4 | 91,3 | 78,0 | 63,0 | 65,2 | 73,9 | 89,1 | 91,3 | 82,4 |
SVM Г** | 82,6 | 93,5 | 82,6 | 78,3 | 84,8 | 82,6 | 91,3 | 93,48 | 82,4 |
Нейронная сеть | 75,56% | 73,33% | 75% |
* - линейное разделение пространства
** - радиально базисная функция Гаусса.
Как видно из табл. 1, ошибка классификации обучающего множества при линейном разделении велика. Малая выборка – главная причина низкого качества распознавания классов. Однако, в тех классах, где количество предприятий достаточно велико, распознавание проходит эффективно. Из этого можно сделать вывод о необходимости увеличения обучающей выборки предприятий. Если нельзя увеличить количество предприятий за конкретный отчетный период, то обучающую выборку можно увеличить за счет расширения временного промежутка данных о финансово-хозяйственной деятельности исследуемых предприятий.
Проведенное прогнозирование позволяет говорить об эффективности применения метода опорных векторов, когда пространство делиться не линейным ядром, а радиально базисной функции Гаусса. Ошибка классификации обучающего множества при линейном разделении велика. Низкие значения обусловлены крайне низким количеством принадлежащих к классам предприятий.
Нейронная сеть, в отличие от метода опорных векторов, показала равномерный результат прогнозирования по всем трем методикам. Обучающую выборку для обучения нейронной сети также рекомендуется увеличить.
Метод, применяемый собственниками предприятий г. Москвы был использован с достаточно высокой вероятностью прогноза обоими методами. Более высокие показатели метода опорных векторов доказывают его более рациональное, чем у нейронной сети разделение множеств. Прогноз по методам Бивера и Донцовой-Никифоровой был затруднен в классах, где количество предприятий не достаточно. В том случае, когда количество предприятий достаточно, прогнозирование можно считать более успешным.
Список литературы:
1. , Никифорова финансовой отчетности: Учебник. – 7-е изд., – М.:ДИС, – 2009
2. Нейрокомпьютерная техника: Теория и практика; пер. с англ., – 2004
3. , Червоненкис распознавания образов, – М.: Наука, 1974
4. Vapnik V. N. "An Overview of Statistical Learning Theory", IEEE transactions on neural networks, vol.10, № 5,– 1999, – pp. 988–999
5. Muller K., Mika S., "An Introduction to Kernel-Based Learning Algorithms," IEEE Neural Networks, – 2001. – №12(2), – pp. 181–201
6. Merkov A. B. About Statistical Learning Theory [HTML] (http://www. recognition. mccme. ru/pub/RecognitionLab. html/slt. html), – 2006
7. Воронцов по методу опорных векторов, [PDF] (http://www. ccas. ru/voron/download/SVM. pdf), – 2007
8. Профессиональное программирование на С++.QT4. – Спб:БХВ, 2006


