О. А. АГАПКИН, С. А. ДОЛЕНКО, И. Г. ПЕРСИАНЦЕВ,
С. А. ШАРОВ

НИИ ядерной физики им.
московского государственного университета им.

*****@***sinp. msu. ru

АДАПТИВНАЯ АВТОМАТИЧЕСКАЯ

СИСТЕМА ПРОГНОЗИРОВАНИЯ ПРОДАЖ

Рассматривается самообучающаяся нейросетевая система прогнозирования продаж. Обсуждаются преимущества и недостатки нейросетевых алгоритмов для использования при прогнозировании продаж.

Введение. Прогнозирование продаж всегда играло важную роль в бизнесе. Чем выше точность прогнозирования, тем более оптимально можно спланировать закупки сырья и комплектующих, загрузку производственных и транспортных линий, аренду складских помещений и другие важные и дорогостоящие для компаний процессы.

В настоящее время для прогнозирования продаж менеджеры используют, как правило, различные статистические методы, реализованные в пакетах Excel, SPSS, Minitab, Eviews и других. Чаще других используются алгоритмы, основанные на регрессии [3], на сглаживании (методы Хольта, Винтерса) [3] и авторегрессионные методики Бокса-Дженкинса (модели ARIMA) [1, 2, 3]. Эти методики осуществляют прогнозирование временного ряда на основании только той информации, которая содержится в его исторических данных. Очевидно, что это является серьезным недостатком этих алгоритмов, т. к. существует много сторонних параметров, влияющих на продажи (например, реклама, цена, экономическая ситуация, активность конкурентов и многое другое). Конечно, есть модели многомерной регрессии и модификации некоторых описанных выше алгоритмов, которые позволяют учитывать внешние факторы, но они недостаточно гибки.

НЕ нашли? Не то? Что вы ищете?

Нейронные сети выгодно отличаются от статистических методов в первую очередь тем, что освобождают от необходимости задавать математическую модель процесса, а также позволяют учитывать произвольное количество внешних факторов.

Описание проблемы. Прогнозирование продаж для современных FMCG (Fast Moving Consumer Goods) компаний имеет огромное значение и сопряжено с большими рисками. Заниженные прогнозы приводят к недополученной прибыли, завышенные оборачиваются либо затратами на использование складских помещений (если продукт имеет длительный срок хранения), либо прямыми потерями и тратами на утилизацию, когда у нереализованного продукта заканчивается срок хранения.

Российское представительство крупной западной FMCG компании продает на российском рынке продукты питания с небольшим сроком хранения. Компания имеет на территории России свое производство. В предлагаемом ассортименте постоянно несколько десятков продуктов, которые распространяются через региональные представительства, которых, в свою очередь, около 100. Для планирования производства компанию интересуют еженедельные прогнозы продаж на срок 4-10 недель вперед от текущей недели для каждого продукта в каждом регионе. Общее количество прогнозов, которые должны автоматически генерироваться каждую неделю, порядка . В компании имеется историческая информация о продажах, заказах и возвратах в виде транзакций с 2001 года. Имеется также информация о всех проведенных рекламных компаниях.

Декомпозиция временных рядов. Хорошо известно, что различные сторонние факторы по-разному влияют на прогнозируемую величину. Например, проведение рекламной промо-акции «на 30 % больше продукта по той же цене», скорее всего, увеличит продажи сразу же, но, как только акция будет закончена, произойдет заметный спад продаж. В то же время обычная телереклама скорее поддерживает узнаваемость продукта, и даже когда она заканчивается, люди все еще «лояльны» этому продукту; спад продаж после длительной телерекламы будет постепенным и очень медленным.

Существуют факторы, имеющие явную сезонную природу. Например, во время праздников резко возрастают продажи некоторой алкогольной продукции; мороженое и пиво лучше продаются летом, чем зимой и т. д. При этом такая сезонность может быть для разных факторов разной по временным масштабам, от нескольких часов до нескольких лет.

Для корректного прогнозирования с учетом различных внешних факторов используют декомпозицию временных рядов [3]. Смысл декомпозиции состоит в том, что прогнозируется не сам временной ряд X, а его составляющие. Обычно выделяют несколько составляющих:

·  Трендовая (T) - это компонента, представляющая основной рост (или спад) во временном ряду.

·  Сезонная (C) - компонента, представляющая вариации временного ряда с выраженной сезонной составляющей.

·  Нерегулярная поправка (W) - представляет труднопредсказуемые, а порой случайные флуктуации в исходном прогнозируемом ряду.

После того, как спрогнозированы отдельные составляющие, они объединяются в общий прогноз временного ряда. В описываемой системе используется по выбору один из двух вариантов декомпозиции:

аддитивный

и мультипликативный

Для выделения компонент временного ряда используется экспоненциальное сглаживание:

где – текущее значение компоненты временного ряда; – следующая по времени значение компоненты; – текущее значение исходного временного ряда; – постоянная сглаживания .

В описываемой системе выделялась трендовая компонента (T, ); сезонная компонента (S, ) и нерегулярная (W).

Система прогнозирования. После проведения декомпозиции каждая компонента прогнозируется отдельно от других. Схема прогнозирования показана на рис. 1.

Рис. 1. Блочная система суперкомитета. Каждая временная составляющая ряда

продаж (трендовая, сезонная, недельная) прогнозируются отдельно

Каждая компонента прогнозируется отдельным комитетом, состоящим из произвольного количества предикторов (экспертов). В западной литературе такой метод иногда называют экспертным. Предикторами внутри комитета могут быть не только нейронные сети, но и статистические алгоритмы (ARIMA, методы Винтерса, Хольта, регрессионные и «наивные» модели). На текущий момент в системе реализованы только нейросетевые модели. Система отслеживает качество работы сетей каждого комитета на новых данных. По этой точности определяется вес каждой нейросети в комитете, и в будущем он будет учитываться при построении прогнозов (рис. 2).

Рис. 2. Качество работы каждой сети определяет вес, с которым эта сеть будет

использоваться в ближайшем будущем

Такая разнородность и адаптивность комитета (статистические методы, нейронные сети разных архитектур) позволяет получать устойчивые прогнозы в самых разных условиях.

Каждая сеть для обучения и построения прогнозов использует свой собственный комплект входных переменных, причем входы у сетей одного комитета могут быть различными, что увеличивает устойчивость работы системы.

«Трендовые» сети:

·  номер недели;

·  значения сглаженного () ряда продаж: текущее; прошлые за -4, -8, -12, -36 недель;

·  текущее значение сглаженного () ряда телевизионного рекламного индекса –TRP;

·  текущее значение сглаженного () ряда индекса общей рекламной активности;

·  другие параметры.

«Сезонные» сети:

·  номер недели;

·  текущее значение сезонной компоненты; ее прошлые значения за -2, -4, -6 недель; «год назад» (это либо 52, либо 53 недели), «год назад+1неделя»;

·  индексы сезонных рекламных кампаний;

·  другие параметры.

«Недельные» сети:

·  номер недели;

·  текущее значение нерегулярной (недельной) компоненты; ее прошлых значений за -1, -2, -3 недели; «год назад» (это либо 52, либо 53 недели), «год назад+1неделя».

·  текущие значения индексов рекламных кампаний типа «больше продукта по той же цене», «купи данный продукт и получи подарок» и других аналогичных;

·  другие параметры.

Кроме того, учитывается информация о продажах и рекламе для так называемых конкурирующих между собой продуктов (т. е. продуктов, влияющих друг на друга; так, увеличение продаж одного из них уменьшает продажи других); в будущем представляется перспективным учитывать также индексы рекламной активности компаний-конкурентов.

Нейронные сети. В настоящий момент в системе реализованы следующие нейросетевые архитектуры:

·  Многослойные персептроны (MLP) с обратным распространением ошибки [5]. Сети могут иметь 1, 2, или 3 скрытых слоя. Количество нейронов в слоях произвольное. Передаточными функциями для нейронов каждого слоя можно выбирать логистическую функцию, , , .

·  Многослойные персептроны с генетическим обучением связей (MLPGA). Свойства персептронов такие же, как в предыдущем пункте.

·  Нейронные сети с общей регрессией (GRNN) [4].

·  Нейронные сети с общей регрессией и генетичеcкой подстройкой (GRNNGA).

Пока наилучшие результаты с точки зрения «качество/скорость работы» были достигнуты на персептронах с одним скрытым слоем; имеющим от 3 до 15 нейронов, передаточную функцию логистическую, или гиперболический тангенс; передаточная функция выходного слоя линейная.

Схема работы. Каждое воскресенье с центрального сервера компании в систему автоматически поступает информация о продажах за прошедшую неделю. Поскольку в системе постоянно существуют суперкомитетов, которые система использует еженедельно для построения прогнозов, каждый суперкомитет состоит из трех комитетов и соответственно, как минимум, из трех сетей, общее количество сетей в системе велико . Переобучать их всех каждую неделю на существующем оборудовании невозможно, поэтому введена процедура еженедельной проверки качества прогнозирования – переобучаются только сети, плохо отработавшие на вновь поступивших данных.

На самом последнем этапе система взвешивает свой «нейросетевой» прогноз с соответствующим прогнозом эксперта Компании, таким образом формируя окончательный прогноз, который затем сохраняется в базе и становится доступным для менеджеров.

Результаты. В настоящее время система прогнозирования проходит тестовую эксплуатацию. Система работает на выделенном для нее 2-процессорном сервере (Dual Intel Xeon 2GHz, Hyper Threading), в параллельном режиме обучая 3 разные нейронные сети. Цикл переобучения инициируется сразу после поступления новых данных – в ночь с воскресенья на понедельник. Пока настройки системы таковы, что полный цикл переобучения проходит за 2-3 дня. Основные положительные результаты от внедрения системы таковы:

·  За счет возросшей автоматизации уменьшились трудозатраты на изготовление прогнозов.

·  Несколько повысилась точность прогнозирования продаж на 4-10 недель вперед по сравнению с прогнозами экспертов Компании.

·  Упростилась процедура доступа менеджеров Компании к прогнозам и работа с ними. Вместо большого количества разрозненных файлов Excel, прогнозы хранятся на одном SQL-сервере.

Перспективы. В будущем представляется перспективным совершенствовать систему в следующих направлениях:

·  Добавить статистические методы (алгоритмы Бокса-Дженкинса, Винтерса, Хольта).

·  Добавить функциональность «что если…» для реализации бизнес моделирования.

Список литературы

1.  Box G. E.P. and Jenkins G. M. “Time series analysis: Forecasting and control”, San Francisco: Holden-Day, 1970.

2.  Makridakis S., Wheelwright S. C., and Hyndman R. J. “Forecasting: methods and applications”, New York: John Wiley & Sons, 1998.

3.  , , “Бизнес-прогнозирование”, Вильямс, 2003.

4.  Specht D. F. “A Generalized Regression Neural Network”, IEEE Transactions on Neural Networks, v.2, N 6, Nov. 1991, 568-576.

5.  Hassoun M. H. “Fundamentals of Artificial Neural Networks”, A Bradford book, The MIT Press Cambridge Massachusetts, 1995.