УДК 330.42 + 519.865
ББК 65.012
АНАЛОГ ПОЛИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ ДЛЯ
СОВОКУПНОСТЕЙ НЕСЧЁТНОЙ МОЩНОСТИ
, докт. экон. наук., проф., ФГБОУ ВПО
«Высшая школа экономики», Москва, *****@***ru;
, докт. экон. наук, проф. ФГБОУ ВПО
«Финансовый университет при Правительстве РФ», Москва,
eug. *****@***ru
В статье предложена методика использования непрерывного аналога полиномиального распределения для описания формирования случайного выборочного ансамбля из неоднородной совокупности несчетной мощности. Получены математические выражения для первых моментов, ковариаций и мод непрерывных распределений, что позволит расширить применение методов выборочных исследований.
Ключевые слова: полиномиальное распределение, выборочный ансамбль, неоднородная совокупность, гипергеометрическое распределение.
THE ANALOGUE OF THE MULTINOMIAL DISTRIBUTION
FOR SETS OF UNCOUNTABLE POWER
Mkhitarian V. S., Cherepanov E. V.
The paper proposes a method of using a continuous analogue of the multinomial distribution to describe the formation of a random sample of an ensemble of heterogeneous aggregate the uncountable power. The mathematical expressions for the first moments, covariance and modes of the continuous distributions have been obtained that allows to extend the application of the sample surveys.
Key words: multinomial distribution, selective ensemble, a heterogeneous population, the hypergeometric distribution.
Методы описания случайных неоднородных выборочных ансамблей в маркетинговых и социально-экономических исследованиях всегда основаны на многомерных обобщениях гипергеометрического распределения (ГГР) [Мхитарян, Черепанов, 2016]. При относительно небольших по сравнению с мощностью конечной генеральной совокупности N объемах выборочных ансамблей n (точнее, при n < 0.1 N [Королюк и др., 1978, п. 6.4.1]) m-мерное ГГР ![]()
практически без потери точности может быть заменено полиномиальным распределением (ПР) [Кендалл, Стюарт, 1966]:
![]()
, (1)
где количество зафиксированных j-х событий в полиномиальной серии из n испытаний Бернулли ровно
: ![]()
, а априорные частоты появления j-го события (все эти события, естественно, предполагаются несовместными) в каждом опыте этой серии равно
.
В некоторых прикладных задачах при изучении социально - и технико-экономических (а также многих других систем, например, потребительских рынков) приходится иметь дело с распределениями, представленными таблицей значений компонент непрерывного случайного вектора. Например, из бассейна объёма N взята проба объёма n воды с примесями c целью изучения допустимости уровня загрязнений.
В этой связи важно разобраться с видом соответствующего непрерывного распределения, что позволяет не только построить выборочные оценки частот по данным маркетинговых обследований или иных измерений, но и работать непосредственно с торговой и иной отчетной статистикой. Пусть в (n+1) –м опыте наблюдается j-е событие. Тогда распределение (1), учитывая, что (при целых n 
0) Г(n+1) = n Г(n), перейдет в распределение
. (2)
С учетом того, что
, можно записать, что первая конечная разность по j-й переменной приближенно будет равна
. (3)
Конечные разности [Гельфонд, 1967] являются прямыми дискретными аналогами производных соответствующих порядков, в силу чего при
правомерно считать, что
, а распределение
непрерывно.
Используя выражение (3), получаем уравнение вида

Для определенности назовем
функцией плотности вероятностей (ФПВ) непрерывного полиномиального распределения (НПР). ФПВ НПР симметрична по всем своим аргументам, что позволяет записать:
(4)
Значение константы С распределения (4) найдем из условия нормировки функции распределения (ФР) НПР к 1:

. (5)
Используя [Прудников и др., 1981, п.2.2.5.1] соотношение вида
, (6)
где В(б, в) – бета-функция, [Янке и др., 1977, п. V.А.3.3], имеющая вид
,
путем последовательного интегрирования соотношения (5) получаем:

где
.
Но тогда ФПВ НПР, с учетом (4) и последнего выражения, запишем в виде
(7)
Для соответствующей ФР можно записать:


,
где случайный вектор
определен в виде

В правой части этого выражения стоит функция распределения Дирихле [Dirichlet distribution]. Заметим, что в известном справочнике [Королюк и др., 1978] в описание распределения Дирихле вкрались опечатки, поэтому этот материал следует использовать осторожно.
ФПВ m-мерного распределения Дирихле имеет вид
, (8)
где
. (9)
Если в серии n испытаний Бернулли с m «непрерывными» исходами рассматривается распределение абсолютного числа различных исходов опытов, то мы имеем дело с НПР (7). При рассмотрении распределения долей различных исходов опытов используется распределение Дирихле (8).
Рассмотрим пример использования исследуемых распределений при контроле качества алкогольной продукции. Пусть в данном сорте водочной продукции должно содержаться 100
% воды, 100
% - этилового спирта, а остальное – допустимый процент примесей. Взята проба объемом n миллилитров этой продукции. НПР
определяет вероятность абсолютных значений
и
фактически обнаруженных в пробе водки, а распределение
- вероятность фактически зарегистрированных
и
долей этих составляющих.
Биномиальное распределение (двумерный случай полиномиального распределения) имеет вид
. (10)
Следовательно, непрерывное биномиальное распределение (НБР) имеет вид
,
Двумерное распределение Дирихле определено в виде

Первые центральные моменты компонент случайного вектора
подчиненного распределению Дирихле, вычисляются [Dirichlet distribution] в виде
(11)
Из выражений (11) для первых моментов
, в силу соотношений вида
, тривиально вычисляются выражения для соответствующих параметров НПР:
(12)
Для определения мод (наиболее вероятных значений) компонентов вектора
, подчиненного распределению Дирихле, запишем:
.
В силу произвольной нумерации компонент вектора
, суммируя эти уравнения, найдем, что точка максимума
определена своими компонентами:
.
Откуда следует, что мода НПР равна:
(13)
Практически авторами был использован непрерывный аналог ПР при выполнении ряда плановых и коммерческих работ, связанных с маркетингом потребительских рынков и прогнозированием экономической динамики ряда радиоэлектронных направлений промышленности. Погрешность получаемых оценок не превышала 3 %.
ЛИТЕРАТУРА
(1967). Исчисление конечных разностей. М.: Наука.
(1966). Теория распределений. / Пер. с англ. М.: Наука.
(ред.), и др. (1978). Справочник по теории вероятностей и математической статистике. Киев: Наукова думка.
, (2016). Стохастические методы анализа данных для маркетинговых и социальных исследований. // Приложение математики в экономических и технических исследованиях, № 1(6), с. 138-150.
, , (1981). Интегралы и ряды. М.: Наука.
(1977). Специальные функции. / Пер. с нем. М.: Наука.
Dirichlet distribution (http://en. wikipedia. org/wiki/Dirichlet_distribution).


