ОПРЕДЕЛЕНИЕ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН НА ОСНОВЕ ОПЫТНЫХ ДАННЫХ -

2.1. Основные задачи Математической статистики

Математические законы теории вероятностей не являются беспредметными абстракциями, лишенными физического содержания; они представляют собой математическое выражение реальных закономер­ностей, фактически существующих в массовых случайных явлениях природы.

До сих пор, говоря о законах распределения случайных величин, мы не затрагивали вопроса о том, откуда берутся, на каком осно­вании устанавливаются эти законы распределения. Ответ на вопрос вполне определенен — в основе всех этих характеристик лежит опыт; каждое исследование случайных явлений, выполняемое методами тео­рии вероятностей, прямо или косвенно опирается на эксперименталь­ные данные. Оперируя такими понятиями, как события и их вероят­ности, случайные величины, их законы распределения и числовые характеристики, теория вероятностей дает возможность теоретиче­ским путем определять вероятности одних событий через вероятности других, законы распределения и числовые характеристики одних случайных величин через законы распределения и числовые характе­ристики других. Такие косвенные методы позволяют значительно экономить время и средства, затрачиваемые на эксперимент, но отнюдь не исключают самого эксперимента. Каждое исследование в области случайных явлений, как бы отвлеченно оно ни было, корнями своими всегда уходит в эксперимент, в опытные данные, в систему наблюдений.

Разработка методов регистрации, описания и анализа статисти­ческих экспериментальных данных, получаемых в результате наблю­дения массовых случайных явлений, составляет предмет специальной науки — математической статистики.

Все задачи математической статистики касаются вопросов обра­ботки наблюдений над массовыми случайными явлениями, но в зави­симости от характера решаемого практического вопроса и от объема

имеющегося экспериментального материала эти задачи могут прини­мать ту или иную форму.

Охарактеризуем вкратце некоторые типичные задачи математи­ческой статистики, часто встречаемые на практике.

1. Задача определения закона распределения

случайной величины (или системы случайных

величин) по статистическим данным

Мы уже указывали, что закономерности, наблюдаемые в массо­вых случайных явлениях, проявляются тем точнее и отчетливее, чем больше объем статистического материала. При обработке обширных по'своему объему статистических данных часто возникает вопрос об" определении законов распределения тех или иных случайных величин. Теоретически при достаточном количестве опытов свойственные этим случайным величинам закономерности будут осуществляться сколь угодно точно. На практике нам всегда приходится иметь дело с огра­ниченным количеством экспериментальных данных; в связи с этим результаты наших наблюдений и их обработки всегда содержат боль­ший или меньший элемент случайности. Возникает вопрос о том, какие черты наблюдаемого явления относятся к постоянным, устойчивым и действительно присущи ему, а какие являются случайными и про­являются в данной серии наблюдений только за счет ограниченного объема экспериментальных данных. Естественно, к методике обра­ботки экспериментальных данных следует предъявить такие требо­вания, чтобы она, по возможности, сохраняла типичные, характерные черты наблюдаемого явления и отбрасывала все несущественное, второстепенное, связанное с недостаточным объемом опытного мате­риала. В связи с этим возникает характерная для математической статистики задача сглаживания или выравнивания стати­стических данных, представления их в наиболее компактном виде с помощью простых аналитических зависимостей.

2. Задача проверки правдоподобия гипотез

Эта задача тесно связана с предыдущей; при решении такого рода задач мы обычно не располагаем настолько обширным стати­стическим материалом, чтобы выявляющиеся в нем статистические закономерности были в достаточной мере свободны от элементов случайности. Статистический материал может с большим или меньшим правдоподобием подтверждать или не подтверждать справедливость той или иной гипотезы. Например, может возникнуть такой вопрос: согласуются ли результаты эксперимента с гипотезой о том, что данная случайная величина подчинена закону распределения F(х)? Другой подобный вопрос: указывает ли наблюденная в опыте тенденция к зависимости между двумя случайными величинами на наличие действительной объективной зависимости между. ними или же она объясняется случайными причинами, связанными с недостаточным объемом наблюдений? Для решения подобных вопросов математиматическая статистика выработала ряд специальных приемов.

7.2. Простая статистическая совокупность. Статистическая функция распределения

Предположим, что изучается некоторая случайная величина X, закон распределения которой в точности неизвестен, и требуется определить этот закон из опыта или проверить экспериментально гипотезу о том, что величина X подчинена тому или иному закону. С этой целью над случайной величиной X производится ряд независимых опытов (наблюдений). В каждом из этих опытов случайная

НЕ нашли? Не то? Что вы ищете?

величина X принимает определенное значение. Совокупность наблю­денных значений величины и представляет собой первичный стати­стический материал, подлежащий обработке, осмыслению и научному анализу. Такая совокупность называется «простой статистической совокупностью» или «простым статистическим рядом». Обычно про­стая статистическая совокупность оформляется в виде таблицы с од­ним входом, в первом столбце которой стоит номер опыта Л а во втором — наблюденное значение случайной величины.

Пример 1. Случайная величина β - угол скольжения самолета в мо­мент сбрасывания бомбы '). Произведено 20 бомбометаний, в каждом из ко­торых зарегистрирован угол скольжения β в тысячных долях радиана. Результаты наблюдений сведены в простой статистический ряд:

i

βi

i

βi

i

βi

1

—20

8

—30

15

—10

2

—60

9

120

16

20

3

—10

10

—100

17

30

4

30

11

—80

18

—80

5

60

12

20

19

60

6

70

13

40

20

70

7

—10

14

—60

Простой статистический ряд представляет собой первичную форму записи статистического материала и может быть обработан различными способами. Одним из способов такой обработки является построение статистической функции распределения случайной величины.

Статистической функцией распределения случайной вели­чины X называется частота события X < х в данном стати­стическом материале:

F*(х) = Р*(Х<х). (7.2.1)

Для того чтобы найти значение статистической функции распре­деления при данном х, достаточно подсчитать число опытов, в ко­торых величина X приняла значение, меньшее чем х, и разделить на общее число п произведенных опытов.

Пример 2. Построить статистическую функцию распределения для случайной величины р, рассмотренной в предыдущем примере2).

') Под углом скольжения подразумевается угол, составленный вектором скорости и плоскостью симметрии самолета.

2) Здесь и во многих случаях далее, при рассмотрении конкретных прак­тических примеров, мы не будем строго придерживаться правила — обозна­чать случайные величины большими буквами, а их возможные значения — соответствующими малыми буквами. Если это не может привести к недора­зумениям, мы в ряде случаев будем обозначать случайную величину и ее возможное значение одной и той же буквой.

Решение. Так как наименьшее наблюденное значение величины равно

—100, то F (—100) = 0. Значение —100 наблюдено один раз, его частота

равна ; следовательно, в точке —100 F* (β) имеет скачок, равный

В промежутке от —100 до — 80 функция F*( β) имеет значение ; в точке

—80 происходит скачок функции F* (β) на так как значение — 80 на­блюдено

дважды, и т. д.

График статистической функции распределения величины представлен на рис. 7.2.1.

Статистическая функция распределения любой случайной вели­чины— прерывной или непрерывной — представляет собой прерывную ступенчатую функцию, скачки которой соответствуют наблюденным значениям случайной величины и по величине равны частотам этих значений. Если каждое отдельное значение случайной величины X было наблюдено только один раз, скачок статистической функции

распределения в каждом наблюденном значении равен , где n —

число наблюдений.

При увеличении числа опытов п, согласно теореме Бернулли, при любом jc частота события X < х приближается (сходится по вероят­ности) к вероятности этого события. Следовательно, при увеличе­нии п статистическая функция распределения F* (х) приближается (сходится по вероятности) к подлинной функции распределения F (х) случайной величины X.

Если Xнепрерывная случайная величина, то при увеличении
числа наблюдений п число скачков функции F* (х) увеличивается,
самые скачки уменьшаются и график функции F* (х)

В принципе построение статистической функции распределения уже решает задачу описания экспериментального материала. Однако при большом числе опытов и построение F* (х) описанным выше способом весьма трудоемко. Кроме того, часто бывает удобно — в смысле наглядности — пользоваться другими характеристиками ста­тистических распределений, аналогичными не функции распределе­ния F(x), а плотности ƒ(x). С такими способами описания стати­стических данных мы познакомимся в следующем параграфе.

2.3. Статистический ряд. Гистограмма

При большом числе наблюдений (порядка сотен) простая стати­стическая совокупность перестает быть удобной формой записи статистического материала — она становится слишком громоздкой и мало наглядной. Для придания ему большей компактности и на­глядности статистический материал должен быть подвергнут до­полнительной обработке — строится так называемый «статистиче­ский ряд».

Предположим, что в нашем распоряжении результаты наблюдений над непрерывной случайной величиной X, оформленные в виде про­стой статистической совокупности. Разделим весь диапазон наблю­денных значений X на интервалы или «разряды» и подсчитаем ко­личество значений mt, приходящееся на каждый J-й разряд. Это число разделим на общее число наблюдений п и найдем частоту, соответ­ствующую данному разряду:

Сумма частот всех разрядов, очевидно, должна быть равна единице.

Построим таблицу, в которой приведены разряды в порядке их расположения вдоль оси абсцисс и соответствующие частоты. Эта таблица называется статистическим рядом:

Ii

X1; X2

X2; X3

Xi; Xi+1

Xk; Xk+1

P *i

P *1

P *2

P *i

P *k

Здесь Ii, — обозначение i-го разряда; x[t xi+lего границы; p*tсоответствующая частота; k — число разрядов.

Пример 1. Произведено 500 измерений боковой ошибки наводки при 'стрельбе с самолета по наземной цели. Результаты измерений (в тысячных долях радиана) сведены в статистический ряд:

Ii

— 4;-3

-3;-2

-2; -1

-1;0

0; 1

1;2

2;3

3;4

mi

6

25

72

133

120

88

46

10

P* i

0,012

0,050

0,144

0,266

0,240

0,176

0,092

0,020

' Здесь Ii обозначены интервалы значений ошибки наводки mi; — число наб­людений в данном интервале,
P* i = mi/n - соответствующие частоты.

При группировке наблюденных значений случайной величины по разрядам возникает вопрос о том, к какому разряду отнести значе­ние, находящееся в точности на Границе двух разрядов. В этих Случаях можно рекомендовать (чисто условно) считать данное зна-; чение принадлежащим в равной мере к обоим разрядам и "прибав­лять к числам mt того и другого разряда по 1/2.

Число разрядов, на которые следует группировать статистический j 'Материал, не должно быть слишком большим (тогда ряд распределения становится невыразительным, и частоты в нем обнаруживают незакономерные колебания); с другой стороны, оно не должно быть слишком малым (при малом числе разрядов свойства распределения описываются статистическим рядом слишком грубо). Практика пока­зывает, что в большинстве случаев рационально выбирать число разрядов порядка 10 — 20. Чем богаче и однороднее статистический Материал, тем большее число разрядов можно выбирать при состав­лении статистического ряда. Длины разрядов могут быть как одина­ковыми, так и различными. Проще, разумеется, брать их одинаковы­ми. Однако при оформлении данных о случайных величинах, рас­пределенных крайне неравномерно, иногда бывает удобно выбирать в области наибольшей плотности распределения разряды более узкие, чем в области малой плотности.

Статистический ряд часто оформляется графически в виде так называемой гистограммы. Гистограмма строится следующим обра­зом. По оси абсцисс откладываются разряды, и на каждом из раз­рядов как их основании строится прямоугольник, площадь которого равна частоте данного разряда. Для построения гистограммы нужно частоту каждого разряда разделить на его длину и полученное число взять в качестве высоты прямоугольника. В случае равных по длине

разрядов высоты прямоугольников пропорциональны соответствующим частотам. Из способа построения гистограммы следует, что полная площадь ее равна единице.

В качестве примера можно привести гистограмму для ошибки наводки, построенную по данным статистического ряда, рассмотрен­ного в примере 1 (рис. 7.3.1).

Очевидно, при увеличении числа опытов можно выбирать все более и более мелкие разряды; при этом гистограмма будет все более приближаться к некоторой кривой, ограничивающей площадь,

равную единице. Нетрудно убедиться, что эта кривая представляет собой график плотности распределения величины X.

Пользуясь данными статистического ряда, можно приближенно построить и статистическую функцию распределения величины X, Построение точной статистической функции распределения с несколь­кими сотнями скачков во всех наблюденных значениях X слишком трудоемко и себя не оправдывает. Для практики обычно достаточно построить статистическую функцию распределения по нескольким точкам. В качестве этих точек удобно взять границы X1, X2, ... разрядов, которые фигурируют в статистическом ряде. Тогда, очевидно,

F*(x1)=0

F*(x2) =
F*(x3) = Pi + Pi

(7.3.2)

Соединяя полученные точки ломаной линией или плавной кривой, получим приближенный график статистической функции распреде-


Пример 2. Построить приближенно статистическую функцию распре­деления ошибки наводки по данным статистического ряда примера 1.


Решение. Применяя формулы (7.3.2), имеем:

F*(-4) = 0; F* (- 3) = 0,012; F* (-2) = 0,01 2 + 0,050 = 0,062;

F*(-l) = 0,206; F* (0) = 0,472; F*(l)= 0,712; F* (2) = 0,888;

F*(3) = 0,980; F* (4) = 1,000.

Приближенный график статистической функции распределения дан на рис. 7.3.2.

7.4. Числовые характеристики статистического распределения

В главе 5 мы ввели в рассмотрение различные числовые характеристики случайных величин: математическое ожидание, дисперсию, начальные и центральные моменты различных порядков. Эти число­вые характеристики играют большую роль в теории вероятностей. Аналогичные числовые характеристики существуют и для статисти­ческих распределений. Каждой числовой характеристике случайной величины X соответствует ее статистическая аналогия. Для основной характеристики положения — математического ожидания случайной величины — такой аналогией является среднее арифметическое наблю­денных значений случайной величины:

М*[Х] = (7.4,1)

где xtзначение случайной величины, наблюденное в 1-й опыте п — число опытов.

Эту характеристику мы будем в дальнейшем называть стати­стическим средним случайной величины.

Согласно закону больших чисел, при неограниченном увеличении числа опытов статистическое среднее приближается, (сходится по ве­роятности) к математическому ожиданию. При достаточно большом п статистическое среднее может быть принято приближенно равным математическому ожиданию. При ограниченном числе опытов стати­стическое среднее является случайной величиной, которая, тем не менее, связана с математическим ожиданием и может дать о нем известное представление.

Подобные статистические аналогии существуют для всех число­вых характеристик. Условимся в дальнейшем эти статистические аналогии обозначать теми же буквами, что и соответствующие чис­ловые характеристики, но снабжать их значком *.

Рассмотрим, например, дисперсию случайной величины. Она пред­ставляет собой математическое ожидание случайной величины

.Х2 = (Х — mх)2:

D[X] = M[X*] = M[(Xmx)2}. (7.4.2)

Если в этом выражении заменить математическое ожидание его статистической аналогией — средним арифметическим, мы получим статистическую дисперсию случайной величины X:

(7.4.3)

где т*х — М*[Х] — статистическое среднее.

Аналогично определяются статистические начальные и централь­ные моменты любых порядков:

(7.4.4)

(7.4.5)

Все эти определения полностью аналогичны данным в главе 5 определениям числовых 'характеристик случайной величины, с той разницей, что в них везде вместо математического ожидания фигу­рирует среднее арифметическое. При увеличении числа наблюдений, очевидно, все статистические характеристики будут сходиться по вероятности к соответствующим математическим характеристикам и при достаточном n могут быть приняты приближенно равными им.

Нетрудно доказать, что для статистических начальных и центральных моментов справедливы те же свойства, которые были выведены в главе 5 для математических моментов. В частности, статистический первый. центральный момент всегда равен нулю:

=- m*x = m*x - m*x = 0

Соотношения между центральными и начальными моментами также сохраняются:

=- 2m*x+(m*x)2=α*2 - (m*x)2

и т. д.

При очень большом количестве опытов вычисление характеристик,10 формулам (7.4.1) — (7.4.5) становится чрезмерно громоздким, и можно применить следующий прием: воспользоваться теми же ^разрядами, на которые был расклассифицирован статистический материал для построения статистического ряда или гистограммы, и считать приближенно значение случайной величины в каждом разряде Постоянным и равным среднему значению, которое выступает в роли «представителя» разряда. Тогда статистические числовые характе­ристики будут выражаться приближенными формулами:

m*x = M*[X] = , (7.4.7)

D*x = D* [X] =, (7.4.8)

= (7.4.9)

(7.4.10)

где xt«представитель» 1-го разряда, р* — частота 1-го разряда, kчисло разрядов.

Как видно, формулы (7.4.7) — (7.4.10) полностью аналогичны формулам п°п° 5.6 и 5.7, определяющим математическое ожидание, дисперсию, начальные и центральные моменты прерывной случайной

величины X, с той только разницей, что вместо вероятностей р{ в них стоят частоты р*, вместо математического ожидания тх — ста­тистическое среднее тх*, вместо числа возможных значений случайной величины — число разрядов.

В большинстве руководств по теории вероятностей и математической статистике при рассмотрении вопроса о статистических аналогиях для харак­теристик случайных величин применяется терминология, несколько отличная от принятой в настоящей книге, а именно, статистическое среднее именуется «выборочным средним», статистическая дисперсия—«выборочной дисперсией» и т. д. Происхождение этих терминов следующее. В статистике, особенно сельскохозяйственной и биологической, часто приходится исследовать распре­деление того или иного признака для весьма большой совокупности индиви­дуумов, образующих статистический коллектив (таким признаком может быть, например, содержание белка в зерне пшеницы, вес того же зерна, длина или вес тела какого-либо из группы животных и т. д.). Данный признак является случайной величиной, значение которой от индивидуума к индивидууму меняется. Однако, для того, чтобы составить представление о распределении этой случайной величины или о ее важнейших характери­стиках, нет необходимости обследовать каждый индивидуум данной обширной совокупности; можно обследовать некоторую выборку достаточно боль­шого объема для того, чтобы в ней были выявлены существенные черты изучаемого распределения. Та обширная совокупность, из которой произво­дится выборка, носит в статистике название генеральной совокупности. При этом предполагается, что число членов (индивидуумов) N в генеральной совокупности весьма велико, а число членов п в выборке ограничено. При достаточно большом N оказывается, что свойства выборочных/статисти­ческих) распределений и характеристик практически не зависят от N; отсюда естественно вытекает математическая идеализация, состоящая в том, что генеральная совокупность, из которой осуществляется выбор, имеет 'беско­нечный объем. При этом отличают точные характеристики (закон распределе­ния, математическое ожидание, дисперсию и т. д.), относящиеся к генераль­ной совокупности, от аналогичных им «выборочных» характеристик. Выбо­рочные характеристики отличаются от соответствующих характеристик генеральной совокупности за счет ограниченности объема выборки n; при неограниченном увеличении а, естественно, все выборочные характери­стики приближаются (сходятся по вероятности) к соответствующим характе­ристикам генеральной совокупности. Часто возникает вопрос о том, каков должен быть объем выборки п для того, чтобы по выборочным характеристи­кам можно было с достаточной точностью судить о неизвестных характерис­тиках генеральной совокупности или о том, с какой степенью точности при заданном объеме выборки можно судить о характеристиках генеральной сово­купности. Такой методический прием, состоящий в параллельном рассмотрении бесконечной генеральной совокупности, из которой осуществляется выбор, и ограниченной по объему выборки, является совершенно естественным в тех областях статистики, где фактически приходится осуществлять выбор из весьма многочисленных совокупностей индивидуумов. Для практических задач, связанных с вопросами стрельбы и вооружения, гораздо более характерно другое положение, когда над исследуемой случайной величиной (или системой случайных величин) производится ограниченное число опалов с целью определить те или иные характеристики этой величины, например, когда с целью исследования закона рассеивания при стрельбе производится некоторое количество выстрелов, или с целью исследования ошибки наводки производится серия опытов, в каждом из которых ошибка наводки регистрируется с помощью фотопулемета, и т. д. При этом ограниченное число опытов связано не с трудностью регистрации и обработки, а со сложностью и дороговизной каждого отдельного опыта. В этом случае с известной натяжкой можно также произведённые n опытов мысленно рас­сматривать как «выборку» из некоторой чисто условной «генеральной сово­купности», состоящей из бесконечного числа возможных или мыслимых опытов, которые можно было бы произвести в данных условиях. Однако искусственное введение такой гипотетической «генеральной совокупности»! при данной постановке вопроса не вызвано необходимостью и вносит в рас­смотрение вопроса, по существу, излишний элемент идеализации, не выте­кающий из непосредственной реальности задачи.

Поэтому мы в данном курсе не пользуемся терминами «выборочное среднее», «выборочная дисперсия», «выборочные характеристики» и т. д., заменяя их терминами «статистическое среднее», «статистическая дисперсия», «статистические характеристики».

2.5. Выравнивание статистических рядов

Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число наблюдений ограничено, что произведены именно те, а не другие опыты, давшие именно те, а не другие результаты. Только при очень большом числе наблюдений эти элементы случайности сглаживаются, и случайное явление обнаруживает в полной мере присущую ему закономерность. На практике мы почти никогда не имеем дела с таким большим числом наблюдений и вынуждены считаться с тем, что любому ста­тистическому распределению свойственны в большей или меньшей, мере черты случайности. Поэтому при обработке статистического материала часто приходится решать вопрос о том, как подобрать для данного статистического ряда теоретическую кривую распределения, выражающую лишь существенные черты статистического материала, но не случайности, связанные с недостаточным объемом эксперимен­тальных данных. Такая задача называется задачей выравнивания (сглаживания) статистических рядов.

Задача выравнивания заключается в том, чтобы подобрать теоре­тическую плавную кривую распределения, с той или иной точки зрения наилучшим образом описывающую данное статистическое рас­пределение (рис. 7.5.1).

Задача о наилучшем выравнивании статистических рядов, как и вообще задача о наилучшем аналитическом представлении эмпири­ческих функций, есть задача в значительной мере неопределенная, t и решение ее зависит от того, что условиться считать «наилучшим». Например, при сглаживании эмпирических зависимостей очень часто исходят из так называемого принципа или метода наименьших квадратов (см. п° 14.5), считая, что наилучшим приближением к эмпирической зависимости в данном классе функций является такое, при котором сумма квадратов отклонений обращается в минимум. При этом вопрос о том, в каком именно классе функций следует искать наилучшее приближение, решается уже не из математических соображений, а из соображений, связанных с физикой решаемой задач»} с учетом характера полученной эмпирической кривой и степени точ­ности произведенных наблюдений. Часто принципиальный характер функции, выражающей исследуемую зависимость, известен заранее из теоретических соображений, из опыта же требуется получить лишь некоторые численные параметры, входящие в выражение функции; именно эти параметры подбираются с помощью метода наименьших квадратов.

Аналогично обстоит дело и с задачей выравнивания статистиче­ских рядов. Как правило, принципиальный вид теоретической кривой выбирается заранее из соображений, связанных с существом задачи,

Рис. 7.5.1,

• . 1

а в некоторых случаях просто с внешним видом статистического распределения. Аналитическое выражение выбранной кривой распре­деления зависит от некоторых параметров; задача выравнивания ста­тистического ряда переходит в задачу рационального выбора тех значений параметров, при которых соответствие между статистиче­ским и теоретическим распределениями оказывается наилучшим.

Предположим, например, что исследуемая величина X есть ошибка измерения, возникающая в результате суммирования воздействий множества независимых элементарных ошибок; тогда из теоретических соображений можно считать, что величина X подчиняется нормаль­ному закону:

(7.5,1)

и задача выравнивания переходит в задачу о рациональном выборе параметров т и о в выражении (7.5.1).

Бывают случаи, когда заранее известно, что величина X распре­деляется статистически приблизительно равномерно на некотором

^Интервале; тогда можно поставить задачу о рациональном выборе ^Параметров того закона равномерной плотности

которым можно наилучшим образом заменить (выровнять) заданное

статистическое распределение.

? Следует при этом иметь в виду, что любая аналитическая функ-5 ция / (х), с помощью которой выравнивается статистическое распределение, должна обладать основными свойствами плотности распределения:

Предположим, что, исходя из тех или иных соображений, нами

; выбрана функция f(x), удовлетворяющая условиям (7.5.2), с помощью

которой мы хотим выровнять данное статистическое распределение;

" в выражение этой функции входит несколько параметров а, Ь, ..,;

требуется подобрать эти параметры так, чтобы функция f(x) наилучшим образом описывала данный статистический материал.
Один с из методов, применяемых для решения этой задачи, — это так называёмый метод моментов.

Согласно методу моментов, параметры а, Ь, ... выбираются с таким расчетом, чтобы несколько важнейших числовых характеристик (моментов) теоретического распределения были равны соответствующим. статистическим характеристикам. Например, если теоретическая кри­вая f(x) зависит только от двух параметров а и Ь, эти параметры выбираются так, чтобы математическое ожидание тх и дисперсия D^ теоретического распределения совпадали с соответствующими стати­стическими характеристиками тх и Dx- Если кривая ¦(X) зависит от трех параметров, можно подобрать их так, чтобы совпали Первые три момента, и т. д. При выравнивании статистических рядов может оказаться полезной специально разработанная система кривых Пир­сона, каждая из которых зависит в общем случае от четырех пара­метров. При выравнивании эти параметры выбираются с тем расче­том, чтобы сохранить первые четыре момента статистического рас­пределения (математическое ожидание, дисперсию, третий и четвертый моменты)'). Оригинальный набор кривых распределения, построенных по иному принципу, дал *). Принцип, на котором строится система кривых , заключается в том, что выбор типа теоретической кривой основывается не на внешних формальных признаках, а на анализе физической сущности случай­ного явления или процесса, приводящего к тому или иному закону распределения.

Следует заметить, что при выравнивании статистических рядов Нерационально пользоваться моментами порядка выше четвертого, так как точность вычисления моментов резко падает с увеличением их порядка.

Пример. 1. В п° 7.3 (стр. 137) приведено статистическое распределе­ние боковой ошибки наводки X при стрельбе с самолета по наземной цели. Требуется выровнять это распределение с помощью нормального закона:

Решение. Нормальный закон зависит от двух параметров: т и в.. Подберем эти параметры так, чтобы сохранить первые два момента — мате­матическое ожидание и дисперсию — статистического распределения.

Вычислим приближенно статистическое среднее ошибки наводки по фор­муле (7.4.7), причем за представителя каждого разряда примем его середину:

m*x =— 3,5 • 0,012 — 2,5 • 0,050 —1,5 • 0,144 — 0,5 • 0,266 + 0,5 - 0,240+

+1,5 • 0,176 + 2,5 • 0,092 + 3,5 • 0,020 = 0,168.

Для определения дисперсии вычислим сначала второй начальный момент по формуле (7.4.9), полагая s = 2, k = 8

=

Пользуясь выражением дисперсии через второй начальный момент (фор­мула (7.4.6)), получим:

D*x=α*2 – (m*2)2 = 2,126 — 0,028 = 2,098.

Выберем параметры т к ч нормального закона так, чтобы выполнялись условия:

m= m*x, σ2 = D*x

то есть примем:

m=0,168; σ = 1,448.

Напишем выражение нормального закона:

Пользуясь в табл. 3 приложения, вычислим значения f(x) на границах разрядов

X

-4

-3

- 2

-1

0

1

2

3

4

¦(X)

0,004

0,025

0,090

0,199

0,274

0,234

0,124

0,041

0,008

Построим на одном графике (рис. 7.5.2) гистограмму и выравнивающую ее кривую распределения.

Из графика видно, что теоретическая кривая распределения / (х), сохра­няя, в основном существенные особенности статистического распределения, 1 свободна от случайных неправильностей хода гистограммы, которые, по-види­мому, могут быть отнесены за счет случайных причин; более серьезное обоснование последнему суждению будет дано в следующем параграфе

Примечание. В данном примере при определении D*x мы вос­пользовались выражением (7.4.6) статистической дисперсии через второй начальный момент. Этот прием можно рекомендовать только в случае, когда математическое ожидание тx* исследуемой случайной величины X сравнительно невелико; в противном случае фор­мула (7.4.6) выражает дисперсию D*x как разность близких чисел и дает весьма малую точность. В случае, когда это имеет место, ре­комендуется либо вычислять D*x непосредственно по формуле (7.4.3), либо перенести начало координат в какую-либо точку, близкую к тх, и затем применить формулу (7.4.6). Пользование формулой (7.4.3) равносильно перенесению начала координат в точку тx* это может оказаться неудобным, так как выражение тx* может быть дробным, и вычитание от* из каждого xt при этом излишне осложняет вычис­ления; поэтому рекомендуется переносить начало координат в ка­кое-либо круглое значение х, близкое к тx*

Пример 2. С целью исследования закона распределения ошибки из­мерения дальности с помощью радиодальномера произведено 400 измерений Дальности. Результаты опытов представлены в виде статистического ряда:

Ii(M)

20; 30

30; 40

40; 50

50; 60

60; 70

70; 80

80; 90

90; 100

mi

21

72

66

38

51

56

64

32

P* i

0,052

0,180

0,165

0,095

0,128

0,140

0,160

0,080


О при х < а или х >


Выровнять статистический ряд с помощью закона равномерной плотности. Решение. Закон равномерной плотности выражается формулой

и зависит от двух параметров α и β. Эти параметры следует выбрать так, чтобы сохранить первые два момента статистического распределения — мате­матическое ожидание и дисперсию D*x Из "примера п° 5.8 имеем выражения математического ожидания и дисперсии для закона равномерной плотности:

mx=

Dx=

Для того чтобы упростить вычисления, связанные с определением статисти­ческих моментов, перенесем начало отсчета в точку х0 = 60 и примем за представителя каждого разряда его середину. Ряд распределения примет вид:

х'i

-35

—25

—15

—5

5

15

25

35

*

Pi

0,052

0,180

0,165

0,095

0,128

0,140

0,160

0,080

где х'i — среднее для разряда значение ошибки радиодальномера X' при но­вом начале отсчета.

и Приближенное значение статистического среднего ошибки X' равно:

m*x’ ==0,26

Второй статистический момент величины X' равен:

a2*= = 447,8
откуда статистическая дисперсия:

D*x’=α*2 – (m*x’)2 = 447,7

Переходя к прежнему началу отсчета, получим новое статистическое среднее:

mx* = mx’*,+ 60 = 60,26


и ту же статистическую дисперсию:

d*x=d*x’=447,7.

Параметры закона равномерной плот­ности определяются уравнениями:

= 60,26; = 447,7.

Решая эти уравнения относительно a и b, имеем:

а» 23,6; b »96,9, откуда

На рис. 7.5.3. показаны гистограмма и выравнивающий ее закон равномерной плотности /(х).