Ступенчатая фигура, состоящая из прямоугольников, основания которых - частичные интервалы, высоты равны отношению частоты к длине частичного интервала( плотность частоты) (частости к длине частичного интервала (плотность частости)).Гистограмма частостей имеет вид:

http://*****/docs/TViMS/NP/lekziitv/lek238.gif

Для гистограммы частот: площадь каждого прямоугольника равна частоте интервала, сумма площадей всех прямоугольников равна объему выборки. Для гистограммы частостей: площадь каждого прямоугольника равна частости интервала, сумма площадей всех прямоугольников равна 1.  Вариационные ряды задают статистическое распределение выборки: соответствие между вариантами и частотами или частостями.

5 билет

Эмирическая функция распределения

Выборочные аналоги интегральной и дифференциальной функций распределения

4.1. Эмпирическая функция распределения.

Пусть известно статистическое распределение частот количественного признака X. Введем обозначения:mxчисло наблюдений, при которых наблюдалось значение признака, меньшее х; п- общее число наблюдений (объем выборки). Ясно, что относительная частота события Х < х равна. mx/nЕсли х изменяется, то изменяется и относительная частота, т. е. относительная частота есть функция от х. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.http://*****/docs/TViMS/NP/lekziitv/BD14868_12.GIF Эмпирической функцией распределения (функцией распределения выборки) называют функцию определяющую для каждого значения х относительную частоту события Х < х, т. е.

НЕ нашли? Не то? Что вы ищете?

В отличие от эмпирической функции распределения выборки функцию распределения F (х) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F (х) определяет вероятность события  Х < х, а эмпирическая функция определяет относительную частоту этого же события. Из теоремы Бернулли следует, что относительная частота события Х < х, т. е. эмпирическая функция стремится по вероятности к вероятности F (х) этого события. Отсюда следует целесообразность использования эмпирической функции распределения выборки для приближенного представления теоретической (интегральной) функции распределения генеральной совокупности. Эмпирическая функция обладает всеми свойствами F(x):1) ее значения принадлежат отрезку [0, 1];2) неубывающая;3) если хi -наименьшая варианта, то http://*****/docs/TViMS/NP/lekziitv/lek242.gifесли x k - наибольшая варианта, то

http://*****/docs/TViMS/NP/lekziitv/lek243.gifИтак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности. Пример. Построить эмпирическую функцию по данному распределению выборки:

xi

2

6

10

mi

12

18

30

Объем выборки n = 12+ 18+ 30 =60. Хнаим= 2, значит при Х £ 2,

http://*****/docs/TViMS/NP/lekziitv/lek244.gifХ<6 наблюдалось 12 раз, следовательно, при Х< 6

http://*****/docs/TViMS/NP/lekziitv/lek245.gif.

Значение Х<10 наблюдалось 12+18= 30 раз, значит при Х<10

http://*****/docs/TViMS/NP/lekziitv/lek246.gif

Так как хнаиб =10, то при Х ³10

http://*****/docs/TViMS/NP/lekziitv/lek247.gif

Искомая эмпирическая функция имеет вид:

http://*****/docs/TViMS/NP/lekziitv/lek248.gif

График строится так же, как и график интегральной функции распределения.

http://*****/docs/TViMS/NP/lekziitv/lek249.gif

Если результаты наблюдений представлены в виде интервального вариационного ряда, то в качестве х принимают концы частичных интервалов и, пользуясь данным выше определением вычисляют значения эмпирической функции. Причем, при Х< хнач

http://*****/docs/TViMS/NP/lekziitv/lek250.gif,

а при Х ³ хкон

http://*****/docs/TViMS/NP/lekziitv/lek251.gif.

Для рассмотренного примера получим таблицу:

х

6,67

6,69

6,71

6,73

6,75

6,77

6,79

6,81

6,83

6,85

http://*****/docs/TViMS/NP/lekziitv/lek252.gif

0

0,01

0,085

0,17

0,39

0,65

0,87

0,94

0,995

1

Так как таблица определяет функцию не полностью, то при изображении графика доопределяем функцию, соединяя точки графика, соответствующие концам интервалов, отрезками. График эмпирической функции для интервального вариационного ряда есть непрерывная линия.

http://*****/docs/TViMS/NP/lekziitv/lek253.gif

6 билет

Выборочные числовые характеристики вариационного статистического ряда

Выборочные характеристики вариационного ряда

Пусть выборка задана вариационным рядом

$x_{i}$

$x_{1}$

$x_{2}$

. . .

$x_{k}$

, где $\sum\limits_{i = 1}^k {m_i } = n.$

$m_{i}$

$m_{1}$

$m_{2}$

. . .

$m_{k}$

Выборочным средним называется величина $x^\ast =

{\displaystyle 1\over\displaystyle n}\sum\limits_{i = 1}^k {x_i m_i } .$

Выборочная дисперсия $D^\ast [X] = {\displaystyle 1\over\displaystyle n}\sum\limits_{i = 1}^k

{(x_i - x^\ast )^2 \cdot m_i } ,$ а корень квадратный из выборочной дисперсии называется выборочным средним квадратическим отклонением $\sigma ^\ast [X] = \sqrt {D^\ast [X]} .$

Выборочные начальные и центральные моменты порядка $s$ определяются соответственно формулами:

\begin{displaymath}

\alpha _s^\ast = {\displaystyle 1\over\displaystyle n}\sum\l...

...style n}\sum\limits_{i = 1}^k {(x_i - x^\ast )^s \cdot m_i

} .

\end{displaymath}

Модой $(M_{o})$ называется вариант, наиболее часто встречающийся в данном вариационном ряду.

Медианой $(M_{е})$ называется вариант $x_{l}$ такой, что $\sum\limits_{i = 1}^l {m_i } \ge {\displaystyle n\over\displaystyle 2}$ и $\sum\limits_{i = l}^k {m_i

} \ge {\displaystyle n\over\displaystyle 2}.$ Медиана обладает тем свойством, что сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины (в том числе и от выборочной средней).

Важность эмпирических характеристик заключается в том, что они близки (при достаточно большом $n$) к соответствующим теоретическим значениям. Поскольку выборочные характеристики являются случайными величинами, а теоретические - числа, то близость понимается в смысле сходимости по вероятностям.

Пример 161. Известно распределение золотых медалистов, окончивших в 2001 году школы Ярославской области, по районам:

Кол-во золотых медалистов

0

1

3

4

6

8

20

Кол-во районов

6

1

4

2

1

3

1

Дайте характеристику распределения признака (число золотых медалистов по районам), вычислив для этого:

а) выборочную среднюю, б) моду и медиану, в) показатели вариации (дисперсию, среднее квадратическое отклонение, размах варьирования).

Решение. а) $х^\ast = {\displaystyle 1\over\displaystyle 18}(0 \cdot 6 + 1 \cdot 1 + 3 \cdot 4 + 4

\cdot 2 + 6 \cdot 1 + 8 \cdot 3 + 20 \cdot 1) \approx 4;$

б) $M_{\rm о} = 0$, т. к. $6 = \max \left\{ {6,1,4,2,3} \right\}$.

$M_{{\rm е}} = 3$, т. к. $6 + 1 + 4 = 11 \ge {\displaystyle 18\over\displaystyle 2}$ и $4 + 2 + 1 + 3 +

1 = 11 \ge {\displaystyle 18\over\displaystyle 2};$

в) $D^\ast [X] = {\displaystyle 1\over\displaystyle 18}(16 \cdot 6 + 9 \cdot 1 + 1 \cdot 4 + 4 \cdot 1

+ 16 \cdot 3 + 256 \cdot 1) \approx 23,2;$

\begin{displaymath}

\sigma ^\ast [X] = + \sqrt {23,2} \approx 4,8;

\end{displaymath}

$R == 20$.

Пример 162. Измерение роста (в см) 100 студентов-первокурсников университета дало следующие результаты:

Рост

154-158

158-162

162-166

166-170

170-174

174-178

178-182

Число студ-ов

10

14

26

28

12

8

2

Найдите выборочную среднюю и выборочное среднее квадратическое отклонение роста первокурсников. Решение. В качестве вариант $x_{i}$ примем середины интервалов и найдем выборочную среднюю роста студентов.

$х^\ast = 0,01 \cdot (156 \cdot 10 + 160 \cdot 14 + 164 \cdot 26 + 168 \cdot

28 + 172 \cdot 12 + 176 \cdot 8 + 180 \cdot 2) = 166$(см). Вычислим теперь выборочную дисперсию

\begin{displaymath}

D^\ast = 0,01 \cdot \left[ {^2 \cdot 10 + ( - 6)^2 \c...

... + 6^2 \cdot 12 + 10^2 \cdot 8 + 14^2 \cdot 2}

\right] = 33,44

\end{displaymath}


и, извлекая из полученного числа корень квадратный, находим среднее квадратическое отклонение

$\sigma ^\ast [X] = \sqrt {D^\ast [X]} = \sqrt {33,44} \approx 5,78$(см).

Допустим, что все значения количественного признака $Х$ разбиты на $k$ групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти групповые средние и дисперсии. Внутригрупповой дисперсией называют среднюю арифметическую дисперсий, взвешенную по объемам групп:

$D_{внгр} = {\left({\sum {N_j \cdot D_{j{ гр}} } } \right)}

\mathord{\left/ {\vp...

...ot D_{j{ гр}} } }

\right)} n}} \right. \kern-\nulldelimiterspace} n\quad (N_{j}$- объем группы $j$$n = \sum {N_j } )$.

Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней:

$D_{{межгр}} = {\left( {\sum {N_j \cdot (\bar {х}_j - \bar {х})^2} }

\right)} \m...

...-\nulldelimiterspace} n(\bar

{х},\bar {х}_j -\mbox{ общая и групповые средние})$.

Пример 163. Найти групповые, внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из следующих двух групп:

Первая группа

Вторая группа

$x_{i}$

2

4

7

$x_{i}$

3

5

6

10

$m_{i}$

3

5

2

$m_{i}$

4

4

3

4

$N_{1}$= 10

$N_{2}$= 15

Решение. 1). Найдем общую и групповые средние:

\begin{displaymath}

х^\ast = {\displaystyle 1\over\displaystyle 25} \cdot (2 \cd...

...dot 2 + 3 \cdot 4 +

5 \cdot 4 + 6 \cdot 3 + 10 \cdot 4) = 4,8;

\end{displaymath}

\begin{displaymath}

х_1^\ast = {\displaystyle 1\over\displaystyle 10} \cdot (2 \...

...5} \cdot (3 \cdot 4 + 5 \cdot 4 + 6 \cdot 3 + 10 \cdot

4) = 6,

\end{displaymath}

и, используя их, - групповые дисперсии:

\begin{displaymath}

D_{1{\rm гр}} = {\displaystyle 1\over\displaystyle 10} \cdot...

... \cdot 3 +^2

\cdot 5 +^2 \cdot 2} \right) = 3;

\end{displaymath}

\begin{displaymath}

D_{2{\rm гр}} = {\displaystyle 1\over\displaystyle 15} \cdot...

... \cdot 4)} \right) =

{\displaystyle 154\over\displaystyle 15}.

\end{displaymath}

2). Найдем внутригрупповую и межгрупповую дисперсии

\begin{displaymath}

D_{{\rm внгр}} = {\displaystyle 1\over\displaystyle 25} \cdo...

... {10 \cdot,8)^2 + 15 \cdot

(6 - 4,8)^2} \right) = 2,16.

\end{displaymath}

3). Найдем общую дисперсию

\begin{displaymath}

\begin{array}{l}

D_{{\rm общ}} = {\displaystyle 1\over\disp...

...t) = 9,52 = D_{{\rm внгр}} + D_{{\rm межгр}} . \\

\end{array}\end{displaymath}

Для вычисления выборочных характеристик при больших выборках используют метод произведений, который продемонстрируем на следующем примере.

Пример 164. Найти выборочные среднюю и дисперсию следующего статистического распределения:

$x_{i}$

20,0

20,2

20,4

20,6

20,8

21,0

21,2

21,4

21,6

21,8

22,0

$m_{i}$

2

3

7

11

17

20

16

13

6

4

1

Решение. Составим расчетную таблицу, для чего

1.  запишем варианты в первый столбец;

2.  запишем частоты во второй столбец, сумму частот (100) поместим в нижнюю клетку столбца;

3.  в качестве ложного нуля выберем варианту 21,0 (в середине ряда) и записываем условные варианты $u_{i} = (x_{i} - 21)) / 0,2 $;

4.  произведения частот на условные варианты записываем в четвертый столбец; отдельно находим сумму отрицательных $$ и отдельно сумму положительных (81) чисел, а их сумму $(- 1)$ помещаем в нижнюю клетку столбца;

5.  произведения частот на квадраты условных вариант записываем в пятый столбец, а их сумму (433) помещаем в нижнюю клетку столбца;

6.  произведения частот на квадраты условных вариант, увеличенных на единицу, запишем в шестой контрольный столбец, а их сумму помещаем в нижнюю клетку столбца.

Контроль: $\sum {m_i \cdot u_i ^2} + 2\sum {m_i \cdot u_i + n = 433 + 2

\cdot + 100 = 531 = \sum {m_i \cdot (u_i + 1)^2} } $, и вычисления произведены правильно.

1

2

3

4

5

6

$x_{i}$

$m_{i}$

$u_{i}$

$m_{i}\cdot u_{i}$

$m_{i}\cdot u_{i}^{2}$

$m_{i}\cdot $($u_{i}$+1)$^{2}$

20,0

2

-5

-10

50

32

20,2

3

-4

-12

48

27

20,4

7

-3

-21

63

28

20,6

11

-2

-22

44

11

20,8

17

-1

-17

17

0

21,0

20

0

$A_{1} = -82$

20

21,2

160

1

16

16

64

21,4

13

2

26

52

117

21,6

6

3

18

54

96

21,8

4

4

16

64

100

22,0

1

5

5

25

36

100

$A_{2} = 81$

$\Sigma m_{i}\cdot u_{i} = -1$

$\Sigma m_{i}\cdot u_{i}^{2}= 433$

$\Sigma m_{i}\cdot (u_{i}+1)^{2}= 531$

Вычислим теперь условные моменты первого и второго порядков:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7