Модуль 3

Методические указания к решению задач по Математической статистике

Вычисление точечных оценок

При вычислении выборочной средней и выборочной дисперсии используются различные приемы, которые упрощают процедуру вычисления. Рассмотрим некоторые из них на конкретных примерах.

Пример 1. Из генеральной совокупности извлечена выборка объема n = 50

Варианта 2 5 7 10

Частота 16 12 8 14

Найти несмещенную оценку генеральной средней.

Р е ш е н и е. Это выборочная средняя (Используем формулу (10а).)

= = (

Пример 2. Найти выборочную среднюю по данному распределению выборки объема n =10 1250 1270 1280

2 5 3

Р е ш е н и е. Т. к. большие числа, то удобнее перейти к условным вариантам , где «ложный нуль» С = 1270 расположен в центре выборки - 20 0 10

2 5 3

Тогда = С + = 1270 – ()/10 =1270 – 1 = 1269.

Пример 3. Найти выборочную дисперсию по данному распределению выборки объема n =10 186 192 194

2 5 3

Р е ш е н и е. Перейдем к условным вариантам

- 5 1 3

2 5 3

Тогда формула для вычисления дисперсии с «ложным нулем» (10в) примет вид

= – =

= = 8,2 – 0,16 = 8,04

Пример 4. Найти выборочную дисперсию по данному распределению выборки объема n =10 0,01 0,04 0,08

5 3 2

Р е ш е н и е. Если десятичные дроби с k десятичными знаками после запятой, то переходят к условным вариантам , где С = . Тогда и = /. В нашем случае

1 4 8

2 5 3

Найдем выборочную дисперсию условных вариант

= – = 7,21

Найдем искомую выборочную дисперсию первоначальных вариант

= /1002 = 7,21/10000 = 0,0007

Пример 5. Найти исправленную выборочную дисперсию по данному распределению выборки объема n =10

НЕ нашли? Не то? Что вы ищете?

102 104 108

2 3 5

Р е ш е н и е. Перейдем к условным вариантам

-2 0 4

2 5 3

Найдем исправленную выборочную дисперсию условных вариант

= =[ ] = 6,93.

Уменьшение всех вариант на С = 104 не изменило их рассеивания, поэтому = = 6,93.

Наиболее удобны для вычислений выборки с равноотстоящими вариантами, которые образуют арифметическую прогрессию с разностью h. В этом случае условными называются варианты, определяемые равенством .

Если в качестве ложного нуля взять произвольную варианту, то все условные варианты окажутся целыми числами. Это очень упрощает расчеты.

Пример. Найти условные варианты статистического распределения

Варианта 23,6 28,6 33,6 38,6 43,6

Частота 5 20 50 15 10

Р е ш е н и е. Имеем h = 5. Выберем С = 33,6 , тогда . Аналогично получим: = 1, = 0, = 1, = 2.

Введем понятие условный эмпирический момент порядка k

= =

Вычисление менее трудоемко и от них легко перейти к обычным моментам. = ={ C} = ( C)

= h + C, =

Вычисление условных моментов можно производить двумя способами методом произведений и методом сумм. Различаются они построением расчетных таблиц. В таблице метода произведений выписываются столбцы с значениями вариант, условных частот и слагаемых 1 и 2 условного момента. Переход к последующему столбцу сводится к перемножению элементов двух предыдущих.

Пример 6. Найти выборочную среднюю и дисперсию по заданному распределению выборки объёма n = 100

Варианта 12 14 16 18 20 22

Частота 5 15 50 16 10 4

Метод произведений. Пусть С = 16 , тогда = , h = 2.

Расчетная таблица №1

1

2

3

4

5

6

2

(+1)2

12

5

-2

-10

20

5

14

15

-1

-15

15

0

16

50

0

0

0

50

18

16

1

16

16

64

20

10

2

20

40

90

22

4

3

12

36

64

-25 +48

n = 100

=23

2=127

(+1)2=273

В 5-ом столбце () = 2. 6 - й столбец для контроля вычислений на основе тождества (+1)2 = 2 + 2 + n.

К о н т р о л ь: 2 + 2 + n = 127 + (да)

Вычислим условные моменты = ()/n = 23/100 = 0,23

= (2)/n = 127/100 = 1,27

Вычислим выборочную среднюю и дисперсию

=h+C = , = =

В 4 столбце происходит накопление частот с учетом их кратности, в верхней части со знаком минус, а в нижней со знаком плюс. В результате получаем, что первый момент есть разность двух чисел = . Для вычисления эти чисел можно использовать простое правило суммирования частот, которое называется метод сумм.

Метод сумм. Расчетная таблица №2

1

2

3

4

25

5

12

5

5

5

14

15

20

0

16

50

0

0

18

16

30

0

20

10

14

18

22

4

4

4

n = 100

48

22

Правила построения таблицы:

1. В 3 и 4 столбец вписывают нули в строку с нулевой условной частотой (i =3). В 4 столбце добавляют еще два нуля, выше и ниже первого.

2. Заполнение верхней части 3 столбца. Обозначим элементы 3 столбца как , тогда = , = + , = + , = + и т. д. до строки с 0. Сумма этих элементов записывается сверху 25.

3. Заполнение верхней части 4 столбца. Обозначим элементы 4 столбца как , тогда = , = + , = + , = + и т. д. до строки с 0. Сумма этих элементов записывается сверху 5.

4. Нижние части 3 и 4 столбцов заполняются аналогично снизу вверх до строки с 0, причем, = = . Суммы этих элементов записываются снизу 48 и 22.

Такой способ накопления частот автоматически учитывает кратность появления каждой частоты в = ()/n и = (2)/n.

Введем обозначения , , , тогда

= , =

В нашем случае

= 48 – 25 = 23, = 48 + 25 = 73, = 22 + 5 =27, = =23/100 =0,23 , = =(73 + 54)/100 = 1,27.

Оба метода дают одинаковое значение условных моментов.

Прямая регрессия.

Задача. Найти выборочные уравнения прямых линий регрессии Y на X и X на Y по данным следующей корреляционной таблицы

Y

X

20

25

30

35

40

16

4

6

10

26

8

10

18

36

32

3

9

44

46

4

12

6

22

56

1

5

6

4

14

46

16

20

n=100

Решение. Имеем равноотстоящие варианты с шагом для Х и для Y. Введем «ложные нули» , и перейдем к условным вариантам , . Корреляционная таблица примет вид

v

u

-2

-1

0

1

2

-2

4

6

10

-1

8

10

18

0

32

3

9

44

1

4

12

6

22

2

1

5

6

4

14

46

16

20

n=100

Найдем средние значения , , ,,

= =

==

= =

= =

= , =

Для вычисления составим расчетную таблицу

v\u

-2

-1

0

1

2

-2

4

-8 \ -8

6

-12 \ -6

-14

28

-1

8

-8 \ -8

10

-10 \ 0

-8

8

0

32

0 \ 0

3

0 \ 3

9

0 \ 18

21

0

1

4

4 \ 0

12

12 \ 12

6

6 \ 12

24

24

2

1

2 \ 1

5

10 \ 10

11

22

-8

-20

-6

14

16

16

20

0

14

32

В каждой клеточке дополнительно записываем произведение частоты на соответствующую варианту (число а) и варианту (число b) . Просуммируем числа b по каждой строке и результаты запишем в предпоследний столбец. Полученные значения сумм будем умножать на соответствующие варианты и результаты запишем в последний столбец. Сумма членов последнего столбца определит усредненное значение от произведения вариант . Для контроля вычислений просуммируем числа а по каждому столбцу (предпоследняя строка). Полученные числа умножим на соответствующие значения варианты (последняя строка) и просуммируем члены последней строки. Совпадение чисел означает правильность вычислений.

Найдем выборочный коэффициент корреляции

=

От условных вариант перейдем к усредненным значениям вариант .

= ; =

;

Выборочное уравнение прямой линии регрессии Y на X принимает вид или

Выборочное уравнение прямой линии регрессии Х на Y принимает вид или

Прямые пересекают ось Ох под углами и , где , . Угол между прямыми определяет формула =0,22 =120

Вывод. Коэффициент корреляции близок к 1 и угол между прямыми достаточно мал. Это указывает на высокую степень тесноты взаимозависимости между признаками Х и Y . Прогнозы, сделанные на основе этих линий регрессии, будут иметь высокий уровень достоверности.