Модуль 3
Методические указания к решению задач по Математической статистике
Вычисление точечных оценок
При вычислении выборочной средней и выборочной дисперсии используются различные приемы, которые упрощают процедуру вычисления. Рассмотрим некоторые из них на конкретных примерах.
Пример 1. Из генеральной совокупности извлечена выборка объема n = 50
Варианта
2 5 7 10
Частота
16 12 8 14
Найти несмещенную оценку генеральной средней.
Р е ш е н и е. Это выборочная средняя (Используем формулу (10а).)
=
= (
Пример 2. Найти выборочную среднюю по данному распределению выборки объема n =10
1250 1270 1280
2 5 3
Р е ш е н и е. Т. к.
большие числа, то удобнее перейти к условным вариантам
, где «ложный нуль» С = 1270 расположен в центре выборки
- 20 0 10
2 5 3
Тогда
= С +
= 1270 – (
)/10 =1270 – 1 = 1269.
Пример 3. Найти выборочную дисперсию по данному распределению выборки объема n =10
186 192 194
2 5 3
Р е ш е н и е. Перейдем к условным вариантам 
- 5 1 3
2 5 3
Тогда формула для вычисления дисперсии с «ложным нулем» (10в) примет вид
=
– =
=
= 8,2 – 0,16 = 8,04
Пример 4. Найти выборочную дисперсию по данному распределению выборки объема n =10
0,01 0,04 0,08
5 3 2
Р е ш е н и е. Если
десятичные дроби с k десятичными знаками после запятой, то переходят к условным вариантам
, где С =
. Тогда ![]()
и = /
. В нашем случае ![]()
1 4 8
2 5 3
Найдем выборочную дисперсию условных вариант
=
– = 7,21
Найдем искомую выборочную дисперсию первоначальных вариант
= /1002 = 7,21/10000 = 0,0007
Пример 5. Найти исправленную выборочную дисперсию по данному распределению выборки объема n =10
102 104 108
2 3 5
Р е ш е н и е. Перейдем к условным вариантам 
-2 0 4
2 5 3
Найдем исправленную выборочную дисперсию условных вариант
=
=
[
–
] = 6,93.
Уменьшение всех вариант на С = 104 не изменило их рассеивания, поэтому
=
= 6,93.
Наиболее удобны для вычислений выборки с равноотстоящими вариантами, которые образуют арифметическую прогрессию с разностью h. В этом случае условными называются варианты, определяемые равенством
.
Если в качестве ложного нуля взять произвольную варианту, то все условные варианты окажутся целыми числами. Это очень упрощает расчеты.
Пример. Найти условные варианты статистического распределения
Варианта
23,6 28,6 33,6 38,6 43,6
Частота
5 20 50 15 10
Р е ш е н и е. Имеем h = 5. Выберем С = 33,6 , тогда
. Аналогично получим:
= –1,
= 0,
= 1,
= 2.
Введем понятие условный эмпирический момент порядка k
=
= 
Вычисление
менее трудоемко и от них легко перейти к обычным моментам.
=
=
{
– C
} =
(
– C)
=
h + C, = 
Вычисление условных моментов можно производить двумя способами методом произведений и методом сумм. Различаются они построением расчетных таблиц. В таблице метода произведений выписываются столбцы с значениями вариант, условных частот и слагаемых 1 и 2 условного момента. Переход к последующему столбцу сводится к перемножению элементов двух предыдущих.
Пример 6. Найти выборочную среднюю и дисперсию по заданному распределению выборки объёма n = 100
Варианта
12 14 16 18 20 22
Частота
5 15 50 16 10 4
Метод произведений. Пусть С = 16 , тогда
=
, h = 2.
Расчетная таблица №1
1 | 2 | 3 | 4 | 5 | 6 |
|
|
|
|
|
|
12 | 5 | -2 | -10 | 20 | 5 |
14 | 15 | -1 | -15 | 15 | 0 |
16 | 50 | 0 | 0 | 0 | 50 |
18 | 16 | 1 | 16 | 16 | 64 |
20 | 10 | 2 | 20 | 40 | 90 |
22 | 4 | 3 | 12 | 36 | 64 |
-25 +48 | |||||
n = 100 |
|
|
|
В 5-ом столбце (![]()
)
= ![]()
2. 6 - й столбец для контроля вычислений на основе тождества ![]()
(
+1)2 = ![]()
![]()
2 + 2![]()
![]()
+ n.
К о н т р о л ь: ![]()
![]()
2 + 2![]()
![]()
+ n = 127 +
(да)
Вычислим условные моменты
= (![]()
![]()
)/n = 23/100 = 0,23
= (![]()
![]()
2)/n = 127/100 = 1,27
Вычислим выборочную среднюю и дисперсию
=
h+C =
, =
=![]()
В 4 столбце происходит накопление частот с учетом их кратности, в верхней части со знаком минус, а в нижней со знаком плюс. В результате получаем, что первый момент есть разность двух чисел
=
. Для вычисления эти чисел можно использовать простое правило суммирования частот, которое называется метод сумм.
Метод сумм. Расчетная таблица №2
1 | 2 | 3 | 4 |
|
|
|
|
12 | 5 | 5 | 5 |
14 | 15 | 20 | 0 |
16 | 50 | 0 | 0 |
18 | 16 | 30 | 0 |
20 | 10 | 14 | 18 |
22 | 4 | 4 | 4 |
n = 100 |
|
|
Правила построения таблицы:
1. В 3 и 4 столбец вписывают нули в строку с нулевой условной частотой (i =3). В 4 столбце добавляют еще два нуля, выше и ниже первого.
2. Заполнение верхней части 3 столбца. Обозначим элементы 3 столбца как
, тогда
=
,
=
+
,
=
+
,
=
+
и т. д. до строки с 0. Сумма этих элементов записывается сверху
25.
3. Заполнение верхней части 4 столбца. Обозначим элементы 4 столбца как
, тогда
=
,
=
+
,
=
+
,
=
+
и т. д. до строки с 0. Сумма этих элементов записывается сверху
5.
4. Нижние части 3 и 4 столбцов заполняются аналогично снизу вверх до строки с 0, причем,
=
=
. Суммы этих элементов записываются снизу
48 и
22.
Такой способ накопления частот автоматически учитывает кратность появления каждой частоты в
= (![]()
![]()
)/n и
= (![]()
![]()
2)/n.
Введем обозначения
,
,
, тогда
=
,
= ![]()
В нашем случае
= 48 – 25 = 23,
= 48 + 25 = 73,
= 22 + 5 =27,
=
=23/100 =0,23 ,
=
=(73 + 54)/100 = 1,27.
Оба метода дают одинаковое значение условных моментов.
Прямая регрессия.
Задача. Найти выборочные уравнения прямых линий регрессии Y на X и X на Y по данным следующей корреляционной таблицы
Y | X |
| ||||
20 | 25 | 30 | 35 | 40 | ||
16 | 4 | 6 | 10 | |||
26 | 8 | 10 | 18 | |||
36 | 32 | 3 | 9 | 44 | ||
46 | 4 | 12 | 6 | 22 | ||
56 | 1 | 5 | 6 | |||
| 4 | 14 | 46 | 16 | 20 | n=100 |
Решение. Имеем равноотстоящие варианты с шагом
для Х и
для Y. Введем «ложные нули»
,
и перейдем к условным вариантам
,
. Корреляционная таблица примет вид
v | u |
| ||||
-2 | -1 | 0 | 1 | 2 | ||
-2 | 4 | 6 | 10 | |||
-1 | 8 | 10 | 18 | |||
0 | 32 | 3 | 9 | 44 | ||
1 | 4 | 12 | 6 | 22 | ||
2 | 1 | 5 | 6 | |||
| 4 | 14 | 46 | 16 | 20 | n=100 |
Найдем средние значения
,
,
,
,
=
= 
=
= 
=
= 
=
= 
=
,
= 
Для вычисления
составим расчетную таблицу
v\u | -2 | -1 | 0 | 1 | 2 |
|
|
-2 | 4 -8 \ -8 | 6 -12 \ -6 | -14 | 28 | |||
-1 | 8 -8 \ -8 | 10 -10 \ 0 | -8 | 8 | |||
0 | 32 0 \ 0 | 3 0 \ 3 | 9 0 \ 18 | 21 | 0 | ||
1 | 4 4 \ 0 | 12 12 \ 12 | 6 6 \ 12 | 24 | 24 | ||
2 | 1 2 \ 1 | 5 10 \ 10 | 11 | 22 | |||
| -8 | -20 | -6 | 14 | 16 |
| |
| 16 | 20 | 0 | 14 | 32 |
|
В каждой клеточке дополнительно записываем произведение частоты
на соответствующую варианту
(число а) и варианту
(число b)
. Просуммируем числа b по каждой строке и результаты запишем в предпоследний столбец. Полученные значения сумм будем умножать на соответствующие варианты
и результаты запишем в последний столбец. Сумма членов последнего столбца определит усредненное значение от произведения вариант
. Для контроля вычислений просуммируем числа а по каждому столбцу (предпоследняя строка). Полученные числа умножим на соответствующие значения варианты
(последняя строка) и просуммируем члены последней строки. Совпадение чисел означает правильность вычислений.
Найдем выборочный коэффициент корреляции
= 
От условных вариант
перейдем к усредненным значениям вариант
.
=
;
= ![]()
; 
Выборочное уравнение прямой линии регрессии Y на X
принимает вид
или ![]()
Выборочное уравнение прямой линии регрессии Х на Y
принимает вид
или ![]()
Прямые пересекают ось Ох под углами
и
, где
,
. Угол между прямыми
определяет формула
=0,22
=120
Вывод. Коэффициент корреляции близок к 1 и угол между прямыми достаточно мал. Это указывает на высокую степень тесноты взаимозависимости между признаками Х и Y . Прогнозы, сделанные на основе этих линий регрессии, будут иметь высокий уровень достоверности.


