Выборка объема n записывается в виде последовательности её значений
.
Последовательность элементов выборки, расположенных в порядке их получения (наблюдения), т. е. последовательность экспериментальных данных называется статистическим рядом.
Последовательность элементов выборки, расположенных в порядке возрастания их значений
, называется ранжированным рядом. Номер элемента ранжированного ряда называется рангом.
В ранжированном ряду может быть несколько одинаковых значений
. В этом случае
называется вариантой. Последовательность вариант, расположенных в порядке возрастания их значений
, называется вариационным рядом.
Для представления экспериментальных данных используется статистическое распределение выборки. Это перечень вариант
и соответствующих им частот
и (или) относительных частот
:
Хi | х1 | х2 | … | хk |
mi | m1 | m2 | ... | mk |
pi | p1 | p2 | ... | pk |
– количество вариант,
– частота повторения варианты в выборке,
– относительные частоты.
Пример Экспериментальные данные (статистический ряд): 10 11 9 8 10 11 10 8 9 10 10 12 10 9 10 10 9 10 10 12 Ранжированный ряд: 8 8 9 9 9 9 10 10 10 10 10 10 10 10 10 10 11 11 12 12 Вариационный ряд: 8 9 10 11 12 Статистическое распределение выборки:
|
Если количество вариант k невелико, то вариационный ряд достаточно представить в виде таблицы
Варианта
| Частота выпадения варианты
|
Если же количество вариант k достаточно велико, то необходимо разделять вариационный ряд на интервалы. В этом случае ряд называется интервальным. Оптимальное количество
интервалов зависит от объема выборки
и может быть вычислено по формуле Старджесса
.
Полученное значение округляется до целого. Рекомендуется выбирать нечетное количество интервалов.
Затем вычисляется ширина интервала h по формуле
,
где
– наибольшее и наименьшее значения данного вариационного ряда
Определяют границы интервалов[1]:
,
где i – номер интервала.
Например, для 1-ого интервала
, для 2-ого интервала
, а для последнего
, если
, и
, если
.
Затем подсчитывают частоту попадания экспериментальных значений в интервалы и вычисляют середину интервала по формуле
.
Результаты удобно представить в виде таблицы
Границы интервалов
| Середины интервалов
| Частота попадания в интервал
|
Пример Построить интервальное распределение для выборки объемом n=40 79 58 54 52 73 67 71 63 85 53 73 67 62 53 41 43 61 52 63 80 72 65 65 77 42 67 64 67 70 68 59 61 75 59 32 69 60 60 60 76 Решение: Определим по формуле Старджесса оптимальное количество интервалов
Поскольку лучше всего выбирать нечетное количество интервалов, то выбираем ближайшее нечетное значение
Расположим выборку экспериментальных данных в ранжированный ряд 32 41 42 43 52 52 53 53 54 58 59 59 60 60 60 61 61 62 63 63 64 65 65 67 67 67 67 68 69 70 71 72 73 73 75 76 77 79 80 85 Из ранжированного ряда определяем максимальное и минимальное значение
тогда по формуле ширина интервала
Определим границы интервалов по формуле
Определим частоты попадания значений элементов выборки в каждый из интервалов - в интервал - в интервал - в интервал - в интервал - в интервал - в интервал - в интервал Определим центры интервалов по формуле
В итоге получим интервальное распределение
|
2.3. Статистические (эмпирические) функции распределения
В математической статистике (в том числе и метрологической практике) для анализа выборок используются аналоги интегральной и дифференциальной функций распределения, которые называются статистическими (или эмпирическими). Можно сказать, что эмпирические функции распределения выборки служат для оценки теоретических функций распределения генеральной совокупности.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 |
Основные порталы (построено редакторами)
