Лекция №2.
Этапы работы со статическими данными методами описательной статистики.
4. Графическое представление данных.
4.1. Представление данных, сгруппированных в дискр. ст. р
– полигон частот – ломаная, соединяющая отрезками точки с координатами (![]()
;![]()
), i=1, … , k, где ![]()
– варианта значения; ![]()
– частоты вариант.
![]()
![]()
![]()
![]()
– столбиковые диаграммы: не смыкающиеся прямоугольники одинаковой ширины, длины равной![]()
, восстановленные из точек ![]()
![]()

– кумулята дискр. ст. р.: кривая наколенных частот: ломанная, соединяющая отрезками точки (![]()
).
![]()
![]()
![]()
![]()
4.2. Представление данных, сгруппированных в интервальном статистическом ряду.
– гистограмма: ступенчатая фигура, состоящая из примыкающих прямоугольников, основаниями которых служат интервалы ![]()
, а высоты равны плотности частоты ![]()
- для гистограммы частот, и плотности относительной частоты ![]()
- для гистограммы относительных частот. гистограммы распределения
S=n

Гистограмма частот![]()
= гистограмма распределения

Гистограмма относительных частот ![]()
- плотность частот.
![]()
![]()
Функцию f*(x)=
называют эмпирической плотностью распределения.
Она представляет собой статистический аналог функции плонтости f(x) СВНТ x.
График этой функции:
Если график функции ![]()
сгладить плавной прямой, то по ее виду можно судить, какой из теоретических законов распределения может быть выбран в качестве гипотезы о законе распределения исследуемой генеральной совокупности.
5. Выборочные числовые характеристики.
А. Числовые характеристики положения ![]()
показатели центральной тенденции
Выборочные числовые характеристики в. р., сгруппированноо в дискретный ст. р.
Среднее выборочное: 
найденное по несгруппированным данным.
Среднее выборочное: 
найденное по сгруппированным данным.
Выборочная мода: ![]()
– вариант значения признака имеющий наибольшую частоту.
Выборочная медиана: ![]()
– в общем случае число, делящее в р. на 2 равных по числу элементов части.


Квартили ![]()
- в общем случае числа, делящие в. р. на 4 равные по числу элементов части.
Если мы имеем данные, которые только собираемся сгруппировать в интервальный стат. ряд или данные наблюдений не утеряны, то можно использовать те же формулы для нахождения сред. выборочного, моды и медианы. Если же мы имеем готовый интервальный статистический ряд и данные наблюдений не сохранились, то используем формулу:
Для Х в
![]()
где ![]()
– середина частичных интервалов разбиения, равная полу сумме концов интервалов
Для моды

ХМ0 – начало модального интервала, т. е. имеет наибольшую частоту
h – ширина модального интервала
nM0 – частота попадания в модальный интервал
nM0-1 – частота попадания в интервал, предшествующий модальному
nM0+1 – частота попадания в интервал, следующий за модальным
Для медианы

Сначала надо определить медианный интервал путем визуального просмотра строки накопленных частот. Тот интервал, накопленная частота которого первая превышает половину объема выборки, будет медианным.
ХМе – начало медианного инт.
![]()
- накопленная частота интервала, предшествующего медианному
![]()
– частота попадания в медианный интервал
Числовые характеристики рассеяния (показатели вариации). Формулы совпадают и для д. ст. р. и для инт. ст. р.
R = ![]()
размах выборки
IQR = ![]()
интервальный размах выборки
Дисперсия выборочная

Дисперсия выборочная исправленная
![]()
Среднее квадратичное отклонение
![]()
Среднее исправленное квадратичное отклонение

Выбросы – нетипичные значения признака, попавшие по выбору. К ним мы отнесем те значения признака из выборки, которые удовлетворяют совокупности неравенств:
![]()
![]()
Дополнительные числовые характеристики (показатели формы распределения). Формулы одинаковые и для дискретного и для интервального ст. р.
Центральный момент S-го порядка

Начальный момент S-го порядка

Они играют роль, подобную производной при исследовании функции


