Лекция №2.

Этапы работы со статическими данными методами описательной статистики.

4. Графическое представление данных.

4.1. Представление данных, сгруппированных в дискр. ст. р

–  полигон частот – ломаная, соединяющая отрезками точки с координатами (;), i=1, … , k, где – варианта значения; – частоты вариант.

       

– столбиковые диаграммы: не смыкающиеся прямоугольники одинаковой ширины, длины равной , восстановленные из точек

– кумулята дискр. ст. р.: кривая наколенных частот: ломанная, соединяющая отрезками точки ().

4.2. Представление данных, сгруппированных в интервальном статистическом ряду.

гистограмма: ступенчатая фигура, состоящая из примыкающих прямоугольников, основаниями которых служат интервалы , а высоты равны плотности частоты - для гистограммы частот, и плотности относительной частоты - для гистограммы относительных частот. гистограммы распределения

S=n

Гистограмма частот = гистограмма распределения

Гистограмма относительных частот - плотность частот.

Функцию f*(x)= называют эмпирической плотностью распределения.

Она представляет собой статистический аналог функции плонтости f(x) СВНТ x.

График этой функции:

Если график функции сгладить плавной прямой, то по ее виду можно судить, какой из теоретических законов распределения может быть выбран в качестве гипотезы о законе распределения исследуемой генеральной совокупности.

5. Выборочные числовые характеристики.

НЕ нашли? Не то? Что вы ищете?

А. Числовые характеристики положения показатели центральной тенденции

Выборочные числовые характеристики в. р., сгруппированноо в дискретный ст. р.

Среднее выборочное: найденное по несгруппированным данным.

Среднее выборочное: найденное по сгруппированным данным.

Выборочная мода: – вариант значения признака имеющий наибольшую частоту.

Выборочная медиана: – в общем случае число, делящее в р. на 2 равных по числу элементов части.

Член в. р. с порядковым номером , если n – нечетное. Число, равное среднему арифметическому двух соседних членов в. р. с порядковыми номерами  и , если n – четное.

Квартили - в общем случае числа, делящие в. р. на 4 равные по числу элементов части.

Если мы имеем данные, которые только собираемся сгруппировать в интервальный стат. ряд или данные наблюдений не утеряны, то можно использовать те же формулы для нахождения сред. выборочного, моды и медианы. Если же мы имеем готовый интервальный статистический ряд и данные наблюдений не сохранились, то используем формулу:

Для Х в

  где – середина частичных интервалов разбиения, равная полу сумме концов интервалов

Для моды

ХМ0 – начало модального интервала, т. е. имеет наибольшую частоту

h – ширина модального интервала

nM0 – частота попадания в модальный интервал

nM0-1 – частота попадания в интервал, предшествующий модальному

nM0+1 – частота попадания в интервал, следующий за модальным

Для медианы

Сначала надо определить медианный интервал путем визуального просмотра строки накопленных частот. Тот интервал, накопленная частота которого первая превышает половину объема выборки, будет медианным.

ХМе – начало медианного инт.

  - накопленная частота интервала, предшествующего медианному

– частота попадания в медианный интервал

Числовые характеристики рассеяния (показатели вариации). Формулы совпадают и для д. ст. р. и для инт. ст. р.

R = размах выборки

IQR = интервальный размах выборки

Дисперсия выборочная

Дисперсия выборочная исправленная

Среднее квадратичное отклонение

Среднее исправленное квадратичное отклонение

Выбросы – нетипичные значения признака, попавшие по выбору. К ним мы отнесем те значения признака из выборки, которые удовлетворяют совокупности неравенств:

  Дополнительные числовые характеристики (показатели формы распределения). Формулы одинаковые и для дискретного и для интервального ст. р.

Центральный момент S-го порядка

Начальный момент S-го порядка

Они играют роль, подобную производной при исследовании функции