Тема работы: Графическое представление результатов эксперимента. Расчёт основных статистических характеристик.

Цель работы: Научиться представлять результаты исследований в графическом виде и определять основные статистические характеристики.

Условие задачи: 18 гимнасток выступали на международных соревнованиях. Результаты в баллах занесены в таблицу.

Таблица исходных данных выборки:

Таблица 3

№ п/п

1

2

3

4

5

6

7

8

9

, баллов

16,42

16,25

16,50

16,32

16,98

16,18

16,50

16,47

16,01

Ранжированная выборка

16,01

16,13

16,15

16,17

16,18

16,25

16,32

16,32

16,33

№ п/п

10

11

12

13

14

15

16

17

18

, баллов

16,32

16,17

16,70

16,13

16,15

16,99

16,33

16,87

16,52

Ранжированная выборка

16,42

16,47

16,50

16,50

16,52

16,70

16,87

16,98

16,99


Определим число интервалов по формуле Стерджеса

Определим шаг (или ширину) интервала по формуле:

где – максимальное значение измеряемого показателя в упорядоченной (ранжированной) выборке, – минимальное значение показателя.

Определим шаг или ширину интервала

Границу интервала обычно округляют в большую сторону до размерности измеряемого показателя. Нижнюю границу первого интервала выберем равной минимальному значению выборки, то есть . Заполним таблицу по результатам выборки (см. табл. 6), которые распределены в интервалы, т. е. результаты измерений представим в виде вариационного ряда.

В первый столбец таблицы впишем номера 5 интервалов.

НЕ нашли? Не то? Что вы ищете?

Во второй столбец – границы интервала. Нижней границей первого интервала выбрали 16,01, прибавим к ней шаг и получим верхнюю границу первого интервала (16,01+0,2=16,21). Этот же результат является нижней границей следующего интервала (16,21+0,2=16,41), (16,41+0,2=16,61), (16,61+0,2=16,81), (16,81+0,2=17,01).

Значение верхней границы последнего интервала 17,01 больше максимального значения показателей выборки 16,99.

Третий столбец – срединные значения интервалов. Середину первого интервала определим как среднее арифметическое значение его границ. Середины следующих интервалов получим прибавлением шага интервала к предыдущим значениям.

Четвертый столбец – частота , т. е. количество значений, попавших в заданный интервал. Если граничный результат был учтен в интервале, то в последующем интервале учитываются значения выше граничного результата.

Пятый столбец – накопленная частота рассчитывается суммированием частот предыдущих интервалов. В последней строке столбца 4 получилось число, равное объему выборки.

Шестой столбец – частость ( рассчитывается делением частоты на объём выборки.

Седьмой столбец – накопленная частость получается суммированием частостей предыдущих интервалов. В последней строке столбца 7 получилась единица.

Распределение измерений, представленное в столбцах 2 (границы интервалов) и 4 (частота) или 2 (границы интервалов) и 6 (частость), называется вариационным рядом. Напомним, что интервальным вариационным рядом называется упорядоченная совокупность интервалов варьирования случайной величины с соответствующими частотами или частостями попаданий в каждый из них значений величины.

Представим результаты измерений в виде вариационного ряда (табл. 7).

Таблица 4

Результаты измерений, представленные в виде вариационного ряда

№ интервала

Границы

Интервала

Срединное значение интервала

Частота

Накопленная частота

Частость

Накопленная
частость

1

2

3

4

5

6

7

1

16,01-16,21

16,11

5

5

5/18

5/18

2

16,21-16,41

16,31

4

9(5+4)

4/18

9/18

3

16,41-16,61

16,51

5

14(9+5)

5/18

14/18

4

16,61-16,81

16,71

1

15(14+1)

1/18

15/18

5

16,81-17,01

16,91

3

18(15+3)

3/18

18/18=1



Графическое представление вариационного ряда

Графическое представление результатов измерений выражается в построении трех графиков: полигона частот (см. рис. 1), гистограммы (рис. 2) и полигона накопленных частот (кривой сумм или кумуляты) (рис. 4). Полигон частот и гистограмма показывают распределение измеряемых показателей и их сгруппированность вокруг среднего значения.

Для построения полигона частот в декартовых координатах по оси абсцисс отложим срединные значения интервалов из таблицы 4, а по оси ординат – соответствующие им частоты (или частости). Для нашего случая полигон распределения изображён на рис. 11.

Рис 11. Полигон частот результатов

Для построения гистограммы по оси абсцисс отложим границы интервалов и на них восстановим прямоугольники до уровня частот, соответствующих интервалам, отложенных по оси ординат.


Рис 12. Гистограмма распределения результатов

Если нанести на гистограмму пунктирной линией полигон распределения частот, то мы получим первоначальное представление о дифференциальной функции распределения.

Как уже говорилось выше, гистограмма является экспериментальным аналогом плотности распределения вероятностей.

Площадь гистограммы равна сумме всех частот, т. е. объёму выборки (18), или сумме частостей, т. е. единице.

Рис 13. Полигон накопленных частот результатов

Для построения полигона накопленных частот (кривой сумм или кумуляты) по оси ординат отложим верхние границы интервалов, а по оси абсцисс – соответствующие им накопленные частоты (рис. 13).

Полигон накопленных частот результатов является экспериментальным аналогом функции распределения.

Далее проведём расчёт основных статистических показателей ряда измерений, он сводится к расчёту характеристик положения, характеристик рассеяния результатов измерений и характеристик формы распределения. Причём приведём методику расчёта с помощью формул для данных сгруппированных в интервалы.

Аналитический анализ.

Характеристики положения:

    среднее арифметическое значение (среднее значение)

где n – объём выборки,
  k – число интервалов группировки,
  – частоты интервалов,
  – срединные значения интервалов.

    Мода

где – нижняя граница модального интервала.

В нашем примере модальным является третий интервал (таблица 4),  т. к. модальным называется интервал группировки с наибольшей частотой. Тогда нижняя граница модального интервала 16,41.

h – ширина интервала группировки,

– частота модального интервала, т. е. частота третьего интервала 5,

– частота интервала, предшествующего модальному, т. е. частота второго интервала 4,

– частота интервала, последующего за модальным, т. е. частота четвёртого интервала 1.

    Медиана

где – нижняя граница медианного интервала.

В нашем примере медианным является третий интервал, т. к. медианным называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/2) или накопленная частость окажется больше 0,5.

Половина объёма выборки 18/2=9, именно в третьем интервале накопленная частота впервые оказалась больше 9, т. е. 14, а накопленная частость 14/18=0,777(7) (больше 0,5).

h – ширина интервала группировки,

0,5n –половина объёма выборки (9),

– частота медианного интервала (6),

– накопленная частота интервала, предшествующего медианному (6).

Характеристики рассеяния результатов измерений:

    Размах вариации:

    Дисперсия.

Для данных, сгруппированных в интервалы, дисперсия определяется по формуле:


где – среднее значение i интервала группировки,

  – частоты интервалов.

    Среднеквадратическое отклонение (стандартное отклонение)

Для данных, сгруппированных в интервалы, стандартное отклонение определяется по формуле:

    Ошибка средней арифметической (ошибка средней)

    Коэффициент вариации

Вывод: так как коэффициент вариации не превышает 10% (V<10%), то выборка считается однородной.

Характеристики формы распределения:

    Мера скошенности

Неравенство нулю меры скошенности свидетельствует о том, что имеет место несимметричное распределение, которое скошено вправо. Действительно, как видно из предыдущих расчётов MoMe. Это нехарактерно для нормального распределения.

    Эксцесс для сгруппированных:


где – частоты интервалов группировки;
– срединное значение интервала группировки;
– среднеквадратическое отклонение.

Знак эксцесса отрицательный, следовательно, у рассматриваемого эмпирического распределения наблюдается тенденция к плосковершинности.