К блоку заданий I. Описательная статистика.
Данные: ZadanMS278.xls, лист2, столбец А
119.3 | 120.3 | 119.4 | 120.6 | 120.7 | 120.4 | 122.5 | 122.7 | 123 | 124.6 |
121.9 | 123.7 | 121.4 | 121.9 | 121.2 | 121.2 | 120.2 | 120.9 | 119.6 | 119 |
122.2 | 120.1 | 123.4 | 120.1 | 120.1 | 122.8 | 121.7 | 119.9 | 122 | 124.2 |
121.5 | 122.1 | 120.7 | 120.1 | 121.4 | 120.9 | 121.5 | 119.4 | 118.8 | 120.3 |
121.5 | 120.3 | 120.3 | 120 | 119.9 | 120 | 119.8 | 121.3 | 121.9 | 123.7 |
122.9 | 119.2 | 122.8 | 120.1 | 121 | 120.1 | 121.8 | 118 | 120.8 | 123 |
119.8 | 120.7 | 120 | 119.1 | 119.9 | 124.1 | 120.2 | 120.7 | 119.2 | 121.4 |
120.8 | 119.6 | 120.2 | 120.9 | 120.6 | 121.4 | 121 | 118.6 | 120.6 | 122.6 |
121.9 | 121.9 | 120 | 123.1 | 121.1 | 120.9 | 122 | 120.8 | 122.1 | 121.4 |
119.3 | 121.4 | 121 | 120.2 | 119.8 | 120.3 | 119.4 | 121.7 | 124.2 |
(данные в бумажный отчёт не включать!).
I. Вычислить основные статистические показатели (см. таблицу ниже; вариационный ряд в отчёте не приводить, но знать, как устроен).
II. Дать определения ко всех показателям (формулы для вычисления) и их интерпретацию.
III. Привести гистограммное представление данных (начальная точка X0 и шаг Д для выбора границ заданы в файле на листе1, строка 2)
IV. Сравнить статистические показатели «своих» данных с показателями данных одного из одногруппников (при построении гистограммы одногруппника использовать «свои» границы, т. е. построить его гистограмму заново)
V. Дать заключение о возможности сравнения данных в двух группах по каким-либо статистическим показателям (копировать слова и целые фразы из отчётов одногруппников и из приведённого ниже образца категорически запрещено).
Отчёт
Первичный статистический анализ показателя прочности.
Имярек Джон Карлович гр. 09-0101 (ZadanMS278)
Объём выборки |
| 99 |
Среднее |
| 121.01,,, |
Медиана |
| 120.8 |
Дисперсия |
| 1.831,,, |
Станд. отклонение |
| 1.353,,, |
Минимум |
| 108.0,1 |
Максимум |
| 124.6 |
Размах |
| 16.6,1 |
Квартиль ј |
| 120.1,1 |
Квартиль ѕ |
| 121.9,1 |
Интеркварт. широта |
| 1.8,1 |
Асимметрия |
| 0.532,,, |
Эксцесс |
| -0.064,,, |
Вариационный ряд (не приводить в бумажном отчёте)
118 | 119.4 | 120 | 120.2 | 120.6 | 120.9 | 121.3 | 121.7 | 122.1 | 123 |
118.6 | 119.4 | 120 | 120.2 | 120.6 | 120.9 | 121.4 | 121.7 | 122.1 | 123.1 |
118.8 | 119.6 | 120 | 120.2 | 120.6 | 120.9 | 121.4 | 121.8 | 122.2 | 123.4 |
119 | 119.6 | 120 | 120.2 | 120.7 | 120.9 | 121.4 | 121.9 | 122.5 | 123.7 |
119.1 | 119.8 | 120.1 | 120.3 | 120.7 | 121 | 121.4 | 121.9 | 122.6 | 123.7 |
119.2 | 119.8 | 120.1 | 120.3 | 120.7 | 121 | 121.4 | 121.9 | 122.7 | 124.1 |
119.2 | 119.8 | 120.1 | 120.3 | 120.7 | 121 | 121.4 | 121.9 | 122.8 | 124.2 |
119.3 | 119.9 | 120.1 | 120.3 | 120.8 | 121.1 | 121.5 | 121.9 | 122.8 | 124.2 |
119.3 | 119.9 | 120.1 | 120.3 | 120.8 | 121.2 | 121.5 | 122 | 122.9 | 124.6 |
119.4 | 119.9 | 120.1 | 120.4 | 120.8 | 121.2 | 121.5 | 122 | 123 |

Шаг гистограммы Д = 1, начальная точка X0 = 117.05
Сравнительный анализ двух групп наблюдений (MS278-MS282):
I | II | ||
Объём выборки |
| 99 | 95 |
Среднее |
| 121.01 | 121.52 |
Медиана |
| 120.8 | 121.5 |
Дисперсия |
| 1.831 | 5.80 |
Станд. отклонение |
| 1.353 | 2.408 |
Минимум |
| 118.0 | 116.2 |
Максимум |
| 124.6 | 126.8 |
Размах |
| 6.6 | 10.6 |
Квартиль ј |
| 120.1 | 119.9 |
Квартиль ѕ |
| 121.9 | 123 |
Интеркварт. широта |
| 1.8 | 3.1 |
Асимметрия |
| 0.532 | 0.098 |
Эксцесс |
| -0.064 | -0.460 |
Таблица частот для двух групп (в %)
Правая граница | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 |
|
% гр. I | 0 | 0 | 1,0 | 3,0 | 20,2 | 33,3 | 23,2 | 11,1 | 4,0 | 4,0 | 0 | 0 | 0 |
% гр. II | 0 | 4,2 | 2,1 | 9,5 | 14,7 | 15,8 | 13,7 | 16,8 | 6,3 | 6,3 | 8,4 | 2,1 | 0 |

Резюме: центр второй группы (как среднее значение, так и медиана) смещён вправо по отношению к первой группе, однако говорить, что во второй группе имеется тенденция к увеличению значения прочности нельзя, поскольку в этих группах наблюдается явное различие в характеристиках разброса (дисперсия и размах группы II несколько больше) и в характеристиках сосредоточения около среднего значения – группа II имеет распределение более симметричное и более пологое около среднего значения.
Пояснения.
1. Гистограммное представление используется для различных целей. При первичном анализе преследуется только цель визуализации всего массива данных. Поэтому если в таблице частот слева или справа имеется больше одного нуля (типа – 0, 0, 0, 2, 0, 5, …), то все крайние нули, кроме одного, отбрасываются (оставить 0, 2, 0, 5, …). Для целей проверки гипотез (следующие задания) это делать запрещается.
2. При использовании какого-либо пакета программ (Excel, R, …) для вычисления статистических показателей можно воспользоваться встроенными функциями. Результат применения этих встроенных функций может отличаться от результатов Проверяющего (он может использовать другой пакет). Такое отличие не возбраняется, но в причинах различий придётся разобраться самостоятельно (пример см. в следующем пункте 3).
3. По упрощённому определению квартиль ј (первая квартиль) есть точка на числовой прямой, относительно которой ровно четверть данных располагаются левее (меньше), а три четверти – правее (больше). Поскольку таких точек может быть много (например, в ряду 1, 2, 7, 8 – любая точка от 1 до 2) или вовсе не быть (если объём выборки не кратен 4), то в соответствии со строгим определением за квартиль ј принимают одну из точек между [n/4]-ым и ([n/4]+1)-ым членами вариационного ряда (здесь [.] – целая часть числа). Способ выбора этой точки в используемом пакете программ необходимо будет объяснить.


