Кроме того, для сравнения гистограммы или полигона вариационного ряда с нормальным распределением, вычисляют коэффициент асимметрии и эксцесс:
,
.
В Excel эти характеристики по выборке вычисляются соответственно функциями
СКОС(массив данных) и ЭКСЦЕСС(массив данных).
Заметим, что для вычисления основных выборочных характеристик в Excel можно использовать также процедуру «Описательная статистика» из надстройки «Пакет анализа».
Задание 1
Для определения петрографического типа пород из горизонта неогеновых лав отобрано и проанализировано на содержание SiO2 (%) 30 проб:
№ | SiO2 | № | SiO2 | № | SiO2 | № | SiO2 | № | SiO2 | № | SiO2 |
1 | 59,5 | 6 | 69,2 | 11 | 62,9 | 16 | 61,2 | 21 | 71,4 | 26 | 67,5 |
2 | 66,8 | 7 | 61,2 | 12 | 62,4 | 17 | 69,3 | 22 | 67,7 | 27 | 65,3 |
3 | 60,5 | 8 | 66,3 | 13 | 71,6 | 18 | 64,6 | 23 | 63,6 | 28 | 69,9 |
4 | 63,7 | 9 | 73,2 | 14 | 65,8 | 19 | 67,8 | 24 | 61,1 | 29 | 73,2 |
5 | 72,5 | 10 | 64,6 | 15 | 63,1 | 20 | 56,6 | 25 | 63,8 | 30 | 60,7 |
- построить ряд распределения по типам лав: андезитобазальты (<57,2%); андезиты (<62,1%); андезит-дациты (<63,0%); дациты (<68,5%); риолит-дациты (<70,5%); риолиты
- определить средний состав лав;
- определить преобладающий состав;
- построить частотное распределение (равноинтервальный ВР) содержания SiO2 в неогеновых лавах;
- определить характеристики распределения по выборке и по ВР
Лабораторная работа №2. Оценки характеристик генеральной совокупности. Случайные ошибки.
Выборочный метод – основной метод, используемый в математической статистике – основан на том, что суждение о свойствах изучаемой генеральной совокупности (иначе говоря, о свойствах распределения изучаемой случайной величины) выносят по некоторой ее части – выборке. Чтобы по выборочным данным можно было судить о свойствах генеральной совокупности, выборка должна быть отобрана случайно. Используется два способа образования выборки:
- повторный отбор, когда каждый элемент, случайно отобранный и обследованный, возвращается в генеральную совокупность и, теоретически, может быть повторно отобран. Например, если в течение некоторого времени на предприятии каждый день опрашивают сотрудника, пришедшего первым.
- бесповторный отбор, когда отобранный элемент не возвращается в общую совокупность. При этом если объем генеральной совокупности велик, любой случайный выбор считают бесповторным.
Оценка параметра
генеральной совокупности одним числом
называется точечной оценкой. Приведем точечные оценки основных параметров распределения признака в генеральной совокупности:
Таблица 2.1. Точечные оценки основных характеристик генеральной совокупности
Параметр (генеральная характеристика) | Оценка (выборочная характеристика) | Функция в Excel | |
Генеральная средняя математическое ожидание М(Х) – для бесконечной генер. совок. | Выборочная средняя
| СРЗНАЧ(…) |
|
Дисперсия дисперсия | Исправленная выборочная дисперсия
| ДИСП(…) | |
Доля р элементов в генеральной совокупности, обладающих указанным свойством; Вероятность р появления указанного свойства | Доля в выборке
| СЧЁТЕСЛИ(…)/СЧЁТ(…) |
|
Мода |
| МОДА(…) |
|
Медиана |
| МЕДИАНА(…) |
|
Между признаками выборочной совокупности и соответствующими признаками генеральной совокупности, как правило, существует некоторое расхождение, которое называется ошибкой статистического наблюдения:
• Ошибки регистрации, или технические ошибки, связаны с недостаточной квалификацией наблюдателей, неточностью подсчетов, несовершенством приборов и т. п.
• Под ошибкой репрезентативности понимают расхождение между выборочной характеристикой и разыскиваемой (истинной) характеристикой генеральной совокупности. Здесь возможны систематические ошибки, связанные с нарушением установленных правил отбора, и случайные ошибки, которые объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.
В результате систематической ошибки выборка может оказаться смещенной, т. к. при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону (например, возраст при анкетировании часто оказывается округлен в меньшую сторону, а стаж работы – в большую). Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки, определить его, как правило, сложно или невозможно. Особенность ошибки смещения состоит в том, что, являясь постоянной частью ошибки репрезентативности, она увеличивается с увеличением объема выборки.
Случайная ошибка с увеличением объема выборки уменьшается. Величину случайной ошибки можно определить.
Для генеральной средней
и генеральной доли р предельную ошибку выборки (или точность) для генерального среднего и генеральной доли можно представить в виде
![]()
где m - стандартная или средняя ошибка выборки, t – коэффициент доверия, связанный с доверительной вероятностью – вероятностью того, что случайная ошибка репрезентативности на самом деле не превосходит вычисленную предельную ошибку.
В случае большой выборки (n>100) определение предельной ошибки для среднего и доли основано на центральной предельной теореме, вследствие которой среднее и доля при большом числе измерений имеют распределения близкие к нормальному. Поэтому коэффициент доверия t вычисляется по таблицам функции Лапласа
из условия
. При работе с таблицами Excel для вычисления коэффициента доверия по заданной доверительной вероятности используют функцию НОРМСТОБР, а для определения доверительной вероятности по коэффициенту доверия – функцию НОРМРАСП. Однако следует иметь в виду, что функция НОРМСТОБР(х) возвращает вероятность принятия нормально распределенной случайной величиной значения меньше х, т. е. величину
. Таким образом, Р(t)=(НОРМСТРАСП(t)-0,5)*2; обратно, t=НОРМСТОБР(0,5*P(t)+0,5)
Стандартная ошибка большой выборки для генеральной средней и генеральной доли рассчитывается в зависимости от условий отбора в соответствии с таблицей:
Таблица 2.2. Расчет стандартных ошибок большой выборки
Повторный отбор (или n<<N, или N=¥) | Бесповторный отбор | |
Для генеральной средней |
|
|
Для генеральной доли |
|
|
Следует отметить, что предельную ошибку для среднего большой выборки можно рассчитать в Excel также при помощи функции
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 |








