Кроме того, для сравнения гистограммы или полигона вариационного ряда с нормальным распределением, вычисляют коэффициент асимметрии и эксцесс:

, .

В Excel эти характеристики по выборке вычисляются соответственно функциями

СКОС(массив данных) и ЭКСЦЕСС(массив данных).

Заметим, что для вычисления основных выборочных характеристик в Excel можно использовать также процедуру «Описательная статистика» из надстройки «Пакет анализа».

Задание 1

Для определения петрографического типа пород из горизонта неогеновых лав отобрано и проанализировано на содержание SiO2 (%) 30 проб:

SiO2

SiO2

SiO2

SiO2

SiO2

SiO2

1

59,5

6

69,2

11

62,9

16

61,2

21

71,4

26

67,5

2

66,8

7

61,2

12

62,4

17

69,3

22

67,7

27

65,3

3

60,5

8

66,3

13

71,6

18

64,6

23

63,6

28

69,9

4

63,7

9

73,2

14

65,8

19

67,8

24

61,1

29

73,2

5

72,5

10

64,6

15

63,1

20

56,6

25

63,8

30

60,7

- построить ряд распределения по типам лав: андезитобазальты (<57,2%); андезиты (<62,1%); андезит-дациты (<63,0%); дациты (<68,5%); риолит-дациты (<70,5%); риолиты

- определить средний состав лав;

- определить преобладающий состав;

- построить частотное распределение (равноинтервальный ВР) содержания SiO2 в неогеновых лавах;

- определить характеристики распределения по выборке и по ВР

Лабораторная работа №2. Оценки характеристик генеральной совокупности. Случайные ошибки.

НЕ нашли? Не то? Что вы ищете?

Выборочный метод – основной метод, используемый в математической статистике – основан на том, что суждение о свойствах изучаемой генеральной совокупности (иначе говоря, о свойствах распределения изучаемой случайной величины) выносят по некоторой ее части – выборке. Чтобы по выборочным данным можно было судить о свойствах генеральной совокупности, выборка должна быть отобрана случайно. Используется два способа образования выборки:

- повторный отбор, когда каждый элемент, случайно отобранный и обследованный, возвращается в генеральную совокупность и, теоретически, может быть повторно отобран. Например, если в течение некоторого времени на предприятии каждый день опрашивают сотрудника, пришедшего первым.

- бесповторный отбор, когда отобранный элемент не возвращается в общую совокупность. При этом если объем генеральной совокупности велик, любой случайный выбор считают бесповторным.

Оценка параметра генеральной совокупности одним числом называется точечной оценкой. Приведем точечные оценки основных параметров распределения признака в генеральной совокупности:

Таблица 2.1. Точечные оценки основных характеристик генеральной совокупности

Параметр

(генеральная характеристика)

Оценка

(выборочная характеристика)

Функция в

Excel

Генеральная средняя – для конечной генер. совокупности;

математическое ожидание М(Х) – для бесконечной генер. совок.

Выборочная средняя

СРЗНАЧ(…)

 

Дисперсия генеральной совокупности;

дисперсия распределения признака Х

Исправленная выборочная дисперсия

ДИСП(…)

Доля р элементов в генеральной совокупности, обладающих указанным свойством;

Вероятность р появления указанного свойства

Доля в выборке

СЧЁТЕСЛИ(…)/СЧЁТ()

 

Мода генеральной совок.

выборки

МОДА(…)

 

Медиана генеральной совок.

выборки

МЕДИАНА(…)

 

Между признаками выборочной совокупности и соответствующими признаками генеральной совокупности, как правило, существует некоторое расхождение, которое называется ошибкой статистического наблюдения:

•  Ошибки регистрации, или технические ошибки, связаны с недостаточной квалификацией наблюдателей, неточностью подсчетов, несовершенством приборов и т. п.

•  Под ошибкой репрезентативности понимают расхождение между выборочной характеристикой и разыскиваемой (истинной) характеристикой генеральной совокупности. Здесь возможны систематические ошибки, связанные с нарушением установленных правил отбора, и случайные ошибки, которые объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.

В результате систематической ошибки выборка может оказаться смещенной, т. к. при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону (например, возраст при анкетировании часто оказывается округлен в меньшую сторону, а стаж работы – в большую). Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки, определить его, как правило, сложно или невозможно. Особенность ошибки смещения состоит в том, что, являясь постоянной частью ошибки репрезентативности, она увеличивается с увеличением объема выборки.

Случайная ошибка с увеличением объема выборки уменьшается. Величину случайной ошибки можно определить.

Для генеральной средней и генеральной доли р предельную ошибку выборки (или точность) для генерального среднего и генеральной доли можно представить в виде

где m - стандартная или средняя ошибка выборки, t – коэффициент доверия, связанный с доверительной вероятностью – вероятностью того, что случайная ошибка репрезентативности на самом деле не превосходит вычисленную предельную ошибку.

В случае большой выборки (n>100) определение предельной ошибки для среднего и доли основано на центральной предельной теореме, вследствие которой среднее и доля при большом числе измерений имеют распределения близкие к нормальному. Поэтому коэффициент доверия t вычисляется по таблицам функции Лапласа из условия . При работе с таблицами Excel для вычисления коэффициента доверия по заданной доверительной вероятности используют функцию НОРМСТОБР, а для определения доверительной вероятности по коэффициенту доверия – функцию НОРМРАСП. Однако следует иметь в виду, что функция НОРМСТОБР(х) возвращает вероятность принятия нормально распределенной случайной величиной значения меньше х, т. е. величину . Таким образом, Р(t)=(НОРМСТРАСП(t)-0,5)*2; обратно, t=НОРМСТОБР(0,5*P(t)+0,5)

Стандартная ошибка большой выборки для генеральной средней и генеральной доли рассчитывается в зависимости от условий отбора в соответствии с таблицей:

Таблица 2.2. Расчет стандартных ошибок большой выборки

Повторный отбор

(или n<<N, или N=¥)

Бесповторный отбор

Для генеральной средней

Для генеральной доли

Следует отметить, что предельную ошибку для среднего большой выборки можно рассчитать в Excel также при помощи функции

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8