Задача 2. Имеется следующее распределение содержаний элемента А в изучаемых породах (таблица 2.10):
Таблица 2.10
xi | ni | xi | ni | xi | ni | xi | ni |
0,41 | 2 | 0,47 | 9 | 0,53 | 41 | 0,59 | 11 |
0,43 | 2 | 0,49 | 9 | 0,55 | 76 | 0,61 | 4 |
0,45 | 8 | 0,51 | 14 | 0,57 | 21 | 0,63 | 3 |
Найти выборочное среднее, среднее квадратическое отклонение, коэффициенты асимметрии и эксцесса.
2.4 Оценка параметров генеральной совокупности
Генеральные совокупности характеризуются некоторыми постоянными числовыми характеристиками распределения. Мы уже говорили о том, что конечной целью вариационного анализа является получение всех статистических характеристик геологического объекта. Выражаясь языком математики, это означает - получить истинные статистические характеристики генеральной совокупности Θ по их выборочным оценкам Tx . Чем меньше объем выборки, тем менее точно производится оценка параметров генеральной совокупности по выборочным значениям. На практике удовлетворительная точность оценок параметров достигается при объеме выборки не менее 50.
Все выборочные оценки из-за случайности выборки являются случайными величинами, отличающимися от постоянного истинного значения параметра генеральной совокупности. Обычно из геологических задач мы должны знать необходимую точность вычисления того или иного показателя. Обозначим через ∆ = (Θ - TN) точность выборочной оценки. Чем меньше величина ∆, тем точнее выборочная оценка. Но поскольку мы имеем дело со случайными величинами, то любую точность мы можем получить только с определенной вероятностью, которая называется доверительной вероятностью P. Она обычно задается близкой к единице: 0,95; 0,98; 0,99. В статистических таблицах чаще всего фигурирует не доверительная вероятность, а уровень значимости - величина, дополняющая доверительную вероятность до 1 (100% - вероятности)
α = 1 – P, (2.16)
Получим соответствующие значения для α: 0,05; 0,02; 0,01. Обычно для геологических исследований принимают уровень значимости α = 0,05, что означает только в 5 случаях из 100 возможно уменьшение точности оценки параметров. В 95 случаях из 100 истинное значение геологического показателя будет лежать в интервале (TN - ∆, TN + ∆). Точность расчета показателей в значительной степени зависит от объема выборки и принятого уровня значимости. В свою очередь, можно рассчитать, какой объем выборки должен быть, чтобы получить средние значения показателей с определенной точностью:
(2.17)
где tα - статистический показатель, распределенный по закону Стьюдента и зависящий от числа степеней свободы выборки f=N-1 и выбранной степени надежности α;
S2 - выборочная дисперсия;
∆ - требуемая точность расчета геологических характеристик объекта.
Но эта формула верна лишь при условии, что все случайные величины как генеральной, так и выборочной совокупности, имеют нормальный закон распределения. Для этого условия вычислены величины возможных ошибок для каждого параметра генеральной совокупности:
для среднего значения:
(2.18)
для среднеквадратичного отклонения:
(2.19)
для коэффициента вариации:
(2.20)
для показателя асимметрии:
(2.21)
для показателя эксцесса:
(2.22)
Общий вид формулы для определения доверительных интервалов:
(2.23)
Пример. Определить доверительный интервал среднего содержания элемента А в изучаемых породах по данным ранее приведенной таблицы 2.1.
Имеем
=4,41; δx= 0,14; Задавшись доверительной вероят-ностью 0,95 (α=0,05), находим по статистической таблице (приложение, табл.3) при N=100; t=1,98. Доверительный интервал равен:
4,41-1,98*0,14≤
≤ 4,41+1,98*0,14
или
4,13≤
≤ 4,69
Это означает, что с вероятностью 0,95 (95%) мы можем утверждать, что среднее значение содержания элемента А в изучаемых породах находится в пределах от 4,14% до 4,69%.
Таким образом, вся процедура оценки параметров, генеральной совокупности по выборкам основывается на знании закона распределения исследуемых геологических характеристик и необходимости сравнения различных выборок между собой. Для этого существуют специальные методы, которые мы рассмотрим в следующем разделе.
3 Статистические гипотезы и критерии их проверки
В процессе изучения геологических объектов информация о них накапливается постепенно. На стадиях поисково-оценочных работ и предварительной разведки по любой из характеристик объекта мы имеем весьма малочисленные выборки. Постепенно с повышением детальности работ повышается как их количество, так и объем. Очень часто статистические характеристики выборок отличаются весьма значительно. Иногда это обусловлено природной изменчивостью изучаемой характеристики объекта, а иногда - геологической неоднородностью объекта, который целесообразно разделить на части и изучать их самостоятельно. Для создания однородной выборки необходимо более тщательно проводить геологический анализ отбираемого материала, более четко ставить геологическую задачу для математической обработки данных.
На неоднородность выборки указывает двувершинность гистограммы вариационного ряда, значительное отличие средних значений, а также дисперсий. Поэтому прежде, чем подводить итоги вариационного анализа и оценивать статистические параметры изучаемого геологического объекта в целом, необходимо провести процедуру проверки значимости различия статистик по разным выборкам. Проверка осуществляется вычислением критериев, каждый из которых предназначен для проверки различия определенных статистик - средних значений, дисперсий, законов распределения и т. д.
Полученное численное значение критерия сравнивается с его табличным аналогом на принятом уровне значимости. В случае превышения расчетного значения над табличным выдвинутая (нулевая) гипотеза отвергается и принимается альтернативное утверждение: сравниваемые статистики отличаются существенно. Такой результат требует геологической проверки однородности изучаемого объекта, материала выборок, а также выполнения требований к ней. Теперь рассмотрим применение статистических гипотез для решения некоторых задач, возникающих при статистической обработке данных.
3.1 Подбор теоретического закона распределения
Под теоретическим распределением понимают распределение показателя в генеральной совокупности. Прежде всего, необходимо выбрать распределение, которое лучше других приближалось бы к выборочному, представленному гистограммой или полигоном частот.
Многие задачи, решаемые статистическими методами, требуют выполнения условия распределения изучаемого показателя по какому-то чаще всего нормальному теоретическому закону. Так, например, широко распространенные в геологии задачи определения необходимого числа разведочных скважин, расчет погрешностей подсчета запасов, установление зависимостей между показателями, требует подчинения выборочных данных нормальному закону распределения. Проверка гипотезы о нормальном законе распределения выборочных данных может быть проведена по показателям асимметрии и эксцесса. Схема проверки такова:
- выдвигается нулевая гипотеза H0: распределение выборочных данных соответствует нормальному закону;
- рассчитывается критерий для проверки выдвинутой гипотезы: должны выполняться следующие неравенства:
;
; (3.1)
Если полученные значения γА и γЕ не больше 3, то нулевую гипотезу принимаем, т. е. в этом случае выборочные данные подчинены нормальному закону распределения. В противном случае для выборочных данных следует подбирать не нормальный, а какой-то другой теоретический закон распределения, например, логнормальный.
Пример. Проверим данные по гранитам, приведенные в предыдущем примере, на подчинение нормальному закону распределения.
Решение: Выдвигаем нулевую гипотезу H0: содержание элемента в гранитах подчинено нормальному закону распределения.
По вычисленным данным A = -0,02; E = 0,35.
Для показателя асимметрии:
<3
Для показателя эксцесса:
<3
Таким образом, принимается гипотеза о нормальности распределения содержания элемент в гранитах.
Более общим критерием для проверки согласованности выборочного и теоретического законов распределения являются критерии, основанные на сравнении их частот распределения. Наиболее широко применяемыми из них являются λ - критерий Колмогорова-Смирнова и χ2 - критерий Пирсона. Прежде всего, для применения этих критериев необходимо рассчитать частоты теоретического закона распределения, который более всего подходит к гистограмме (полигону) вариационного ряда и выдвинут в качестве нулевой гипотезы. Рассмотрим расчет частот нормального распределения. Он осуществляется по формуле:
(3.2)
где
- теоретические частоты нормального закона распределения;
N - объем выборки;
h - ширина интервала группировки данных;
S - среднеквадратичное отклонение;
- табличное значение функции нормального распределения, в котором
.
Пример. Рассчитаем теоретические частоты для данных табл. 2.3. По ранее произведенным вычислениям имеем следующие данные
S = 1,39; h = 1,0; N = 100. Результаты вычислений приведены в таблице 3.1.
Таблица 3.1
xi | ni |
|
|
|
|
|
|
0,5 | 1 | -3,91 | 2,81 | 0,008 | 0,006 | 0,6 | 1 |
1,5 | 3 | -2,91 | 2,09 | 0,045 | 0,032 | 3,2 | 3 |
2,5 | 11 | -1,91 | 1,37 | 0,156 | 0,112 | 11,2 | 11 |
3,5 | 21 | -0,91 | 0,65 | 0,325 | 0,232 | 23,2 | 23 |
4,5 | 31 | 0,09 | 0,06 | 0,398 | 0,286 | 28,6 | 29 |
5,5 | 23 | 1,09 | 0,78 | 0,294 | 0,121 | 21,2 | 21 |
6,5 | 7 | 2,09 | 1,50 | 0,120 | 0,093 | 9,3 | 9 |
7,5 | 2 | 3,09 | 2,22 | 0,034 | 0,024 | 2,4 | 2 |
8,5 | 1 | 4,09 | 2,94 | 0,005 | 0,004 | 0,4 | 1 |
Σ | 100 | 100 |
Последняя колонка таблицы 3.1 содержит теоретические частоты, полученные округлением до целых единиц предыдущего расчетного столбца. Сумма полученных теоретических частот обязательно должна совпадать с суммой выборочных частот, т. е. с объемом выборки. После вычисления частот выбранного теоретического распределения необходимо оценить согласованность между эмпирическими и теоретическими частотами.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |


