Министерство образования и науки Украины

Донецкий национальный технический университет

Математические методы в

экологической геологии

Учебное пособие

Донецк, 2007

УДК 519.87:55:504

В 67

В учебном пособии изложены основные методы математической статистики, использующиеся при обработке геологической и экологической информации. Рассмотрено практическое назначение метода, последовательность расчетов, решение типовых задач. Разработаны задачи и вопросы для самостоятельной работы студентов. В приложении размещены наиболее широко используемые статистические таблицы. Учебное пособие рассчитано на студентов, аспирантов, преподавателей, занимающихся обработкой и интерпретацией информации.

Автор: Татьяна Петровна Волкова, доктор геологических наук, профессор, заведующий кафедрой «Полезные ископаемые и экологическая геология» Донецкого национального технического университета.

Рецензент: , доктор геолого-минералогических наук, професор, заведующий отделом электромагнитных исследований Украинского государственного научно-исследовательского института горной геологи, геомеханики и маркшейдерского дела (УкрНИМИ) НАН Украины

Печатается согласно решению Ученого Сонета Донецкого национального технического университета (ДонНТУ) протокол от 18.05.07

Введение

Современный поток геологических данных столь интенсивен и разнообразен, что обработка их с необходимой детальностью, в требуемые сроки без применения математических методов и компьютеров становится невозможной. Применение математических методов обеспечивает необходимое обобщение экспериментальных данных, позволяющее затем классифицировать объект, сравнить его с другими аналогичными, найти для него наиболее точные характеристики.

НЕ нашли? Не то? Что вы ищете?

Все эколого-геологические объекты имеют, как правило, очень сложное строение и представляют собой результат взаимодействия сложных физических, химических и биологических природных факторов, между которыми существуют сложные причинно-следственные связи. Все это определяет значительную изменчивость показателей, характеризующих различные свойства. Это означает, что в близких природных условиях онине остаются постоянными, а колеблются в пределах какого-то интервала. Кроме того, геологические процессы длительны, изучаемые объекты имеют значительные размеры. Это обусловливает применение выборочного метода опробования как основного методического приема изучения эколого-геологических объектов. Сеть наблюдений и объемы отбираемых проб несопоставимо малы, в сравнении с объемами недр, на которые они распространяются. Поэтому основными математическими методами, применяемыми в геологии и экологии, являются методы теории вероятностей и математической статистики.

Курс "Математические методы в геологии и экологии" знакомит будущих специалистов с возможностями применения математических методов при изучении и прогнозировании свойств геолого-экологических объектов, получении их обобщающих характеристик.

Содержание

Введение.............................................................................3

1. Некоторые положения теории вероятностей..............................5

1.1 Основные понятия и теоремы...............................................

1.2 Случайные величины и их статистические характеристики..................................................................................

1.3 Функции распределения вероятностей................................

1.4 Контрольные вопросы и задачи.............................................

2. Вариационный анализ.....................................................................

2.1 Выборка, требования к ней.....................................................

2.2 Выборочное распределение и его

основные характеристики........................................................

2.3 Контрольные вопросы и задачи..............................................

3. Проверка статистических гипотез.................................................

3.1 Оценка параметров генеральной совокупности...................

3.2 Теоретическое распределение и расчет его частот...............

3.3 Статистические гипотезы и критерии для их проверки.......

3.4 Контрольные вопросы и задачи..............................................

4. Дисперсионный анализ...................................................................

4.1 Понятия и задачи......................................................................

4.2 Однофакторный анализ...........................................................

4.3 Двухфакторный анализ............................................................

4.4 Контрольные вопросы и задачи..............................

5. Корреляционный анализ.................................................................

5.1 Понятия и задачи......................................................................

5.2 Парная корреляция..................................................................

5.3 Корреляционное отношение..................................................

5.4 Множественная корреляция...................................................

5.5 Ранговый коэффициент корреляции.....................................

5.6 Контрольные вопросы и задачи.............................................

6. Регрессионный анализю.................................................................

6.1 Понятия и задачи.....................................................................

6.2 Линейная регрессия................................................................

6.3 Нелинейная регрессия............................................................

6.4 Множественная регрессия......................................................

6.5 Оценка полученной зависимости..........................................

6.6 Контрольные вопросы и задачи.............................................

7. Пространственно-статистический анализ.....................................

7.1 Геолого-экологические объекты как совокупность полей

пространственных переменных.............................................

7.2 Модель пространственной изменчивости признака............

7.3 Проверка гипотезы о наличии закономерной

составляющей..........................................................................

7.4 Автокорреляция.......................................................................

7.5 вариограмма и крайгинг.........................................................

7.6 Проверка однородности линейно упорядоченных в

пространстве наблюдений......................................................

7.7 Выделение и описание закономерной составляющей.........

7.7.1 Тренд-анализ...................................................................

7.7.2 Методы скользящего среднего.....................................

7.7.3 Анализ карт.....................................................................

7.7 Геометро-статистическая модель..........................................

7.8 Контрольные вопросы и задачи.............................................

8. Методы распознавания образов.....................................................

8.1 Понятия и задачи..................................................................

8.2 Информативность признаков...............................................

8.3 Алгоритмы распознавания...................................................

3.4 Контрольные вопросы и задачи...........................................

Приложение Статистические таблицы..............................................

1 Некоторые положения теории вероятностей и математической статистики.

1.1 Основные понятия

Первичными понятиями в теории вероятностей являются: событие, случайная величина, вероятность. Событием считается любой результат эксперимента или наблюдения: обнаружение рудной минерализации, появление нефти в скважине, выброс отходов в реку и т. д. Результаты наблюдений фиксируются как значения конкретных эколого-геологических показателей, которые в теории вероятностей и математической статистике связывают с понятием случайной величины. В основе статистических методов лежит понятие о вероятности случайного события, которое представляет собой численную меру возможности его появления. Например, при литохимическом опровании площадей устанавливают диапазон изменения случайной величины - содержаний рудных элементов. А затем определяют вероятность события - появления на изучаемой площади аномальных рудных содержаний. Для установления границ изменения вероятности события рассмотрим классический пример теории вероятности - извлечение шара из лототрона. Если, например в лототроне находятся шары с различными номерами только черного цвета, то извлечение белого шара с заданным номером является событием невозможным, а вероятность его наступления равна нулю. И, наоборот, извлечение черного шара с любым номером из лототрона с черными шарами имеет вероятность равную единицы. Это событие будет наступать всегда и поэтому называется достоверным. Таким образом, вероятность случайного события меняется в диапазоне от 0 до 1.

Вероятность наступления любого произвольного события (p) прямо пропорциональна числу случаев (m), благоприятствующих заданному условиями, и обратно пропорциональна числу всех равновозможных случаев (n), которые могут произойти (1.1):

p=m/n. (1.1)

События делятся на совместные и несовместные. Несовместными называются такие события, совместное наступление которых при одном испытании невозможно. Например, отнесение одного образца пород одновременно к осадочным и изверженным породамявляется несовместным событием. Для расчета вероятности наступления одного из нескольких несовместных событий: А, В, ..., К применяется теорема сложения вероятностей каждого из этих событий (1.2):

Р(А или В или ... или К) = Р(А)+ Р(В) + ... + Р(К) (1.2)

Если из совокупности несовместных событий: А, В, ..., К одно из них при данных условиях всегда наступает, то такая совокупность образует полную систему событий.

Основные практические преобразования, следующие из теории вероятностей связаны с теоремами сложения и умножения вероятностей отдельных событий. Для полной системы событий сумма их вероятностей будет равна единице. Два события Е и Ē, образующие полную систему, называются противоположными.

Р(Е) + Р(Ē)=1 (1.3)

Примером противоположных событий является извлечение из лототрона четного (Е) и нечетного (Ē) номера шара; наличие(О)или отсутствие (Ō) в шлихе золота. Если вероятность одного из этих событий обозначить через р, а вероятность противоположного события через q, то:

p+q = 1; (1.4)

q = 1- p; (1.5)

Пример. Допустим, имеем N=100 проб, 30 из которых характеризуются содержаниями рудного элемента до 1%; 50 проб имеют содержания того же элемента от 1% до 2%; 20 проб имеют содержания рудного элемента более 2%. Если взять наугад любую пробу из этой совокупности, то вероятность того, что содержание рудного элемента в ней будет менее 1%, равна:

Р(А<1%)=30/100=0,3

Вероятность того, что содержание рудного элемента будет не менее 1%, равна сумме вероятностей двух событий:

Этот же результат можно получить на основе понятия противоположного события:

Р(А≥1%)=1-Р(А<1%)=1-0,3=0,7.

Для совместных событий теорема сложения вероятности имеет следующую формулировку: вероятность совместного наступления двух событий (одновременно или последовательно) равна произведению вероятности одного из них на условную вероятность другого, вычисленную при условии, что первое событие уже наступило:

Р (А и В)=Р(А)*PA(B)=P(B)*PB(A); ; (1.6)

где PA(B), PB(A) - условные вероятности появления одного из событий при условии, что второе событие уже наступило.

Например, следуя условию предыдущего примера, если первой взята проба с содержанием рудного элемента А<1%. Вероятность этого события, как определено выше, равна 0,3. Вероятность того, что вторая проба будет иметь содержание не менее 1%, учитывая результат первого события, будет определяться теоремой сложения вероятностей двух совместных событий и равна:

Р (А и В)=Р(А)*PA(B)=(30/100)*(70/99)»0.212

PA(B) - условная вероятность вычислялась из условия, что первая проба уже извлечена, поэтому общее число проб n=99, а число благоприятствующих событий m=70.

Для двух совместных событий терема сложения вероятностей будет иметь вид:

Р(А или В)=Р(А)+Р(В) - Р(А)*PA(B)=Р(А)+Р(В) - P(B)*PB(A )(1.7)

Для несовместных событий вероятность их совместного наступления Р (А и В) равна нулю и приходим к ранее приведенному равенству для вероятности суммы несовместных событий.

Пользуясь теоремами сложения и умножения вероятностей, можно получить формулу полной вероятности. Пусть событие А наступает только при появлении одного из несовместных событий Н1, Н2, ... Нi, ... Нn, образующих полную систему. Полная система событий Н1, Н2, ... Нi, ... Нn называется системой гипотез, при появлении одной из которых наступает событие А, что и отражается формулой полной вероятности. Если известны вероятности наступления каждого из них РНi, то можно показать, что:

(1.8)

Геолого-экологические исследования базируются на изучении процессов и свойств объектов путем замеров в отдельных точках наблюдения либо непосредственно на месте их расположения, либо путем отбора и анализа образцов и проб в отдельных участках. При этом выборочные наблюдения занимают весьма малый объем в сравнении с объемом всего изучаемого объекта. Тем не менее, значения показателей в точках наблюдения распространяются на весь изучаемый объем. Поэтому существенное значение для оценки точности исследований и достоверности выводов имеет густота сети наблюдений. Поэтому следующие два основных понятия теории вероятностей генеральной и выборочной совокупности связаны именно с принятой методикой выборочных наблюдений.

Генеральная совокупность - это все теоретически возможные значения случайной величины (изучаемого показателя) на объекте. Выборочная совокупность (выборка) - это наблюденные, замеренные на изучаемом объекте значения этого признака. Для того, чтобы статистические исследования были достоверны и соответствовали заданной точности, необходимо при создании выборки выполнить условия массовости, однородности, случайности и независимости.

Условие массовости должно обеспечить достаточный объем выборочной совокупности для обеспечения надежности статистических оценок. Эмпирическим путем установлено, что при уменьшении выборки до 30 значений и менее многие статистические методы не имеет смысла применять из-за низкой достоверности. Поэтому вопрос о минимально допустимом объеме выборки надо рассматривать для каждой конкретной задачи.

Условие однородности подразумевает включение в выборку наблюдений, выполненных одинаковым способом и принадлежащих одному объекту. Поскольку границы эколого-геологических объектов не всегда можно четко провести, то и выполнить это требование достаточно сложно. Поэтому применение статистических методов должно сопровождаться анализом возможных последствий нарушения этого условия.

Условие случайности предусматривает непредсказуемость попадания из генеральной совокупности отдельных наблюдений в выборку. В результате субъективного, неслучайного отбора значений показателя в выборку можно искусственно завысить или наоборот занизить статистические характеристики. Поэтому соблюдение этого условия также является необходимым для достоверности статистических выводов.

Условие независимости предполагает, что результаты отдельных замеров показателя в точках наблюдения не связаны между собой.

1.2 Параметры распределения случайной величины

Как было показано выше, случайная величина является результатом наблюдений и, следовательно, ее значения изменяются в некотором дипазоне. Различают дискретные и непрерывные случайные величины. Например, результаты спектрального анализа проб являются дискретной величиной, принимающие строго определенные значения: 0,001; 0,002;...0,01; 0,02;...0,1; 0,2;...1; 2;... %. Содержания элемента, полученного при химическом анализе проб, являются случайной величиной, принимающей значения на определенном интервале.

Диапазон изменения случайной величины может задаваться таблично или графически. При большом объеме значений такое представление данных достаточно громоздко, поэтому предпочитают графический способ. Когда случайная величина задается графически, то по оси абсцисс откладывают значения случайной величины, а по оси ординат - вероятности их выпадения. Теоретически такой график должен охватить весь диапазон изменения случайной величины с определением вероятностей принятия случайной величиной любого значения. В этом случае он называется законом распределения случайной величины p=f(x). Для непрерывной случайной величины вводится понятие интегральной функции распределения F(x). Она определяет для каждого значения (х) вероятность того, что случайная величина (Х) примет значение меньше х: F(x)=Р(Х<х) Вероятность того, что случайная величина (Х) примет значение в интервале от a до b, равна разности значений интегральной функции на концах интервала:

; (1.9)

где f(x)≥0 - плотность распределения вероятностей или дифференциальный закон распределения непрерывной случайной величины. Её значение в генеральной совокупности равно 1:

(1.10)

В математической статистике известно большое количество теоретических законов плотности распределения случайной величины. Наиболее широко применяемыми из них в геологии являются нормальный (рис.1.1) и логнормальный законы распределения (рис. 1.2). Во многих случаях закон распределения случайной величины неизвестен. Но его можно подобрать, если определить основные параметры распределения - математическое ожидание и дисперсию случайной величины.

Рис. 1.1 Нормальный закон распределения

Рис. 1.2 Логнормальный закон распределения

Математическим ожиданием дискретной случайной величины называется сумма произведений определенных значений случайной величины на соответствующие им вероятности:

; (1.11)

Если Х - непрерывная случайная величина. изменяющаяся в пределах от -¥ до +¥ с плотностью вероятности f(x), то ее математическое ожидание определяют из выражения:

(1.12)

Математическое ожидание случайной величины в пределах всей генеральной совокупности принято обозначать а или М(Х). Рассмотрим некоторые свойства математического ожидания:

1. M(C)=C; то есть математическое ожидание постоянной величины равно самой постоянной величине.

2. М(СХ)=С*М(Х); т. е. постоянный множитель можно выносить за знак математического ожидания

3. М(Х+Y+...Z)=M(X)+M(Y)+...M(Z); т. е. математическое ожидание суммы нескольких случайных величин равно сумме их математических ожиданий.

Дисперсией (D) случайной величины (X)называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания. Для дискретной случайной величины:

D(X)=M(X-M(X))2=; (1.13)

а для непрерывной:

D(X)=M(X-M(X))2=. (1.14)

Дисперсию случайной величины в пределах всей генеральной совокупности принято обозначать s2. Приведем некоторые свойства этого параметра:

1. D(C)=0; т. е. дисперсия постоянной величины равна нулю.

2. D(CX)+C2D(X); т. е. постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23