, (6.7);

где a = r (S(y)):S(x). (6.8);

Из этого следует, что коэффициент корреляции не только служит мерой тесноты линейной связи, но и может являться основой для составления уравнения линейной регрессии:

(6.9);

Для данных предыдущего примера:

=0,4; =3,1; S(x)=0,17; S(y)=1,31; r=0.96.

Уравнением линейной регрессии Y по Х будет:

у – 3,1= 0,96*(1,31:0,17)*(х – 0,4) или

у =7,4*х +0,14.

Таким образом, полученное уравнение полностью совпадает с вычисленным ранее.

6.3. Нелинейная регрессия.

После вычисления F- критерия для проверки соответствия модели выборочным данным можно прийти к выводу, что прямая линия неадекватно представляет выборку. В простейшем случае можно предположить, что связь между переменными X и Y более сложная. Иногда можно иметь вполне определенное мнение о характере связи между переменными. С другой стороны, мы можем только предполагать наличие зависимости между двумя переменными X и Y (ее может и не существовать) или просто хотим получить выражение одной из них через другую. Обычно наши задачи находится между этими двумя крайними случаями: мы предполагаем наличие связи, но не знаем ее формы. В последних двух случаях мы можем подобрать аппроксимирующее уравнение к имеющимся данным. Если линейный коэффициент корреляции (ґ) и корреляционное отношение (η) существенно различаются, то корреляцию следует считать нелинейной, а линию регрессии отличающейся от прямой. Подбор уравнения связи определяется видом эмпирической линии регрессии, которая определяется положением групповых средних (см. рис.5.3). Выбор уравнений для нелинейной регрессии весьма обширен. Некоторые из них показаны на рисунке 6.2.

НЕ нашли? Не то? Что вы ищете?

Рис. 6.2. Графики нелинейных зависимостей

К каждой кривой приведено уравнение, содержащее определенное число коэффициентов, которые и требуется определить в результате проведения регрессионного анализа. Как видно из формул, приведенных на рисунке 6.2, возможны различные типы аппроксимирующих функций. Наиболее универсальной является полиномиальная аппроксимация, заключающаяся в том, что в качестве приближающей функции выбирается сумма целых степеней независимой переменной:

(6.10)

Уравнение, в котором все переменные суммируются, называется линейным, так как соотношение между всеми парами имеют своими графиками прямые линии. Расширение первоначального уравнения с помощью добавления следующих степеней приводит к тому, что график начинает искривляться. Один дополнительный член заставляет прямую изменить наклон, второй дополнительный член приводит к возникновению двух точек перегиба и т. д. Увеличивающаяся искривленность позволяет линии более точно подходить к исходным данным. Действительно, если число дополнительных членов достигнет (n-1), то линия пройдет точно через каждую данную точку. Однако в построении такой линии мало смысла, так как она не является более эффективной, чем сами исходные данные. Кроме того, наиболее важную информацию о данном массиве можно сохранить с использованием лишь нескольких членов в полиномиальном уравнении. Например, на рисунке 6.2 изображены полиномы второй и третьей степеням аргумента. Например, общий вид полинома третьей степени: . Такова же степень уравнения , так как оно является частным случаем предыдущего при b0, b1, b2, равных нулю. Полиномиальное уравнение строится по наблюдениям с помощью метода наименьших квадратов, а процесс этого построения называется подбором кривой.

Вычисление коэффициентов уравнений регрессии проводят методом наименьших квадратов. Количество нормальных уравнений равно количеству определяемых параметров. Составляют их аналогично нормальным уравнениям для линейного уравнения регрессии. Для параболы 2-го порядка система нормальных уравнений, аналогично (6.2) имеет вид

(6.11);

Уравнения гиперболического вида у = а : х + b (х≠0) легко привести к линейному: у = ах1 + b, где х1=1 : х, а система нормальных уравнений имеет вид:

(6.12);

Во многих других случаях уравнение нелинейной регрессии удается привести к линейному виду. Так, если уравнение y=a*bx прологарифмировать и обозначить lgy=Y, lga=a1, lgb=b1, то оно приводится к виду Y=a1+b1x, то есть к линейному.

6.4 Оценка полученной зависимости.

Для оценки качества полученного уравнения можно воспользоваться критерием разностного ряда. Пример расчета этого критерия для полученного ранее уравнения у=7,4х+0,14 приведен в нижеследующей таблице:

ŷi

Δi

Δi2

ŷi

Δi

Δi2

1,1

0,88

0,22

0,0484

4,10

3,84

0,26

0,0674

1,7

1,62

0,08

0,0064

4,60

4,58

0,02

0,0004

2,4

2,36

0,04

0,0016

5,50

5,32

0,18

0,0324

2,6

3,10

-0,50

0,2500

ИТОГО

0,30

0,4066

= 0,30 : 7 + 0,043; ;

;

Находим по статистическим таблицам:t0,05 (f=6) = 2,45. Поскольку tэмп<t0,05, то различие сравниваемых рядов несущественно.

7 Пространственно-статистический анализ


При изучении месторождений полезных ископаемых и площадей, подлежащих экологической оценке, приходится иметь дело с пространственно заданными совокупностями весьма разнообразных качественных и количественных свойств окружающей среды. При статистической обработке данных по двум выборкам может быть получено одно и то же среднее значение показателя в пробах. Допустим, что в результате маршрутного пересечения двух пластов пород получены значения содержания элемента, меняющиеся в диапазоне от 1 до 5 вес.%. Используя аппарат математической статистики, получим, что породы пластов по данному показателю имеют одинаковое среднее и дисперсию, т. е. статистически не различаются. Учет пространственного положения точек наблюдения дает совершенно новую, отличную от вероятностно - статистической, информацию о наблюдаемом явлении. Например, исследование измененчивости содержания золота и мощности жилы в пространственно упорядоченных точках наблюдения на золоторудном месторождении позволяет говорить о различном характере изменчивости этих показателей (рис.7.1).

- Рис. 7.1 Графики изменения параметров золоторудной

- жилы: а - содержания золота; б - мощности жилы

Мы видим, что мощность жилы (рис.1б) закономерно возрастает от одного контакта к другому, тогда как содержание золота крайне изменчиво и представляет случайное изменение (рис.1б). Обработка данных с учетом их пространственного положения составляет основу пространственно-статистического анализа. Только в результате ряда последовательных процедур обработки данных можно получить достоверное представление (модель) об изменении эколого-геологических свойств объекта в природе. Поэтому специалистов геологов и экологов интересуют не только средние статистические характеристики изменчивости показателей, но также закономерности их изменения в пространстве. Для этого необходимо обрабатывать уже не случайно расположенные пробы, а пространственно упорядоченные наблюдения на объекте. Каждое наблюдение должно иметь пространственную привязку - координаты, число которых отражает «мерность» изображения - одно-, двух-, трехмерное.

Пространственно - статистический анализ применим при поисках и разведке, геохимическом картировании, металлогенических, геофизических, экологических, литологических, морфоструктурных и других исследованиях. С помощью его методов решаются такие задачи, как установление границ зон экологически опасных для человека, зон влияния предприятий на окружающую среду, направлений сноса обломочного материала терригенных отложений, выявление зональности интрузивных массивов и рудных тел, прогнозирование рудоносности и участков развития оползней по комплексу геолого-геофизических признаков и многие другие задачи.

7.1 Геолого-экологические объекты как совокупность полей пространственных переменных

Все свойства геолого-экологических объектов могут быть охарактеризованы единым понятием поля пространственной переменной. Под этим понятием подразумевается пространство, каждому элементарному объему которого, наряду с пространственными координатами, может быть поставлено в соответствие определенное значение какого-либо свойства. Принято различать поля морфометрических, морфоструктурных, геохимических, геофизических, инженерно-геологических и других геолого-экологических показателей. Большинство из них являются скалярными величинами, поскольку для их определения в пространстве необходимо знать в каждой точке наблюдения модуль (абсолютную величину) и знак показателя. Значительно реже используются поля векторных величин, характеризующихся модулем и направлением. К их числу можно отнести магнитное поле. Любое скалярное поле может быть преобразовано в векторное, если изучать не исходные поля, а скорости их изменения - градиенты полей.

В зависимости от изменения во времени поля всех показателей подразделяются на стационарные и динамические. Для первых характерна неизменность поля во времени, в отличие от вторых. Такое деление достаточно условно, так как это зависит от рассматриваемого промежутка времени. Если этот промежуток времени мал, то многие показатели за это время изменяются настолько незначительно, что этим можно пренебречь и считать их поля стационарными, точнее квазистационарными. С увеличением промежутка времени наблюдений, на одном и том же объекте, поле того же показателя необходимо будет рассматривать как динамическое. Для изучения таких полей необходимо создавать сеть стационарных наблюдений за режимом изменения характеристик во времени. Без этого невозможны пространственные увязки наблюдений, выполненных в разное время и для разных частей объекта.

Пространственно-статистический анализ относится к числу основных исследований полей геолого-экологических показателей. Он включает комплекс методов по определению амплитудных и частотных характеристик, уровневого строения полей, выделению в их пределах областей с заданными свойствами, изучению пространственных соотношений полей различных показателей, характеризующих в целом геолого-экологические объекты.

Основной процедурой пространственно-статистического анализа является геометризация полей. Это комплекс графоаналитических операций над пространственно заданными показателями с целью выявления и последующего изображения функции, аппроксимирующей поле пространственной переменной. Впервые применять геометрические методы для описания закономерностей пространственных изменений свойств предложил . Им были разработаны основные положения горной геометрии, требования к функциям, описывающим поля этих свойств.

Функции, аппроксимирующие поля переменных, должны удовлетворять трем основным требованиям: однозначности, непрерывности и плавности. Функция называется однозначной, если она пересекается с перпендикуляром, восстановленным из точки плоскости или линии сечения поля, один раз. Во многих случаях это достигается путем выбора плоскости проецирования поля. Аппроксимирующая поле переменной функция называется непрерывной, если незначительному изменению координат соответствует также незначительное изменение количественной характеристики поля. Часто для геолого-экологических объектов это понятие отождествляется с определением сплошности их строения. Если на объектах исследования широко развиты дизъюнктивные нарушения, то поля многих показателей могут быть аппроксимированы лишь кусочно-непрерывными функциями. Основным требованием для его применения при изучении природных объектов является наличие пространственно упорядоченной системы наблюдений.

В соответствии с формализованным определением понятия «геологического поля» какое-либо его свойство может быть записано в математических символах следующим образом:

U = f (x, y, z, t) (7.1)

где U - показатель, характеризующий свойство;

x, y, z - пространственные координаты;

t - координата времени.

Если влиянием времени можно пренебречь (поле стационарное), то запись для трехмерного изображения будет иметь вид: U = f (x, y, z); для двухмерного случая: U = f (x, y); для одномерного: U = f (x).

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23