где [SY]-вектор-столбец, состоящий из сумм квадратов и
смешанных произведений зависимой переменной Y со
всеми независимыми переменными X1, X2, …, Xm;
[SX] – матрица сумм квадратов и смешанных
произведений независимых переменных X1 , X2 , …, Xm
[b] – вектор-столбец искомых коэффициентов регрессии.
Коэффициенты регрессии bi, рассчитываются как частные коэффициенты регрессии, характеризующие изменения данной независимой переменной при условии, что влияние всех остальных переменных устранено. Они называются «весом» соответствующей независимой переменной в изменчивости зависимой переменной.
Приведенное уравнение (8.12) может быть решено путем обращения матрицы [SX]. Однако, в процессе обращения матрицы возникают вычислительные трудности, связанные с резким возрастанием числа цифр в суммах квадратов, что приводит к потерям значащих цифр при их округлении. Поэтому для решения уравнений обычно используются корреляционные матрицы зависимой и независимой переменных [R], со стандартизованными частными коэффициентами регрессии типа:
Bk=bk*Sk/Sy (8.13);
где Sk, Sy - оценки стандартных отклонений независимой
(Xk) и зависимой (Y) переменных соответственно.
В матричной форме уравнение имеет следующий вид:
[R]*[B]=[rxy], (8.14)
где [rxy] – вектор коэффициентов корреляции между
переменными Y и X1,2…m
Решение этого уравнения относительно искомых коэффициентов выполняется с обращением матрицы [R]-1:
[B] = [R]-1 [rxy] (8.15)
Рассчитанные коэффициенты В переводятся в b по формуле bk=Bk (Sy /Sk) ,а постоянный член b0 рассчитывается по формуле b0=
. Оценка общего вклада всех независимых переменных в оценку y определяется значением квадрата множественного коэффициента корреляции R2. R=1-1/Cii (где Сii -диагональный элемент матрицы [R]-1, обратное корреляционной матрице [R]). Для сравнительной оценки вклада каждой зависимой переменной коэффициент R2 сначала рассчитывается для пары y и xk с максимальным коэффициентом корреляции, а затем последовательно с тремя и более переменными (до m переменных).
Рассмотрим на примере трехмерного признакового пространства построение уравнения множественной регрессии методом подстановки, рассмотренном ранее для двумерной регрессии.
Исходными данными служит выборка из N точек наблюдений, в которых замерено три признака - x y z. Уравнение для зависимой переменной (z) ищется в виде:
(8.16);
Коэффициенты А и В рассчитываются по аналогии с ранее приведенными формулами 6.7-6.9:
(8.17);
Уравнение 8.16 с коэффициентами 8.17 описывает обычную плоскость в трехмерном пространстве. Оно позволяет вычислять теоретические (вероятные) значения зависимой переменной по заданным значениям независимых переменных в области их изменения. Как правило, оно пригодно только внутри этой области. В отдельных случаях, после тщательного анализа сущности изучаемого влияния, допускается некоторая экстраполяция.
Пример. В результате обработки данных анализа 100 проб получены следующие статистики для трех элементов:
=2; S(x)=2; rxy=0,50;
=30; S(y)=10; rxz=0,65;
=10; S(z)=10; ryz=0,60.
Составить уравнение регрессии z по x и y.
Рассчитаем коэффициенты уравнения множественной регрессии:
![]()
Подставляя эти значения в уравнение регрессии, получим:
Z – 10 = 2,35*(x-2) + 0,37*(y-30);
Z = 2,35x + 0,37y – 5,8.
Модели множественной регрессии используются для предсказаний значений зависимой переменной по набору независимых переменных (например, концентраций рудного элемента по содержаниям породообразующих элементов; объёмной массы руды по объёмным массам тяжелых минералов в рудах; глубины формирования минерала по содержаниям в минералах элементов-индикаторов и т. д. ).
8.3 Проверка однородности линейно упорядоченных в пространстве наблюдений
При решении разнообразных геологических (членение немых толщ, построение классификаций пород, выделение аномалий и т. п.) и экологических (оценка влияния промышленных объектов) задач бывает невозможно, определить границу между сравниваемыми объектами. Интуитивно ясно, что граница должна проводиться там, где рассматриваемый признак испытывает наибольшее изменение, а не там, где он ведет себя стабильно. Определение границ необходимо проводить по одному признаку Решение задачи следует искать по всему комплексу имеющихся признаков. Имеем n наблюдений с определением в них m признаков, то есть матрицу вида:
x11 x12 … x1j … x 1m
………………………………
X21 x22 … x2j … x 2m
………………………………
xn1 xn2 … xnj … x n m
Менять заданное расположение объектов (точек наблюдения) в ней не разрешается. Проверка однородности рассматриваемой совокупности может быть осуществлена с помощью формулы:
(18)
где к - порядковый номер очередной граничной точки (1≤k≤n-1).
Из всех Vk выбирают максимальное и сравнивают с χ2 при принятом уровне значимости и имеющемся числе степеней свободы f=m. Если (Vk)max≥χ2a(m), то совокупность считается однородной, иначе проверяют неоднородность каждой из получившихся совокупностей. Процесс дробления продолжают до тех пор, пока все выделенные участки не окажутся однородными.
Например, в нижеследующей таблице приведены данные о содержаниях трех форм фораминифер и окончательные результаты расчленения пород данным методом.
№№ проб | Значения признаков | Vk | №№ проб | Значения признаков | Vk | ||||
X | Y | Z | X | Y | Z | ||||
1 | 0 | 1 | 0 | 15 | 3 | 20 | 2 | ||
2 | 0 | 2 | 0 | 16 | 4 | 17 | 2 | ||
3 | 0 | 4 | 0 | 17 | 4 | 16 | 3 | ||
4 | 0 | 4 | 0 | 14,44 | 18 | 6 | 26 | 3 | |
5 | 3 | 7 | 0 | 19 | 5 | 37 | 3 | ||
6 | 4 | 9 | 1 | 20 | 5 | 31 | 4 | ||
7 | 2 | 5 | 0 | 21 | 6 | 27 | 1 | ||
8 | 4 | 10 | 1 | 22 | 3 | 18 | 5 | ||
9 | 3 | 6 | 0 | 17,68 | 23 | 4 | 13 | 2 | |
10 | 3 | 13 | 0 | 24 | 4 | 20 | 9 | 20,03 | |
11 | 6 | 15 | 0 | 25 | 0 | 0 | 5 | ||
12 | 6 | 17 | 2 | 26 | 0 | 10 | 7 | ||
13 | 7 | 13 | 2 | 11,27 | 27 | 1 | 6 | 0 | |
14 | 3 | 17 | 1 | 28 | 2 | 1 | 2 |
При просчете по всем пробам значение Vmax=30,44 пришлось, на интервал между точками 24 и 25, для верхней части таблицы было получено значениеVmax=32,11, а для нижней 3,23 что меньше допустимого Х2 0,05 (3}=7,82; для интервала проб 1-9 Vmax =14,44(между точками 4 и 5), а 10—24 — 11,27 (между, точками 13—14). В интервалах проб 1—4, 5—9, 10— 13, 14-24-максимальные значения критерии составили 2,69; 2,75;-4,59 и7,04, что меньше допустимого и свидетельствует об однородности пород.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |


