Лабораторная работа № 5.Часть 1. Корреляционный анализ.(Практическая часть.
Пример 5.1. Определить наличие корреляционной связи между содержанием золота и свинца по данным проб в таблице
Таблица 5.1. Содержание свинца и золота в рудах полиметаллического месторождения
№ проб | Pb | Au | № проб | Pb | Au | № проб | Pb | Au |
1 | 2,05 | 3,76 | 19 | 1,21 | 0,61 | 37 | 5,16 | 0,87 |
2 | 5,03 | 2,09 | 20 | 2,92 | 0,40 | 38 | 0,37 | 1,15 |
3 | 0,80 | 1,98 | 21 | 0,74 | 0,27 | 39 | 0,44 | 0,91 |
4 | 0,31 | 0,20 | 22 | 1,53 | 2,57 | 40 | 2,21 | 4,25 |
5 | 0,77 | 3,10 | 23 | 3,70 | 0,90 | 41 | 4,67 | 2,03 |
6 | 4,01 | 1,67 | 24 | 2,71 | 1,69 | 42 | 1,44 | 4,31 |
7 | 1,19 | 2,59 | 25 | 1,90 | 4,32 | 43 | 3,13 | 0,25 |
8 | 1,26 | 1,70 | 26 | 1,51 | 2,30 | 44 | 1,35 | 0,39 |
9 | 0,68 | 0,23 | 27 | 0,21 | 1,22 | 45 | 0,81 | 1,35 |
10 | 0,91 | 1,21 | 28 | 4,81 | 1,05 | 46 | 1,32 | 3,51 |
11 | 4,33 | 0,91 | 29 | 1,38 | 2,09 | 47 | 0,99 | 1,62 |
12 | 2,38 | 1,68 | 30 | 3,96 | 2,54 | 48 | 2,41 | 3,98 |
13 | 0,98 | 2,44 | 31 | 1,96 | 1,58 | 49 | 1,03 | 0,35 |
14 | 0,42 | 0,50 | 32 | 0,52 | 0,82 | 50 | 1,55 | 2,80 |
15 | 1,71 | 1,21 | 33 | 2,95 | 0,20 | 51 | 3,39 | 0,41 |
16 | 3,51 | 1,15 | 34 | 1,10 | 1,44 | 52 | 1,23 | 1,58 |
17 | 1,11 | 2,30 | 35 | 0,93 | 3,15 | 53 | 1,48 | 4,22 |
18 | 2,10 | 3,48 | 36 | 1,78 | 1,21 | 54 | 4,03 | 1,19 |
Решение. Скопируем данные из таблицы на лист Excel: в столбец В – данные по содержанию свинца, в столбец С – по содержанию золота. Вычислить коэффициент корреляции Пирсона легко:

Полученное значение -0,049 показывает отсутствие линейной корреляционной связи показателей.
Однако для обоснованного применения коэффициента корреляции Пирсона надо быть уверенными в соответствии (или хотя бы непротиворечии) данных обеих выборок нормальному распределению. Проведем проверку для первой выборки (Pb) (объем выборки n=54 это формально позволяет):

Заметим, что число интервалов 7 не позволяет получить размер интервалов в виде конечной десятичной дроби, поэтому полученная верхняя граница седьмого интервала несколько меньше максимального значения в выборке. Поэтому при заполнении столбца частот необходимо недоопределить массив интервалов, введя формулу
=ЧАСТОТА(B2:B55;E2:E7),
а при вычислении теоретической частоты для последнего интервала используем не значение в ячейке Е8, а функцию МАКС(В2:В55)

Полученное значение критерия χ2 указывает на противоречие данных нормальному закону распределения, поэтому полностью доверять коэффициенту корреляции Пирсона нельзя.
Вычислим коэффициент ранговой корреляции Спирмена. Для этого вычислим значения функции РАНГ для данных обеих выборок и длины связок:

Поскольку в выборке данных содержания золота есть совпадающие значения (неединичные связки), следует вычислить согласованные ранги Ri и Si, а также, для применения формулы коэффициента Спирмена в случае совпадающих значений, величины Ri-(n+1)/2 и Si-(n+1)/2:

Далее, вычислим значения поправочных коэффициентов Т для обеих выборок, введя в ячейке К56 формулу
=СУММКВ(K2:K55)-54
и скопировав ее в ячейку L56.
В ячейке Р56 вычислим значение
, введя формулу
=СУММПРОИЗВ(O2:O55;P2:P55).
Значение коэффициента корреляции Спирмена вычислим в ячейке О58, введя формулу:
=6*P56/(54^3-54-0,5*(К56+L56)).
Полученное значение коэффициента 0,046 близко к 0 и не требует проверки статистической значимости, тем не менее, определим критическое значение коэффициента Спирмена – оно равно 0,226 и превышает вычисленное значение коэффициента корреляции.

Таким образом, можно сделать вывод об отсутствии линейной корреляционной связи между содержанием золота и свинца в пробах.
Здесь следует подчеркнуть, что пока мы рассматривали только гипотезу о наличии линейной корреляции, когда зависимость математического ожидания одной величины от значения другой выражается линейным уравнением, и поле точек соотношений величин представляет собой «облако», более или менее вытянутое около некоторой прямой. Но возможны и другие формы зависимости. Отсутствие линейной корреляции не означает отсутствия корреляционной связи вообще. Проверка гипотезы о наличии криволинейной корреляционной связи основывается на вычислении корреляционного отношения, о котором мы поговорим немного позже.


