Корреляция может быть парной и множественной.
Парная корреляция - это связь между двумя показателями, один из которых является фактором, другой - результативным показателем.
Множественная корреляция - связь между несколькими факторами и одним результативным показателем.
Корреляционный анализ направлен на решение двух задач:
• установление тесноты связи;
• количественную оценку влияния факторов на результативный показатель.
Теснота связи между явлениями измеряется корреляционным отношением. Количественная оценка тесноты связи в зависимости от корреляционного отношения приведена в табл. 2.6.
Таблица 2.6. Качественная оценка тесноты связи при различных значениях корреляционного отношения
Величина корреляционного отношения | 0,1 - 0,3 | 0,3 - 0,5 | 0,5 - 0,7 | 0,7 - 0,9 | 0,9 - 0,99 |
Теснота связи | Слабая | Умеренная | Заметная | Высокая | Весьма высокая |
Общая формула корреляционного отношения:

где
- среднее квадратическое отклонение у от теоретических значений уx; yх определяется на основе уравнений регрессии;
- среднее квадратическое отклонение эмпирических (фактических) значений у.
В случае прямолинейной зависимости корреляционное отношение называется коэффициентом корреляции и обозначается буквой r.
Корреляционное отношение (коэффициент корреляции) принимает значения от 0 до 1:
если η (r) = 0, то связь между показателями отсутствует;
если η(r) = 1, то связь функциональная (детерминированная);
если η(r) - отрицательная величина, то связь между показателями обратная.
Алгоритм расчетов при корреляционном анализе связи парной корреляции состоит из ряда этапов.
Этап 1. Производится отбор наиболее важных существенных факторов, влияющих на результативный показатель. При отборе факторов учитываются причинно-следственные связи между показателями, причем все факторы должны быть количественно измеримы. Большую помощь при отборе факторов для корреляционной модели оказывают аналитические группировки, способ сравнения параллельных и динамических рядов, линейные графики. Отбор показателей для анализа и придание им статуса фактора или результативного значения осуществляются на основе знания экономических законов. Например, знание закона спроса и предложения помогает изучить влияние ценового фактора на изменение спроса. Отобранные для анализа показатели и результаты наблюдений за их изменением помещаются в таблицу, в которой факторные признаки располагаются в порядке возрастания или убывания, т. е. ранжируются.
Этап 2. Данные из таблицы наносятся на плоскость координат - строится корреляционное поле.
Этап 3. Производится обоснование формы связи:
• по форме корреляционного поля;
• путем визуального анализа ранжированного ряда.
Подобное обоснование является приблизительным и нуждается в дальнейшем уточнении с помощью ошибки аппроксимации.
Форма связи определяет дальнейшие действия корреляционного анализа.
Если связь носит прямолинейный характер, то рассчитывается коэффициент корреляции.
Если связь криволинейная, то прежде всего определяются теоретические значения уx . С этой целью решается уравнение регрессии, описывающее связь между изучаемыми показателями. Затем рассчитывается корреляционное отношение.
Корреляционное отношение, или коэффициент корреляции, дает количественную оценку тесноты связи, характеризует силу влияния факторных признаков на результативные.
При прямолинейной форме связи коэффициент корреляции рассчитывается по формуле:
(2.3)
Коэффициент корреляции может быть представлен и как среднее значение произведений нормированных отклонений (tx, ty).
(2.4)
Нормированные отклонения определяются по формулам:

где
,
- средние квадратические отклонения:

Если коэффициент корреляции возвести в квадрат, то получим коэффициент (индекс) детерминации, который показывает, чему равна доля влияния изучаемого фактора на совокупный показатель.
При значениях тесноты связи меньше 0,7 величина индекса детерминации d всегда будет меньше 50%. Это означает, что на долю вариации факторного признака х приходится меньшая доля по сравнению с другими признаками, влияющими на изменение результативного показателя. Синтезированные при таких условиях математические модели связи практического значения не имеют.
Если значения показателей тесноты связи более 0,7, выбирается уравнение регрессии, с помощью которого описывается форма связи между показателями.
Этап 4. Выбор и решение уравнения регрессии. Выбор конкретного уравнения регрессии, адекватно описывающего форму связи, является довольно сложной процедурой. В условиях использования ПЭВМ выбор адекватной модели осуществляется перебором решений, наиболее часто применяемых в анализе парной корреляции уравнений регрессии. Если форму связи сразу установить сложно, решают уравнения нескольких типов. Выбор адекватной модели производится на основе ошибки аппроксимации ε :

где
- теоретическое значение, рассчитанное на основе выбранной модели.
Наибольшее значение ошибки аппроксимации свидетельствует о том, что оцениваемая модель дает наиболее адекватное описание формы взаимосвязи. Причем ошибка аппроксимации не должна превышать 0,2, или 20%.
Прямолинейное уравнение регрессии показывает равномерное нарастание результативного признака с увеличением факторного:
у = а + bх.
Коэффициент регрессии b несет основную смысловую нагрузку в уравнении регрессии. Он показывает, на сколько единиц в среднем изменяется результативный признак у с изменением на одну единицу факторного признака х. Эта всегда именованная величина b на графике показывает угол наклона прямой.
Свободный член а показывает начальную ординату, т. е. расстояние от начала координат до пересечения прямой с осью у.
Значения коэффициентов определяются методом наименьших квадратов. Он основан на предположении, что линия, выравнивающая эмпирические данные, должна проходить так, чтобы сумма квадратов отклонений от этой линии была наименьшей, т. е.
![]()
![]()
Подставим в выражение Q теоретическое значение результативного признака
yх = а + bх, получим
Q принимает минимальное значение, если частные производные
и
.
После дифференцирования получим

Приравняв обе части к 0 и умножив их на
, получим:
Суммируя каждый член уравнения в отдельности, получим:

или


Криволинейная форма связи может быть представлена уравнением гиперболы, параболы, логарифмической функцией и т. д.:
а) уравнение гиперболы
![]()
параметры a , b определяются на основе системы уравнений:

б) параболическая форма связи может описываться параболическим уравнением, например параболой 2-го порядка:
у = a + bx + cx2 .
Расчет аргументов производится также на основе принципа наименьших квадратов, т. е.
в) при логарифмической форме связи
у = а + b lgx
параметры уравнения определяются на основе системы уравнений:

Применение корреляционно-регрессионного анализа рассмотрим на примере прямолинейной зависимости между факторами х и результативным признаком у. Показатели условные, так как назначение примера - продемонстрировать основные процедуры метода. Обозначим х - качество товара в баллах, у - розничная цена, руб.
Исходные и расчетные данные приведены в табл. 2.7.

|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 |


