Любая произвольная группировка ранжированного признака-фактора.
Проверка наличия исключений группировочных значений признака-результата
Исключения есть?
Да Нет
![]()
![]()
Укрупнение интервалов ряда признака-фактора до первого исключения (исключений в значениях признака-результата), возврат к предшествующей группировке. | Разукрупнение ряда признака-фактора до получения первых исключений в значениях признака-результата; возврат к предшествующей группировке. |
Рис. 9.3.
2.3.4. Определение эмпирической силы связи (коэффициент детерминации, эмпирическое корреляционное отношение).
В лекции 6 мы изучили эти категории:
;
, ![]()
где
– соответственно эмпирический коэффициент детерминации и эмпирическое корреляционное отношение;
– соответственно общая и межгрупповая дисперсии.
В свою очередь:
а) общая дисперсия:
;
но мы будем пользоваться упрощенной формулой: σ
(9.4)
Примечание 9.1: эта формула выводится из общей формулы дисперсии путем преобразований на основании следующего свойства дисперсии: дисперсия от средней всегда меньше дисперсий, исчисленных от других величин, т. е. она имеет свойства минимальности. Путем рассуждений можно прийти к следующему правилу: средний квадрат отклонений равен среднему квадрату значений признака минус квадрат среднего значения признака:
; (9.5)
б) межгрупповая дисперсия
.
(9.6)
Пример 9.5 (развитие примеров 9.3 и 9.4)
Дополнение к табл. 9.1:
y2: 4; 9; 36; 16; 4; 9; 16; 25; 36; 64; 25; 49; 49; 64; 36; 81; 81; 64; 49; 64; 81; 36; 100; 81; 100.

(9.7)
Расчет дисперсии групповых средних уровней производительности (на основании табл. 9.2 второй вариант группировки) (табл. 9.3).
Таблица 9.3
|
|
|
-3,04 | 9,242 | 46,21 |
-1,94 | 3,764 | 15,06 |
0,26 | 0,068 | 0,20 |
1,36 | 1,850 | 9,25 |
1,96 | 3,842 | 30,74 |
ИТОГО: 101,45 |
;
.
То есть связь между энерговооруженностью и производительностью труда нами доказана в количественном выражении.
2.4. Нахождение теоретической формы связи
Характер связи может быть прямым и обратным, а по форме связи могут быть линейными и криволинейными.
2.4.1. Выравнивание по прямой
Уравнение линейной связи:
yx = a0 + a1x. (9.8)
Система нормальных уравнений для нахождения параметров уравнения (9.8):

(9.9)
Пример 9.6 (развитие предыдущих примеров)
Характер поля корреляции (рис. 9.2) и параллельные ряды (табл. 9.2) приводят к предположению о возможности использования формулы 9.8
Таблица 9.4
Таблица расчетов составляющих системы уравнений 9.8, 9.9.
№ п/п | x | y | x2 | у · x |
1 | 6,0 | 2 | 36 | 12,0 |
2 | 6,1 | 3 | 37,21 | 18,3 |
* | * | * | * | * |
16 | 11,5 | 6 | 132,25 | 69 |
* | * | * | * | * |
25 | 13,3 | 10 | 176,89 | 133,0 |
∑ | 253,7 | 161 | 2713,25 | 1753,1 |
25а0 + 253,7а1 = 161;
253,7а0 + 2713,25а0 = 1753,1;
а1 = 0,875;
а0 = -2,25;
ух = 0,875х – 2,25.
Теоретическое управление связи между энерговооруженностью рабочих и производительностью их труда:
уx = 0,857x - 2,
Параметры при x (в нашем случае 0,857) называются коэффициентами регрессии, regressio (лат.) – обратное движение, зависимость среднего значения какой-либо величины от некоторой другой величины или нескольких величин.
Коэффициент регрессии в уравнении (9.10) «говорит»: изменение x на 1 пункт дает среднее изменение у на 0,857 пункта. Конкретно по примеру: прирост энерговооруженности труда на 1 тыс. кВт. ч. в году на одного работающего дает прирост производства одним рабочим 857-ми штук изделий в год (в среднем).
Уравнение, приводящее корреляционную зависимость к функциональной, называется уравнением регрессии.
Подставим значения х в это уравнение и получим теоретические значения у(
), попутно произведем вычисления, которые нам будут необходимы в дальнейшем:
Таблица 9.5
№ п/п |
|
|
|
1 | 2,9 | -0,9 | 0,81 |
2 | 3,0 | 0 | 0 |
* | * | * | * |
16 | 7,6 | 1,4 | 1,96 |
* | * | * | * |
25 | 9,2 | 0,8 | 0,64 |
Итого | 161 | -12,3 +12,3 | 39,52 |
Построим и сравним графики: у,
и
.
Анализ соотношения графиков, изображенных на рис. 9.4:
1. Сопоставление
с у демонстрирует общую дисперсию
.
2. Линия
изображает теоретические значения у при абстрагировании от влияний факторов, кроме х; это переменная средняя значений у.
3. То, что переменная средняя отличается от средней постоянной, говорит о влиянии фактора х; дисперсия переменной средней по отношению к постоянной средней (
).

|
|
|

|
|
Рис. 9.4
4. То, что линия
не совпадает с линией у, говорит о том, что связь между у и х не полная; колебания у по отношению
являются вариацией, обусловленной другими нежели х факторами; количественно эту вариацию можно исчислить как дисперсию, измеряющую отклонения у от
может выразиться так: колебания у вокруг
.
Этот анализ приводит к размышлению о том, что надо доказать правомерность выбранной формы регрессии.
2.4.2. Теоретическое корреляционное отношение (индекс корреляции)
Необходимо измерить силу влияния х на
.
Общая дисперсия
(мера отклонений у от
) нами определена как 5,69 (формула 9.7).
Если от общей дисперсии мы вычтем дисперсию, вызванную прочими факторами (
), то по правилу сложения дисперсий получается дисперсия, измеряющая отклонения у от ух обусловленные фактором х (
), (но это только в том случае, если уравнение регрессии выбрано верно), то есть:
=
. (9.11)
Дисперсию
можно определить как средний квадрат отклоне-
ний у от ух:
=
. (9.12)
Отношение
к
покажет долю вариации, вызванную группировочным признаком х (
)
. (9.13)
Корень квадратный из
называется теоретическим корреляционным отношением или индексом корреляции R.
R =
(9.14)
Корреляционное отношение – это числовой показатель силы связи между двумя варьирующими величинами; оно бывает эмпирическим и теоретическим:
· эмпирическое корреляционное отношение – это истинное корреляционное отношение;
· теоретическое корреляционное отношение – это «сила связи» между фактором и теоретически полученным результатом по гипотетически подобранному уравнению регрессии.
Корреляционное отношение

0,0 0,3 0,7 1,0
![]()
связи нет или она очень связь есть связь высокая, вплоть
слабая до функциональной
Рис. 9.5
Пример 9.7 (развитие предыдущих примеров)![]()
= 5,69;
пользуемся данными табл. 9.5:
![]()
,
=
,
т. е. 72,2 % дисперсии (вариации) вызвано признаком х.
R =
= 0,85,
Т. е. наш выбор уравнения регрессии (формулы 9.8, 9.10) правомерен.
Примечание 9.2: теоретическое корреляционное отношение можно исчислять и по формуле:
R = , (9.15)
где
;
.
2.4.3. Линейный коэффициент корреляции
Этот коэффициент (r) является частным случаем индекса корреляции, применение которого ограничено только линейной формой связи; он показывает не только тесноту, но и направление связи (от -1 до +1). Линейный коэффициент корреляции построен на сопоставлении стандартных отклонений варьирующих признаков (среднеквадратическое отклонение или стандартная ошибка) от их среднего значения, он имеет следующую исходную формулу:
r =
: п, (9.16)
дальнейшее преобразование этой формулы приводят её к такому виду:
r =
(9.17)
Все данные для расчета этого коэффициента в сквозном примере есть; рассчитайте его и сравните с R.
2.4.4. Понятие о множественной корреляции
Множественная корреляция заключается в анализе влияния на результативный признак (у) более одного признака-фактора (x, z, v, w и т. д.).
При линейной зависимости уравнение связи выглядит так:
(9.18)
В зависимости от количества аргументов используется соответствующая система нормальных уравнений, например при их наличии в количестве двух (x, z):
а0 + а1∑х + а2∑z = ∑у
а0∑х + а1∑х2 + а2∑хz = ∑ух. (9.19)
а0∑z + а1∑хz + а2∑z2 = ∑уz
Показателем тесноты связи в случае её линейного характера служит совокупный (общий) коэффициент корреляции, который при двух аргументах рассчитывается по следующей формуле:
, (9.20)
где rxy, rzy, rxz – линейные коэффициенты парной корреляции между соответствующими признаками. Так же как индекс корреляции, совокупный коэффициент корреляции изменяется от 0 до 1.
При изучении зависимости результативного признака от факторов трех и более не следует вручную выводить параметры уравнения и совокупный коэффициент корреляции; следует пользоваться готовыми программами для их расчета на ЭВМ.
Обобщим изученный выше материал в виде алгоритма – схемы (рис. 9.6).
Мы все время имели дело с линейными зависимостями, однако, эти зависимости могут носить и криволинейный вид.
2.5. Криволинейные зависимости
Последовательность количественно-качественного анализа будет такой же, как она представлена на рис. 9.6, однако в блоке 5 можно ошибиться, поэтому в алгоритме предусмотрен возврат к этому блоку в случае неподтверждения гипотезы о типе связи.
2.5.1. Выравнивание по гиперболе
yx = а0 + а1*
; (9.21)
а0*n + а1
;
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |


