Любая произвольная группировка ранжированного признака-фактора.

Проверка наличия исключений группировочных значений признака-результата

 

Исключения есть?

 

Да Нет

Укрупнение интервалов ряда признака-фактора до первого исключения (исключений в значениях признака-результата), возврат к предшествующей группировке.

Разукрупнение ряда признака-фактора до получения первых исключений в значениях признака-результата; возврат к предшествующей группировке.

Рис. 9.3.

2.3.4. Определение эмпирической силы связи (коэффициент детерминации, эмпирическое корреляционное отношение).

В лекции 6 мы изучили эти категории:

; ,

где – соответственно эмпирический коэффициент детерминации и эмпирическое корреляционное отношение; – соответственно общая и межгрупповая дисперсии.

В свою очередь:

а) общая дисперсия:

;

но мы будем пользоваться упрощенной формулой: σ

(9.4)

Примечание 9.1: эта формула выводится из общей формулы дисперсии путем преобразований на основании следующего свойства дисперсии: дисперсия от средней всегда меньше дисперсий, исчисленных от других величин, т. е. она имеет свойства минимальности. Путем рассуждений можно прийти к следующему правилу: средний квадрат отклонений равен среднему квадрату значений признака минус квадрат среднего значения признака:

; (9.5)

б) межгрупповая дисперсия

. (9.6)

Пример 9.5 (развитие примеров 9.3 и 9.4)

Дополнение к табл. 9.1:

y2: 4; 9; 36; 16; 4; 9; 16; 25; 36; 64; 25; 49; 49; 64; 36; 81; 81; 64; 49; 64; 81; 36; 100; 81; 100.

НЕ нашли? Не то? Что вы ищете?

(9.7)

Расчет дисперсии групповых средних уровней производительности (на основании табл. 9.2 второй вариант группировки) (табл. 9.3).

Таблица 9.3

-

-3,04

9,242

46,21

-1,94

3,764

15,06

0,26

0,068

0,20

1,36

1,850

9,25

1,96

3,842

30,74

ИТОГО: 101,45

;

.

То есть связь между энерговооруженностью и производительностью труда нами доказана в количественном выражении.

2.4. Нахождение теоретической формы связи

Характер связи может быть прямым и обратным, а по форме связи могут быть линейными и криволинейными.

2.4.1. Выравнивание по прямой

Уравнение линейной связи:

yx = a0 + a1x. (9.8)

Система нормальных уравнений для нахождения параметров уравнения (9.8):

(9.9)

Пример 9.6 (развитие предыдущих примеров)

Характер поля корреляции (рис. 9.2) и параллельные ряды (табл. 9.2) приводят к предположению о возможности использования формулы 9.8

Таблица 9.4

Таблица расчетов составляющих системы уравнений 9.8, 9.9.

№ п/п

x

y

x2

у · x

1

6,0

2

36

12,0

2

6,1

3

37,21

18,3

*

*

*

*

*

16

11,5

6

132,25

69

*

*

*

*

*

25

13,3

10

176,89

133,0

253,7

161

2713,25

1753,1

25а0 + 253,7а1 = 161;

253,7а0 + 2713,25а0 = 1753,1;

а1 = 0,875;

а0 = -2,25;

ух = 0,875х – 2,25.

Теоретическое управление связи между энерговооруженностью рабочих и производительностью их труда:

уx = 0,857x - 2,

Параметры при x (в нашем случае 0,857) называются коэффициентами регрессии, regressio (лат.) – обратное движение, зависимость среднего значения какой-либо величины от некоторой другой величины или нескольких величин.

Коэффициент регрессии в уравнении (9.10) «говорит»: изменение x на 1 пункт дает среднее изменение у на 0,857 пункта. Конкретно по примеру: прирост энерговооруженности труда на 1 тыс. кВт. ч. в году на одного работающего дает прирост производства одним рабочим 857-ми штук изделий в год (в среднем).

Уравнение, приводящее корреляционную зависимость к функциональной, называется уравнением регрессии.

Подставим значения х в это уравнение и получим теоретические значения у(), попутно произведем вычисления, которые нам будут необходимы в дальнейшем:

Таблица 9.5

№ п/п

1

2,9

-0,9

0,81

2

3,0

0

0

*

*

*

*

16

7,6

1,4

1,96

*

*

*

*

25

9,2

0,8

0,64

Итого

161

-12,3

+12,3

39,52

Построим и сравним графики: у, и .

Анализ соотношения графиков, изображенных на рис. 9.4:

1.  Сопоставление с у демонстрирует общую дисперсию .

2.  Линия изображает теоретические значения у при абстрагировании от влияний факторов, кроме х; это переменная средняя значений у.

3.  То, что переменная средняя отличается от средней постоянной, говорит о влиянии фактора х; дисперсия переменной средней по отношению к постоянной средней ().

 

 

6,44

 

 

 

Рис. 9.4

4.  То, что линия не совпадает с линией у, говорит о том, что связь между у и х не полная; колебания у по отношению являются вариацией, обусловленной другими нежели х факторами; количественно эту вариацию можно исчислить как дисперсию, измеряющую отклонения у от может выразиться так: колебания у вокруг .

Этот анализ приводит к размышлению о том, что надо доказать правомерность выбранной формы регрессии.

2.4.2. Теоретическое корреляционное отношение (индекс корреляции)

Необходимо измерить силу влияния х на .

Общая дисперсия (мера отклонений у от ) нами определена как 5,69 (формула 9.7).

Если от общей дисперсии мы вычтем дисперсию, вызванную прочими факторами (), то по правилу сложения дисперсий получается дисперсия, измеряющая отклонения у от ух обусловленные фактором х (), (но это только в том случае, если уравнение регрессии выбрано верно), то есть:

= . (9.11)

Дисперсию можно определить как средний квадрат отклоне-

ний у от ух:

= . (9.12)

Отношение к покажет долю вариации, вызванную группировочным признаком х ()

. (9.13)

Корень квадратный из называется теоретическим корреляционным отношением или индексом корреляции R.

R = (9.14)

Корреляционное отношение – это числовой показатель силы связи между двумя варьирующими величинами; оно бывает эмпирическим и теоретическим:

·  эмпирическое корреляционное отношение – это истинное корреляционное отношение;

·  теоретическое корреляционное отношение – это «сила связи» между фактором и теоретически полученным результатом по гипотетически подобранному уравнению регрессии.

Корреляционное отношение

0,0 0,3 0,7 1,0

 

связи нет или она очень связь есть связь высокая, вплоть

слабая до функциональной

Рис. 9.5

Пример 9.7 (развитие предыдущих примеров)

= 5,69;

пользуемся данными табл. 9.5:

, = ,

т. е. 72,2 % дисперсии (вариации) вызвано признаком х.

R = = 0,85,

Т. е. наш выбор уравнения регрессии (формулы 9.8, 9.10) правомерен.

Примечание 9.2: теоретическое корреляционное отношение можно исчислять и по формуле:

R = , (9.15)

где ; .

2.4.3. Линейный коэффициент корреляции

Этот коэффициент (r) является частным случаем индекса корреляции, применение которого ограничено только линейной формой связи; он показывает не только тесноту, но и направление связи (от -1 до +1). Линейный коэффициент корреляции построен на сопоставлении стандартных отклонений варьирующих признаков (среднеквадратическое отклонение или стандартная ошибка) от их среднего значения, он имеет следующую исходную формулу:

r = : п, (9.16)

дальнейшее преобразование этой формулы приводят её к такому виду:

r = (9.17)

Все данные для расчета этого коэффициента в сквозном примере есть; рассчитайте его и сравните с R.

2.4.4. Понятие о множественной корреляции

Множественная корреляция заключается в анализе влияния на результативный признак (у) более одного признака-фактора (x, z, v, w и т. д.).

При линейной зависимости уравнение связи выглядит так:

(9.18)

В зависимости от количества аргументов используется соответствующая система нормальных уравнений, например при их наличии в количестве двух (x, z):

а0 + а1∑х + а2∑z = ∑у

а0∑х + а1∑х2 + а2∑хz = ∑ух. (9.19)

а0∑z + а1∑хz + а2∑z2 = ∑уz

Показателем тесноты связи в случае её линейного характера служит совокупный (общий) коэффициент корреляции, который при двух аргументах рассчитывается по следующей формуле:

, (9.20)

где rxy, rzy, rxz – линейные коэффициенты парной корреляции между соответствующими признаками. Так же как индекс корреляции, совокупный коэффициент корреляции изменяется от 0 до 1.

При изучении зависимости результативного признака от факторов трех и более не следует вручную выводить параметры уравнения и совокупный коэффициент корреляции; следует пользоваться готовыми программами для их расчета на ЭВМ.

Обобщим изученный выше материал в виде алгоритма – схемы (рис. 9.6).

Мы все время имели дело с линейными зависимостями, однако, эти зависимости могут носить и криволинейный вид.

2.5. Криволинейные зависимости

Последовательность количественно-качественного анализа будет такой же, как она представлена на рис. 9.6, однако в блоке 5 можно ошибиться, поэтому в алгоритме предусмотрен возврат к этому блоку в случае неподтверждения гипотезы о типе связи.

2.5.1. Выравнивание по гиперболе

yx = а0 + а1*; (9.21)

а0*n + а1;

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22