7. Теория статистики. Под. ред. , М., 1996.

8. Шмойлова статистики. М: “Финансы и статистика”,2004.

9. Экономическая статистика. 2-е изд., доп.: Учебник/ Под ред. . - М.: ИНФРА – М, 2002.

10. и др. «Статистика», М., 1997г.

11. , Попова теория статистики. Методические указания и задачи, М: 1996.

12. и др. Статиска. Курс лекций. М.: Инфра-М, 1997.

13. , , . Общая теория статистики. Учебник, 2-е издание, исправленное и дополненное. М.: «ИНФРА –М», 2002.

14. Герчук методы в статистике. М.,1968.

15. , , Колесниченко статистики. Учебное пособие. Тамбов: «Издательство ТГУ», 2004.

Модуль 10. Причинность, регрессия, корреляция.

10.2. Практический материал.

Пример 1.

Определите характер связи между факторным и результативным признаком. Изобразите корреляционную связь графически. Измерьте тесноту связи. Постройте адекватное уравнение регрессии, рассчитайте коэффициент Фишера и ошибку аппроксимации (рис. 10.1.2).

Рис. 10.1.2. Метод приведения параллельных данных.

Примеч. Ряд №1 «Ломанная регрессии», полученная соединением точек, нанесенных на график значений «х» и «у» прямыми линиями.

Мы видим, что с увеличением величины «х» величина «у» также возрастает. Можно сделать предположение, что связь между ними прямая и что ее можно описать или уравнением прямой, или уравнением параболы второго порядка.

Предполагаем, что зависимость будет линейной.

Расчетная таблица 10 для определения зависимости затрат на ремонт оборудования на торговых предприятиях в расчете на 10 м2 полезной площади (тыс. руб.) в зависимости от сроков эксплуатации (лет) по модели

НЕ нашли? Не то? Что вы ищете?

Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:

;

где n — объем исследуемой совокупности (число единиц наблюдения),

и – коэффициенты, и – свободные члены

В уравениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр — коэффициент регрессии, который показывает, насколько изменяется в среднем значение результативного признака при измении факторного на единицу его собственного измерения.

Сначала по итоговым данным таблицы определим параметры уравнения:

==≈19,6

== ≈-

≈0,1858

Таким образом, при изменении объема производства продукции на 1 тыс. единиц себестоимость 1 единицы произведенной продукции уменьшается на 0,1858 рублей или на 19 копеек.

Подставляя значения вычисленных параметров ( и ), в уравнение регрессии получаем:

Изобразим корреляционную связь графически, совместив на одном графике полученные теоретические значения (ряд №2) с исходными (эмпирическими) данными (ряд№1). Этот график (рис. 10.1.1) дает представление о достаточно незначительном отличии эмпирических данных от построенной теоретической модели.

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Для этого сначала рассчитаем все виды средних величин, дисперсий и средних квадратических отклонений.

σ2у==

σ2ху==

Таблица 10.1.1.

Расчетная таблица для определения показателей, используемых для подбора адекватной функции.

σ2ε==

0,5230,511+0,0195

σ2х==

На основании приведенных вычислений определяем фактические значения t – критерия.

=.

=

– табличное значение, определяется по распределению Стьюдента (t – распределению) при вероятности α=0,05 и v=n-2=10-2=8 равно 2,306.

Наши расчеты показывают, что условие неравенства не соблюдаются для одного параметра, и это не позволяет признать параметр уравнения типичными.

Далее произведем оценку практической значимости полученной модели. Для прямолинейной связи это выполняется посредством расчета линейного коэффициента корреляции.

Линейный коэффициент корреляции изменяется в пределах от –1 до 1.

-0,98 или 98 %.

Знак минус указывает на обратную зависимость.

Значимость линейного коэффициента корреляции проверяется на основе t – критерия Стьюдента:

==13,65

Если расчетное значение (табличное), то гипотеза отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а, следовательно, и о статистической существенности зависимости между x и y.

По шкале Чеддока связь между факторным и результативным признаком является весьма высокой, т. к. 98% результативного признака обусловлено действием факторного признака и свидетельствует о статистической существенности зависимости между x и y.

Аналогичный результат получаем посредсвом индекса корреляции R, так как при линейной зависимости = R

R= ==0,98 или 98%

Проверка адекватности всей модели осуществляется с помощью F – критерия Фишера и величины средней ошибки аппроксимации .

==194

где m – число параметров уравнения

(при и , т. е. m=2)

V1=n-m=10-2=8 V2=m-1=2-1=1

194 › 5,32

Индекс корреляции является типичным т. к. выполняется следующее условие:

Значение средней ошибки аппроксимации, показывает степень влияния на изменение результативного признака неучтенных факторов и не должна превышать 12-15%.

=

=0,25*0,055*100%=1,375%

Пример 2.

Имеются следующие данные (табл. 10.2.2) о посевной площади зерновых культур в тыс. га (х1), валовом сборе в тыс. т. (у) и внесении минеральных удобрений в центнерах на 1 га посевной площади (х2) требуется построить множественное уравнение регрессии, рассчитать параметры уравнения, проанализировать полученные результаты.

Рассмотрим решение многофакторной модели на примере данных таблицы 10.1.2.

Таблица 10.1.2.

Расчетная таблица для определения параметров уравнения регрессии для трех, связанных между собой признаков

Решение:

=4582,2+4334,4+4334,4-4418,55-4437,6-4390,4=,55=4,45

=27065,33+26391,8+26370,,,42-

26710,88=79827,,4=1,11

15; 88,6; 4,5

56; 340,7; 17,2

4,5; 27,4; 1,4

=7154,7+6857,64+6904,8-6899,18-7069,2-

6946,24=20917,,62=2,52

 

15; 56; 88,6

56; 218,2; 340,7

4,5; 17,2; 27,4

=89680,2+85856,4+85339,,,6-

85926,4=,34=52,78

Тогда уравнение регрессии с полученными оценками параметров будет иметь вид:

Определение средних арифмитических величин, средних квадратических отклонений, нормированных коэффициентов регрессии и эластичности произведем на основании расчетной таблицы 10.2.2.

≈3,73

≈0,299

≈5,9;

;

;

≈2,50.

Таблица 10.1.3.

Расчет среднеквадратических отклонений.

Соотношение нормированных коэффициентов регрессии свидетельствует, что второй фактор (внесение минеральных удобрений) влияет на результативный фактор (валовой сбор зерновых) в 2,5 раза сильнее, чем размеры посевных площадей.

Коэффициенты эластичности и будут равны:

≈0,358;

=0,601.

Рассчитанные коэффициенты эластичности свидетельствуют о том, что при увеличении посевной площади (х1) на 1 % – валовой сбор зерновых увеличивается на 0,358 %, а при увеличении доз внесения минеральных удобренийй (х2) на 1 % – на 0,601%.

Значимость параметров уравнения определим по -критерию Стьюдента . В свою очередь определяется как ; =0,808.

Тогда расчетные значения t-критериев при и будут равны:

При уровне значимости =0,5; числа степеней свободы v=n-k-1=15-2-1=12 =0,695. По этому критерию в уравнении регрессии параметры и является значимыми т. к. они больше . Поэтому многофакторная модель может использоваться для перспективных расчетов планирования валовых сборов зерновых культур в зависимости от площади их посева и внесения доз минеральных удобрений.

При этом, рассчитанный индекс множественной корреляции равный 0,8156 свидетельствует о сильной связи, так как факторы х1 и х2 на 81,6% обуславливают результативную величину ״у״.

Пример 3.

Расчет коэффициентов ассоциации и контингенции произведем на примере данных таблицы 10.1.4.

Таблица 10.1.4.

Данные об изготовлении качественной продукции

рабочими предприятия

=

Так как , что ›0,5, то качество изготовленной продукции зависит от специальной подготовки рабочих предприятия.

10.2. Задания для самоконтроля по теме “Корреляционно - регрессионный анализ”.

1.Используя данные таблицы 10.2.1 определите характер связи между факторным и результативным признаком с помощью коэффициента корреляции и постройте адекватное уравнение регрессии.

Таблица 10.2.1

Показатели продуктивности коров (тыс. кг) и уровня себестоимости молока (руб. за 1 тонну) по хозяйствам области

№ хозяйства

1

2

3

4

5

6

7

8

9

10

Продуктивность

3.5

3.2

2.4

2.6

3.0

3.0

3.1

2.7

3.5

3.3

Себестоимость

4.2

4.1

3.8

3.3

3.4

4.0

4.1

3.0

3.2

3.1

2. По данным, представленным в табл. 10.2.2, изучается зависимость индекса человеческого развития от переменных:

* - ожидаемая продолжительность жизни при рождении в 1997 г., лет;

* - суточная калорийность питания населения, ккал на душу населения.

Постройте уравнение множественной регрессии. Оцените статистическую значимость уравнения множественной регрессии. Оцените полученные результаты

Таблица 10.2.2.

Зависимость индекса человеческого развития.

№ п/п

"Х1" ожидаемая продолжительность жизни, лет

"Х2" суточна калорийность питания населения, Гкал на душу населения

"У" Индекс человеческого развития

1

62,60

2,42

0,545

2

66,30

3,29

0,616

3

65,90

3,02

0,711

4

67,90

3,04

0,760

5

74,30

3,31

0,845

6

76,00

3,28

0,914

Сумма

413,00

18,35

4,391

3. Произведите расчет коэффициентов ассоциации и контингенции произведем на примере данных таблицы 10.2.3.

Таблица 10.2.3

Данные об изготовлении качественной продукции

рабочими предприятия

10.3. Тест по теме: “Корреляционно - регрессионный

анализ”.

1.  Если изменение результативного признака всецело обусловлено действием факторного признака, то связь называют:

а) балансовой;

б) компонентной;

в) функциональной;

г) корреляционной.

2.  Если связь между факторным и результативным показателем признается тесной, то коэффициент корреляции при этом стремиться к:

а) нулю;

б) единице;

в) -¥;

г) +¥.

3.  По направлению связи могут быть:

а) прямые и обратные;

б) линейные и нелинейные;

в) слабые и сильные;

г) парные и множественные.

4.  Классификация связей на слабые и сильные связана с признаком:

а) направленности;

б) аналитической формы;

в) силы воздействия;

г) количеством взаимодействующих факторов.

5.  Определение формы зависимости производится с помощью:

а) корреляционного анализа;

б) регрессионного анализа;

в) дисперсионного анализа;

г) дифференцирования.

6.  Совокупное влияние всех факторов позволяет определить дисперсия:

а) факторная;

б) остаточная;

в) внутригрупповая;

г) общая.

7.  Насколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1% позволяет определить коэффициент:

а) эластичности;

б) детерминации;

в) корреляции;

г) конкордации.

8.  Насколько процентов вариация результативного признака объясняется вариацией другого признака, входящего в множественное уравнение регрессии, позволяет определить коэффициент:

а) эластичности;

б) детерминации;

в) корреляции;

г) конкордации.

9.  Теснота связи между факторным и результативным признаком определяется с помощью коэффициента:

а) эластичности;

б) детерминации;

в) корреляции;

г) конкордации.

10.  Среди ниже представленных коэффициентов найдите непараметрические коэффициенты оценки связи:

а) эластичности;

б) детерминации;

в) корреляции;

г) конкордации.

10.4. Вопросы для письменного опроса.

1. Представьте качественную и количественную характеристику известных вам связей показателей социально-экономических явлений.

2. Каково основное отличие корреляционной связи от других видов связей и какие задачи необходимо решить для ее определения?

3. В чем заключается сущность известных вам статистических методов выявления наличия связи, ее характера и направления?

4. Каковы основные требования, подчеркивающие достаточную адекватность уравнения регрессии реально моделированному явлению?

5. Каким образом осуществляется определение параметров искомого уравнения при построении модели регрессии?

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10