X1 – доходы авиакомпании (руб.);

X2 – количество перевезенных пассажиров;

X3 – количество выполненных рейсов;

X4 – количество сегментов;

X5 – количество выставленных кресел;

X6 – количество агентов

Отбор факторов на второй стадии исследования начинают обычно с анализа матрицы парных коэффициентов корреляции признаков, полученных на первой стадии. Выявляются факторы, тесно связанные между собой . При наличии таких связей между факторными признаками один или несколько из них нужно исключить таким образом, чтобы между оставшимися факторами не было тесных связей (при этом коэффициенты корреляции между результирующим признаком Y и факторами могут быть, конечно, высокими). Эта процедура позволяет избежать отрицательных эффектов мультиколлинеарности (см. табл. 2).

Характеризуя в целом последствия мультиколлинеарности, отметим, что при ее наличии снижается точность оценок регрессионных коэффициентов (стандартные ошибки коэффициентов получаются слишком большими); отсюда вероятно некорректное введение в анализ тех или иных переменных; резко возрастает чувствительность коэффициентов регрессии к особенностям исходных данных, так что добавление, например, небольшого числа наблюдений может привести к сильным сдвигам в значениях bi .

Отметим, что мультиколлинеарность может быть выявлена не только при анализе парных коэффициентов корреляции. Существуют более тонкие методы оценки существенности мультиколлинеарности и определения факторов, "ответственных" за нее.

Таблица 2

Y

X1

X2

X3

X4

X5

X6

Y-V_SALE

1

0,64

0,71

0,63

0,67

0,68

0,48

X1-REV

0,64

1

0,99

0,95

0,95

0,97

-0,12

X2-PAX

0,71

0,99

1

0,95

0,96

0,97

-0,06

X3-KOL_FLT

0,63

0,95

0,95

1

0,99

0,99

-0,21

X4-SEG

0,67

0,95

0,96

0,99

1

0,99

-0,11

X5-KRESLA

0,68

0,97

0,97

0,99

0,99

1

-0,14

X6-KOL_AGNT

0,48

-0,12

-0,06

-0,21

-0,11

-0,14

1

Для построения адекватной регрессионной модели в качестве предикторов мы выберем количество пассажиров и количество агентов, так как это факторы оказывают наибольшее влияние на результирующий признак и имеют наименьшую взаимную корреляцию.

НЕ нашли? Не то? Что вы ищете?

При построении регрессионных моделей, прежде всего, возникает вопрос о виде функциональной зависимости, характеризующей взаимосвязи между результирующим признаком и несколькими признаками-факторами. Выбор формы связи должен основываться на качественном, теоретическом и логическом анализе сущности изучаемых явлений.

Чаще всего ограничиваются линейной регрессией, т. е. зависимостью вида:

где Y - результирующий признак; X1, …, Xn - факторные признаки; b1,…,bn - коэффициенты регрессии; а - свободный член уравнения; ε - ''ошибка" модели.

Коэффициенты регрессии bj определяются таким образом, чтобы рассогласования ε, характеризующие степень приближения реальных значений результирующего признака Y с помощью линейной модели , были минимальными. Это достигается на основе метода наименьших квадратов. Укажем содержательный смысл коэффициентов bj, в уравнении множественной линейной регрессии: величина bj - показывает, насколько в среднем изменяется результирующий признак Y при увеличении соответствующего фактора Xj на единицу шкалы его измерения при фиксированных (постоянных) значениях других факторов, входящих в уравнение регрессии (т. е. оценивается "чистое" воздействие каждого фактора на результат)[2].

Для нахождения коэффициентов a, b1, b2 необходимо решить систему нормальных уравнений:

В результате произведенных вычислений мы получили регрессионную модель вида:

Y = ,01 + 101,03*X1 + 77808,91*X2

Вычисления прогнозных значений Y по данным обучающей выборки дали нам следующие результаты (см. табл.3).

Таблица 3

YEAR

MONTH

V_SALE

PAX

AGENTS

Предсказанное Y

ОШИБКА

Y

X2

X6

2000

1

324949

676

,89

5%

2000

2

277038

698

,5

-2%

2000

3

316408

743

,3

0%

2000

4

348910

743

,81

-3%

2000

5

371047

749

,59

-5%

2000

6

433406

744

,59

-7%

2000

7

541566

745

,42

-3%

2000

8

563306

745

,06

7%

2000

9

465042

720

,61

5%

2000

10

402289

709

,53

-1%

2000

11

350355

704

,59

-4%

2000

12

378773

693

,62

1%

2001

1

367406

672

,45

-4%

2001

2

329541

651

,66

-6%

2001

3

397711

671

,76

3%

2001

4

430335

663

,91

-7%

2001

5

471350

642

,10

-4%

2001

6

547851

645

,62

-5%

2001

7

634111

644

,76

-3%

2001

8

669621

616

,97

9%

2001

9

548065

579

,02

-5%

2001

10

442130

500

,85

-8%

2001

11

350309

317

,49

-10%

Таким образом, зная количество агентов и возможное количество перевезенных пассажиров, мы можем со средней ошибкой 5% предсказать объемы продаж за требуемый период времени.

Литература:

1.  «Прикладной статистический анализ». «Приор», Москва-2001;

2.  «Теория статистики». «Фининсы и статистика», Москва-2001.

Из за большого объема этот материал размещен на нескольких страницах:
1 2