С целью изучения помощи факторного анализа взаимосвязей между восемью показателями по данным n=305 наблюдений была построена матрица парных коэффициентов корреляции R. Требуется определить , используя следующие методы:

1) наибольшего элемента по строке (столбцу);

2) среднего коэффициента корреляции;

3) триад;

4) первого центроидного фактора.

Составить таблицу и построить график по полученным результатам. Сравнить полученные результаты с данными Хармана. (См.: Современный факторный анализ / Пер. с англ. - М.: Статистика, 1972)

Матрица парных коэффициентов корреляции R представлена в виде треугольной, хотя она является симметрической.

x1

x2

x3

x4

x5

x6

x7

x8

x1

1

x2

0,846

1

x3

0,805

0,881

1

x4

0,859

0,826

0,801

1

x5

0,473

0,376

0,380

0,436

1

x6

0,398

0,326

0,319

0,329

0,762

1

x7

0,301

0,277

0,237

0,327

0,730

0,583

1

x8

0,382

0,415

0,345

0,365

0,629

0,577

0,539

1

Задача №6

По иерархическому агломеративному алгоритму провести классификацию n=4 хозяйств, работа которых характеризуется показателями объема реализованной продукции: x1 - растениеводства и х2 - животноводства с одного гектара пашни (млн. руб/га). Построить дендрограмму.

номер хозяйства

1

2

3

4

Хi1

1

7

1

9

Xi2

5

9

3

7

Для этого:

а) в качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу "средней связи";

б) в качестве расстояния между объектами принять взвешенное евклидово расстояние с "весами" =0,l, =0,9, а расстояние между кластерами измерять по принципу "дальнего соседа";

в) в качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу "центра тяжести".

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7