гиперболой

параболой

сравнить полученные результаты

Практическое занятие №5. Компонентный анализ.

1)Решение задач

По представленным выборочным данным

провести компонентный анализ:

рассчитать выборочные характеристики

нормировать данные

составить и решить характеристическое уравнение

рассчитать матрицы собственных значений и собственных векторов

рассчитать матрицы факторных нагрузок и значений главных компонент

построить уравнение регрессии на главных компонентах

найти вектор оценок коэффициентов регрессии

проверить значимость полученного уравнения регрессии

проверить значимость коэффициентов регрессии

сделать выводы

2)Выполнение тестов

Практическое занятие №6. Факторный анализ.

1)Решение задач

По матрице парных коэффициентов корреляции

вычислить редуцированную корреляционную матрицу методом

наибольшего элемента по строке (столбцу);

среднего коэффициента корреляции;

триад;

первого центроидного фактора

сравнить полученные результаты

вычислить первый и второй главные факторы

сделать выводы

2)Выполнение тестов

Практическое занятие №7. Кластерный анализ.

1)Решение задач

По представленным данным

провести классификацию объектов по иерархическому агломеративному алгоитму с использованием

обычного евклидова расстояния

взвешенного евклидова расстояния

Хемминогова расстояния

принципа «ближайшего соседа»

принципа центра тяжести

принципа Варда

сравнить полученные результаты

построить дендрограммы

сделать выводы

2)Выполнение тестов

Практическое занятие №8. Дискриминантный анализ.

НЕ нашли? Не то? Что вы ищете?

1)Решение задач

По данным двух обучающих выборок

определить, к какому классу относятся новые объекты

По данным трех обучающих выборок

определить, к какому классу относятся новые объекты

2)Выполнение тестов

Практическое занятие №9. Канонические корреляции.

1)Решение задач

По двум группам статистических данных

вычислить первую пару канонических величин и каноническую корреляцию

оценить значимость канонических корреляций

Практическое занятие №10. Интегральный показатель качества жизни.

1)Решение задач

По статистическим данным Мурманской области

построить интегральный показатель качества жизни населения в годах

определить тенденцию

сделать выводы

5. Учебно-методическое обеспечение дисциплины.

5.1. Рекомендуемая литература:

Основная литература

1.  Дубров статистические методы: для экономистов и менеджеров. Учеб. Для студ. спец. вузов/ , , И – М.: Финансы и статистика, 2003 гриф

2.  Глинский, анализ : учеб. пособие для студ. вузов экон. профиля / , . - 3-е изд., перераб. и доп. - М. : ИНФРА-М;Новосибирск:Сибирское соглашение, 2002. [Гриф]

3.  Медик, статистика в медицине: учеб. пособие для студ. вузов/ , .- М..: Финансы и статистика, 2007. гриф.

4.  Экономико-статистический анализ: учеб. пособие для студ. экон. спец. вузов/ , , – М.: Юнити-Дана, 2002 гриф

Дополнительная литература

, , Староверов многомерных наблюдений. М., Статистика, 1974. , , Мешалкин статистика: Методы исследования зависимостей. М., Финансы и статистика, 1983, т.1. , , Мешалкин статистика. Классификация и снижение размерности. М., Финансы и статистика, 1985, т.2. Дубров A. M., Мхитарян B. C., Трошин статистический анализ в экономических исследованиях. М., МЭСИ, 1988. Факторный анализ. М., Статистика, 1980. Многомерный статистический анализ и временные ряды. М. Наука. 1976. Корнилов зависимостей с помощью пакетов программ статистического анализа для ЕС ЭВМ. М., МЭСИ, 1988. Мандель анализ. М., Финансы и статистика, 1988. Носко для начинающих. М. ИЭПП. 20с. , Титаренко методы оценивания. М., Статистика, 1980. , Макаров данных на компьютере. М. Инфра-М. 2003. – 544 с. Современный факторный анализ. М., Статистика, 1972.

6. Примерные зачетные тестовые задания.

1. Известно, что при фиксированном значении х3 между величинами х1 и х2 существует положительная связь. Какое значение может принять частный коэффициент корреляции r12/3

а) -0,8; б) 0; в) 0,4; г) 1,3.

2. По результатам п=20 наблюдений получен частный коэффициент корреляции

r12(3) = 0,8 . Определите, чему при уровне значимости α=0,05 равна разность между наблюдаемым (r12(3)) и критическим (rkp) значениями коэффициентов корреляции:

а) -0,513; б) 0,344; в) 0,700; г) 0,133.

3. Известно, что х3 усиливает связь между величинами х1 и х2. По результатам наблюдений получен частный коэффициент корреляции r12(3) = -0,45. Какое значение может принять парный коэффициент корреляции r12:

а) 0,4; б) 0,2; в) -0,8; г) 1,2.

4. По результатам п=10 наблюдений рассчитан частный коэффициент корреляции r12(3) = 0,83 и с доверительной вероятностью γ=0,95 найдена интервальная оценка

0,37≤ r12(3)≤0,96. Какое значение принимает верхняя граница доверительного интервала

а) 0,94; б) 0,98; в) 0,39; г) 0,27.

5. По результатам п=20 наблюдений рассчитан r13(2) = 0,62 и найден при γ =0,95 доверительный интервал 0,23≤ r12(3)≤0,83.

Какое значение примет нижняя граница доверительного интервала для п=10 если γ и r13(2) остались неизменными:

а) 0,45; б) 0,20; в) 0,32; г) 0,89.

6. Множественный коэффициент корреляции R1(2,3) = 0,8. Определите, какой процент дисперсии величины x1 объясняется влиянием х2 и х3

а) 28%; б) 32%; в) 64%; г) 80%.

7. По результатам 20 наблюдений найден множественный коэффициент корреляции R1(2;3) =0,8. Проверьте значимость множественного коэффициента корреляции, т. е. гипотезу

Но: R1(2;3) =0 при α =0,05 и определите разность между наблюдаемым Fнабл и критическим Fkp значениями статистики критерия:

а) 2,8; б) -13,6; в) 9,4; г) 11,5.

8. Какое значение может принимать коэффициент детерминации:

а) -0,5; б) -0,2; в) 0,4; г) 1,2.

9. Какое значение может принять множественный коэффициент корреляции:

а) -0,5; б) -1; в) 0; г) 1,2.

10. По результатам n=25 наблюдений получен парный коэффициент корреляции r12 = 0,6. Известно, что х3 занижает связь между х1 и х2. Какое значение может принять частный коэффициент корреляции r12(3):

а) -0,5; б) -0,6; в) 0,5; г) 0,8.

11. Какие требования в модели регрессионного анализа предъявляются к распределению ошибок наблюдения εi, а именно к их математическому ожиданию Мεi, и дисперсии Dεi:

a)Mεi =l;Dεi,=σ2;

б) Мεi =0; D εi =0;

в) Мεi,=0; Dεi = σ 2;

г)Mεi =l;Dεi =0.

12. Что минимизируется согласно методу наименьших квадратов:

а) б) в) г)

13. Дана ковариационная матрица вектора

Чему равна оценка дисперсии элемента вектора , т. е.

а) 5,52; б) 0,04; в) 0,01; г) 2,21.

14. При исследовании зависимости себестоимости продукции y от объема выпуска x1 и производительности труда х2 по данным n=20 предприятий получено уравнение регрессии: у - 2,88 - 0,72x1-l,51x2 и среднеквадратические отклонения коэффициентов регрессии: sb1 = 0,052 и sb2 = 0,5. Можно ли при уровне значимости α=0,05 утверждать, что значимы коэффициенты регрессии:

а) ; б) ; в) оба значимы; г) оба не значимы.

15. По данным теста 14 определите с доверительной вероятностью γ=0,99 на какую величину максимально может измениться себестоимость продукции у, если объем производства x1 увеличить на единицу:

а) -0,6; б) 0,72; в) -1,5; г) -0,83.

16. Уравнению регрессии у= 2,88 - 0,72x1 -1,51x2 соответствует множественный коэффициент корреляции Ry (, 2) = 0,84 . Какая доля вариации результативного показателя у (в %) объясняется входящими в уравнение регрессии переменными х1 и х2

а) 70,6; б) 16,0; в) 84,0; г) 29,4.

17. По данным n=15 фирм исследована зависимость прибыли y от числа работающих x вида у = + х. Была получена оценка остаточной дисперсии = 2,2 и обратная матрица:

Определите чему равна дисперсия оценки коэффициента регрессии

а) 1,500; б) 0,110; в) 0,682; г) 0,242.

18. По данным n=25 регионов получена регрессионная модель объема реализации медикаментов на одного жителя y в зависимости от доли городского населения х1 и числа фармацевтов х2 на 10 тыс. жителей: y = 11,7 + 0,06 х1 +0,42 х2 и среднеквадратические отклонения коэффициентов регрессии = 0,04 и = 0,14. Начиная с какого уровня значимости α можно утверждать, что у зависит от доли городского населения x1:

а) 0,3; б) 0,2; в) 0,1; г) 0,05.

19. По данным теста 18 определите, чему равна при доверительной вероятности γ=0,95 верхняя граница интервальной оценки коэффициента регрессии при х2

а) 0,13; б) 0,2; в) 0,65; г) 0,71.

20. Финансовая устойчивость предприятия характеризуется p=8 показателями. В результате расчетов получены собственные значения трех первых главных компонент: λ1=4,0; λ2=1,6 и λ3=0,8. Чему равен относительный вклад 2-х первых главных компонент (в %):

а) 30; б) 70; в) 60; г) 80.

21. Дана матрица факторных нагрузок: . Чему равен относительный вклад второй главной компоненты f2 в суммарную дисперсию (в %):

а) 74; б) 37; в) 4; г) 23.

22. В каких пределах меняются элементы матрицы факторных нагрузок А:

а)(-1;0); б) (0,1); в) (-1, 1); г)(0;2).

23. Дана матрица факторных нагрузок

Чему равен парный коэффициент корреляции между переменной х3 и второй главной компонентой z2

а) 0,12; б) 0,96; в) -0,24; г) 0,19.

24. Дана матрица факторных нагрузок

Чему равен коэффициент корреляции между переменными х(1) и х(2):

а) 0,75; б) 1,25; в) 0,25; г) -0,25.

25. При исследовании взаимосвязи двух показателей х(1)и х(2) получен коэффициент корреляции r12=0,9. Чему равно собственное значение λ1, соответствующее первой главной компоненте:

а) 0,1; 6)1,9; в) 1,8; г) 0,2.

26. Деятельность п предприятий региона характеризуется четырьмя показателями. При проведении компонентного анализа по матрице R получены собственные значения, одно из которых оказалось пропущенным: 1,2; 1,4 и 0,6. Чему равно собственное значение λ3 соответствующее третьей главной компоненте:

а) 2,5; б) 1,2; в) 0,6; г) 0,8.

27. В кластер S1 входят 4 объекта, расстояние от которых до объекта №5 составляет соответственно: 2, 5, 6, 7. Чему равно расстояние от объекта №5 до кластера S1, если исходить из принципа «ближайшего соседа»:

а) 2; б) 5; в) 6; г) 7.

28. Определить по данным теста 1 расстояние от объекта 5 до кластера Si, исходя из принципа «дальнего соседа»:

а) 2; 6)5; в) 6; г) 7.

29. Чему равно по данным теста 27 расстояние от объекта S1, исходя из принципа «средней связи»:

а) 2; б) 5; в) 6; г) 7.

30. Расстояние между пятью объектами (n=5) характеризуется матрицей расстояний:

Чему равно расстояние между кластерами S1,2 и S3,4,5, в которые входят соответственно объекты (1,2) и (3,4,5), если исходить из принципа средней связи:

а) 4,45; б) 3,37; в) 4,89; г) 2,86

31. Данные о четырех фирмах, деятельность которых характеризуется показателями х(1) и х(2), представлены в таблице

i

1

2

3

4

х(1)

1

7

1

9

х(2)

5

9

3

7

Чему равно расстояние ρE(1,2) между 1-ми 2-м объектами, если в качестве метрики принять обычное евклидово расстояние:

а) 3,78; 6)9,34; в) 7,21; г) 5,19.

7. Примерный перечень вопросов к зачету (экзамену).

Предмет и метод многомерного статистического анализа. Роль многомерных методов статистического анализа в социально-экономических исследования. Многомерное нормальное распределение. Свойства. Робастное оценивание при наличии ассимметрии распределения экономических показателей. Методы исчисления устойчивых (робастных) оценок: Пуанкаре, Винзора, Хубера. Виды коэффициентов корреляции. Проверка значимости и построение доверительных областей. Оценку вектора коэффициентов уравнения регрессии и остаточной дисперсии с помощью метода наименьших квадратов. Линейная множественная регрессионная модель. Предпосылки регрессионного анализа. Кластерный анализ как метод многомерной классификации. Методы определения расстояний между объектами исследования. Определение расстояния между кластерами в кластерном анализе. Характеристики близости объектов и показателей в кластерном анализе. Функционалы качества разбиения. Иерархические кластер-процедуры. Метод k - средних. Метод параллельных кластер-процедур. Сущность метода дискриминантного анализа. Обучающие выборки. Линейный дискриминантный анализ при наличии k-выборок. Оценка качества дискриминантной функции и информативности отдельных признаков. Метод главных компонент в ряду методов многомерной классификации. Регрессия на главные компоненты. Математическая модель метода главных компонент. Алгоритм метода. Получение матрицы весовых коэффициентов, собственные значения и собственные векторы. Квадратичные формы и главные компоненты. Главные компоненты двумерного и трехмерного пространства. Линейная модель факторного анализа. Факторное отображение и факторная структура. Преобразование матрицы парных коэффициентов корреляции в факторном анализе. Методы расчета общностей. Метод главных факторов. Получение первого главного фактора. Методы вращения факторной структуры. Модель метода канонических корреляций. Канонические корреляции и канонические величины генеральной совокупности и их оценивание. Построение интегрального показателя качества сложной системы на примере социальной системы.

8. Практикум по решению задач.

Примеры решения задач.

Задача №1

На основе данных средней производительности труда (выработка на одного работающего) 10 предприятий подотрасли. Проверить наличие грубых ошибок.

Выработка рабочих

№ предприятия

1

2

3

4

5

6

7

8

9

10

Выработка

12

11

13

12

14

12

18

15

14

13

Решение

1. Составим вариационный ряд:

11,12,12,12,13,13,14,14,15,18. Наибольшее значение равно x(10=18.

2. Вычислим среднее значение: =13,4.

3. Определим оценку среднего квадратического отклонения:

s=1,91.

4. Наибольшее значение

5. По табл.8 для N=10 определим Са= С0.05 =2,294.

6. Проверим гипотезу Но

С0.05<Т(10), т. е. 2,294<2,41.

Следовательно, гипотеза об однородности ряда отвергается. Значение выработки на одного работающего на предприятии № 7 является нетипичным, Это значение можно считать грубой ошибкой при уровне значимости=0,05.

Задача №2

Деятельность п = 8 карьеров характеризуется себестоимостью 1т. песка (X1), сменной добычей песка (Х2) и фондоотдачей (Х3). Значения показателей представлены в таблице.

X1 (тыс. руб.)

30

20

40

35

45

25

50

30

Х2 (тыс. руб.)

20

30

50

70

80

20

90

25

Х3

20

25

20

15

10

30

10

20

Требуется:

1. Оценить параметры генеральной совокупности, которая предполагается нормально распределенной;

2. При =0.05 проверить значимость частных коэффициентов корреляции . При =0.95 построить интервальную оценку для .

3. Найти точечную оценку множественного коэффициента корреляции и при =0.05 проверить его значимость.

Решение:

1. Найдем значения средних арифметических () и среднеквадратических отклонений () где j =1, 2, 3, а также парных коэффициентов корреляции r12, r13 и r23 по формулам:

тыс. руб.

=48.125 =18.75 =9,49 = 26,68. = 6,48

= 0.871

где = 1875

В результате расчетов получим

2. Предварительно найдем точечные оценки частных коэффициентов корреляции из выражения

где R12 - алгебраическое дополнение элемента r12 корреляционной матрицы R, а R11 и R22 алгебраические дополнения 1-го и 2-го диагонального элемента этой матрицы

Аналогично находим: r13/2=-0.462 и r23/1 =-0.494

Для проверки значимости частных коэффициентов корреляции найдем rкр. (=0.05, v=n-c-2= 5)=0.754, где c - порядок коэффициента корреляции (число фиксированных признаков). В нашем примере c= 1.

Так как <rкр.=0.754, то гипотезы Н0: =0 не отвергаются, т. е. предположение о равенстве его нулю не противоречит наблюдениям, но п = 8 мало.

Определим интервальную оценку для при =0.95. Для этого используем Z-

преобразование Фишера и предварительно найдем интервальную оценку для Z из условия:

По таблице Z-преобразования Фишера для r13/2=-0.462, учитывая, что Z'(-r)= - Z'(r),

будем иметь Z'(-0,462) = -0.497. По таблице нормального закона из условия Ф(t)=0.95 найдем t=l.96.

Тогда , откуда Z [-1.477,0.483].

По таблице Z - преобразования для Zmin= -1,477 и Zmax=0.483 найдем интервальную оценку для : [-0.9,0.45].

Полученная интервальная оценка подтверждает вывод о незначимости частного коэффициента корреляции , т. к. ноль находится внутри доверительного интервала.

3. Найдем точечную оценку множественного коэффициента корреляции и при =0.05 проверим его значимость.

Точечная оценка определяется по формуле:

, где - определитель корреляционной матрицы

= 1+0.871(-0.879)(-0.874)+0.871(-0.879)(-0.80.87=0.043

Проверим гипотезу Н0: =0

, где с=2. Критическое значение по таблице F - распределения Fкр. (=0.05, V1 =2, V2 =5) = 5.79

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7