гиперболой
параболой
сравнить полученные результаты
Практическое занятие №5. Компонентный анализ.
1)Решение задач
По представленным выборочным данным
провести компонентный анализ:
рассчитать выборочные характеристики
нормировать данные
составить и решить характеристическое уравнение
рассчитать матрицы собственных значений и собственных векторов
рассчитать матрицы факторных нагрузок и значений главных компонент
построить уравнение регрессии на главных компонентах
найти вектор оценок коэффициентов регрессии
проверить значимость полученного уравнения регрессии
проверить значимость коэффициентов регрессии
сделать выводы
2)Выполнение тестов
Практическое занятие №6. Факторный анализ.
1)Решение задач
По матрице парных коэффициентов корреляции
вычислить редуцированную корреляционную матрицу методом
наибольшего элемента по строке (столбцу);
среднего коэффициента корреляции;
первого центроидного фактора
сравнить полученные результаты
вычислить первый и второй главные факторы
сделать выводы
2)Выполнение тестов
Практическое занятие №7. Кластерный анализ.
1)Решение задач
По представленным данным
провести классификацию объектов по иерархическому агломеративному алгоитму с использованием
обычного евклидова расстояния
взвешенного евклидова расстояния
Хемминогова расстояния
принципа «ближайшего соседа»
принципа центра тяжести
принципа Варда
сравнить полученные результаты
построить дендрограммы
сделать выводы
2)Выполнение тестов
Практическое занятие №8. Дискриминантный анализ.
1)Решение задач
По данным двух обучающих выборок
определить, к какому классу относятся новые объекты
По данным трех обучающих выборок
определить, к какому классу относятся новые объекты
2)Выполнение тестов
Практическое занятие №9. Канонические корреляции.
1)Решение задач
По двум группам статистических данных
вычислить первую пару канонических величин и каноническую корреляцию
оценить значимость канонических корреляций
Практическое занятие №10. Интегральный показатель качества жизни.
1)Решение задач
По статистическим данным Мурманской области
построить интегральный показатель качества жизни населения в годах
определить тенденцию
сделать выводы
5. Учебно-методическое обеспечение дисциплины.
5.1. Рекомендуемая литература:
Основная литература
1. Дубров статистические методы: для экономистов и менеджеров. Учеб. Для студ. спец. вузов/ , , И – М.: Финансы и статистика, 2003 гриф
2. Глинский, анализ : учеб. пособие для студ. вузов экон. профиля / , . - 3-е изд., перераб. и доп. - М. : ИНФРА-М;Новосибирск:Сибирское соглашение, 2002. [Гриф]
3. Медик, статистика в медицине: учеб. пособие для студ. вузов/ , .- М..: Финансы и статистика, 2007. гриф.
4. Экономико-статистический анализ: учеб. пособие для студ. экон. спец. вузов/ , , – М.: Юнити-Дана, 2002 гриф
Дополнительная литература
, , Староверов многомерных наблюдений. М., Статистика, 1974. , , Мешалкин статистика: Методы исследования зависимостей. М., Финансы и статистика, 1983, т.1. , , Мешалкин статистика. Классификация и снижение размерности. М., Финансы и статистика, 1985, т.2. Дубров A. M., Мхитарян B. C., Трошин статистический анализ в экономических исследованиях. М., МЭСИ, 1988. Факторный анализ. М., Статистика, 1980. Многомерный статистический анализ и временные ряды. М. Наука. 1976. Корнилов зависимостей с помощью пакетов программ статистического анализа для ЕС ЭВМ. М., МЭСИ, 1988. Мандель анализ. М., Финансы и статистика, 1988. Носко для начинающих. М. ИЭПП. 20с. , Титаренко методы оценивания. М., Статистика, 1980. , Макаров данных на компьютере. М. Инфра-М. 2003. – 544 с. Современный факторный анализ. М., Статистика, 1972.6. Примерные зачетные тестовые задания.
1. Известно, что при фиксированном значении х3 между величинами х1 и х2 существует положительная связь. Какое значение может принять частный коэффициент корреляции r12/3
а) -0,8; б) 0; в) 0,4; г) 1,3.
2. По результатам п=20 наблюдений получен частный коэффициент корреляции
r12(3) = 0,8 . Определите, чему при уровне значимости α=0,05 равна разность между наблюдаемым (r12(3)) и критическим (rkp) значениями коэффициентов корреляции:
а) -0,513; б) 0,344; в) 0,700; г) 0,133.
3. Известно, что х3 усиливает связь между величинами х1 и х2. По результатам наблюдений получен частный коэффициент корреляции r12(3) = -0,45. Какое значение может принять парный коэффициент корреляции r12:
а) 0,4; б) 0,2; в) -0,8; г) 1,2.
4. По результатам п=10 наблюдений рассчитан частный коэффициент корреляции r12(3) = 0,83 и с доверительной вероятностью γ=0,95 найдена интервальная оценка
0,37≤ r12(3)≤0,96. Какое значение принимает верхняя граница доверительного интервала
а) 0,94; б) 0,98; в) 0,39; г) 0,27.
5. По результатам п=20 наблюдений рассчитан r13(2) = 0,62 и найден при γ =0,95 доверительный интервал 0,23≤ r12(3)≤0,83.
Какое значение примет нижняя граница доверительного интервала для п=10 если γ и r13(2) остались неизменными:
а) 0,45; б) 0,20; в) 0,32; г) 0,89.
6. Множественный коэффициент корреляции R1(2,3) = 0,8. Определите, какой процент дисперсии величины x1 объясняется влиянием х2 и х3
а) 28%; б) 32%; в) 64%; г) 80%.
7. По результатам 20 наблюдений найден множественный коэффициент корреляции R1(2;3) =0,8. Проверьте значимость множественного коэффициента корреляции, т. е. гипотезу
Но: R1(2;3) =0 при α =0,05 и определите разность между наблюдаемым Fнабл и критическим Fkp значениями статистики критерия:
а) 2,8; б) -13,6; в) 9,4; г) 11,5.
8. Какое значение может принимать коэффициент детерминации:
а) -0,5; б) -0,2; в) 0,4; г) 1,2.
9. Какое значение может принять множественный коэффициент корреляции:
а) -0,5; б) -1; в) 0; г) 1,2.
10. По результатам n=25 наблюдений получен парный коэффициент корреляции r12 = 0,6. Известно, что х3 занижает связь между х1 и х2. Какое значение может принять частный коэффициент корреляции r12(3):
а) -0,5; б) -0,6; в) 0,5; г) 0,8.
11. Какие требования в модели регрессионного анализа предъявляются к распределению ошибок наблюдения εi, а именно к их математическому ожиданию Мεi, и дисперсии Dεi:
a)Mεi =l;Dεi,=σ2;
б) Мεi =0; D εi =0;
в) Мεi,=0; Dεi = σ 2;
г)Mεi =l;Dεi =0.
12. Что минимизируется согласно методу наименьших квадратов:
а)
б)
в)
г)
13. Дана ковариационная матрица вектора

Чему равна оценка дисперсии элемента
вектора
, т. е.
а) 5,52; б) 0,04; в) 0,01; г) 2,21.
14. При исследовании зависимости себестоимости продукции y от объема выпуска x1 и производительности труда х2 по данным n=20 предприятий получено уравнение регрессии: у - 2,88 - 0,72x1-l,51x2 и среднеквадратические отклонения коэффициентов регрессии: sb1 = 0,052 и sb2 = 0,5. Можно ли при уровне значимости α=0,05 утверждать, что значимы коэффициенты регрессии:
а)
; б)
; в) оба значимы; г) оба не значимы.
15. По данным теста 14 определите с доверительной вероятностью γ=0,99 на какую величину максимально может измениться себестоимость продукции у, если объем производства x1 увеличить на единицу:
а) -0,6; б) 0,72; в) -1,5; г) -0,83.
16. Уравнению регрессии у= 2,88 - 0,72x1 -1,51x2 соответствует множественный коэффициент корреляции Ry (, 2) = 0,84 . Какая доля вариации результативного показателя у (в %) объясняется входящими в уравнение регрессии переменными х1 и х2
а) 70,6; б) 16,0; в) 84,0; г) 29,4.
17. По данным n=15 фирм исследована зависимость прибыли y от числа работающих x вида у =
+
х. Была получена оценка остаточной дисперсии
= 2,2 и обратная матрица: 
Определите чему равна дисперсия оценки коэффициента регрессии ![]()
а) 1,500; б) 0,110; в) 0,682; г) 0,242.
18. По данным n=25 регионов получена регрессионная модель объема реализации медикаментов на одного жителя y в зависимости от доли городского населения х1 и числа фармацевтов х2 на 10 тыс. жителей: y = 11,7 + 0,06 х1 +0,42 х2 и среднеквадратические отклонения коэффициентов регрессии
= 0,04 и
= 0,14. Начиная с какого уровня значимости α можно утверждать, что у зависит от доли городского населения x1:
а) 0,3; б) 0,2; в) 0,1; г) 0,05.
19. По данным теста 18 определите, чему равна при доверительной вероятности γ=0,95 верхняя граница интервальной оценки коэффициента регрессии при х2
а) 0,13; б) 0,2; в) 0,65; г) 0,71.
20. Финансовая устойчивость предприятия характеризуется p=8 показателями. В результате расчетов получены собственные значения трех первых главных компонент: λ1=4,0; λ2=1,6 и λ3=0,8. Чему равен относительный вклад 2-х первых главных компонент (в %):
а) 30; б) 70; в) 60; г) 80.
21. Дана матрица факторных нагрузок:
. Чему равен относительный вклад второй главной компоненты f2 в суммарную дисперсию (в %):
а) 74; б) 37; в) 4; г) 23.
22. В каких пределах меняются элементы матрицы факторных нагрузок А:
а)(-1;0); б) (0,1); в) (-1, 1); г)(0;2).
23. Дана матрица факторных нагрузок 
Чему равен парный коэффициент корреляции между переменной х3 и второй главной компонентой z2
а) 0,12; б) 0,96; в) -0,24; г) 0,19.
24. Дана матрица факторных нагрузок 
Чему равен коэффициент корреляции между переменными х(1) и х(2):
а) 0,75; б) 1,25; в) 0,25; г) -0,25.
25. При исследовании взаимосвязи двух показателей х(1)и х(2) получен коэффициент корреляции r12=0,9. Чему равно собственное значение λ1, соответствующее первой главной компоненте:
а) 0,1; 6)1,9; в) 1,8; г) 0,2.
26. Деятельность п предприятий региона характеризуется четырьмя показателями. При проведении компонентного анализа по матрице R получены собственные значения, одно из которых оказалось пропущенным: 1,2; 1,4 и 0,6. Чему равно собственное значение λ3 соответствующее третьей главной компоненте:
а) 2,5; б) 1,2; в) 0,6; г) 0,8.
27. В кластер S1 входят 4 объекта, расстояние от которых до объекта №5 составляет соответственно: 2, 5, 6, 7. Чему равно расстояние от объекта №5 до кластера S1, если исходить из принципа «ближайшего соседа»:
а) 2; б) 5; в) 6; г) 7.
28. Определить по данным теста 1 расстояние от объекта 5 до кластера Si, исходя из принципа «дальнего соседа»:
а) 2; 6)5; в) 6; г) 7.
29. Чему равно по данным теста 27 расстояние от объекта S1, исходя из принципа «средней связи»:
а) 2; б) 5; в) 6; г) 7.
30. Расстояние между пятью объектами (n=5) характеризуется матрицей расстояний:

Чему равно расстояние между кластерами S1,2 и S3,4,5, в которые входят соответственно объекты (1,2) и (3,4,5), если исходить из принципа средней связи:
а) 4,45; б) 3,37; в) 4,89; г) 2,86
31. Данные о четырех фирмах, деятельность которых характеризуется показателями х(1) и х(2), представлены в таблице
i | 1 | 2 | 3 | 4 |
х(1) | 1 | 7 | 1 | 9 |
х(2) | 5 | 9 | 3 | 7 |
Чему равно расстояние ρE(1,2) между 1-ми 2-м объектами, если в качестве метрики принять обычное евклидово расстояние:
а) 3,78; 6)9,34; в) 7,21; г) 5,19.
7. Примерный перечень вопросов к зачету (экзамену).
Предмет и метод многомерного статистического анализа. Роль многомерных методов статистического анализа в социально-экономических исследования. Многомерное нормальное распределение. Свойства. Робастное оценивание при наличии ассимметрии распределения экономических показателей. Методы исчисления устойчивых (робастных) оценок: Пуанкаре, Винзора, Хубера. Виды коэффициентов корреляции. Проверка значимости и построение доверительных областей. Оценку вектора коэффициентов уравнения регрессии и остаточной дисперсии с помощью метода наименьших квадратов. Линейная множественная регрессионная модель. Предпосылки регрессионного анализа. Кластерный анализ как метод многомерной классификации. Методы определения расстояний между объектами исследования. Определение расстояния между кластерами в кластерном анализе. Характеристики близости объектов и показателей в кластерном анализе. Функционалы качества разбиения. Иерархические кластер-процедуры. Метод k - средних. Метод параллельных кластер-процедур. Сущность метода дискриминантного анализа. Обучающие выборки. Линейный дискриминантный анализ при наличии k-выборок. Оценка качества дискриминантной функции и информативности отдельных признаков. Метод главных компонент в ряду методов многомерной классификации. Регрессия на главные компоненты. Математическая модель метода главных компонент. Алгоритм метода. Получение матрицы весовых коэффициентов, собственные значения и собственные векторы. Квадратичные формы и главные компоненты. Главные компоненты двумерного и трехмерного пространства. Линейная модель факторного анализа. Факторное отображение и факторная структура. Преобразование матрицы парных коэффициентов корреляции в факторном анализе. Методы расчета общностей. Метод главных факторов. Получение первого главного фактора. Методы вращения факторной структуры. Модель метода канонических корреляций. Канонические корреляции и канонические величины генеральной совокупности и их оценивание. Построение интегрального показателя качества сложной системы на примере социальной системы.8. Практикум по решению задач.
Примеры решения задач.
Задача №1
На основе данных средней производительности труда (выработка на одного работающего) 10 предприятий подотрасли. Проверить наличие грубых ошибок.
Выработка рабочих
№ предприятия | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Выработка | 12 | 11 | 13 | 12 | 14 | 12 | 18 | 15 | 14 | 13 |
Решение
1. Составим вариационный ряд:
11,12,12,12,13,13,14,14,15,18. Наибольшее значение равно x(10=18.
2. Вычислим среднее значение:
=13,4.
3. Определим оценку среднего квадратического отклонения:
s=1,91.
4. Наибольшее значение
![]()
5. По табл.8 для N=10 определим Са= С0.05 =2,294.
6. Проверим гипотезу Но
С0.05<Т(10), т. е. 2,294<2,41.
Следовательно, гипотеза об однородности ряда отвергается. Значение выработки на одного работающего на предприятии № 7 является нетипичным, Это значение можно считать грубой ошибкой при уровне значимости=0,05.
Задача №2
Деятельность п = 8 карьеров характеризуется себестоимостью 1т. песка (X1), сменной добычей песка (Х2) и фондоотдачей (Х3). Значения показателей представлены в таблице.
X1 (тыс. руб.) | 30 | 20 | 40 | 35 | 45 | 25 | 50 | 30 |
Х2 (тыс. руб.) | 20 | 30 | 50 | 70 | 80 | 20 | 90 | 25 |
Х3 | 20 | 25 | 20 | 15 | 10 | 30 | 10 | 20 |
Требуется:
1. Оценить параметры генеральной совокупности, которая предполагается нормально распределенной;
2. При
=0.05 проверить значимость частных коэффициентов корреляции
. При
=0.95 построить интервальную оценку для
.
3. Найти точечную оценку множественного коэффициента корреляции
и при
=0.05 проверить его значимость.
Решение:
1. Найдем значения средних арифметических (
) и среднеквадратических отклонений (
) где j =1, 2, 3, а также парных коэффициентов корреляции r12, r13 и r23 по формулам:
тыс. руб.
=48.125
=18.75
=9,49
= 26,68.
= 6,48
= 0.871
где = 1875
В результате расчетов получим

2. Предварительно найдем точечные оценки частных коэффициентов корреляции из выражения

где R12 - алгебраическое дополнение элемента r12 корреляционной матрицы R, а R11 и R22 алгебраические дополнения 1-го и 2-го диагонального элемента этой матрицы

Аналогично находим: r13/2=-0.462 и r23/1 =-0.494
Для проверки значимости частных коэффициентов корреляции найдем rкр. (
=0.05, v=n-c-2= 5)=0.754, где c - порядок коэффициента корреляции (число фиксированных признаков). В нашем примере c= 1.
Так как
<rкр.=0.754, то гипотезы Н0:
=0 не отвергаются, т. е. предположение о равенстве его нулю не противоречит наблюдениям, но п = 8 мало.
Определим интервальную оценку для
при
=0.95. Для этого используем Z-
преобразование Фишера и предварительно найдем интервальную оценку для Z из условия:

По таблице Z-преобразования Фишера для r13/2=-0.462, учитывая, что Z'(-r)= - Z'(r),
будем иметь Z'(-0,462) = -0.497. По таблице нормального закона из условия Ф(t)=0.95 найдем t=l.96.
Тогда
, откуда Z
[-1.477,0.483].
По таблице Z - преобразования для Zmin= -1,477 и Zmax=0.483 найдем интервальную оценку для
:
[-0.9,0.45].
Полученная интервальная оценка подтверждает вывод о незначимости частного коэффициента корреляции
, т. к. ноль находится внутри доверительного интервала.
3. Найдем точечную оценку множественного коэффициента корреляции
и при
=0.05 проверим его значимость.
Точечная оценка определяется по формуле:
, где
- определитель корреляционной матрицы
= 1+0.871(-0.879)(-0.874)+0.871(-0.879)(-0.80.87=0.043

Проверим гипотезу Н0:
=0
, где с=2. Критическое значение по таблице F - распределения Fкр. (
=0.05, V1 =2, V2 =5) = 5.79
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 |


