Министерство
и торговли
Российской Федерации
Государственный университет –
Высшая школа экономики
Факультет прикладной политологии
Программа дисциплины
Компьютерные методы обработки данных в политологии
для направления 030200.68 Политология
магистерская программа «Прикладная политология»
Авторы и
Одобрена на заседании |
кафедры основ информатики и прикладного программного обеспечения |
Зав. кафедрой |
_____________ |
“___” _____ _____ 2007 г. |
«Утверждаю»
Проректор
_______________________
“___” __________ 2007 г.
Москва 2007
Требования к студентам
Приступая к изучению дисциплины, слушатель должен быть знаком с основами математической статистики и теории вероятностей. Данный курс не заменяет стандартного курса статистики.
Дисциплина рассчитана на 28 учебных часа, которые включают в себя лекционную часть (10 часов), практическую работу с пакетом SPSS (18 часов) и самостоятельные занятия (28 часов).
На практических занятиях слушатели учатся анализировать статистические данные с помощью пакета SPSS для решения задач политологии.
Цель изучения дисциплины:
1) познакомить слушателей с основными понятиями и областью применения системы SPSS;
2) дать слушателям целостное представление о возможностях анализа данных в системе SPSS;
3) научить основам работы с различными типами исходной информации, исследованию взаимосвязей между данными и проведению анализа данных.
Учебная задача дисциплины
В результате изучения дисциплины слушатель должен
1) иметь представление о возможностях пакета SPSS в части решения задач с использованием различных методов статистического анализа;
2) знать способы анализа статистических данных с помощью регрессионного, кластерного и факторного анализа данных;
3) уметь самостоятельно проводить обработку информации для дальнейшей работы с ней в SPSS и анализировать скрытые закономерности в данных;
4) обладать навыками работы в SPSS для решения проблем, возникающих при проведении анализа информации.
Формы контроля
Текущий контроль
- Работа на практических занятиях (выполнение заданий на компьютере)
- Эссе сдается для проверки на последнем занятии данного модуля (20 часов самостоятельных занятий)
Аудиторные часы | Формы текущего контроля | Самостоя-тельная работа | Всего часов | Курс, семестр, модуль | ||
Лекции | Сем. и практ. занятия | Всего | ||||
15 | 9 | 24 | работа на занятии, домашнее задание | 33 | 57 | 1,1,1 |
9 | 9 | 18 | работа на занятии, 1 контрольная работа, домашнее задание | 33 | 51 | 1,1,2 |
II. Тематический расчет часов
Номера и наименования тем | Аудиторные занятия | Самост. работа | Всего часов |
| ||
Лекции | Практическ. занятия | Всего учебных часов | ||||
Тема 1. Системы анализа политических данных. Характеристика SPSS. | 1 | 1 | 0 | 2 |
| |
Тема 2. Подготовка данных к анализу. Редактирование данных. | 1 | 2 | 3 | 7 | 12 |
|
Тема 3. Описательные статистики.* | 2 | 3 | 5 | 12 | 19 |
|
Тема 4. Исследование взаимосвязей между данными. Проверка гипотез. | 2 | 4 | 6 | 12 | 20 |
|
Тема 5. Регрессионный анализ данных. | 2 | 5 | 7 | 19 | 29 |
|
Тема 6. Факторный анализ данных. | 1 | 2 | 3 | 8 | 13 |
|
Тема 7. Кластерный анализ данных. | 1 | 2 | 3 | 8 | 13 |
|
Итого часов | 10 | 18 | 28 | 66 | 108 |
|
Формы контроля
Текущий контроль
- работа на практических занятиях;
Промежуточный контроль
- промежуточное тестирование по завершении первой части -25 мин.
- эссе (30 часов самостоятельных занятий)
Итоговый контроль
Зачет.
Структура итоговой оценки по учебной дисциплине:
Формы работы | Вклад в итоговую оценку (%) |
Работа на практических занятиях | 30 |
Промежуточный тест | 10 |
Эссе | 30 |
Зачет | 30 |
Все формы текущего, промежуточного и итогового контроля оцениваются по 10-балльной шкале:
8-10 — «отлично»
6—7 — «хорошо»
4—5 —«удовлетворительно»
1—3 —«неудовлетворительно»
Структура учебного курса.
Тема 1. Системы анализа данных. Характеристика SPSS.
Обзор существующих систем хранения и анализа данных. Назначение и оболочка SPSS. Состав пакета, учебник, система помощи. Содержание и разделы главного меню. Окна вывода, окно редактирования данных. Панели инструментов. Характеристика диалоговых окон. Набор статистических методов, типы графиков.
Тема 2. Подготовка данных к анализу. Редактирование данных..
Сбор данных. Выборка. Влияние объемов выборки на точность оценки. Подготовка данных к обработке: rодирование и кодировочные таблицы, создание матриц данных.
Типы переменных. Загрузка данных в систему. Ввод данных, экспорт данных их других систем. Обнаружение ошибок ввода. Проверка данных на состоятельность. Модификация данных: вычисление переменных, аггрегирование данных, ранговые преобразования.
Тема 3. Описательные статистики
Исследование данных и их свойств: математическое ожидание, дисперсия и стандартное отклонение, вариации и формы распределения. Медиана. Вычисление описательных статистик для генеральной совокупности. Правило Бьенамэ-Чебышева.
Тема 4. Исследование взаимосвязей между данными. Проверка гипотез.
Разведочный анализ. Сравнение средних. Таблица сопряженности. Анализ множественных ответов. Непараметрические тесты. Измерение линейных связей, парная и частная корреляция.
Тема 5. Регрессионный анализ данных
Простая линейная регрессия. Множественная регрессия. Результаты множественной регрессии. Остатки и выбросы.
Тема 6. Факторный анализ данных. Метод главных компонент. Метод главных факторов. Интерпретация факторов.
Тема 7. Кластерный анализ данных.
Кластеризация наблюдений. Иерархические методы кластерного анализа. Партиционные методы кластерного анализа.
Тематика заданий по различным формам текущего контроля:
Примерное содержание заданий
1) Построить диаграмму Steam and Leaf,
2) Проанализировать основные характеристики распределения (мода, смещение и т. д.);
3) Построить и проанализировать ящичковую диаграмму, определить наличие выбросов и экстремумов;
4) Оценить близость распределения к нормальному на основе графика Normal Q-Q Plot, Q-Q Plot Detrended, критерия Колмогорова-Смирнова и следующих характеристик распределения: остроты пика, смещения и соотношения их величин и ошибок;
5) Оценить гетероскедастичность на основе графика Spread-versus-level и статистики Ливиня;
6) Построить таблицу сопряженности и определить наличие зависимости между переменными, тесноту и направление связи.
7) Построить уравнение регрессии и оценить параметры уравнения.
8) Найти факторы наиболее полно объясняющие наблюдаемые связи между перменными, имеющимися в наличии.
9) Сформировать группы наблюдений с помощью кластерного анализа.
Тема эссе:
На основе найденных в Интернет социологических данных по конкретному региону и проведенного по ним статистического анализа провести политический анализ этого региона.
Базовой учебник
1. SPSS: искусство обработки информации. Анализ статичстических данных и восстановление скрытых закономерностей: Пер. с нем./ Ахим Бююль, Петер Цефель – СПб.: , 2002.
Основная литература
Крыштановский социологических данных с помощью пакета SPSS - М.: Изд. дом ГУ ВШЭ, 2006. , , Трошин статистические методы – М.: Финансы и статистика, 2000. , Тюрин анализ на компьютере.- М.: Наука, 1997.Методические рекомендации (материалы) преподавателю:
Методические материалы оформлены в виде приложения к программе.
Методические указания студентам:
Методические указания студентам приводятся в вариантах классных заданий домашнего задания.
Автор программы: _____________________________/./
Автор программы: _____________________________//


