Партнерка на США и Канаду по недвижимости, выплаты в крипто
- 30% recurring commission
- Выплаты в USDT
- Вывод каждую неделю
- Комиссия до 5 лет за каждого referral
Министерство образования и науки Российской Федерации
Государственное образовательное учреждение высшего образования
Ивановский государственный химико-технологический университет
Методические указания
ê ëàáîðàòîðíîìó ïðàêòèêóìó ïî äèñöèïëèíå
«Анализ данных»
Составитель:
Иваново 2016
Методические указания к ëàáîðàòîðíîìó ïðàêòèêóìó ïî äèñöèïëèíå «Анализ данных» / Сост. . Иван. гос. хим.-технол. ун-т. Иваново, 2016. – 12 с.
Методические указания содержат план освоения материала по дисциплине «Анализ данных», òåìàòèêó ëàáîðàòîðíûõ çàíÿòèé è çàäàíèÿ äëÿ êîíòðîëüíûõ ðàáîò.
Предназначены для студентов дневной формы обучения по направлению 38.03.05 Бизнес-информатика.
Оглавление
Содержание разделов дисциплины.. 2
Содержание лабораторного практикума. 2
Указания к установке учебной версии аналитической платформы DeductorStudio 2
Комплект заданий к реферату. 2
Задания к контрольным работам. 2
Рекомендуемая литература. 2
Содержание разделов дисциплины
Тема 1. Основные понятия дисциплины.
Введение в анализ данных. Проблема обработки данных. Проблема адекватности. Основные задачи анализа и интерпретации данных. Этапы анализа данных: выявление закономерностей, прогнозирование, анализ исключений. Сферы применения анализа данных
Тема 2. Статистические методы анализа данных.
Проверка гипотез о вероятностной природе данных: стационарности, нормальности, независимости, однородности, оценивание параметров функции распределения.
Тема 3. Выявление связей и закономерностей в данных
Регрессионный анализ, корреляционный анализ. Основные методы многомерного статистического анализа: дискриминантный анализ, кластерный анализ, анализ главных компонент, факторный анализ. Динамические модели и прогноз на основе временных рядов.
Тема 4. Системы DATA MINING. в задачах анализа и интерпретации данных
Понятие об интеллектуальных системах анализа и интерпретации данных. DATA MINING - системы извлечения новых знаний из данных. Типы систем DATA MINING -предметно-ориентированные аналитические системы, статистические пакеты, нейронные сети, деревья решений, обнаружение логических закономерностей, генетические алгоритмы, системы визуализации многомерных данных
Содержание лабораторного практикума
Тема 1. Основные понятия дисциплины.
Матрица данных. Гипотезы компактности и скрытых факторов. Структура матрицы данных и задачи обработки. Матрица объект-объект и признак-признак. Расстояние и близость. Измерение признаков. Отношения и их представление. Основные проблемы измерений. Основные типы шкал.
Тема 2. Статистические методы анализа данных.
Функция потерь. Байесовская дискриминантная функция. Принятие решение по максимуму правдоподобия. Оптимальная дискриминантная функция для нормально распределенных образов. Дискриминантная функция Фишера. Множественный дискриминантный анализ. Пошаговый дискриминантный анализ. Ошибки классификации. Примеры построения статистических дискриминантных функций для различных статистических нескольких моделей данных. Обучение для статистических дискриминантных функций. Оценки максимального правдоподобия, байесовские оценки.
Тема 3. Выявление связей и закономерностей в данных
Классификация методов прогнозирования. Оценивание трендов. Методы скользящего среднего. Экспоненциальное сглаживание. Регрессионный анализ и прогнозирование. Линейные параметрические модели временных рядов. Методы оценивания моделей авторегрессии, скользящего среднего и смешанных моделей. Сезонные модели. Прогнозирование на основе параметрических моделей. Прогнозирование с использованием нейронных сетей.
Тема 4. Системы DATA MINING. в задачах анализа и интерпретации данных
Комплексные системы класса DATA MINING для обработки данных - "PolyAnalist", Intelligent Miner.
Указания к установке учебной версии аналитической платформы DeductorStudio
Установочный файл необходимо скачать с сайта разработчика BaseGroup Labs.
BaseGroup Labs — профессиональный поставщик программных продуктов и решений в области бизнес-аналитики, специализирующийся на разработке систем для глубокого анализа данных, охватывающих вопросы сбора, интеграции, очистки данных, построения моделей и визуализации.
Ссылка для скачивания https://basegroup. ru/deductor/download
Скачанный файл необходимо разархивировать и запустить установочный файл.
На первом шаге установки нажимаем кнопку Далее.

Знакомимся с лицензионным соглашением и переходим к следующему шагу.

Вносим информацию о себе и переходим к следующему шагу.

Указываем адрес для установки программы или соглашаемся с предложенным по умолчанию (рекомендуется).

Установку осуществляем в полном объеме, включая документацию и примеры.

Указываем папку для ярлыка программы в меню Пуск или соглашаемся с предложенным по умолчанию (рекомендуется).

Выбираем дополнительные задачи при установке программы или соглашаемся с предложенным по умолчанию (рекомендуется).

Выполняем установку программы с выбранными параметрами

Для самостоятельного изучения аналитической платформы рекомендуется использовать практикум «Базовые навыки работы в Deductor Studio»
Комплект заданий к реферату
1. Корреляционный анализ. Пример проведения анализа в программах STATISTICA и EXCEL.
2. Ранг и персентель. Реализация в пакете анализа EXCEL.
3. Пакет анализа EXCEL. Инструмент ковариация.
4. Регрессионный анализ в EXCEL.
5. Инструменты анализа данных в EXCEL. Гистограмма.
6. Анализ данных в EXCEL. генерация случайных чисел.
7. Описательная статистика в пакете анализа EXCEL.
8. Однофакторный дисперсионный анализ в пакете EXCEL.
9. Двухфакторный дисперсионный анализ в пакете EXCEL.
10. Экспотенциальное сглаживание в пакте EXCEL.
11. Пакет анализа EXCEL. Инструмент скользящее среднее.
По согласованию с преподавателем может быть выбрана другая тема.
По реферату выполняется устное сообщение с презентацией.
Каждый доклад обсуждается на занятии.
Задания к контрольным работам
Задание на контрольную работу №1
1. Импортировать текстовый файл Регионы. txt
2. Применить мастер обработки Кластеризация (Поля «Регион» и «Численность» информационные, остальные поля входные. Все множество – обучающее, количество кластеров – 4)
3. Способы визуализации: таблица и все в категории ДатаМайнинг.
4. В таблице, используя фильтр и онлайн-статистику, дать характеристику каждого кластера. Сравнить результаты с информацией в визуализаторе «профиль кластеров»
5. Определить кластеры, имеющие наибольшее сходство.
6. Сделать выводы о связях между кластерами, исходя из обобщенного критерия.
Сдается:
1. Файл сценария анализа.
2. Текстовый файл с развернутыми выводами.
Задание на контрольную работу №2
1. Импортировать текстовый файл Недвижимость_КР. txt
2. Выполнить оценку качества данных.
3. Заполнить пропущенную информацию методом интерполяции.
4. Экстремальные значения удалить, выбросы ограничить.
5. Построить прогнозную модель стоимость объекта недвижимости, используя метод Нейронные сети.
Сдается:
1. Файл сценария анализа.
2. Текстовый файл с развернутыми выводами.
Рекомендуемая литература
1. Ананьев, экспериментальных данных: учебное пособие. Ч. 1. [Электронный ресурс] : Учебные пособия — Электрон. дан. — Кемерово : КемГУ, 2009. — 106 с. — Режим доступа: http://e. /book/30104 — Загл. с экрана.
2. Симчера, многомерного анализа статистических данных. [Электронный ресурс] : Учебные пособия — Электрон. дан. — М. : Финансы и статистика, 2008. — 400 с. — Режим доступа: http://e. /book/1005 — Загл. с экрана.
3. Цехановский, данными. [Электронный ресурс] : Учебники / , . — Электрон. дан. — СПб. : Лань, 2015. — 432 с. — Режим доступа: http://e. /book/65152 — Загл. с экрана.
4. Data Mining: учебное пособие / .- 2-е изд., испр. — М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2008. — 382 с: (Серия «Основы информационных технологий»)
5. Практикум «Базовые навыки работы в Deductor Studio» / Компания BaseGroup™ Labs 2009


