Дифференцированный зачет проводится по теоретическим вопросам дисциплины и практическому заданию. При выставлении оценок экзаменатор руководствуется следующими критериями.
Оценка «отлично» (91-100 баллов)
Студент дал полные, развернутые ответы на все теоретические вопросы билета, продемонстрировал знание терминологии и основных методов ИАД, умение применять теоретические знания при решении задач. Студент показал исчерпывающие знания по следующим направлениям: многомерная модель данных, определение OLAP-систем, концептуальное многомерное представление, двенадцать правил Кодда, методы прогнозирования и классификации: деревья решений, метод опорных векторов, метод «ближайшего соседа», нейронные сети, методы кластерного анализа, студент без затруднений ответил на все дополнительные вопросы. Задача решена полностью без неточностей и ошибок.
Оценка «хорошо» (71-90 баллов)
Студент раскрыл в основном теоретические вопросы, однако допущены неточности в определении основных понятий эконометрики. При этом неполно освящены второстепенные детали, однако в полной мере освоены основные методы интеллектуального анализа данных. При ответе на дополнительные вопросы допущены небольшие неточности. При решении задачи допущены несущественные ошибки.
Оценка «удовлетворительно»
При ответе на теоретические вопросы студентом допущено несколько существенных ошибок в толковании основных понятий. Логика и полнота ответа страдают заметными изъянами. Заметны пробелы в знании основных методов. Теоретические вопросы в целом изложены достаточно, но с пропусками материала. Имеются принципиальные ошибки в логике построения ответа на вопрос. Студент не решил задачу или при решении допущены грубые ошибки.
Оценка «неудовлетворительно»
Ответ на теоретические вопросы свидетельствует о непонимании и крайне неполном знании основных понятий и методов теории экономических информационных систем. Обнаруживается отсутствие навыков применения теоретических знаний при решении соответствующих задач. Студент не смог ответить ни на один дополнительный вопрос. Задача не решена.
4. Типовые модульные контрольные работы
Модульная контрольная работа №1
1. Хранилища данных: концепция, свойства, классификация
2. Многомерная модель данных. Определение OLAP-систем.
3. Архитектура OLAP-систем. MOLAP-серверы.
Практическое задание
Выбрать правильные ответы:
1. Часть зависимой переменной в регрессионной модели, которая может быть объяснена значением регрессора:
случайное возмущение; отклик; уравнение регрессии; остаток.2. Гипотеза является сложной, если:
она состоит из конечного числа простых гипотез; она состоит из бесконечного числа простых гипотез; Содержит только одно предположение.3. Коррелированность возмущений с различными номерами называется:
гомоскедастичностью; гетероскедастичностью; автокорреляцией4. Критической областью называют:
совокупность значений критерия, при которых нулевую гипотезу принимают; совокупность значений критерия, при которых нулевую гипотезу отвергают. Укажите формулу вычисления коэффициента детерминации для парной регрессии: RSS/TSS; 1-(ESS/TSS); ESS/TSS.Решите задачу
Наблюдения 16 пар (X, Y) дали следующие результаты:
УY2 = 526 УX2 = 657 УXY = 492
УY = 64 УX = 96
Оцените регрессию ![]()
Сформулируйте нулевую (основную) и альтернативные гипотезы при проверке статистической значимости коэффициентов регрессии.
Модульная контрольная работа №2
1. Сравнение статистик, машинного обучения и Data Mining. Классификация задач Data Mining. Сферы применения Data Mining. Процесс Data Mining
2. Методы прогнозирования и классификации: деревья решений, метод опорных векторов, метод «ближайшего соседа»
3. Методы кластерного анализа
Практическое задание
Выбрать правильные ответы:
1. Причины гетероскедастичности (множественный выбор):
исследование неоднородных объектов; характер наблюдений; ошибки спецификации; ошибки измерений.2. Под мультиколлинеарностью понимается линейная зависимость (единичный выбор):
зависимой переменной с одним или несколькими регрессорами; двух, или нескольких регрессоров; зависимой переменной с возмущением; регрессоров с возмущением.3. Критерий качества МНК в множественной регрессии (множественный выбор):
4. С увеличением объема выборки длина доверительного интервала прогнозируемого значения зависимой переменной (единичный выбор):
увеличивается; уменьшается не меняется. Обычный R2 и скорректированный R2adj коэффициенты детерминации для множественной регрессии связаны отношением (единичный выбор):Решите задачу
Для двух видов продукции А и Б зависимость расходов предприятия Y (тыс. руб.) от объема производства X (шт.) характеризуется данными, представленными в таблице:
Уравнение регрессии | Коэффициент детерминации | Число наблюдений |
YA=160 +0,8 X | 0,8 | 30 |
1. Поясните смысл величин 0,8 и 0,6 в уравнениях регрессии.
2. Найдите значения F-критерия Фишера для уравнений регрессии.
Модульная контрольная работа №3
1. В чем состоит цель поиска ассоциативных правил. Дайте определения категориям «транзакция», «поддержка набора», «поддержка правила», «достоверность правила».
2. Алгоритм поиска ассоциативных правил Apriori: этапы работы. В чем состоит отличие алгоритма Apriori от алгоритмов AIS и SETM.
3. Организационные факторы при внедрении Data Mining в деятельность компании.
4. Человеческие факторы при внедрении Data Mining в деятельность компании. Основные роли специалистов в процессах Data Mining.
5. Перечислите стандарты методологии Data Mining. В чем состоят их особенности.
5. Контрольные вопросы для подготовки к зачету
СППР: задачи, архитектура, источник данных. Хранилища данных: концепция, свойства, классификация. Создание хранилищ данных Многомерная модель данных. Правила Кодда. Определение OLAP-систем. Архитектура OLAP. Тест FASMI MOLAP-серверы. ROLAP-серверы. HOLAP-серверы. Сравнение статистик, машинного обучения и Data Mining. Классификация задач Data Mining. Сферы применения Data Mining. Процесс Data Mining Задачи интеллектуального анализа данных. Классификация и кластеризация Задачи интеллектуального анализа данных. Прогнозирование и визуализация Методы прогнозирования и классификации: деревья решений Методы прогнозирования и классификации: метод опорных векторов Методы прогнозирования и классификации: метод «ближайшего соседа» Методы прогнозирования и классификации: нейронные сети. Методы кластерного анализа. Стандарт CWM: назначение, структура и состав. Стандарт CRISP: структура, фазы и задачи. Стандарт PMML. Стандарт OLE DB для Data Mining. Поставщики Data Mining. Классификация инструментов. Программное обеспечение Data Mining для поиска ассоциативных правил. Программное обеспечение для решения задач кластеризации и сегментации. Программное обеспечение для решения задач классификации. Программное обеспечение Data Mining для решения задач оценивания и прогнозирования.6. Тематика реферативных сообщений
Инструментальные средства ИАД применительно к задачам СППР. Направления развития информационных технологий ИАД. Направления развития современных информационных технологий в СППР. Инструментальные средства сбора и доработки данных. Инструментальные средства преобразования данных. Инструментальные средства оперативного (OLAP) анализа. История нейрокомпьютинга. Задачи ИАД на основе искусственных нейронных сетей. Биологическая и математическая модели нейрона. Однослойные и многослойные нейронные сети. Структура искусственной нейронные сети. Особенности структуры нейронных сетей и ее влияние на свойства сети. Решение задач с помощью многослойного персептрона. Топологии нейронных сетей.7. Контрольные вопросы промежуточной аттестации (по итогам изучения курса)
Данные и модели их представления. Задачи ИАД. Алгебра матриц. Функции многих переменных. Необходимые и достаточные условия существования экстремумов применительно к квадратичным формам. Типы шкал. Допустимые преобразования в шкалах. Проверка истинности утверждений. Статистическая выборка. Числовые характеристики распределений. Комплексные числа и их применение при визуализации многомерных данных. Методы и алгоритмы оцифровки графиков. Методы и алгоритмы обработки изображений. Простые и сложные признаки и способы оценки их информативности. Алгоритмы поиска систем информативных признаков. Матрица объект-признак и её статистические характеристики. Проблема сжатия данных. Разнотипные данные и методы их обработки. Задача поиска логических закономерностей. Методы классификации и прогнозирования. Задачи кластерного анализа. Иерархические и итеративные методы кластеризации. Особенности кластеризации в качественных и количественных шкалах. Кластеризация данных по матрице объект-признак. Кластеризация данных по матрице матрице связи. Назначение компонентного и факторного анализа. Сходство и различие компонентного и факторного анализа. Применение компонентного и факторного анализа к задачам ИАД. Методы распознавания образов с учителем и без учителя. Задачи принятия решений. Метод анализа иерархий. Модификации метода анализа иерархий в интересах реализации интеллектуальных подсказок пользователям. Основные понятия когнитивного моделирования. Инструментальные средства ИАД применительно к задачам СППР. Направления развития ИАД. Направления развития современных информационных технологий в СППР. Краткая история нейрокомпьютинга. Задачи ИАД на основе искусственных нейронных сетей. Место нейронных сетей среди других методов решения задач Информационный подход к моделированию нейрона. Биологический подход к моделированию нейрона. Структура искусственной нейронные сети. Структура двухкровневого персептрона, многоуровневого персептрона (МСП). Особенности структуры нейронных сетей и ее влияние на свойства сети. Алгоритм решения задач с помощью МСП. Классификация задач решаемых с помощью МСП. Постановка задач распознавания, аппроксимации, прогнозирования. Примеры задач. Топологии нейронных сетей.8. Тематика практических задач промежуточной аттестации (по итогам изучения курса)
Алгебра матриц. Экстремумы функций многих переменных. Графическое представление данных в различных типах шкал, их графическое представление в МАТЛАБ. Сжатие данных. Методы классификации. Метод анализа иерархий.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 |


