Технологии анализа данных

1.  Информационные процессы. Информационные технологии анализа данных.

2.  Определение OLTP.

3.  OLAP. Элементы OLAP. Операции OLAP. Что такое измерение, мера, гиперкуб? Что значит срез, транспонирование, свертка, детализация?

4.  Что такое оперативный источник данных?

5.  Тест FASMI.

6.  Архитектура OLAP. OLAP на стороне сервера. OLAP на стороне клиента.

7.  Типы OLAP. Что значит MOLAP, ROLAP, HOLAP?

8.  Структура БД типа звезда.

9.  Структура БД типа снежинка.

10.  Хранилище данных (ХД). Элементы хранилища данных.

11.  Информационные потоки и информационные процессы ХД.

12.  Виды ХД. Физическое, виртуальное ХД. Витрины данных.

Data Mining

1.  Определение Data Mining (DM), Text Mining, Visual Mining, Web Mining.

2.  Практическое применение и задачи DM.

3.  Определение задач классификации, регрессии, кластеризации, ассоциация, построения последовательности, прогнозирования, анализа отклонений.

4.  Описательный и предсказательный характеры задач

5.  Обучение с учителем, обучение без учителя.

6.  Модели представления знаний. Правила, деревья решений, кластеры.

7.  Жизненный цикл проекта DM. В чем заключается сбор данных, очистка и трансформация данных, построение модели, оценка модели?

8.  Методы DM

9.  Задачи классификации и регрессии. Алгоритм построения 1-правил, наивный Байесовский метод

10.  Метод «разделяй и властвуй», алгоритмы ID3 и С4.5.

11.  Области применения классификационных правил, деревьев решений.

13.  Кластеризация. Примеры в области IT и Web.

14.  Постановка задачи кластеризации, кластер, меры схожести

15.  Алгоритмы кластеризации.

16.  Иерархические алгоритмы кластеризации. Дендрограмма.

17.  Неиерархические алгоритмы кластеризации.

18.  Очевидный алгоритм графовой кластеризации.

19.  Алгоритм, основанный на построении минимального остовного дерева