Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Программа спецкурса

«Введение в методы интеллектуального анализа данных (Data Mining

Лектор: доцент

Введение.

1.  Часть I. Задачи и алгоритмы интеллектуального анализа данных

1.1.  Задачи «обучения без учителя»

1.1.1.  Поиск ассоциативных правил (алгоритмы Apriori и FP-tree).

1.1.2.  Кластеризация и самоорганизация.

1.1.3.  Иерархическая кластеризация (Single-link, Complete-link и другие)

1.1.4.  Методы разбиения типа K-средних (K-Means и K-medoids).

1.1.5.  Методы кластеризации на основе ближайших соседей (DBSACAN и DENCLUE).

1.1.6.  Статистические методы кластеризации (Expectation Maximization)

1.1.7.  Нейро-сетевые методы кластеризации (SOM и сети Кохонена),

1.1.8.  Методы концептуальной кластеризации (COBWEB).

1.1.9.  Grid-Кластеризация (алгоритм CLIQUE)

1.1.10.  Нечеткая кластеризация (Fuzzy K-means и Fuzzy Relations).

1.1.11.  Анализ главных компонент (PCA) и независимых компонент (ICA)

1.1.12.  Поиск исключений.

1.2.  Задачи «обучения с учителем»

1.2.1.  Задача классификации и задача прогнозирования.

1.2.2.  Методы «ближайшего соседа».

1.2.3.  Байесовские методы.

1.2.4.  Регрессионный анализ.

1.2.5.  Методы на основе правил и деревьев решений.

1.2.6.  Нейронные сети.

1.2.7.  Kernel методы.

1.2.8.  Методы усиления (boosting и bagging), ансамбли классификаторов.

2.  Часть II. Анализ разнородных сложно структурированных данных

2.1.  Предобработка данных.

2.1.1.  Методы дискретизации.

2.1.2.  Сокращение размерности и выявление ключевых свойств (feature extraction)

2.1.3.  Обработка пропущенных значений (неопределенность и импутация)

2.1.4.  Меры сходства для сложно структурированных данных.

2.2.  Анализ многомерных данных.

2.2.1.  Концепции OLAP: задачи, структуры данных, операции.

2.2.2.  Методы DM для OLAP-данных. Многомерность и учет иерархий.

2.3.  Web mining и Text mining.

2.3.1.  Представление текстовых и гипертекстовых данных, меры сходства.

2.3.2.  Задачи анализа текстовых данных с помощью методов DM. Алгоритмы и особенности.

2.4.  Анализ временных рядов (числовых и символьных).

2.4.1.  Прикладные задачи анализа числовых и символьных временных рядов.

2.4.2.  Методы DM для выявления трендов и исключений, прогнозирования и группировки числовых и символьных временных рядов.

Заключение: выводы, открытые проблемы, перспективы.