Спецкурсы кафедры математических методов прогнозирования для аспирантов

на 2015/16 учебный год


Спецкурс

Семестр

Лектор

1

«Прикладные задачи анализа данных»http://данных/

Applied data mining problems

Осень

д. ф.-м. н., профессор

2

«Непрерывные морфологические модели и алгоритмы»

Continuous morphological models and algorithms


Осень

д. т.н., профессор


3

«Задачи и алгоритмы вычислительной геометрии»

Problems and algorithms of computational geometry


Весна

д. т.н., профессор


4

«Логический анализ данных в распознавании»

Logical data analysis in pattern recognition

Осень

д. ф.-м. н, доцент

5

«Методы машинного обучения и поиск достоверных закономерностей в данных»

Machine learning and knowledge discovery

Осень

д. ф.-м. н.

6

«Нестатистические методы анализа данных и классификации»,

Non-statistical methods of data mining and classification

Осень


д. ф.-м. н., профессор

7

«Нестатистический анализ данных»,

Non-statistical data mining

Весна

д. ф.-м. н., профессор

8

«Методы оптимизации в машинном обучении»

Optimization in machine learning

Осень

н. с. http://www. machinelearning. ru/wiki/index. php? title=Smais

9

«Метрические методы интеллектуального анализа данных»

Metric methods of machine learning

Весна

к. ф.-м. н., доцент Майсурадзе Арчил Ивериевич

10

«Вероятностное тематическое моделирования»

Probabilistic topic modelling

Весна

д. ф.-м. н.

http://www. machinelearning. ru/wiki

11

«Исчисления высказываний классической и интуиционистской логик»

Propositional calculus of classical and intuitionistic logics

Осень

доцент, к. ф.-м. н.



Курс «Прикладные задачи анализа данных»

НЕ нашли? Не то? Что вы ищете?

Аннотация

Основная цель: практика решения современных задач классификации, прогнозирования, регрессии, рекомендации и т. п., подготовка участников к соревнованиям на платформах Kaggle и Algomost.

Программа

Вводное занятие: цели курса, материалы, правила, участие в соревнованиях. Соревнование Learning Social Circles in Networks по определению кругов в эго-подграфах графа социальной сети (задача, данные, их загрузка, редакторское расстояние), приложения анализа социальных сетей.

Анализ социальных сетей, определение кругов пользователей: динамические графы, приложения анализа социальных сетей, погружение графов в признаковое пространство, сходство вершин, важность вершин, прогнозирование появления рёбер в динамическом графе, решение задачи соревнования IJCNN Social Network Challenge, признаки рёбер, алгоритм PageRank и его модификации, сообщества в графах и их выделение, спектральные методы на графах, генерация случайных графов.

Искусство визуализации данных: игра "Что за данные", признаки в задаче [bioresponse], выделение групп признаков, что можно увидеть в данных, оценка признаков и фолдов, деформация ответов, устойчивость закономерностей, профили лет (в прогнозировании вр. рядов), плотности, оценка качества признаков с помощью RF и удалений, результаты алгоритмов и их линейные комбинации, ручная деформация пространств, визуализация и сглаживание плотностей, построение профилей. Что надо знать о признаках. Визуализация по-вертикали и по-горизонтали. Шумы и шумовые признаки. Задачи [cause-effect-pairs], [GiveMeSomeCredit], [DarkWorlds].

Оценка среднего, оценка вероятности, оценка плотности. Весовые схемы: проблема оценки среднего, выбросы, разные целевые функционалы, оценка минимального контраста, среднее по Колмогорову, SMAPE-минимизация, двухэтапные алгоритмы и их настройка, пересчёт вероятности и прямая оценка, введение весовых схем, устойчивость весовых схем, ансамблирование, непараметрическое восстановление плотности, весовые схемы при оценке плотности. Задача [dunnhumby's Shopper Challenge]. Задача [пробки].

Линейная классификация и регрессия: персептронный алгоритм, режимы обучения, концепция поощрение-наказание, концепция минимизации функционала, линейная регрессия, SGD, хэширование признаков, регуляризация, обобщения регрессии, прогноз раскупаемости, прогноз методом kNN, прогноз линейным оператором, линейный алгоритм над SVD, признаковое прогнозирование спроса, профили товаров, сезонность, LibSVM, LibLinear. Задачи: [JRS12], [NN5], [tourism2]. Разбор решения задачи соревнования Learning Social Circles in Networks. Tradeshift Text Classification.

Анализ текстов: классификация и регрессия - этапы работы с текстом, токенизация, стоп-слова, векторное представление документа, n-граммы, стемминг, алгоритм Портера, TF*IDF, оценки качества (точность, полнота, F-мера), классификация спама, Local and Global Consistency, этапные алгоритмы, устойчивые признаки, иерархическая классификация текстов, основные методы (Роше, kNN, SVM), приведение к шаблону, обнаружение оскорблений, распределение по топикам (задача со многими классами), блендинг алгоритмов, фонетические алгоритмы. Задачи: [spam], [LSHTC], [JRS12]. Представление программы Vowpal Wabbit.

Случайные леса: универсальные методы анализа данных, бэггинг и бустинг, построение одного дерева, OOB(out of bag)-проверка, параметры случайного леса (random forest: mtry, nodesize, samplesize) и их настройка, рейтинг признаков (importance). Программирование случайного леса. Области устойчивости функционалов. Искусство генерации признаков: географические и временные признаки. Концепция чёрного ящика на примере GBM. Настройка параметров GBM, суммирование. Нестандартные функционалы и настройка на них. Калибровка ответов алгоритмов. Сведение задачи рекомендации к регрессии. Критерии расщепления.

Разбор задач [see-click-predict-fix], [wikimart].

k ближайших соседей, настройка комбинаций алгоритмов: Сглаживание функционалов качества при использовании весовых схем. Ограничение методов типа kNN (тренд, некорректность метрики).

Примитивная настройка линейных комбинаций алгоритмов и метрик. Технология LENKOR (синтез близостей, составление комбинации близостей, настройка коэффициентов, добавление нелинейностей). Подробный разбор задачи детектирования оскорблений. Задачи [PhotoQualityPrediction] (определение качества фотографии по метаданным), [unimelb] (предсказывание успешности выполнения гранта), [VLNetChallenge] (рекомендация видеолекций для просмотра). Деформация ответов, теоремы Колмогорова, Горбаня и Пинкуса, алгебраический подход к коррекции и его правильное применение на практике.

Курс «Непрерывные морфологические модели и алгоритмы»

Аннотация

В компьютере изображения представляются прямоугольными матрицами точек, обладающих определенным цветом и яркостью. Такое дискретное представление является удобным для ввода, запоминания, обработки в компьютере. Однако для анализа формы объектов такое представление неудобно. Человеку привычнее и проще при описании формы объектов оперировать непрерывными геометрическими фигурами. Основные преимущества непрерывного представления: адекватность его с физической сущностью «сплошных» объектов реального мира, возможность использования для анализа, преобразований и распознавания формы методов «непрерывной» математики.

В курсе рассматриваются вопросы анализа формы плоских фигур и связанные с этим приложения в области распознавания изображений, компьютерной графики и геоинформатики. Рассматриваются темы, относящиеся к вычислительной геометрии – геометрический поиск, выпуклые оболочки, пересечения и близость объектов. Вычислительная геометрия является теоретической основой для разработки эффективных алгоритмов работы с изображениями.

Программа

    Основные понятия вычислительной геометрии. Мера сложности вычислений. Асимптотический анализ сложности. Рекурсивные алгоритмы. Оценка вычислительной сложности задачи.
    Алгоритмическая парадигма «разделяй и властвуй». Геометрический поиск. Локализация точки в простом и в выпуклом многоугольнике при уникальном и массовом запросе. Локализация точки в планарном подразбиении.
    Построение выпуклых оболочек. Алгоритмы Джарвиса, Грэхема. Слияние выпуклых оболочек. Метод редукции для оценки сложности задачи.
    Пересечения геометрических объектов. Пересечения конечного множества отрезков. Алгоритмическая парадигма плоского заметания. Структуры данных в алгоритме заметания.
    Близость геометрических объектов. Разбиения Вороного и триангуляции Делоне. Преобразования двойственных графов. Алгоритмы построения триангуляции Делоне: наивные, жадные, инкрементные, флип-флоп, рекурсивные. Обобщенные диаграммы Вороного для различных множеств сайтов – кругов, отрезков, многоугольников.
    Обобщенная диаграмма Вороного и скелет многоугольной фигуры.

Литература

М. ычислительная геометрия: введение. Москва: «Мир», 1989. Местецкий морфология бинарных изображений: фигуры, скелеты, циркуляры. Москва: Физматлит. 2009. Местецкий по вычислительной геометрии. Учебное пособие. ВМК МГУ, 2013. Конспект [1.46 Мб] Местецкий по непрерывным морфологическим моделям Презентации PowerPoint [3.8 Мб]

Курс «Задачи и алгоритмы вычислительной геометрии»

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6