MLST: Статистические методы в MATLAB
Продолжительность 8 академических часов.
Этот курс представляет собой введение в статистические инструменты MATLAB и Statistics Toolbox™ такие как:
· Импорт и организация данных.
· Описательная статистика.
· Визуализация данных.
· Генерация случайных чисел и выполнение моделирования.
· Сопоставление распределений данным.
· Выполнение двумерной и многомерной регрессии.
Предварительная подготовка
Практические знания MATLAB и основных статистических данных.
Программа курса
Модуль 1. Управление данными.
Перед выполнением какого-либо анализа необходимо импортировать данные в MATLAB и организовать их должным образом. В этом модуле рассматриваются методы импорта и типы данных, доступные в MATLAB и Statistics Toolbox. Обращается отдельное внимание на работу с общими проблемами, такими как недостающие данные.
· Импорт данных.
· Организация данных.
· Категории данных и массивы данных.
· Несоразмерные и отсутствующие данные.
Модуль 2. Исследование данных.
В данном модуле рассматриваются основные статистические исследования данных, включая визуализацию и расчет сводных статистических данных.
· Описательная статистика.
· Среднее значение.
· Распространение.
· Статистическая визуализации.
· Группированные данные.
Модуль 3. Распределения и случайные числа.
В этом модуле освещаются функциональности, доступные в Statistics Toolbox, для исследования различных распределений вероятности, а также генерации случайных чисел из одного из этих распределений или из любого другого распределения.
· Распределения вероятностей.
· Распределения в Statistics Toolbox.
· Генерация случайных чисел.
· Потоки случайных чисел.
· Случайные числа для произвольных распределений.
· Моделирование методом Монте-Карло.
Модуль 4. Установка и тестирование распределения.
После изучения массивов данных, часто бывает желательно сравнить данные с теоретическим распределением, оценить параметры распределения данных или проверить гипотезы о данных. В этом модуле показано, как решать эти задачи в рамках функций, доступных в Statistics Toolbox.
· Выбор распределения.
· Подгонка распределения.
· Тестирование распределения.
· Проверка гипотезы.
· Пример: цены на бензин.
Модуль 5. Регрессионный анализ.
В этой главе обсуждается, как подобрать линейные и нелинейные модели для двумерных данных.
· Прогнозы и реакции.
· Графики разбросов.
· Корреляция и ковариация.
· Линейные модели.
· Нелинейные модели.
Модуль 6. Дисперсионный анализ.
В этом модуле рассматриваются задачи определения различий в группированных данных, в том числе множественные сравнения между группами. Обсуждаются переменные множественных группировок и множественных реакций.
· Одномерный ANOVA анализ.
· Двумерный ANOVA анализ.
· N-мерный ANOVA анализ.
· Многомерный ANOVA анализ.
Модуль 7. Многомерная статистика.
Этот модуль расширяет понятия предыдущих модулей до массивов данных с многими переменными. Представлены специализированные методы многомерного анализа и визуализации.
· Многомерные отображения.
· Анализ главных компонент.
· Кластеризация.


