MLST: Статистические методы в MATLAB

Продолжительность 8 академических часов.

Этот курс представляет собой введение в статистические инструменты MATLAB и Statistics Toolbox™ такие как:

·  Импорт и организация данных.

·  Описательная статистика.

·  Визуализация данных.

·  Генерация случайных чисел и выполнение моделирования.

·  Сопоставление распределений данным.

·  Выполнение двумерной и многомерной регрессии.

Предварительная подготовка

Практические знания MATLAB и основных статистических данных.

Программа курса

Модуль 1. Управление данными.

Перед выполнением какого-либо анализа необходимо импортировать данные в MATLAB и организовать их должным образом. В этом модуле рассматриваются методы импорта и типы данных, доступные в MATLAB и Statistics Toolbox. Обращается отдельное внимание на работу с общими проблемами, такими как недостающие данные.

·  Импорт данных.

·  Организация данных.

·  Категории данных и массивы данных.

·  Несоразмерные и отсутствующие данные.

Модуль 2. Исследование данных.

В данном модуле рассматриваются основные статистические исследования данных, включая визуализацию и расчет сводных статистических данных.  

·  Описательная статистика.

·  Среднее значение. 

·  Распространение.

·  Статистическая визуализации.

·  Группированные данные.

Модуль 3. Распределения и случайные числа.

В этом модуле освещаются функциональности, доступные в Statistics Toolbox, для исследования различных распределений вероятности, а также генерации случайных чисел из одного из этих распределений или из любого другого распределения.

·  Распределения вероятностей.

·  Распределения в Statistics Toolbox.

·  Генерация случайных чисел.

·  Потоки случайных чисел.

·  Случайные числа для произвольных распределений.

·  Моделирование методом Монте-Карло.

Модуль 4. Установка и тестирование распределения.

После изучения массивов данных, часто бывает желательно сравнить данные с теоретическим распределением, оценить параметры распределения данных или проверить гипотезы о данных. В этом модуле показано, как решать эти задачи в рамках функций, доступных в Statistics Toolbox.

·  Выбор распределения.

·  Подгонка распределения.

·  Тестирование распределения.

·  Проверка гипотезы.

·  Пример: цены на бензин.

Модуль 5. Регрессионный анализ.

В этой главе обсуждается, как подобрать линейные и нелинейные модели для двумерных данных.

·  Прогнозы и реакции.

·  Графики разбросов.

·  Корреляция и ковариация.

·  Линейные модели.

·  Нелинейные модели.

Модуль 6. Дисперсионный анализ.

В этом модуле рассматриваются задачи определения различий в группированных данных, в том числе множественные сравнения между группами. Обсуждаются переменные множественных группировок и множественных реакций.

·  Одномерный ANOVA анализ.

·  Двумерный ANOVA анализ.

·  N-мерный ANOVA анализ.

·  Многомерный ANOVA анализ.

Модуль 7. Многомерная статистика.

Этот модуль расширяет понятия предыдущих модулей до массивов данных с многими переменными. Представлены специализированные методы многомерного анализа и визуализации.

·  Многомерные отображения. 

·  Анализ главных компонент.

·  Кластеризация.