Лабораторная работа 8.
ИССЛЕДОВАНИЕ ВЫБОРОЧНЫХ ХАРАКТЕРИСТИК ДАТЧИКА СЛУЧАЙНЫХ ЧИСЕЛ С ПРОВЕРКОЙ ГИПОТЕЗЫ О ВИДЕ ЗАКОНА РАСПРЕДЕЛЕНИЯ ВЫБОРОЧНЫХ ДАННЫХ.
Описательные статистики.
Идея описательных статистик очень проста: вместо того, чтобы рассматривать все значения переменной, а их может быть очень много (тысячи и миллионы), вначале стоит посмотреть описательные статистики. Они дают общее представление о значениях, которые принимает переменная.
К описательным (дескриптивным) статистикам относятся: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, мода и т. д.
Для выполнения данной лабораторной работы, откройте в приложении Statistica файл, который был сформирован в Лабораторной работе №1 и сохранен с расширением *.sta.
1. В меню «Статистики» выбираем пункт «Основные статистики и таблицы».
2. В стартовой панели выберите диалог «Таблицы частот» и нажмите кнопку «ОК»
3. В диалоговом окне «Таблицы частот» нажмите кнопку «Переменные» и выберите переменные из файла данных.
4.
![]() |
При выборе вкладки «Описательные статистики» вы должны получить таблицу вида:
По умолчанию таблицы результатов окна «Описательные статистики» содержат средние значения, число наблюдений без пропусков N, стандартные отклонения, а также минимальные и максимальные значения для выбранных переменных.
С помощью кнопки «Select Cases» можно задать условия выбора наблюдений
Следующим шагом данной лабораторной работы, является проверка нормальности наблюдаемых величин (в данном случае делается это с помощью оценок коэффициентов асимметрии и эксцесса). Работаем с ранее созданным файлом.
1. Запустите модуль «Основные статистики и таблицы»
2. В стартовой панели модуля выберите «Основные статистики» и нажмите ОК.
3. В появившемся окне «Описательные статистики» нажмите кнопку «Переменные» и выберите переменную.
4. Нажмите кнопку «Другие статистики» и дайте указание системе, что вам нужно вычислить асимметрию и эксцесс, а также их стандартные ошибки.
5. В результате этих манипуляций должна появиться таблица.
6. Дайте анализ получившимся данным.
Проверка гипотезы о виде закона распределения и вычисление ширины доверительного интервала по каждому параметру.
Первый, самый естественный шаг вероятностных рассуждений заключается в следующем: если существует некоторая переменная, принимающая значения случайным образом, то необходимо узнать, с какими вероятностями эта переменная принимает определенные значения. Совокупность этих вероятностей как раз и задает распределение вероятностей. Например, имея игральную кость, можно a priori считать, что с равными вероятностями 1/6 она упадет на любую грань. И это происходит при условии, что кость симметричная. Если кость не симметричная, то можно определить большие вероятности для тех граней, которые выпадают чаще, а меньшие вероятности – для тех граней, которые выпадают реже, исходя из опытных данных. Если какая-то грань вообще не выпадает, то ей можно присвоить вероятность 0. Это и есть простейший вероятностный закон, с помощью которого можно описать результаты бросания кости. Конечно, это чрезвычайно простой пример, но аналогичные задачи возникают, например, при актуарных расчетах, когда на основе реальных данных рассчитываются реальные риски при инвестировании.
Доверительный интервал, представляет собой интервал значений, который покрывает неизвестный параметр с заданной надежностью γ. Если установить больший уровень доверия, то интервал станет шире, поэтому возрастает вероятность, с которой он "накрывает" неизвестное среднее популяции, и наоборот. Можно отметить, что ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки. Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.
Целью данной лабораторной работы, является подбор вида закона распределения и вычисление ширины доверительного интервала по каждому параметру.
Программа Statistica позволяет «подогнать» вероятностные распределения к реальным данным. Подгонкой (англ. термин fitting) называют аналитические процедуры, позволяющие подобрать распределение, которое с достаточной степенью точности описывает наблюдаемые данные. Итак, имея значения переменной Х, мы проверяем гипотезу, согласно которой распределение Х описывается вероятностным законом F.
Анализ проводится в модуле «Подгонка распределений» (Distribution Fitting).
1. Откройте в программе Statistica файл с данными.
2. Затем, откройте модуль «Подгонка распределений».
3. В появившемся окне «Непрерывные распределения» двойным щелчком мыши выберите то распределение, которое находится в списке первым.
4. Нажмите кнопку «Переменные» и выберите переменную для анализа.
5. Программа вычислит оценку параметра распределения и представит результаты в таблице. По получившимся данным оцените значение статистики хи-квадрат. По уровню значимости р, определите, насколько хорошо данные согласуются с гипотезой о выбранном законе распределения.
6. Для иллюстрации приведенных таблиц можно воспользоваться графиком. Для этого нажмите кнопку «График».
7. Для выбора адекватного закона распределения повторите эти же манипуляции с другими распределениями.
Для того, что бы оценить ширину доверительного интервала:
1. Откройте модуль «Основные статистики и таблицы».
Откройте вероятностный калькулятор (Probability calculator) и оцените ширину доверительного интервала, для каждого параметра.



