Тема 2. Параметрические и непараметрические тесты. Параметрические методы сравнения средних

Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

Тема 2. Параметрические и непараметрические тесты. Параметрические методы сравнения средних

2.1. Параметрические и непараметрические методы сравнения выборок

Прежде всего ‑ о терминах. Что подразумевается под «средними»? Ответ вполне ожидаем – речь идет о средних значениях.

Команда Means (Средние) предназначена для сравнения подгрупп объектов по средним значениям количественных признаков. При этом возможна ситуация, когда в наборе переменных, участвующих в анализе, имеются не только количественные переменные, для которых вычисляются средние, но и номинальные переменные, разделяющие объекты на подгруппы. Так, например, можно сравнить средние значения успеваемости юношей и девушек, представителей разных учебных групп и т. д. Результаты вычислений представляют собой таблицы, схожие с таблицами сопряженности (или кросстабами). Для каждой исследуемой подгруппы вычисляется не только частота, но среднее значение. А если быть более точным ‑ для выбранных подгрупп команда Means (Средние) подсчитывает средние значения, стандартные отклонения и частоты. Дополнительно – с помощью кнопки Options (Параметры) – можно задать вывод результатов однофакторного дисперсионного анализа. Подробно сущность дисперсионный анализ мы сегодня разбирать не будем. В целом команда Means (Средние) является одной из самых простых в SPSS.

Итак. Сравнение средних значений различных выборок относится к наиболее часто применяемым методам статистического анализа. При этом всегда должен быть выяснен вопрос, можно ли объяснить имеющееся различие средних значений статистическими колебаниями или нет. В последнем случае говорят о значимом различии.

НЕ нашли? Не то? Что вы ищете?

При сравнении средних значений выборок предполагается, что обе выборки подчиняются нормальному распределению. Если это не так (распределение не подчиняется нормальному закону), то вычисляются медианы и для сравнения выборок используется непараметрический тест.

2.2. Параметрические методы сравнения выборок

Сначала мы опробуем наиболее прозрачную возможность для сравнения средних в SPSS.

· Загрузите файл:

hyper. sav

Мы хотим проверить, значительно ли различается действие двух групп медикаментов на людей в зависимости от их возраста.

· Выберите в меню команду:

Analyze (Анализ)

Compare Means (Сравнение средних)

Means (Средние)

Откроется диалоговое окно Means (Средние).

Список Inependent List (Независимые переменные) в нижнем поле окна предназначен для неколичественных (номинальных) переменных, которые, собственно, и определяют сравниваемые подгруппы (выборки). Это может быть ‑ пол, принадлежность к какой-либо группе вообще, например, любителей кактусов). На основе этих переменных строится таблица сопряженности.

med

Independent

List

Список Dependent List (Зависимые переменные) в верхнем поле окна предназначен для количественных переменных, для которых и будут вычисляться средние значения и др. характеристики. Таких переменных может быть задано/назначено/указано несколько одновременно, причем для каждой их них можно задать независимый, собственный набор вычисляемых характеристик.

Dependent

List

ОК

В окне просмотра появятся следующие результаты:

‑ средние значения (средний возраст) пациентов, принимавших разные препараты. По умолчанию будут также вычислены стандартные отклонения.

Чтобы задать несколько переменных в списке Independent List (Независимые переменные), используйте кнопки Previous (Предыдущая) и Next (Следующая) под указателем текущего слоя. Что такое слои в данном случае? Это, по сути, многомерность таблицы. Слой ‑ независимое измерение, соответствующее переменной, Каждой независимой переменной соответствует свой слой.

Next

Independent

List

Количественных переменных тоже может быть задано несколько. Их количество ‑ количество столбцов в таблице результатов.

Dependent

List

ОК

В окне просмотра появятся результаты.

Команда Means (Средние) позволяет выполнить однофакторный дисперсионный анализ. Для этого в группе Statistics for First Layer (статистики для первого слоя) в нижней части окна Options (Параметры) нужно установить флажок ANOVA table and eta (Таблица ANOVA и коэффициент Эта). Дисперсионный анализ проведен только для средних значений первого слоя. Чтобы выполнить аналогичную процедуру для средних других слоев, необходимо указать соответствующую независимую переменную в первом слое.

Параметр Sig./Знч. (Значимость) – вероятность того, что наблюдаемые различия случайны. Величина p < 0.001 свидетельствует о высокой статистической значимости различий.

Итак, мы протестировали одну из «универсальных» техник сравнения средних, без предварительного анализа исследуемой ситуации. Однако, при сравнении средних значений выборок, вообще говоря, выделяют четыре различные тестовые ситуации:

1. Сравнение двух независимых выборок

2. Сравнение двух зависимых (спаренных) выборок

3. Сравнение более двух независимых выборок

4. Сравнение более двух зависимых выборок

В каждой из перечисленных ситуаций применяются соответствующий статистический тесты:

1. t-тест для независимых выборок (тест Стьюдента)

2. t-тест для зависимых выборок

3. Однофакторный дисперсионный анализ

4. Однофакторный дисперсионный анализ с повторными измерениями

Рассмотрим по порядку и на примерах техники названных тестов.

Различные варианты обработки данных с применением t-критерия позволяют сделать вывод о различии двух средних.

В случае независимых выборок с помощью t-критерия проверяется достоверность различия двух выборок по переменной, общей для этих двух выборок. Логика вполне очевидная: 1) для выбранных подгрупп вычисляются средние значения и 2) затем по t-критерию определяется статистическая значимость их различия. Применение t-критерия ‑ один из самых распространенных методов статистического вывода, так как он позволяет достаточно легко ответить на простой вопрос о различии двух выборок по уровню выраженности/интенсивности измеренного признака/переменной. Основное требование ‑ переменные, по которым сравниваются выборки, должны быть измерены метрической шкалой. В противном случае пользуются непараметрическими методами.

Результат сранения средних значений с применением t-критерия оценивается по уровню значимости.

Уровень значимости является мерой статистической достоверности результата вычислений (в данном случае – различий средних) и служит основанием для интерпретации.

Если исследование показало, что p–уровень значимости различий не превышает 0,05, это означает, что с вероятностью не более 5% различия являются случайными. Обычно этот факт является основанием для вывода о статистической достоверности различий. В противном случае (т. е. p > 0,05) различие признается статистически недостоверным и не подлежит содержательной интерпретации.

SPSS позволяет определять два уровня значимости: односторонний (one-tailed) и двусторонний (two-tailed). Обычно используется двусторонний уровень значимости. Но если заранее известно направление различий и именно это направление и интересует исследователя, то можно использовать односторонний критерий значимости. Это достаточно редкая ситуация. Существенным различием между двумя типами уровней значимости является то, что двусторонний p-уровень оказывается вдвое больше, чем односторонний.

2.2.1. Сравнение двух независимых выборок

Этот тест предназначен для сравнения средних значений двух выборок. Для сравниваемых выборок должны быть определены значения одной и той же переменной. Обязательное условие t-критерия для независимых выборок – независимость выборок.

С помощью этого критерия можно сравнить успеваемость студентов и студенток (т. е. гендерный аспект), отношение различных (независимых!) соц.-демографических групп к какому-либо событию и т. д.

· Загрузите файл:

hyper. sav

· Выберите в меню команду:

Analyze (Анализ)

Compare Means (Сравнение средних)

Independent-Samples T Test... (t-тест для независимых выборок)

Откроется диалоговое окно Independent-Samples T Test.

Test Variable(s)

med

Grouping Variable

Define Groups...

med = 1

med = 2

Group 1

(Группа 1)

Group2

Options...

Continue

ОК

В окне просмотра появятся следующие результаты:

– количество наблюдений, средние значения, стандартные отклонения и стандартные ошибки средних в обеих группах,

– результаты теста Левена на равенство дисперсий.

СТАНДАРТНОЕ ОТКЛОНЕНИЕ – наиболее распространенный показатель вариации количественной переменной, измеряет "средний" разброс значений переменной относительно ее среднего арифметического в тех же единицах измерения, что и сама переменная; равен корню квадратному из дисперсии. Используется при нахождении стандартной ошибки, среднего арифметического, построении доверительных интервалов, статистической проверке гипотез, измерении линейных связей между переменными и т. п. Вычисляется по формуле:

Стандартное отклонение (σ или SD) – показатель степени разброса отдельных индивидуальных наблюдений относительно этого среднего, то есть, мера внутригрупповой изменчивости данного признака.

Все более подробные нюансы стандартного отклонения – в базовом курсе социологии.

Как правило, гипотеза о равенстве (гомогенности) дисперсий не принимается, если тест Левена дает значение р < 0,05 (гетерогенность дисперсий). Для случаев как гомогенности (равенства), так и гетерогенности (неравенства) выводятся следующие характеристики:

– результаты t-теста: значение распределения t, количество степеней свободы df, вероятность ошибки р (под обозначением "Значимость (2-сторонняя)"),

– разница средних значений, ее стандартная ошибка и доверительный интервал.

В данном примере мы не получаем значимого различия воздействия двух группами лекарств по возрасту (р = 0,880).

2.2.2. Сравнение двух зависимых выборок

Этот вариант t-критерия позволяет сравнить средние значения двух измерений одного признака для одной и той же выборки, например – результаты первого и повторного медицинских анализов. Обязательное условие применения t-критерия для зависимых выборок – наличие повторного измерения для одной выборки.

Теперь выясним, значимо ли изменяется содержание холестерина через месяц после начала приема лекарств. Для этого мы сравним переменные chol0 и chol1 при помощи t-теста для зависимых выборок. В этом тесте будут участвовать данные всех пациентов, независимо от группы принимаемых лекарств.

· Выберите в меню команду:

Analyze (Анализ)

Compare Means (Сравнение средних)

Paired-Samples Т Test... (t-тест для парных выборок)

Откроется диалоговое окно Paired-Samples T Test.

chol0

chol1

Paired Variables

ОК

Paired Samples Statistics (Статистики парных выборок)

Paired Samples Correlations (Корреляции парных выборок)

Paired Samples Test (Критерий (тест) парных выборок)

Результаты, выведенные в окне просмотра, содержат:

‑ средние значения, количество наблюдений, стандартные отклонения и стандартные ошибки средних для обеих переменных

‑ ткоэффициент корреляции (момент произведений Пирсона) между переменными и значимость его отклонения от нуля

‑ среднее значение, количество наблюдений, стандартное отклонение и стандартная ошибка разницы

‑ результаты t-теста: тестовая величина, полученная из распределения Стьюдента, количество степеней свободы df, вероятность ошибки p, обозначенная "Sig. (2-tailed)")

Значимого изменения содержания холестерина за один месяц после начала приема лекарств не наблюдается (р = 0,332).

2.2.3. Сравнение более чем двух независимых выборок

Далее мы исследуем, существует ли значимое различие веса (переменная gr) между четырьмя разными возрастными группами (переменная ak).

· Выберите в меню команду:

Analyze (Анализ)

Compare Means (Сравнение средних)

One-Way ANOVA... (Однофакторный дисперсионный анализ)

Подобная возможность есть и в первом пункте подменю (Means...), но она дает значительно более ограниченные возможности для анализа, и поэтому мы ее не рассматриваем.

Появится диалоговое окно One-Way AN OVA.

Dependent List

Factor

Options...

Descriptive

Homogeneity-of-variance

Post Нос...

One-Way ANOVA

Post Hoc Multiple Comparisons

тест Дункана

0,05

ОК

В окне просмотра появятся следующие результаты:

Descriptives (Описательные статистики)

Test of Homogeneity of Variances (Критерий(тест) гомогенности дисперсий)

ANOVA (Однофакторный дисперсионный анализ)

Апостериорные тесты Гомогенные подгруппы

Рост

Дункан

Altersklassen	N	Подмножество для альфа = .05
1	2	1
66-75 Jahre	47	162,47
> 75 Jahre	24	162,67
56-65 Jahre	51	164,82
bis 55 Jahre	52		169,10
Знч.	,202	1,000

Отражены средние значения для групп внутри однородных подгрупп.

a Используется гармоническое среднее для размера выборки = 39,300.

b Размеры групп не одинаковы. Используется гармоническое среднее размеров групп. Уровни ошибки I рода не гарантируются.

Выведенные результаты содержат:

‑ количество наблюдений, средние значения, стандартные отклонения и стандартные ошибки средних, 95% доверительные интервалы, минимумы и максимумы для всех слоев фактора

‑ результаты теста Левена на гомогенность дисперсий

типовую схему дисперсионного анализа, включая вероятность ошибки р (значимость) для оценки общей значимости

‑ результаты многорангового теста Дункана

В этом примере дисперсионный анализ дает максимально значимый результат (р < 0,001). Тест Дункана выделяет две гомогенные подгруппы (со стандартным значением р = 0,05), одна из которых включает возрастной класс до 55 лет, а другая ‑ три остальных класса. Это означает, что возрастной класс до 55 лет значимо отличается от трех других возрастных классов, которые, в свою очередь, не обнаруживают значимого различия между собой.

Уменьшение роста с увеличением возраста может быть связано с тем, что в старших возрастных классах преобладают женщины, рост которых мал по сравнению с мужчинами, что и вызывает данный эффект.

Если мы повторим этот анализ для категорий пола, то обнаружим, что у мужчин факт уменьшения роста с увеличением возраста подтверждается, а для женщин ‑ нет.

Теперь более подробно рассмотрим имеющиеся в диалоговом окне ANOVA кнопки Contrasts (Контрасты), Post Hoc... и Options..., а также возможности, которые они предоставляют.

2.2.4. Сравнение более чем двух зависимых выборок

На основе данных по гипертонии исследуем, значимо ли изменяется содержание холестерина в течение четырёх промежутков времени (такое сравнение для первых двух промежутков времени мы уже провели при сравнении более двух независимых выборок).

Для достижения этой цели подходит однофакторный дисперсионный анализ с повторными измерениями.

· Загрузите файл:

hyper. sav

· Выберите в меню команду:

Analyze (Анализ)

General Linear Model (Общая линейная модель)

Repeated Measures... (Повторные измерения)

Откроется диалоговое окно Repeated Measures Define Factors (Определить фактор(ы) для повторных измерений).

Нам нужно проанализировать четыре переменных: chol0, chol1, chol6 и chol12; следовательно, фактор повторных измерений будет задаваться четырьмя уровнями (слоями).

faktor1

Number of Levels

Add

Define

Repeated Measures

cho

Within-Subject Variables

ОК

Замечание. Для неподготовленного пользователя толкование полученных результатов расчёта может составить большие трудности. Поэтому пока ограничимся указанием, что результаты обычного дисперсионного анализа содержатся в строке "Sphericity assumed" (Предположение о сферичности) таблицы вывода, приведенной ниже:

Tests of Within-Subjects Effects (Проверка внутригрупповых эффектов)

Вероятность ошибки р составляет 0,048, что указывает на значимое различие между отдельными моментами времени.

2.2.5. T-тест одной выборки

T-критерий для одной выборки позволяет сравнить среднее значение этой выборки с некоторой эталонной величинчой. Например, отличается ли среднее значение для данной выборки от нормативной величины ит. д.

Еще раз и другими словами. Этот тест позволяет выяснить, отличается ли среднее значение, полученное на основе данной выборки, от предварительно заданного контрольного значения.

Мы проверим, отличается ли средний показатель холестерина, полученный при исследовании гипертонии, от значения 229, которое могло быть определено в каком-либо другом исследовании.

· Загрузите файл:

hyper. sav

· Выберите в меню команду:

Analyze (Анализ)

Compare Means (Сравнение средних)

One-Sample T Test... (t-тест для одной выборки)

Откроется диалоговое окно One-Sample T Test.

cho

Test Variable(s)

Test Value (Контрольное значение)

229

ОК

Результаты, показанные в окне просмотра, свидетельствуют о том, что в данном исследовании средний исходный уровень холестерина составляет 237,27, что значимо (р = 0,029) отличается от контрольного значения 229.

One-Sample Statistics (Статистики для одновыборочного t-критерия)

One-Sample Test (Одновыборочный t-критерий)

Кнопкой Options... (Параметры) можно задать вместо 95% любой другой доверительный интервал. Значение доверительного интервала может принимать значения в промежутке от 1 до 99%.

Тема 2. Параметрические и непараметрические тесты. Параметрические методы сравнения средних

Партнерка на США и Канаду по недвижимости, выплаты в крипто

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы