Тема 2. Параметрические и непараметрические тесты. Параметрические методы сравнения средних
2.1. Параметрические и непараметрические методы сравнения выборок
Прежде всего ‑ о терминах. Что подразумевается под «средними»? Ответ вполне ожидаем – речь идет о средних значениях.
Команда Means (Средние) предназначена для сравнения подгрупп объектов по средним значениям количественных признаков. При этом возможна ситуация, когда в наборе переменных, участвующих в анализе, имеются не только количественные переменные, для которых вычисляются средние, но и номинальные переменные, разделяющие объекты на подгруппы. Так, например, можно сравнить средние значения успеваемости юношей и девушек, представителей разных учебных групп и т. д. Результаты вычислений представляют собой таблицы, схожие с таблицами сопряженности (или кросстабами). Для каждой исследуемой подгруппы вычисляется не только частота, но среднее значение. А если быть более точным ‑ для выбранных подгрупп команда Means (Средние) подсчитывает средние значения, стандартные отклонения и частоты. Дополнительно – с помощью кнопки Options (Параметры) – можно задать вывод результатов однофакторного дисперсионного анализа. Подробно сущность дисперсионный анализ мы сегодня разбирать не будем. В целом команда Means (Средние) является одной из самых простых в SPSS.
Итак. Сравнение средних значений различных выборок относится к наиболее часто применяемым методам статистического анализа. При этом всегда должен быть выяснен вопрос, можно ли объяснить имеющееся различие средних значений статистическими колебаниями или нет. В последнем случае говорят о значимом различии.
При сравнении средних значений выборок предполагается, что обе выборки подчиняются нормальному распределению. Если это не так (распределение не подчиняется нормальному закону), то вычисляются медианы и для сравнения выборок используется непараметрический тест.
2.2. Параметрические методы сравнения выборок
Сначала мы опробуем наиболее прозрачную возможность для сравнения средних в SPSS.
· Загрузите файл:
hyper. sav
Мы хотим проверить, значительно ли различается действие двух групп медикаментов на людей в зависимости от их возраста.
· Выберите в меню команду:
Analyze (Анализ)
Compare Means (Сравнение средних)
Means (Средние)
Откроется диалоговое окно Means (Средние).
Список Inependent List (Независимые переменные) в нижнем поле окна предназначен для неколичественных (номинальных) переменных, которые, собственно, и определяют сравниваемые подгруппы (выборки). Это может быть ‑ пол, принадлежность к какой-либо группе вообще, например, любителей кактусов). На основе этих переменных строится таблица сопряженности.
- Перенесите переменную med (медицинский препарат) в поле Independent List (Независимые переменные).
Список Dependent List (Зависимые переменные) в верхнем поле окна предназначен для количественных переменных, для которых и будут вычисляться средние значения и др. характеристики. Таких переменных может быть задано/назначено/указано несколько одновременно, причем для каждой их них можно задать независимый, собственный набор вычисляемых характеристик.
- В списке исходных переменных щелкните на переменной а (возраст) и щелчком на кнопке с треугольником перенесите ее в поле ‑ Dependent List (Зависимые переменные) Запустите команду, щелкнув на ОК
В окне просмотра появятся следующие результаты:
‑ средние значения (средний возраст) пациентов, принимавших разные препараты. По умолчанию будут также вычислены стандартные отклонения.
Чтобы задать несколько переменных в списке Independent List (Независимые переменные), используйте кнопки Previous (Предыдущая) и Next (Следующая) под указателем текущего слоя. Что такое слои в данном случае? Это, по сути, многомерность таблицы. Слой ‑ независимое измерение, соответствующее переменной, Каждой независимой переменной соответствует свой слой.
- Щелкните кнопку Next (Следующая). Перенесите переменную ak (возрастные группы) в поле Independent List (Независимые переменные).
Количественных переменных тоже может быть задано несколько. Их количество ‑ количество столбцов в таблице результатов.
- В списке исходных переменных щелкните на переменной gr (вес) и щелчком на кнопке с треугольником перенесите ее в поле – Dependent List (Зависимые переменные) Запустите команду, щелкнув на ОК
В окне просмотра появятся результаты.
Команда Means (Средние) позволяет выполнить однофакторный дисперсионный анализ. Для этого в группе Statistics for First Layer (статистики для первого слоя) в нижней части окна Options (Параметры) нужно установить флажок ANOVA table and eta (Таблица ANOVA и коэффициент Эта). Дисперсионный анализ проведен только для средних значений первого слоя. Чтобы выполнить аналогичную процедуру для средних других слоев, необходимо указать соответствующую независимую переменную в первом слое.
Параметр Sig./Знч. (Значимость) – вероятность того, что наблюдаемые различия случайны. Величина p < 0.001 свидетельствует о высокой статистической значимости различий.
Итак, мы протестировали одну из «универсальных» техник сравнения средних, без предварительного анализа исследуемой ситуации. Однако, при сравнении средних значений выборок, вообще говоря, выделяют четыре различные тестовые ситуации:
1. Сравнение двух независимых выборок
2. Сравнение двух зависимых (спаренных) выборок
3. Сравнение более двух независимых выборок
4. Сравнение более двух зависимых выборок
В каждой из перечисленных ситуаций применяются соответствующий статистический тесты:
1. t-тест для независимых выборок (тест Стьюдента)
2. t-тест для зависимых выборок
3. Однофакторный дисперсионный анализ
4. Однофакторный дисперсионный анализ с повторными измерениями
Рассмотрим по порядку и на примерах техники названных тестов.
Различные варианты обработки данных с применением t-критерия позволяют сделать вывод о различии двух средних.
В случае независимых выборок с помощью t-критерия проверяется достоверность различия двух выборок по переменной, общей для этих двух выборок. Логика вполне очевидная: 1) для выбранных подгрупп вычисляются средние значения и 2) затем по t-критерию определяется статистическая значимость их различия. Применение t-критерия ‑ один из самых распространенных методов статистического вывода, так как он позволяет достаточно легко ответить на простой вопрос о различии двух выборок по уровню выраженности/интенсивности измеренного признака/переменной. Основное требование ‑ переменные, по которым сравниваются выборки, должны быть измерены метрической шкалой. В противном случае пользуются непараметрическими методами.
Результат сранения средних значений с применением t-критерия оценивается по уровню значимости.
Уровень значимости является мерой статистической достоверности результата вычислений (в данном случае – различий средних) и служит основанием для интерпретации.
Если исследование показало, что p–уровень значимости различий не превышает 0,05, это означает, что с вероятностью не более 5% различия являются случайными. Обычно этот факт является основанием для вывода о статистической достоверности различий. В противном случае (т. е. p > 0,05) различие признается статистически недостоверным и не подлежит содержательной интерпретации.
SPSS позволяет определять два уровня значимости: односторонний (one-tailed) и двусторонний (two-tailed). Обычно используется двусторонний уровень значимости. Но если заранее известно направление различий и именно это направление и интересует исследователя, то можно использовать односторонний критерий значимости. Это достаточно редкая ситуация. Существенным различием между двумя типами уровней значимости является то, что двусторонний p-уровень оказывается вдвое больше, чем односторонний.
2.2.1. Сравнение двух независимых выборок
Этот тест предназначен для сравнения средних значений двух выборок. Для сравниваемых выборок должны быть определены значения одной и той же переменной. Обязательное условие t-критерия для независимых выборок – независимость выборок.
С помощью этого критерия можно сравнить успеваемость студентов и студенток (т. е. гендерный аспект), отношение различных (независимых!) соц.-демографических групп к какому-либо событию и т. д.
· Загрузите файл:
hyper. sav
Мы хотим проверить, значительно ли различается действие двух групп медикаментов на людей в зависимости от их возраста.
· Выберите в меню команду:
Analyze (Анализ)
Compare Means (Сравнение средних)
Independent-Samples T Test... (t-тест для независимых выборок)
Откроется диалоговое окно Independent-Samples T Test.
- В списке исходных переменных щелкните на переменной а (возраст) и щелчком на кнопке с треугольником перенесите ее в список тестируемых переменных – Test Variable(s) Таким же способом перенесите переменную med в поле Grouping Variable (Группирующая переменная) Щелчком на кнопке Define Groups... (Определить группы) открывается окно, в котором можно ввести значения двух категорий для группирующей переменной. Мы будем сравнивать две группы, удовлетворяющие условиям соответственно med = 1 и med = 2. Поэтому внесите в поле Group 1 (Группа 1) значение 1, а в поле Group2 — значение 2 Щелчком на кнопке Continue вернитесь в основное диалоговое окно. Теперь следует выяснить, какие параметры установлены по умолчанию. Щелкните для этого на кнопке Options... (Параметры). Не изменяя настроек, щелкните на кнопке Continue и вернитесь в основное диалоговое окно Запустите t-тест, щелкнув на ОК
В окне просмотра появятся следующие результаты:
– количество наблюдений, средние значения, стандартные отклонения и стандартные ошибки средних в обеих группах,
– результаты теста Левена на равенство дисперсий.
СТАНДАРТНОЕ ОТКЛОНЕНИЕ – наиболее распространенный показатель вариации количественной переменной, измеряет "средний" разброс значений переменной относительно ее среднего арифметического в тех же единицах измерения, что и сама переменная; равен корню квадратному из дисперсии. Используется при нахождении стандартной ошибки, среднего арифметического, построении доверительных интервалов, статистической проверке гипотез, измерении линейных связей между переменными и т. п. Вычисляется по формуле:
,
Стандартное отклонение (σ или SD) – показатель степени разброса отдельных индивидуальных наблюдений относительно этого среднего, то есть, мера внутригрупповой изменчивости данного признака.
Все более подробные нюансы стандартного отклонения – в базовом курсе социологии.
Как правило, гипотеза о равенстве (гомогенности) дисперсий не принимается, если тест Левена дает значение р < 0,05 (гетерогенность дисперсий). Для случаев как гомогенности (равенства), так и гетерогенности (неравенства) выводятся следующие характеристики:
– результаты t-теста: значение распределения t, количество степеней свободы df, вероятность ошибки р (под обозначением "Значимость (2-сторонняя)"),
– разница средних значений, ее стандартная ошибка и доверительный интервал.
В данном примере мы не получаем значимого различия воздействия двух группами лекарств по возрасту (р = 0,880).
2.2.2. Сравнение двух зависимых выборок
Этот вариант t-критерия позволяет сравнить средние значения двух измерений одного признака для одной и той же выборки, например – результаты первого и повторного медицинских анализов. Обязательное условие применения t-критерия для зависимых выборок – наличие повторного измерения для одной выборки.
Теперь выясним, значимо ли изменяется содержание холестерина через месяц после начала приема лекарств. Для этого мы сравним переменные chol0 и chol1 при помощи t-теста для зависимых выборок. В этом тесте будут участвовать данные всех пациентов, независимо от группы принимаемых лекарств.
· Выберите в меню команду:
Analyze (Анализ)
Compare Means (Сравнение средних)
Paired-Samples Т Test... (t-тест для парных выборок)
Откроется диалоговое окно Paired-Samples T Test.
- Перенесите переменные chol0 и chol1 из списка исходных переменных в поле парных переменных Paired Variables Щелкните на ОК, чтобы начать вычисления. В окне просмотра появятся следующие результаты:
Paired Samples Statistics (Статистики парных выборок)
Paired Samples Correlations (Корреляции парных выборок)
Paired Samples Test (Критерий (тест) парных выборок)
Результаты, выведенные в окне просмотра, содержат:
‑ средние значения, количество наблюдений, стандартные отклонения и стандартные ошибки средних для обеих переменных
‑ ткоэффициент корреляции (момент произведений Пирсона) между переменными и значимость его отклонения от нуля
‑ среднее значение, количество наблюдений, стандартное отклонение и стандартная ошибка разницы
‑ результаты t-теста: тестовая величина, полученная из распределения Стьюдента, количество степеней свободы df, вероятность ошибки p, обозначенная "Sig. (2-tailed)")
Значимого изменения содержания холестерина за один месяц после начала приема лекарств не наблюдается (р = 0,332).
2.2.3. Сравнение более чем двух независимых выборок
Далее мы исследуем, существует ли значимое различие веса (переменная gr) между четырьмя разными возрастными группами (переменная ak).
· Выберите в меню команду:
Analyze (Анализ)
Compare Means (Сравнение средних)
One-Way ANOVA... (Однофакторный дисперсионный анализ)
Подобная возможность есть и в первом пункте подменю (Means...), но она дает значительно более ограниченные возможности для анализа, и поэтому мы ее не рассматриваем.
Появится диалоговое окно One-Way AN OVA.
- Перенесите переменную gr в список зависимых переменных Dependent List, a переменную ak ‑ в поле Factor (Фактор) Посмотрите, какие параметры можно задать для этого теста (кнопка Options...). Задайте вывод описательной статистики (флажок Descriptive) и проверку на гомогенность дисперсий (флажок Homogeneity-of-variance) Чтобы выполнить апостериорный тест, вернувшись в основное диалоговое окно, щелкните на кнопке Post Нос... Откроется диалоговое окно One-Way ANOVA: Post Hoc Multiple Comparisons (Однофакторный дисперсионный анализ: апостериорные множественные сравнения) Выберите тест Дункана (флажок Duncan). При значимом результате дисперсионного анализа этот тест показывает, какие именно возрастные группы значимо отличаются друг от друга. По умолчанию установлен уровень значимости 0,05; можно выбрать и другое значение Запустите тест, щелкнув на ОК
В окне просмотра появятся следующие результаты:
Descriptives (Описательные статистики)
Test of Homogeneity of Variances (Критерий(тест) гомогенности дисперсий)
ANOVA (Однофакторный дисперсионный анализ)
Апостериорные тесты Гомогенные подгруппы
Рост
Дункан
Altersklassen | N | Подмножество для альфа = .05 | |
| 1 | 2 | 1 | |
66-75 Jahre | 47 | 162,47 | |
> 75 Jahre | 24 | 162,67 | |
56-65 Jahre | 51 | 164,82 | |
bis 55 Jahre | 52 | 169,10 | |
Знч. | ,202 | 1,000 |
Отражены средние значения для групп внутри однородных подгрупп.
a Используется гармоническое среднее для размера выборки = 39,300.
b Размеры групп не одинаковы. Используется гармоническое среднее размеров групп. Уровни ошибки I рода не гарантируются.
Выведенные результаты содержат:
‑ количество наблюдений, средние значения, стандартные отклонения и стандартные ошибки средних, 95% доверительные интервалы, минимумы и максимумы для всех слоев фактора
‑ результаты теста Левена на гомогенность дисперсий
типовую схему дисперсионного анализа, включая вероятность ошибки р (значимость) для оценки общей значимости
‑ результаты многорангового теста Дункана
В этом примере дисперсионный анализ дает максимально значимый результат (р < 0,001). Тест Дункана выделяет две гомогенные подгруппы (со стандартным значением р = 0,05), одна из которых включает возрастной класс до 55 лет, а другая ‑ три остальных класса. Это означает, что возрастной класс до 55 лет значимо отличается от трех других возрастных классов, которые, в свою очередь, не обнаруживают значимого различия между собой.
Уменьшение роста с увеличением возраста может быть связано с тем, что в старших возрастных классах преобладают женщины, рост которых мал по сравнению с мужчинами, что и вызывает данный эффект.
Если мы повторим этот анализ для категорий пола, то обнаружим, что у мужчин факт уменьшения роста с увеличением возраста подтверждается, а для женщин ‑ нет.
Теперь более подробно рассмотрим имеющиеся в диалоговом окне ANOVA кнопки Contrasts (Контрасты), Post Hoc... и Options..., а также возможности, которые они предоставляют.
2.2.4. Сравнение более чем двух зависимых выборок
На основе данных по гипертонии исследуем, значимо ли изменяется содержание холестерина в течение четырёх промежутков времени (такое сравнение для первых двух промежутков времени мы уже провели при сравнении более двух независимых выборок).
Для достижения этой цели подходит однофакторный дисперсионный анализ с повторными измерениями.
· Загрузите файл:
hyper. sav
· Выберите в меню команду:
Analyze (Анализ)
General Linear Model (Общая линейная модель)
Repeated Measures... (Повторные измерения)
Откроется диалоговое окно Repeated Measures Define Factors (Определить фактор(ы) для повторных измерений).
Нам нужно проанализировать четыре переменных: chol0, chol1, chol6 и chol12; следовательно, фактор повторных измерений будет задаваться четырьмя уровнями (слоями).
- Задайте имя фактора. По умолчанию принимается имя фактора faktor1; при желании можно задать для него любое другое имя (например, "время") Введите число 4 в поле Number of Levels (Количество уровней) Щелкните на кнопке Add. Других факторов повторных измерений у нас нет, поэтому можно сразу закрыть этот диалог кнопкой Define (Определить). Появится диалоговое окно Repeated Measures (Повторные измерения) Перенесите переменные chol0, chol1, chol6 и chol12 в список Within-Subject Variables (Переменные внутри субъекта); далее кнопками, которые находятся внизу диалогового окна, можно установить дополнительные параметры, но пока оставим их без внимания Запустите вычисления, щелкнув на ОК Проанализируйте результаты, появившиеся в окне просмотра.
Замечание. Для неподготовленного пользователя толкование полученных результатов расчёта может составить большие трудности. Поэтому пока ограничимся указанием, что результаты обычного дисперсионного анализа содержатся в строке "Sphericity assumed" (Предположение о сферичности) таблицы вывода, приведенной ниже:
Tests of Within-Subjects Effects (Проверка внутригрупповых эффектов)
Вероятность ошибки р составляет 0,048, что указывает на значимое различие между отдельными моментами времени.
2.2.5. T-тест одной выборки
T-критерий для одной выборки позволяет сравнить среднее значение этой выборки с некоторой эталонной величинчой. Например, отличается ли среднее значение для данной выборки от нормативной величины ит. д.
Еще раз и другими словами. Этот тест позволяет выяснить, отличается ли среднее значение, полученное на основе данной выборки, от предварительно заданного контрольного значения.
Мы проверим, отличается ли средний показатель холестерина, полученный при исследовании гипертонии, от значения 229, которое могло быть определено в каком-либо другом исследовании.
· Загрузите файл:
hyper. sav
· Выберите в меню команду:
Analyze (Анализ)
Compare Means (Сравнение средних)
One-Sample T Test... (t-тест для одной выборки)
Откроется диалоговое окно One-Sample T Test.
- Перенесите переменную chol0 в поле Test Variable(s) и введите в поле Test Value (Контрольное значение) значение 229. Запустите вычисления, щелкнув на ОК.
Результаты, показанные в окне просмотра, свидетельствуют о том, что в данном исследовании средний исходный уровень холестерина составляет 237,27, что значимо (р = 0,029) отличается от контрольного значения 229.
One-Sample Statistics (Статистики для одновыборочного t-критерия)
One-Sample Test (Одновыборочный t-критерий)
Кнопкой Options... (Параметры) можно задать вместо 95% любой другой доверительный интервал. Значение доверительного интервала может принимать значения в промежутке от 1 до 99%.


