Партнерка на США и Канаду по недвижимости, выплаты в крипто
- 30% recurring commission
- Выплаты в USDT
- Вывод каждую неделю
- Комиссия до 5 лет за каждого referral
Выявить статистическую значимость зависимостей между переменными позволяют критерий
и сопутствующие тесты. Исследуем нашу зависимость между частотой посещения развлекательного центра, полом и возрастом респондентов на предмет статистической значимости. Для этого вновь откройте диалоговое окно Crosstabs. В этом окне остались две не рассмотренные нами кнопки: Exact и Statistics — именно они позволяют исследовать значимость перекрестных распределений. По умолчанию SPSS определяет статистическую значимость только на основании асимптотического метода. Одной из разновидностей данного метода и является
. Данный критерий используется наиболее часто в маркетинговых исследованиях. Однако применение асимптотического критерия
накладывает на данные, содержащиеся в анализируемой перекрестной таблице, существенные ограничения, которые подробно описаны ниже.
Так, важнейшим требованием к исследуемым данным является достаточно большие значения в ячейках таблицы. При наличии небольших по размеру выборок или при построении разрезов третьего и более уровня данное условие является недостижимым. Исходя из опыта анализа данных в маркетинговых исследованиях, можно утверждать, что подобные ситуации встречаются достаточно часто. В связи с этим в случае несоответствия имеющихся данных общепринятому критерию
следует воспользоваться другими статистическими методами.
Сначала на примере перекрестного распределения по трем переменным рассмотрим использование наиболее популярного статистического метода установления статистической значимости зависимостей — критерия
. Для того чтобы организовать наряду с перекрестной таблицей вывод соответствующих статистик, в главном диалоговом окне Crosstabs щелкните на кнопке Statistics (рис. 4.5). В открывшемся диа-
логовом окне выберите параметр Chi-square
). Это позволит впоследствии определить, имеется ли определенная связь между исследуемыми переменными.
При анализе зависимостей, кроме обнаружения наличия связи, также можно определить, насколько сильно выражена данная зависимость (установить силу связи). Сделать это позволяют релевантные статистические тесты, применяемые отдельно для каждого из трех типов переменных, участвующих в анализе. Для номинальных переменных следует применять один из тестов, представленных в области Nominal. Наиболее универсальным и часто применяемым методом является V Cramer's. Для порядковых переменных следует применять один из методов, представленных в области Ordinal. Мы рекомендуем использовать наиболее универсальный метод: Gamma. Теоретически этот же метод можно применять и для интервальных переменных, однако все же для них рекомендуется использовать более релевантную процедуру корреляционного анализа.
Далее рассмотрим, как применять перечисленные статистические методы на примере нашей задачи с двумя порядковыми переменными Частота посещения развлекательного центра и Возраст. Для этого выберите параметр Gamma и закройте описываемое окно, щелкнув на кнопке Continue. Запустите процедуру построения перекрестных распределений, щелкнув на кнопке ОК в главном диалоговом окне Crosstabs.
|
![]() |
В окне SPSS Viewer появится уже рассмотренная выше таблица перекрестного распределения трех переменных: Частота посещения, Возраст и Пол. Но, в отличие от предыдущего случая, ниже будут отображены две таблицы, из которых можно узнать о наличии, силе и направлении (только для порядковых и интервальных переменных) связи между анализируемыми переменными. Рассмотрим их по порядку.
В первой таблице, Chi-Square Tests, выводятся результаты расчета критерия
(строка Pearson Chi-Square) и некоторых других статистик (рис. 4.6). Необходимо отметить, что расчет всех статистических процедур производится для каждого варианта переменной, расположенной в слоях (в нашем случае Пол) по отдельности (то есть отдельно для целевых групп мужчин и женщин). Данное обстоятельство уже было отмечено выше.
В нашем примере для респондентов-мужчин величина критерия
— 56,048, однако для практических целей важна не столько сама величина, столько ее значимость, представленная в столбце Asymp. Sig. (2-sided). Именно из условия статистической значимости критерия
следует статистическая значимость всей зависимости. В нашем примере значимость анализируемого критерия и для мужчин, и для женщин достаточно высока (0,001 и 0,014 соответственно), что позволяет сделать предварительный вывод о том, что между частотой посещения развлекательного центра и возрастом для каждой половой группы респондентов существует определенная статистически значимая зависимость. Тем не менее одной значимости критерия
недостаточно, чтобы с уверенностью утверждать о наличии значимой зависимости между тремя анализируемыми переменными. Для этого необходимо, чтобы выполнялись следующие два критерия.
Процент ячеек, в которых ожидаемые значения1 (Expected counts) меньше или равны 5, должен быть менее или равным 20 %. Это значение отображается в примечании «а» в первой строке после таблицы Chi-Square Tests. На практике приемлемая доля ожидаемых частот меньше 5 может отклоняться от 20 % (в пределах +5 %). При наличии ярко выраженной зависимости можно считать такую зависимость статистически значимой. Также всегда необходимо иметь в виду практические соображения (и это относится ко всем без исключения статистическим процедурам). Если ожидаемые частоты меньше 5 у переменных, представляющих малую практическую значимость для исследователя, — значит, можно не принимать в расчет рассматриваемый критерий и признать зависимость значимой по практическим соображениям. Как видно на рис. 4.58, в нашем случае 55 % ячеек имеют ожидаемые значения меньше 5 (при этом минимальное ожидаемое значение 0,32). Следовательно, несмотря на то что критерий
является статистически значимым, он не удовлетворяет рассматриваемому дополнительному условию.
Суммы по строкам и столбцам должны быть больше 0. В нашем случае данное условие удовлетворяется.
Еще одной не рассмотренной статистикой в таблице Chi-Square Tests является тест Mantel-Hanzel (строка Linear-by-Lf near Association). Его значимость позволяет сделать вывод о наличии линейной зависимости между неноминальными переменными. Если величина данного теста статистически значима, следовательно, между строковой и столбцовой переменными есть линейная зависимость. В нашем случае (рис. 4.6) линейная зависимость между возрастом и частотой посещения развлекательного центра существует только в целевой группе респондентов-женщин. Про мужчин подобное сказать нельзя.
![]() |
После того как мы установили наличие зависимости между тремя анализируемыми переменными (при этом между возрастом и частотой посещения для респондентов-женщин существует и линейная зависимость), можно приступить к анализу таблицы Symmetric Measures (рис. 4.7), чтобы определить силу выявленной связи.
|
|
![]() |
Для порядковых переменных (как в нашем случае) определить силу связи позволяет критерий Gamma. Этот показатель может варьироваться в интервале от -1 (максимально разнонаправленная зависимость) до 1 (полная зависимость); значение О показывает полное отсутствие зависимости. Значение критерия Gamma представлено в столбце Value таблицы Symmetric Measures. В нашем случае в группе респондентов-мужчин имеется лишь весьма слабая положительная зависимость (Gamma = 0,080). Столбец Approx. Sig. свидетельствует о том, что данная зависимость еще и статистически незначима. Обратная ситуация в группе респондентов-женщин: для них установлена слабая, но статистически значимая положительная зависимость между возрастом и частотой посещения развлекательного центра.
Если в перекрестном анализе участвуют номинальные переменные, силу (но не направление) связи позволяет определить критерий Cramer's V. Отображение этого критерия можно установить в диалоговом окне Statistics при помощи параметра Phi and Cramer's V (см. рис. 4.5).
Давайте рассчитаем данный критерий для наших переменных. Результаты расчетов представлены на рис. 4.8. В целом, критерий Cramer's V может варьироваться в пределах от 0 до 1, где 0 показывает отсутствие связи между исследуемыми переменными, а 1 — полную зависимость. В нашем случае и для мужчин, и для женщин есть статистически значимые (как показывает столбец Approx. Sig.) слабые зависимости (для мужчин Cramer's V = 0,205; для женщин = 0,176). Необходимо отметить, что значение 1 для теста Cramer's V является практически недостижимым, поэтому значения 0,8-0,9 следует считать весьма высокими.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 |





