Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Выявить статистическую значимость зависимостей между переменными позволя­ют критерий и сопутствующие тесты. Исследуем нашу зависимость между час­тотой посещения развлекательного центра, полом и возрастом респондентов на предмет статистической значимости. Для этого вновь откройте диалоговое окно Crosstabs. В этом окне остались две не рассмотренные нами кнопки: Exact и Statistics — именно они позволяют исследовать значимость перекрестных распределений. По умолчанию SPSS определяет статистическую значимость только на основании асимптотического метода. Одной из разновидностей данного метода и является . Данный критерий используется наиболее часто в маркетинговых исследовани­ях. Однако применение асимптотического критерия накладывает на данные, содержащиеся в анализируемой перекрестной таблице, существенные ограниче­ния, которые подробно описаны ниже.

Так, важнейшим требованием к исследуемым данным является достаточно боль­шие значения в ячейках таблицы. При наличии небольших по размеру выборок или при построении разрезов третьего и более уровня данное условие является недостижимым. Исходя из опыта анализа данных в маркетинговых исследовани­ях, можно утверждать, что подобные ситуации встречаются достаточно часто. В свя­зи с этим в случае несоответствия имеющихся данных общепринятому критерию следует воспользоваться другими статистическими методами.

Сначала на примере перекрестного распределения по трем переменным рассмотрим использование наиболее популярного статистического метода установления стати­стической значимости зависимостей — критерия . Для того чтобы организовать наряду с перекрестной таблицей вывод соответствующих статистик, в главном диа­логовом окне Crosstabs щелкните на кнопке Statistics (рис. 4.5). В открывшемся диа-

логовом окне выберите параметр Chi-square ). Это позволит впоследствии опреде­лить, имеется ли определенная связь между исследуемыми переменными.

При анализе зависимостей, кроме обнаружения наличия связи, также можно оп­ределить, насколько сильно выражена данная зависимость (установить силу связи). Сделать это позволяют релевантные статистические тесты, применяемые отдель­но для каждого из трех типов переменных, участвующих в анализе. Для номиналь­ных переменных следует применять один из тестов, представленных в области Nominal. Наиболее универсальным и часто применяемым методом является V Cra­mer's. Для порядковых переменных следует применять один из методов, представ­ленных в области Ordinal. Мы рекомендуем использовать наиболее универсальный метод: Gamma. Теоретически этот же метод можно применять и для интервальных переменных, однако все же для них рекомендуется использовать более релевант­ную процедуру корреляционного анализа.

НЕ нашли? Не то? Что вы ищете?

Далее рассмотрим, как применять перечисленные статистические методы на приме­ре нашей задачи с двумя порядковыми переменными Частота посещения развлека­тельного центра и Возраст. Для этого выберите параметр Gamma и закройте описываемое окно, щелкнув на кнопке Continue. Запустите процедуру построения перекрестных распределений, щелкнув на кнопке ОК в главном диалоговом окне Crosstabs.

Рис. 4.5. Диалоговое окно Statistics

 

 

В окне SPSS Viewer появится уже рассмотренная выше таблица перекрестного распределения трех переменных: Частота посещения, Возраст и Пол. Но, в отличие от предыдущего случая, ниже будут отображены две таблицы, из которых можно уз­нать о наличии, силе и направлении (только для порядковых и интервальных пере­менных) связи между анализируемыми переменными. Рассмотрим их по порядку.

В первой таблице, Chi-Square Tests, выводятся результаты расчета критерия (строка Pearson Chi-Square) и некоторых других статистик (рис. 4.6). Необходимо отметить, что расчет всех статистических процедур производится для каждого варианта пе­ременной, расположенной в слоях (в нашем случае Пол) по отдельности (то есть отдельно для целевых групп мужчин и женщин). Данное обстоятельство уже было отмечено выше.

В нашем примере для респондентов-мужчин величина критерия — 56,048, одна­ко для практических целей важна не столько сама величина, столько ее значимость, представленная в столбце Asymp. Sig. (2-sided). Именно из условия статистической значимости критерия следует статистическая значимость всей зависимости. В нашем примере значимость анализируемого критерия и для муж­чин, и для женщин достаточно высока (0,001 и 0,014 соответственно), что позволяет сделать предварительный вывод о том, что между частотой посещения развлека­тельного центра и возрастом для каждой половой группы респондентов существу­ет определенная статистически значимая зависимость. Тем не менее одной значи­мости критерия недостаточно, чтобы с уверенностью утверждать о наличии значимой зависимости между тремя анализируемыми переменными. Для этого необходимо, чтобы выполнялись следующие два критерия.

Процент ячеек, в которых ожидаемые значения1 (Expected counts) меньше или равны 5, должен быть менее или равным 20 %. Это значение отображается в при­мечании «а» в первой строке после таблицы Chi-Square Tests. На практике приемле­мая доля ожидаемых частот меньше 5 может отклоняться от 20 % (в пределах +5 %). При наличии ярко выраженной зависимости можно считать такую зависимость статистически значимой. Также всегда необходимо иметь в виду практические со­ображения (и это относится ко всем без исключения статистическим процедурам). Если ожидаемые частоты меньше 5 у переменных, представляющих малую прак­тическую значимость для исследователя, — значит, можно не принимать в расчет рассматриваемый критерий и признать зависимость значимой по практическим соображениям. Как видно на рис. 4.58, в нашем случае 55 % ячеек имеют ожидае­мые значения меньше 5 (при этом минимальное ожидаемое значение 0,32). Следо­вательно, несмотря на то что критерий является статистически значимым, он не удовлетворяет рассматриваемому дополнительному условию.

Суммы по строкам и столбцам должны быть больше 0. В нашем случае данное условие удовлетворяется.

Еще одной не рассмотренной статистикой в таблице Chi-Square Tests является тест Mantel-Hanzel (строка Linear-by-Lf near Association). Его значимость позволяет сде­лать вывод о наличии линейной зависимости между неноминальными перемен­ными. Если величина данного теста статистически значима, следовательно, между строковой и столбцовой переменными есть линейная зависимость. В нашем слу­чае (рис. 4.6) линейная зависимость между возрастом и частотой посещения раз­влекательного центра существует только в целевой группе респондентов-женщин. Про мужчин подобное сказать нельзя.


После того как мы установили наличие зависимости между тремя анализируе­мыми переменными (при этом между возрастом и частотой посещения для рес­пондентов-женщин существует и линейная зависимость), можно приступить к анализу таблицы Symmetric Measures (рис. 4.7), чтобы определить силу выяв­ленной связи.

Рис. 4.6. Таблица Chi-Square Tests

 
 

Рис. 4.7. Таблица Symmetric Measures для порядковых переменных

 

Для порядковых переменных (как в нашем случае) определить силу связи позво­ляет критерий Gamma. Этот показатель может варьироваться в интервале от -1 (мак­симально разнонаправленная зависимость) до 1 (полная зависимость); значение О показывает полное отсутствие зависимости. Значение критерия Gamma представ­лено в столбце Value таблицы Symmetric Measures. В нашем случае в группе респон­дентов-мужчин имеется лишь весьма слабая положительная зависимость (Gamma = 0,080). Столбец Approx. Sig. свидетельствует о том, что данная зависимость еще и статистически незначима. Обратная ситуация в группе респондентов-женщин: для них установлена слабая, но статистически значимая положительная зависимость между возрастом и частотой посещения развлекательного центра.

Если в перекрестном анализе участвуют номинальные переменные, силу (но не направление) связи позволяет определить критерий Cramer's V. Отображение этого критерия можно установить в диалоговом окне Statistics при помощи параметра Phi and Cramer's V (см. рис. 4.5).

Давайте рассчитаем данный критерий для наших переменных. Результаты расче­тов представлены на рис. 4.8. В целом, критерий Cramer's V может варьироваться в пределах от 0 до 1, где 0 показывает отсутствие связи между исследуемыми переменными, а 1 — полную зависимость. В нашем случае и для мужчин, и для женщин есть статистически значимые (как показывает столбец Approx. Sig.) слабые зависи­мости (для мужчин Cramer's V = 0,205; для женщин = 0,176). Необходимо отме­тить, что значение 1 для теста Cramer's V является практически недостижимым, поэтому значения 0,8-0,9 следует считать весьма высокими.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41