Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Когда требуется выяснить, насколько изменится один признак при изменении другого, например длина прыжка в длину в зависимости от увеличения взрывной силы мышц ног, используется регрессионный анализ.

В некоторых случаях тесноту взаимосвязи определяют на основании коэффициента детерминации (D), который вычисляют по формуле:

D = r2 100 %.

Этот коэффициент определяет часть общей вариации одного показателя, которая объясняется вариацией другого показателя. Так, для вычисленного значения r = –0,75 коэффициент детерминации определится как:

D = (–0,75)2 100 % = 56,2 %.

Следовательно, только 56,2 % взаимосвязи спортивного результата в беге на 30 м и в тройном прыжке объясняется их взаимовлиянием. Остальная часть — 43,8 % (100 % – 56,2 % = 43,8 %) вариации объясняется влиянием других неучтенных факторов.

Определение коэффициента корреляции при оценке качественных признаков. Если показатели измерены в шкале наименований (т. е. им можно присвоить определенные числа, но нельзя говорить, что один из них больше другого), то рассчитывать описанные ранее коэффициенты корреляции нельзя. В том случае, когда анализируется связь только между двумя качественными признаками (например, выполнение и невыполнение заданий, пол мужской и женский и др.) и когда каждый из них может иметь лишь два состояния (0 и 1, + и –, да и нет и др.), для исследования взаимосвязи пользуются тетрахорическим коэффициентом сопряженности (корреляции). Обозначается он как Т4 и вычисляется по формуле:

Т4 = ,

где А — значение, которое соответствует числу испытуемых (попыток), совпадающих по обоим показателям X и Y, т. е. 1–1;

НЕ нашли? Не то? Что вы ищете?

В — значение, которое соответствует числу совпадений 0–X и 1–Y;

С — значение, соответствующее числу совпадений 1–X и 0–Y;

D — значение совпадений 0–X и 0–Y; n — объем выборки.

Рассмотрим пример. Группа испытуемых (10 человек) выполняла два разных по трудности двигательных задания. Выполнение фиксировалось как «1», невыполнение «0». Определим степень эквивалентности двух заданий. Для этого необходимо рассчитать тетрахорический коэффициент сопряженности. Данные представлены в таблице 4.

Таблица 4

Исходные данные для расчета
тетрахорического коэффициента сопряженности

№ п/п

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

X

1

1

0

1

1

0

1

0

0

1

1

0

1

1

0

Y

0

1

1

1

0

0

1

1

0

1

0

1

1

0

1

Чтобы вычислить коэффициент Т4, данные сгруппируем в четырехпольную корреляционную таблицу (табл. 5) и подсчитаем число совпадений соответственно для A, B, C, и D клеток.

Таблица 5

Расчет тетрахорического коэффициента сопряженности

Y

X

Алгоритм расчета

1

0

1

A = 5

B = 4

A+B 5+4=9

0

C = 4

D = 2

C+D 4+2=6

A+C 5+4=9

B+D 4+2=6

A+B+C+D 5+4+4+2=15

Подставим эти значения в формулу и рассчитаем тетрахорический коэффициент сопряженности:

Т4 = = =

= –= –= – 0,028.

Коэффициент Т4 изменяется в пределах от –1 до +1. Следовательно, значение Т4 = 0,028 характеризует несущественную отрицательную взаимосвязь, т. е. два задания практически не эквивалентны.

3.4. Статистические гипотезы и достоверность
статистических характеристик

Часто при анализе какого-либо явления приходится по некоторым измерениям показателя делать обобщающий вывод. Например, после тренировочного занятия десяти бегунов у трех наблюдается неполное восстановление. Можно ли на этом основании судить о трудности тренировочного процесса или это случайность? Наверное, если такой неприятный факт случится со всеми десяти спортсменами, сомнений в неправильном построении занятия не будет. Следовательно, в данном случае можно говорить о представительности (репрезентативности) выборки, на основании которой можно сделать вывод. Этот же вопрос можно сформулировать иначе: сколько испытуемых необходимо обследовать, чтобы получить достоверные результаты измерений? Это очень важно для исследователя, так как является необходимостью научно решаемых задач. Эти вопросы и такие, как сравнение средних результатов различных групп, при проведении параллельного эксперимента с участием контрольной и экспериментальной групп, оценка результатов, полученных в начале и в конце эксперимента в одной и той же группе, решаются с использованием некоторых приемов проверки статистических гипотез. С этой целью рассчитывается достоверность различий.

Статистической гипотезой называется проверяемое математическими методами предположение относительно статистических характеристик результатов измерений.

При сравнении статистических характеристик почти никогда не встречается случая их абсолютного равенства. В силу каких-то случайных или закономерных причин значения их отличаются друг от друга. Задача при проверке гипотез состоит в том, чтобы отличить случайные влияния от закономерных. Например, пусть среднее значение длины тела студентов России равно 178 см, а в БФСГУ — 180 см. Можно ли говорить на основе этих данных, что наши студенты в среднем выше испытуемых генеральной совокупности, или это различие чисто случайное?

НЕ нашли? Не то? Что вы ищете?

Ясно, что если отклонение маленькое, то оно может быть случайным с очень большой степенью вероятности; если отклонение большое, вероятность его случайного появления мала. Можно выбрать такое критическое отклонение, вероятность появления которого по случайным причинам настолько мала, что оно практически невозможно, и поэтому если оно в действительности имело место, то это свидетельствует, что предположение о том, что средняя длина тела студентов БФСГУ равна средней по России, не удовлетворяет фактам. Например, если бы различия в длине тела составляли, скажем, 15—20 см, то, очевидно, наши испытуемые действительно выше испытуемых генеральной совокупности. Вероятность появления таких различий в силу случайных причин настолько мала, что ее можно было бы не принимать во внимание.

При проверке статистической гипотезы решение экспериментатора никогда не принимается с уверенностью, т. е. всегда существует некоторый риск принять неправильное решение. Оценка степени этого риска и представляет собой суть проверки статистической гипотезы. Ясно, что исключить на 100% этот риск невозможно. Но экспериментатор может выбрать вероятность или уровень значимости, который характеризует вероятность отклонения, признаваемого невозможным в силу лишь случайных причин. Самыми распространенными уровнями являются: 0,001; 0,01; 0,05. В педагогических исследованиях различия считаются достоверными при 5 % уровне значимости. Уровень 0,05 означает, что выборочное значение может встретиться в среднем не чаще чем 5 раз в 100 наблюдениях.

Построение доверительных интервалов статистических характеристик. Статистические характеристики (среднее арифметическое, среднее квадратическое отклонение, коэффициент вариации) не дают необходимой оценки генеральной совокупности, т. к. остаются неизвестными нижние (Хниж) и верхние (Хверх) граничные значения, между которыми можно с определенной вероятностью ожидать генеральную статистическую характеристику.

Для теории педагогических оценок, построения шкал оценок, построения доверительных интервалов необходимо знать процент результатов, лежащих в различном диапазоне варьирования, или колеблемости.

Для оценки варьирования результатов измерений используют следующие соотношения:

± 1,96 σ интервал включает 95 % всех результатов;

± 2,58 σ интервал включает 99 % всех результатов;

± 3,29 σ интервал включает 99,9 % всех результатов.

Таким образом, отклонения от больше, чем на 2 σ следует ожидать в 4—5 случаях из 100, отклонения большего, чем 2,5 σ — в одном случае из 100, большего, чем 3,3 σ — в одном из 1000. В статистике существует правило трех сигм, использующееся при исключении сильно отклоняющихся результатов измерений. Результаты измерений, отклоняющиеся от более чем на 3 σ, можно считать ошибочными и исключить из расчетов.

Доверительные границы Хниж. и Хверх. определяют по формуле:

Хниж.(верх)= ± Ua ××,

где Ua — значение нормированного отклонения для данного уровня значимости a (0,05, 0,01 или 0,001), — стандартная ошибка средней арифметической.

Предположим, у 100 студентов измерили рост, произвели расчет основных статистических характеристик и получили следующие данные:

= 178,4 см; σ = 5,72 см; = 0,57.

Выберем 5 %-й уровень значимости, значит, U = 1,96 (для a = 0,05).

Определим нижние и верхние граничные значения.

Хниж. = – Ua × = 178,4 – 1,96 × 0,57 = 177,28,

Хверх. = + Ua × = 178,4 + 1,96 × 0,57 = 179,52.

Значения доверительных границ для a=0,01 (U=2,58) будут следующими:

Хниж. = – Ua × = 178,4 –2,58 × 0,57 = 176,93,

Хверх. = + Ua × = 178,4 + 2,58 × 0,57 = 179,87.

Следовательно, в 95 % случаев значения длины тела студентов, охваченных обследованием, будут находиться в интервале от 177,28 до 179,52 см, а в 99 % — в интервале от 176,93 до 179,87 см.

Сравнение двух средних арифметических. Несвязанные выборки. Определение достоверности различий между результатами двух исследований по шкалам интервальной и отношений производится при помощи t-критерия Стьюдента. В этом случае должны быть известны следующие статистические характеристики:1, 2, σ1, σ2, и объемы выборок n1 и n2 для двух сравниваемых групп (например, экспериментальной и контрольной). Вычисление t-критерия Стьюдента производится по следующим формулам.

1.  В случае, когда равны объемы выборки, но не равны дисперсии:

N = n1 = n2, σ1 ¹ σ2,

tрасчет=,

число степеней свободы g = 2n – 2 (приложение 7).

2. В случае, когда не равны объемы выборки и не равны дисперсии:

n1 ¹ n2, σ1 ¹ σ2;

tрасчет = ,

число степеней свободы g = n1 + n2 – 2.

3. В случае неравных объемов выборки и равных дисперсий:

n1 ¹ n2, σ=σ1=σ2;

tрасчет = ,

число степеней свободы g = n1+n2 –2.

После того как вычислено tрасчет, по специальной таблице (приложение 7) его сравнивают с критическим значением tкрит. При 5 %-м (t0,05) или 1 %-м (t0,01) уровнях значимости и определенном числе степеней свободы, если tрасчет окажется больше граничного значения tкрит, то различия между средними арифметическими двух групп считаются достоверными при выбранном уровне значимости. Если tрасчет окажется меньше граничного значения tкрит, то при выбранном уровне значимости различия между средними арифметическими двух групп считаются недостоверными.

Предположим, что две группы студентов выполняли контрольное упражнение в подтягивании на перекладине. В одной группе было 10 человек (n1 = 10), в другой — 12 (n2 = 12). Студенты первой группы подтянулись в среднем 12 раз (1 = 12), студенты второй — 14 раз (2 = 14). Показатели вариации составили соответственно: σ1 = 3,5 и σ2 = 4,8.

Так как и объем групп и дисперсии неравны, значение tрасчет вычисляем по формуле 2.

tрасчет = = = 1,13.

Число степеней свободы g = n1 + n2 – 2 = 10 + 12 – 2 = 20. Выбираем уровень значимости равным 0,05. Для значения p = 0,05 и g = 20 по таблице граничных значений t-критерия Стьюдента (приложение 7) находим критическое значение tкрит. Оно равно 2,09, что больше tрасчет — различия статистически не достоверны. Таким образом, группы не отличаются друг от друга по изучаемому показателю. Наблюдаемые различия следует рассматривать как случайные.

Сравнение двух средних арифметических. Связанные выборки. Часто экспериментальные исследования проводятся с участием одной группы испытуемых, и измерения проводятся до и после эксперимента. При этом стараются определить — повлиял ли внесенный фактор на исследуемые показатели или нет. При проведении таких экспериментов выборки всегда равны и называются связанными. Для того чтобы определить tрасчет, предварительно вычисляют для каждого испытуемого разность между первым и вторым измерениями (di), рассчитывают среднюю арифметическую разностей (d) и находят стандартное отклонение средней разности (Sd). Для расчета tрасчет нужно знать две формулы:

Sd = , tрасчет =

число степеней свободы g = n – 1.

Поясним на примере. Группа студентов из восьми человек для повышения силовых способностей применяла в течение семестра новую методику тренировки. В начале и в конце семестра были проведены контрольные тестирования в подтягивании на перекладине. Результаты тестирования и порядок расчета промежуточных значений представлены в таблице 6.

По таблице (приложение 7) для заданного уровня значимости (зададим его равным 0,05) и степени свободы (7) находим tкрит.. Оно равно 2,37. Наше расчетное tрасчет больше табличного значения, значит, различия статистически достоверны. Таким образом, применяемая студентами методика повышения силовых способностей позволила статистически достоверно (Р = 0,05) улучшить результаты в подтягивании на перекладине.

Таблица 6

Расчет достоверности различий для связанных выборок

№ п/п

Результаты теста

di

di2

Sd = =

= =

= = 1,04

tрасчет = = = 2,64

g = n – 1 = 8 – 1 = 7

tрасчет > tкрит; 2,64 > 2,37 при Р = 0,05

исходн.

заключ.

1

10

12

–2

4

2

8

11

–3

9

3

11

14

–3

9

4

12

14

–2

4

5

9

12

–3

9

6

14

16

–2

4

7

15

17

–2

4

8

10

15

–5

25

Сумма (S)

–22

68

Среднее арифметич. ()

–2,75

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9