Для тематических тестов высокая корреляция между заданиями неизбежна, так как задания отражают слабо варьирующее, исходное содержание, что вполне оправдано назначением теста.

Однако для итоговых тестов высокой корреляции между заданиями по возможности стараются избегать, поскольку вряд ли имеет смысл включать в итоговый тест несколько заданий, оценивающих одинаковые содержательные элементы,. Поэтому в итоговых тестах обычно стремятся к невысокой положительной корреляции, когда значения коэффициента варьируют в интервале (0; 0,3) и каждое задание привносит свой специфический вклад в общее содержание теста.

Десятый шаг. На десятом шаге с помощью подсчета значений коэффициента бисериальной корреляции оценивается валидность отдельных заданий теста.

Коэффициент бисериальной корреляции используется в том случае, когда один набор значений распределения задается в дихотомической шкале, а другой — в интервальной. Тогда в качестве показателя связи между распределениями выбирают бисериальный коэффициент. Под эту ситуацию подпадает подсчет корреляции между результатами выполнения каждого задания (дихотомическая шкала) и суммой баллов испытуемых (интервальная или квазиинтервальная шкала) по заданиям теста.

Объяснение, на котором основан вывод формулы для подсчета бисериального коэффициента корреляции приводится в книге [9] и ряде других изданий. Формула для подсчета, полученная по результатам вывода, имеет вид :

(5.9)

где — среднее значение индивидуальных баллов испытуемых, выполнивших верно -е задание теста; — среднее значение индивидуальных баллов испытуемых, выполнивших неверно -е задание теста; — стандартное отклонение по множеству значений индивидуальных баллов; (.— число испытуемых, выполнивших верно -е задание теста; (— число испытуемых, выполнивших неверно -е задание теста; — общее число испытуемых, = + ; — ордината нормированного нормального распределения в точке, за которой лежит процентов площади под нормальной кривой.

НЕ нашли? Не то? Что вы ищете?

Более удобным является другой коэффициент корреляции, получивший название точечно-бисериального коэффициента — . Оба коэффициента : точечно-бисериальный и бисериальный коэффициенты очень похожи и вычисляются по сходным наборам данных. Однако формула для намного проще, поэтому именно ему часто отдают предпочтение в практической работе. Помимо простоты в вычислении, точечно - бисериальный коэффициент по сравнению с бисериальным обладает еще одним важным преимуществом. Для вычисления предположение о нормальном распределении весьма существенно.. В том случае, когда гипотеза о нормальности нарушается, значения могут выходить за границы интервала [- 1; +1], смещаясь в ту или иную сторону вдоль числовой прямой.

В отличие от бисериального точечно-бисериальный коэффициент не бывает больше +1 или меньше - 1. Формула для вычисления значения имеет вид

где все обозначения те же, что и в формуле (5.9). де все обозначения прежние и - среднее значение всех индивидуальных баллов по выборке учеников.

. Например, для результатов по заданию 5 ( данные табл. 5.3).

так как 1,4, 5, 9 и 10-й испытуемые выполнили задание 5 верно;

так как 2, 3, 6, 7 и 8-й испытуемые выполнили задание 5 неверно.

Стандартное отклонение, подсчитанное для рассматриваемого примера ранее,

В табл. 5.11 приведены точные значения , рассчитанные с помощью компьютерных программ для данных матрицы в табл. (5.3)..

Интерпретация. Анализ значений коэффициента бисериальной корреляции в табл. 5.11 указывает на два довольно неудачных задания теста. Это те же самые третье [= 0,26] и восьмое [=0,26 ] задания. Полученный вывод дает ценную информацию о низкой валидности заданий 3 и 8 теста. Эти задания следует признать неудачными и для улучшения теста их необходимо удалить. В целом задание можно считать валидным, когда значение =0,5. Под этот критерий подпадают все, кроме двух заданий (третьего и восьмого) рассматриваемого примера матрицы теста.

Оценка валидности задания позволяет судить о том, насколько задание пригодно для работы в соответствии с общей целью создания теста. Если эта цель — дифференциация учеников по уровню подготовки, то валидные задания должны четко отделять хорошо подготовленных от слабо подготовленных учеников тестируемой группы.

Решающую роль в оценке валидности задания играет разность

(находящаяся в числителе дроби формулы (5.10). Чем выше значение этой разности, тем лучше работает задание на общую цель дифференциации испытуемых, выполняющих тест.

Значения, близкие к нулю, указывают на низкую дифференцирующую способность задания теста. В том случае, когда в разности доминирует вклад а не задание следует просто удалить из теста. В нем побеждают слабые ученики, а сильные выбирают неверный ответ либо пропускают задание при выполнении теста. Таким образом, подлежат выбросу все задания, у которых < 0/

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6