Основное терминологическое поле теории педагогических измерений.
, заместитель директора ГБОУ ДПО ПО «ЦОКО» по инновационной работе
А
Автор - разработчик теста (test developer) – специалист (учитель-предметник или иной педагогический работник), имеющий адекватный уровень подготовки в области теории и практики педагогических измерений.
Адаптивный тест (аdaptive test) — тест, в котором тестовые задания предлагаются тестируемому в зависимости от правильности его ответа на предыдущее тестовое задание.
Ассоциация – словесная подсказка в тестовом задании, помогающая тестируемому угадать правильный ответ.
Апробация теста – предварительное тестирование репрезентативной выборки для определения соответствия теста его целям и заданным характеристикам.
Аккомодация (аccommodation) — изменения в тесте и (или) его администрировании, осуществленные с целью оценивания качества знаний учащихся с ограниченными возможностями здоровья.
Альтернативные формы теста (аlternate forms) — различные версии (варианты) одного и того же теста, одного уровня трудности, подготовленные для оценивания одного и того же учебного сегмента, но с разными тестовыми заданиями.
Аналитическая выборка (analysis sample) — группа тестируемых, дающая по результатам тестирования основание для определения дескриптивных и вероятностных статистик, характеризующих качественный аспект тестирования.
Аналитический подсчет баллов (аnalytic scoring, trait scoring) — процедура подсчета рейтером результатов тестирования для теста, состоящего из заданий со свободно конструированным ответом, в соответствии с заранее заданными критериями.
Анализ тестовых заданий (items analysis) – процесс определения трудности и дифференцирующей способности заданий теста посредством статистического анализа, на основе которого и принимается решение о включении задания в содержание теста.
Аудит педагогический (educational аudit) — систематическая документированная деятельность по измерению и оценке академических достижений обучающихся с целью оценки степени соответствия результатов обучения требованиям образовательных стандартов и (или) содержанию учебных программ.
Б
Балл (score) – условная единица, используемая в тестировании, для оценки результата выполнения тестового задания.
Балл критериальный (cut off score) – граничное (пороговое) значение тестового балла, с помощью которого выборка испытуемых делится на тех, кто справился с тестом, и тех кто не справился.
Балл первичный (raw score) – индивидуальный балл тестируемого по результатам выполнения теста, равный сумме баллов за верные ответы на задания теста.
Балл тестовый (test score) – окончательное численное выражение оценки уровня подготовленности тестируемого, полученное на основании стандартизованной обработки результата, выраженного в первичных баллах.
Балл истинный (true score) – гипотетический балл на определенной для теста шкале, соответствующий уровню подготовленности тестируемого в момент тестирования.
Балл категории ответа на тестовое задание – балл, соответствующий определенной категории ответа на политомическое тестовое задание, зависящий от полноты этого ответа.
Банк тестовых заданий – совокупность систематизированных тестовых заданий, разработанных для разных целей, прошедших апробацию и имеющих известные качественные характеристики.
Бланк ответов – стандартный бланк для записи ответов на тестовые задания или записи номера выбранного ответа из нескольких предложенных заданий.
В
Валидность теста (test validity) – комплексная характеристика теста, отражающая его свойство служить той цели, для которой он создавался (понятие универсальное, но аспекты доказательств валидности – различны).
Валидность очевидная (face validity) – представление о сфере применения теста, его результативности и практической ценности у лиц, не располагающих специальными сведениями о тесте.
Валидность критериально-ориентированная (сriterion-related validity) — характеристика теста, отражающая его возможность несмещенно сопоставлять результаты педагогического тестирования с внешним критерием, характеризующим объект измерения.
Валидность сопоставительная – вид критериально-ориентированной валидности, отражающий корреляцию результатов тестирования, полученного с помощью теста, с результатами измерения того же объекта другим методом.
Валидность прогностическая (predicative validity) – критериальная валидность, отражающая эффективность прогноза теста о возможностях тестируемых в будущем.
Валидность конструкта (сonstruct validity) — теоретические и эмпирические данные о том, что тест измеряет на самом деле и о том, каков качественный уровень выводов, сделанных на основе результатов тестирования.
Валидность факторная (factor validity) – характеристика педагогического теста, выражающая корреляцию между тестом и каждым из выделенных факторов академических достижений тестируемых.
Валидность статистическая (statistical validity) — характеристика теста, определяемая анализом результатов тестовых испытаний и проверкой знаний традиционными методами.
Валидность содержательная (content validity) – один из аспектов валидности конструкта, фокусирующий доказательства на пригодности знаний, умений и навыков, составляющих содержание тестовых заданий.
Валидизаация теста – совокупность процедур по улучшению валидности теста.
Валидизаация перекрестная (cross-validation) – процедура, в которой для определения прогностической валидности тестирования модель оценивания, экспериментально полученная на одной выборке, применяется к другой выборке.
Верификация – 1) процесс установления истинности научных утверждений путем их эмпирической проверки, 2) подтверждение соответствия конечного продукта предопределенным эталонным требованиям (стандартам).
Взвешивание (weighting) — определение относительного вклада каждого первичного балла в том случае, когда два или более баллов объединены в сложный балл политомического тестового задания.
Внутренняя согласованность (internal consistency) – характеристика теста, отражающая степень однородности тестовых заданий с точки зрения измеряемого тестом качества знаний учащихся.
Внутренней согласованности коэффициент (coefficient of internal consistency) – одна из разновидностей коэффициента надежности теста, вычисляемая как ко-эффициент корреляции между результатами ответов испытуемых на четные и нечетные вопросы одного и того же теста.
Воспроизводимость (reproducibility) – свойство теста к повторению основных характеристик при последующих применениях.
Выравнивание вариантов теста – определенный метод решения комплекса вопросов, связанных с отображением на определенной шкале латентных характеристик всех тестовых заданий (в том числе, составляющих его различные варианты).
Выборочная совокупность (sample) тестовых заданий – совокупность заданий теста, являющаяся частью гипотетической генеральной совокупности тестовых заданий.
Выборка нормативная стратифицированная – группа тестируемых, содержащая представителей всех наиболее значимых страт, реально существующих в генеральной совокупности потенциальных испытуемых, причем в той же пропорции.
Г
Генеральная совокупность (universe) - совокупность всех мысленно возможных объектов (статистических единиц) данного вида, над которыми проводятся наблюдения с целью получения конкретных значений случайной величины.
Генеральная совокупность тестовых заданий – гипотетическое множество тестовых заданий, полностью представляющее конкретную область знаний (учебный предмет).
Д
Дисперсия (variance) - статистика, выраженная в единицах и показывающая степень разброса результатов тестирования в баллах.
Дисперсионный анализ (analysis of variance) - совокупность моделей и методов, применяемых для исследования влияния одной или нескольких переменных ( факторов) на одну зависимую количественную переменную (отклик).
Дифференцирующая способность тестового задания (item discrimination power) – количественная характеристика способности тестового задания дифференцировать учащихся по уровню их подготовленности.
И
Измерение – количественное сопоставление свойств объекта с эталоном, принятым в качестве единицы измерения.
Индекс – количественная характеристика признака, цифровой показатель чего-либо.
Индикатор – качественная характеристика признака, доступная наблюдению и измерению, и позволяющая судить о других характеристиках объекта, недоступ-ных непосредственному исследованию.
Искажения (bias) — в теории педагогических измерений тенденция оценочных процедур, когда полученные результаты имеют систематические отклонения от реальных.
К
Качество как философская категория – существенная определенность предмета, то, в силу чего он является данным, а не другим.
Качество конструкционное – совокупность устойчивых свойств (признаков) объекта.
Качество эксплуатационное – конкурентоспособность объекта (предмета, услуг), демонстрирующая степень соответствия эталону с точки зрения потребителя.
Качество результата педагогического измерения - конструкционное качество, представдляющее собой совокупность следующих характеристик: надежность, валидность, точность, достоверность, правильность, сходимость, воспроизво-димость.
Качество образования (в широком смысле) – интегральная характеристика системы образования, отражающая степень соответствия реальных достигаемых образовательных результатов и условий образовательного процесса нормативным требованиям, социальным и личностным ожиданиям.
Качество образования – совокупность его свойств, обусловливающая приспособленность к реализации социальных целей по формированию и развитию личности в аспектах ее обученности, воспитанности, выраженности социальных, психических и физических свойств.
Качество знаний – целостная совокупность устойчивых свойств, характеризующих результат обучения (полнота, глубина, системность, систематичность, оперативность, гибкость, конкретность, осознанность, свернутость-развернутость и т. д.).
Квалитология – наука о качестве создаваемых человеком объектов и процессов.
Квалиметрия – область науки, объединяющая количественные методы оценки качества объектов, используемые для обоснования оценочных суждений и решений, принимаемых при стандартизации и управлении качеством.
Критерий – измеряемый признак, на основании которого производится сравнение, классификация, оценка объектов и явлений.
Количество как философская категория – то, что характеризует объект с точки зрения его измеримости.
Компетенция - отчужденное, заранее заданное социальное требование (норма) к образовательной подготовке обучающегося, необходимое для его эффективной деятельности в определенной сфере.
Компетентность (по Дж. Равену) - специфическая способность (состоявшееся качество личности), ориентированная на эффективное выполнение конкретного действия в конкретной предметной области, включающая узкоспециальные знания, предметные навыки, способы мышления, понимание ответственности за свои действия.
Компетентностный подход – освоение учащимися различного рода умений, позволяющих им в будущем действовать эффективно в ситуациях профессиональной, личной и общественной жизни.
К ключевым компетенциям относят:
- умение учиться (learning);
- исследование (searching);
- думание (thinking);
- общение (communicating);
- кооперацию, взаимодействие (cooperating);
- умение «делать дело», доводить дело до конца (getting things done);
- умение адаптироваться к себе, принимать себя (adopting oneself).
Корреляционный анализ – комплекс методов статистического исследования взаимозависимости между переменными, связанными такими отношениями, при которых эта взаимозависимость является нелинейной (стандартной мерой связи переменных является коэффициент корреляции).
Корреляция бисериальная – метод корреляционного анализа отношения переменных, одна из которых измеряется в дихотомической шкале, а другая в порядковой или интервальной.
Корреляция ранговая – метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения.
Конструкт — совокупность структурных единиц знаний учебного сегмента, для измерения и оценки которых создается педагогический тест (например, знание истории, фактологический материал, понимание прочитанного, навыки обучения, способность к анализу текста, логическое мышление, интеллект и т. д.)
Коэффициент стабильности (coefficient of stability) – коэффициент надежности теста, выраженный показателем корреляции между результатами двух последовательных тестирований одного и того же контингента испытуемых одним и тем же тестом.
Коэффициент эквивалентности (coefficient of equivalence) – коэффициент надежности, который определяется корреляцией между результатами двух параллельных форм одного и того же теста одного и того же контингента тестируемых.
Конструктно-нерелевантная вариация (construct-irrelevant variance) — различия между показателями тестируемых в баллах, вызванные другими факторами, нежели различия в знаниях, умениях, навыках, или других характеристиках, включенных в конструкт теста, предназначенный для измерения.
Контрастные группы – эмпирические выборки тестируемых, подбираемые с максимальным и минимальным проявлением критериальных признаков.
Л
Логит – интервал на логарифмической шкале, принятый за единицу и являющийся мерой сопоставимости уровней подготовленности тестируемого
и трудности тестового задания
(при разности между
и
в один логит вероятность выполнения тестируемым задания равна 0,73).
М
Матричное тестирование (matrix sampling) — метод администрирования теста, когда разным выборкам тестируемых предлагаются разные тестовые задания.
Матрица ответов тестируемого (person-item score matrix) – прямоугольная таблица (размер n х k), в каждой позиции которой указываются ответы тестируемых (номер столбца соответствует номеру задания, а строки являются профилями тестируемых).
Меры центральной тенденции – характеристики совокупности переменных, отражающие наиболее типичный, репрезентативный для изучаемой выборки тестируемых, результат (наиболее распространенными мерами центральной тенденции являются: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая, мода и медиана).
Меры изменчивости – статистические показатели вариации переменной относительно средних значений, определяющие степень отклонений от центральной тенденции распределения (размах, среднее абсолютное отклонение, дисперсия, стандартное отклонение, коэффициент вариации и др).
Модель частичного оценивания (partial credit model) – обобщенная логическая модель для политомических тестовых заданий, позволяющая дополнить альтернативную оценку выполнения задания оценкой «частично правильный ответ».
Метод доведения ответа до правильного (answer-until-correct method) – метод, используемый в компьютерном тестировании, когда тестируемый должен отвечать на каждое задание до тех пор, пока не выберет правильный ответ.
Модератор – комплексная характеристика контингента тестируемых, указывающая на практическую эффективность теста и учитывающая демографические показатели – возраст, пол, регион и т. п.
Н
Надежность (reliability) – показатель стабильности и устойчивости результатов тестирования в одинаково подготовленных группах тестируемых при неоднократном предъявлении теста.
Надежность ретестовая (test-retest method) – подсчитывается коэффициент корреляции по результатам двух тестирований, разнесенных во времени.
Надежность, определяемая методом эквивалентных форм (alternate-form reliability) предполагает тестирование не по одному, а двум тестам, одинаковым по охвату материала, степени трудности, но не идентичных,
Надежность, определяемая методом расщепления (split-half method) – надежность теста, основанная на сопоставлении результатов тестирования по двум или нескольким эквивалентным частям теста.
Надежность по методу Кьюдера-Ричардсона - метод, в основе которого однократное предъявление единственной формы теста (задания теста предполагаются дихотомическими) и согласовании ответов по всем заданиям теста (чем однороднее тест, тем согласованнее его результаты).
Надежность по методу Кронбаха – обобщение метода Кьюдера-Ричардсона на случай, когда задания теста не являются дихотомическими.
Надежность классификации (reliability of classification) — степень соответствия результатов тестирования испытуемого определенной категории (например, базовый, средний и продвинутый уровни) при условии проведения повторного тестирования с использованием альтернативной формы теста (при этом предполагается, что изменений в способностях испытуемого не происходит)
Надежности коэффициент – количественная характеристика надежности теста, изменяющаяся от 0 до 1, показывающая меру реального результата тестирования и меру влияния на этот результат случайных ошибок.
Нормальное распределение (normal distribution) – модель распределения переменных относительно среднего случайным образом под влиянием множества независимых факторов (кривая нормального распределения описывается формулой де Муавра и имеет вид симметричной унимодальной колоколообразной кривой.)
Нормативная группа (norm group) – группа тестируемых, используемая в качест-ве основания для сравнения, при котором оценки отдельных тестируемых интер-претируются в сравнении с распределением баллов в группе.
Нормы тестовые – количественные или качественные критерии оценки результатов педагогического теста, позволяющие определить уровень академических достижений учащегося в той или иной области знаний (в качестве одного из критериев могут выступать статистические показатели выборки стандартизации).
О
Ограничение значений (restriction of range) – ситуация, в которой анализ результатов тестирования не включает в себя данные испытуемых, которые имели бы самые высокие или самые низкие оценки по одному (или более) переменным.
Однопараметрическая модель тестирования – логистическая модель, в которой функция успеха зависит только от разности
(
– уровень подготовленности тестируемого,
- трудность тестового задания).
Отвлекающий ответ (distractor) – вариант ответа на задание множественного выбора, похожий на правильный ответ, но таковым не являющийся.
Основа тестового задания (stem) – языковые и речевые единицы, а также цифро-буквенные обозначения, с которыми тестируемый должен проделать мыслительную или речевую операцию, заданную тестовой ситуацией и сформулированную в инструкции.
Оценивание суммативное (summative evaluation) – оценивание, используемое для принятия решений о выставлении той или иной оценки учащемуся в конце учебной деятельности или определения готовности к продвижению (на основе такого оценивания разрабатываются суждения об общем уровне успешности учащихся).
Оценивание формативное (formative evaluation) – вид оценивания, созданный для помощи учебному процессу, путем обеспечения обучаемого информацией, которая может быть использована для определения сильных и слабых мест.
П
Параллельные варианты теста – варианты теста с примерно одинаковыми статистическими характеристиками.
План педагогического теста (технологическая матрица) – таблица, в которой каждое тестовое задание соотносится с определенным элементом содержания учебной дисциплины, видом знаний или умений.
Пользователь теста - юридическое или физическое лицо, использующее тест или результаты тестирования для оценки уровня подготовленности испытуемых в определенной области знаний.
Показатель – обобщенная количественная характеристика объекта исследования, выраженная в числовой форме.
Подсчет баллов целостный (holistic scoring) - процедура оценивания результатов тестирования для тестов со свободно-конструируемым ответом, обеспечивающая одно общее суждение об успешности выполнения теста.
Последовательное тестирование – педагогическое тестирование, при котором тестовые задания с известными характеристиками последовательно предъявляются тестируемому, уровень подготовленности которого оценивается после каждого ответа с возрастающей точностью.
Претест (рretest, pilot testing) — педагогический тест, подготовленный в соответствии со спецификацией, для сбора статистических характеристик тестовых заданий и теста в целом, но не прошедший апробацию.
Процентиль (percentile) – сотая часть условной шкалы, дробящей распределение на сто равных частей, и используемая для ранжирования тестируемых по результатам теста.
Р
Разрешающая способность теста – длина промежутка на шкале уровня подготовленности тестируемых, соответствующая изменению первичного балла тестируемого на единицу.
Рандомизация - процесс перемешивания объектов, в результате которого они располагается в случайном порядке.
Ранг (rank) - номер наблюдения в вариационном ряде.
Размах (range) - разность между наибольшим и наименьшим наблюдаемым значением количественного показателя.
Ранжир - упорядоченный по некоторому основанию ряд.
Рейтинг (rating) - индивидуальный числовой показатель оценки качества или свойства объекта, используемый при упорядочивании или классификации.
Рейтер — лицо (компьютеризированная процедура), определяющее результат тестирования в баллах исходя из правильности ответов тестируемого за каждое задание теста.
Регрессии уравнение (regression equation) — формула, вида Y = aх + b, используемая для оценки ожидаемого значения критерия, учитывающая значение одного или более наблюдаемых переменных как прогностических показателей.
Репликация - повторение исследования с целью определения степени согласованности результатов.
С
Ситуативные переменные педагогического тестирования – совокупность случайных факторов, влияющих на результат тестирования.
Сложносоставной балл (composite score) — балл, являющийся комбинацией двух или более баллов, полученной в соответствии с определенным правилом.
Смещение или систематическая ошибка оценивания (bias of estimator) – разница между ожидаемым значением статистики и истинным значением параметра генеральной совокупности, который эта статистика оценивает.
Сопоставимость — необходимое условие для сравнения статистических показателей и их анализа, требующее единства методологии расчёта показателей, единиц измерения, полноты охвата наблюдением исследуемого явления и других условий сравнимости.
Стандартное отклонение (standard deviation) — статистика показывающая, что количество вариаций в наборе тестовых баллов, выражается в тех же единицах, что и сами оценки, и рассматриваемая при этом как типичное расстояние между индивидуальным баллом тестируемого и средним.
Стандартная ошибка оценивания (standard error of estimate) — статистика, демонстрирующая степень, с которой оценка количественных тенденций меняется в выборках из одной и той же популяции.
Стандартная ошибка измерения ( standard error of measurement) — статистика, показывающая несостоятельность тестовых баллов, вызванных такими факторами, как угадывание ответов, особенности некоторых тестовых заданий, включенных в тест, лояльность или строгость в оценивании результата ( в терминах статистики стандартная ошибка измерения суть величина, которая показывает стандартное отклонение различий между наблюдаемыми и истинными баллами) .
Стандарт — нормативно-технический документ, устанавливающий комплекс норм, правил, требований к объектам стандартизации, обязательный для исполнения в определенных областях деятельности, разработанный в установленном порядке и утвержденный компетентным органом.
Стандарт организации – документ по стандартизации, утверждаемый юридическим лицом для совершенствования производства, обеспечения качества продукции, работ, оказания услуг.
Стандарт образования – диагностическое описание минимальных обязательных требований к отдельным сторонам образования, удовлетворяющее следующим условиям:
- применимость к определенному образовательному феномену,
- выполнение в диагностических показателях качества данного феномена,
- ориентированность на объективные методы контроля его качества.
Стандартизация - деятельность по разработке (ведению), утверждению, изменению (актуализации), отмене, опубликованию и применению документов по стандартизации и иная деятельность, направленная на достижение упорядоченности в отношении объектов стандартизации;
Стандартизация теста (test standardization) – процедура получения распределения индивидуальных баллов по тесту для нормативной группы испытуемых, позволяющая сопоставлять результаты у разных групп тестируемых.
Стандартизированная нормативная выборка – группа тестируемых, включающая представителей наиболее значимых страт генеральной совокупности.
Спецификация теста – документ, содержащий информацию о целях, плане, структуре теста, особенностях включенных тестовых заданий, правилах его администрирования и обработки результатов, общем сценарии тестирования
Субтест (subtest) – часть теста, состоящая из ограниченного числа тестовых заданий, допускающая независимую обработку результатов с целью решения частных задач тестирования.
Т
Тест педагогический (educational test) – система, специально подобранных, расположенных в порядке возрастания трудности тестовых заданий специфической формы, предназначенная для количественной оценки академических достижений школьников в одной или нескольких областях.
Тест педагогический стандартизированный (standardized educational test) – педагогический тест, имеющий спецификацию, тестовые характеристики, стабильно подтвержденные на нескольких репрезентативных выборках тестируемых, и являющий собой единство стандартных методов конструирования, администрирования, обработки, интерпретации и оценки результата.
Тест педагогический локально-стандартизированный (teacher-made test) – педагогический тест, апробируемый на ограниченном контингенте испытуемых (класс, параллель) и менее строгий по статистическим показателям качества, чем тест стандартизированный.
Тест гетерогенный (heterogeneuse test) – тест, позволяющий оценить уровень подготовленности тестируемого по нескольким смежным учебным дисциплинам.
Тест гомогенный (homogeneuse test) – тест, позволяющий оценить уровень подготовленности тестируемого по одной учебной дисциплине.
Тест критериально-ориентированный тест (CRT) – тест, цель которого выявить знания тестируемого в соответствии с учебной программой и оценить результаты тестирования относительно некоторого критерия.
Тест нормативно-ориентированный (NRT) – тест, цель которого сравнить академические достижения тестируемых друг с другом или дать оценку этим достижениям относительно тестовой нормы.
Тест мощности (power test) – педагогический тест, включающий тестовые задания, расположенные в порядке возрастания трудности, и не предполагающий жестких ограничений по времени.
Тест скорости (speed test) - тест, включающий задания примерно равной трудности, результат выполнения которого определяется количеством выполненных заданий за определенное время.
Тест идентификации (indification test) – тест, включающий вместо словесных ответов схемы, графики, диаграммы, чертежи, в котором испытуемому необходимо в соответствии с условием задания распознать (идентифицировать) изображение.
Тест полиморфный – педагогический тест, содержащий тестовые задания различных типов.
Тест мономорфный – педагогический тест, содержащий задания одного типа.
Тест вступительный (placement test) – проводимый с целью определения уровня обученности для распределения тестируемых по результатам теста в соответствующие группы.
Тест по аудированию (listening test) – коммуникативно-речевой тест, предназначенный для проверки орфоэпических, просодических, лексических и грамматических навыков тестируемого, уровня его понимания речевого сообщения при слуховом восприятии.
Тест тренировочный, репетиционный (mocktest) – педагогический тест, проверяющий степень подготовленности обучающихся к решающему (экзаменационному, итоговому) тестированию.
Тест прогностический – тест, определяющий успех или неуспех тестируемого в будущем.
Тестирующий (tester) – специалист, непосредственно проводящий тестирование, имеющий соответствующее квалификационное удостоверение.
Тестирование абсолютное – тестирование, предназначенное для оценивания уровня подготовки каждого обучающегося в конкретной области знаний.
Тестирование относительное – педагогическое тестирование, предназначенное для сопоставления уровня подготовки школьников относительно друг друга или относительно тестовых норм.
Тестовая батарея (test battery) – несколько субтестов, объединенных единой целью использования и предназначенных для оценки различных сторон академических достижений тестируемого.
Тестовая искушенность – индивидуальный опыт тестируемого, приобретенный в ходе неоднократного выполнения педагогических тестов.
Тестовое задание (item) – минимальная составляющая единица педагогического теста в виде задания специфической формы, отвечающая требованиям технологичности, чистоты формы и предметного содержания и, кроме того, статистическим требованиям:
1) известной трудности; 2) дифференцирующей способностью (достаточной вариации тестовых баллов); 3) положительной корреляции баллов задания с баллами по всему тесту.
Тестовое задание множественного выбора (multiple-choise item) – тестовое задание с несколькими вариантами ответа, один (или более) из которых верный.
Тестовое задание дихотомическое – задание, выполнение которого оценивается альтернативно («1» - верно решенное задание, «0» - за нерешенное задание).
Тестовое задание политомическое – тестовое задание, выполнение которого допускает несколько категорий ответа, каждая из которых оценивается по-разному.
Тестовое задание на установление правильной последовательности (sequences item) – задание, при выполнении которого необходимо установить правильную последовательность действий, операций, событий.
Тестовое задание на установление соответствия (matching item) - задание, при выполнении которого необходимо установить соотношение между элементами двух или более множеств.
Тестовое задание со свободно конструируемым (кратким или полным) ответом (free-response item, essay item) – тестовое задание без указания возможных вариантов ответа, требующее самостоятельного формулирования ответа.
Тестовое задание в виде логического соотношения – задание, при выполнении которого предполагается установить логическую связь между понятиями.
Теория моделирования и параметризации педагогических тестов (Item Response Theory) — теория тестирования, ориентированная на математические модели, параметрами которых (подлежащими определению), служат различные характеристики как тестируемых, так и самого теста (аналог данной теории – математическая теория измерения латентных качеств личности – Latent Trait Theory)
Точность измерения (рrecision) — ширина интервала, попадание в который данной величины может быть оценено с любой заданной вероятностью.
Трудность тестового задания (item difficulty) – основная количественная характеристика тестового задания, определяемая долей тестируемых, ответивших правильно на тестовое задание.
У
Учебный сегмент (domain) — определенная совокупность знаний, умений, навыков, являющихся частью содержания учебного предмета.
Х
Характеристическая функция заданного уровня подготовленности испытуемых функция характеристик заданий теста, полученная из функции успеха для тестового задания при фиксированном значении заданного уровня подготовленности испытуемых.
Характеристическая функция заданных параметров тестовых заданий функция одного переменного уровня подготовленности участников тестирования, полученная из функции успеха для тестового задания при фиксированных значениях характеристик заданий.
Ш
Шкала (scale) – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную систему действительных чисел.
Шкалирование (scaling) – метод, связанный с выставлением каждому тестируемому тестового балла по единой шкале, вне зависимости от группы и варианта теста (преобразование первичных баллов в шкалированные).
Шкала процентная ( percentage mastery scale)– порядковая шкала, на которой тестовый балл тестируемого прямопропорционален его первичному баллу.
Шкала номинативная – это шкала, в которой не выражены количественные характеристики объектов, а учитывается только то свойство объектов, что они разные.
Шкала порядковая (ранговая) - шкала, позволяющая ранжировать объекты (присваивать им ранги) по какому-либо признаку.
Шкала интервальная – это шкала, классифицирующая по принципу «больше - меньше» на определенное количество единиц.
Шкала отношений - шкала, классифицирующая по принципу «больше - меньше» в определенное количество раз
Шкала нормативная (normative scale) — шкала, которая определяется в терминах результативности нормативной группы (во многих случаях, шкала определяется значениями специфических величин - средних и стандартного отклонения шкалированных баллов нормативной группы)
Шкала нормализованных процентилей - порядковая шкала, тестовый балл по которой соответствует квантилям нормального распределения, в частности, квантилям стандартной нормальной переменной с нулевым математическим ожиданием и единичной дисперсией.
Шкала первичных процентилей – порядковая шкала, тестовый балл испытуемого по которой определяется соответствующим квантилю эмпирического распределения частот первичных баллов участников тестирования.
Э
Эталонный (якорный) тест – тест небольшой длины, служащий для выравнивания шкалы (вариантов теста)
Я
Якорные тестовые задания (anchor items) – тестовые задания, общие для всех или нескольких вариантов теста.


