Основное терминологическое поле теории педагогических измерений.

, заместитель директора ГБОУ ДПО ПО «ЦОКО» по инновационной работе

А

Автор - разработчик теста (test developer) – специалист (учитель-предметник или иной педагогический работник), имеющий адекватный уровень подготовки в области теории и практики педагогических измерений.

Адаптивный тест (аdaptive test) — тест, в котором тестовые задания предлагаются тестируемому в зависимости от правильности его ответа на предыдущее тестовое задание.

Ассоциация – словесная подсказка в тестовом задании, помогающая тестируемому угадать правильный ответ.

Апробация теста – предварительное тестирование репрезентативной выборки для определения соответствия теста его целям и заданным характеристикам.

Аккомодация (аccommodation) — изменения в тесте и (или) его администрировании, осуществленные с целью оценивания качества знаний учащихся с ограниченными возможностями здоровья.

Альтернативные формы теста (аlternate forms) — различные версии (варианты) одного и того же теста, одного уровня трудности, подготовленные для оценивания одного и того же учебного сегмента, но с разными тестовыми заданиями.

Аналитическая выборка (analysis sample) — группа тестируемых, дающая по результатам тестирования основание для определения дескриптивных и вероятностных статистик, характеризующих качественный аспект тестирования.

Аналитический подсчет баллов (аnalytic scoring, trait scoring) — процедура подсчета рейтером результатов тестирования для теста, состоящего из заданий со свободно конструированным ответом, в соответствии с заранее заданными критериями.

НЕ нашли? Не то? Что вы ищете?

Анализ тестовых заданий (items analysis) – процесс определения трудности и дифференцирующей способности заданий теста посредством статистического анализа, на основе которого и принимается решение о включении задания в содержание теста.

Аудит педагогический (educational аudit) — систематическая документированная деятельность по измерению и оценке академических достижений обучающихся с целью оценки степени соответствия результатов обучения требованиям образовательных стандартов и (или) содержанию учебных программ.

Б

Балл (score) – условная единица, используемая в тестировании, для оценки результата выполнения тестового задания.

Балл критериальный (cut off score) – граничное (пороговое) значение тестового балла, с помощью которого выборка испытуемых делится на тех, кто справился с тестом, и тех кто не справился.

Балл первичный (raw score) – индивидуальный балл тестируемого по результатам выполнения теста, равный сумме баллов за верные ответы на задания теста.

Балл тестовый (test score) – окончательное численное выражение оценки уровня подготовленности тестируемого, полученное на основании стандартизованной обработки результата, выраженного в первичных баллах.

Балл истинный (true score) – гипотетический балл на определенной для теста шкале, соответствующий уровню подготовленности тестируемого в момент тестирования.

Балл категории ответа на тестовое задание – балл, соответствующий определенной категории ответа на политомическое тестовое задание, зависящий от полноты этого ответа.

Банк тестовых заданий – совокупность систематизированных тестовых заданий, разработанных для разных целей, прошедших апробацию и имеющих известные качественные характеристики.

Бланк ответов – стандартный бланк для записи ответов на тестовые задания или записи номера выбранного ответа из нескольких предложенных заданий.

В

Валидность теста (test validity) – комплексная характеристика теста, отражающая его свойство служить той цели, для которой он создавался (понятие универсальное, но аспекты доказательств валидности – различны).

Валидность очевидная (face validity) – представление о сфере применения теста, его результативности и практической ценности у лиц, не располагающих специальными сведениями о тесте.

Валидность критериально-ориентированная (сriterion-related validity) — характеристика теста, отражающая его возможность несмещенно сопоставлять результаты педагогического тестирования с внешним критерием, характеризующим объект измерения.

Валидность сопоставительная – вид критериально-ориентированной валидности, отражающий корреляцию результатов тестирования, полученного с помощью теста, с результатами измерения того же объекта другим методом.

Валидность прогностическая (predicative validity) – критериальная валидность, отражающая эффективность прогноза теста о возможностях тестируемых в будущем.

Валидность конструкта (сonstruct validity) — теоретические и эмпирические данные о том, что тест измеряет на самом деле и о том, каков качественный уровень выводов, сделанных на основе результатов тестирования.

Валидность факторная (factor validity) – характеристика педагогического теста, выражающая корреляцию между тестом и каждым из выделенных факторов академических достижений тестируемых.

Валидность статистическая (statistical validity) — характеристика теста, определяемая анализом результатов тестовых испытаний и проверкой знаний традиционными методами.

Валидность содержательная (content validity) – один из аспектов валидности конструкта, фокусирующий доказательства на пригодности знаний, умений и навыков, составляющих содержание тестовых заданий.

Валидизаация теста – совокупность процедур по улучшению валидности теста.

Валидизаация перекрестная (cross-validation) – процедура, в которой для определения прогностической валидности тестирования модель оценивания, экспериментально полученная на одной выборке, применяется к другой выборке.

Верификация – 1) процесс установления истинности научных утверждений путем их эмпирической проверки, 2) подтверждение соответствия конечного продукта предопределенным эталонным требованиям (стандартам).

Взвешивание (weighting) — определение относительного вклада каждого первичного балла в том случае, когда два или более баллов объединены в сложный балл политомического тестового задания.

Внутренняя согласованность (internal consistency) – характеристика теста, отражающая степень однородности тестовых заданий с точки зрения измеряемого тестом качества знаний учащихся.

Внутренней согласованности коэффициент (coefficient of internal consistency) – одна из разновидностей коэффициента надежности теста, вычисляемая как ко-эффициент корреляции между результатами ответов испытуемых на четные и нечетные вопросы одного и того же теста.

Воспроизводимость (reproducibility) – свойство теста к повторению основных характеристик при последующих применениях.

Выравнивание вариантов теста определенный метод решения комплекса вопросов, связанных с отображением на определенной шкале латентных характеристик всех тестовых заданий (в том числе, составляющих его различные варианты).

Выборочная совокупность (sample) тестовых заданий – совокупность заданий теста, являющаяся частью гипотетической генеральной совокупности тестовых заданий.

Выборка нормативная стратифицированная – группа тестируемых, содержащая представителей всех наиболее значимых страт, реально существующих в генеральной совокупности потенциальных испытуемых, причем в той же пропорции.

Г

Генеральная совокупность (universe) - совокупность всех мысленно возможных объектов (статистических единиц) данного вида, над которыми проводятся наблюдения с целью получения конкретных значений случайной величины.

Генеральная совокупность тестовых заданий – гипотетическое множество тестовых заданий, полностью представляющее конкретную область знаний (учебный предмет).

Д

Дисперсия (variance) - статистика, выраженная в единицах и показывающая степень разброса результатов тестирования в баллах.

Дисперсионный анализ (analysis of variance) - совокупность моделей и методов, применяемых для исследования влияния одной или нескольких переменных ( факторов) на одну зависимую количественную переменную (отклик).

Дифференцирующая способность тестового задания (item discrimination power) – количественная характеристика способности тестового задания дифференцировать учащихся по уровню их подготовленности.

И

Измерение – количественное сопоставление свойств объекта с эталоном, принятым в качестве единицы измерения.

Индекс – количественная характеристика признака, цифровой показатель чего-либо.

Индикатор – качественная характеристика признака, доступная наблюдению и измерению, и позволяющая судить о других характеристиках объекта, недоступ-ных непосредственному исследованию.

Искажения (bias) — в теории педагогических измерений тенденция оценочных процедур, когда полученные результаты имеют систематические отклонения от реальных.

К

Качество как философская категория – существенная определенность предмета, то, в силу чего он является данным, а не другим.

Качество конструкционное – совокупность устойчивых свойств (признаков) объекта.

Качество эксплуатационное – конкурентоспособность объекта (предмета, услуг), демонстрирующая степень соответствия эталону с точки зрения потребителя.

Качество результата педагогического измерения - конструкционное качество, представдляющее собой совокупность следующих характеристик: надежность, валидность, точность, достоверность, правильность, сходимость, воспроизво-димость.

Качество образования (в широком смысле) – интегральная характеристика системы образования, отражающая степень соответствия реальных достигаемых образовательных результатов и условий образовательного процесса нормативным требованиям, социальным и личностным ожиданиям.

Качество образования – совокупность его свойств, обусловливающая приспособленность к реализации социальных целей по формированию и развитию личности в аспектах ее обученности, воспитанности, выраженности социальных, психических и физических свойств.

Качество знаний – целостная совокупность устойчивых свойств, характеризующих результат обучения (полнота, глубина, системность, систематичность, оперативность, гибкость, конкретность, осознанность, свернутость-развернутость и т. д.).

Квалитология – наука о качестве создаваемых человеком объектов и процессов.

Квалиметрия – область науки, объединяющая количественные методы оценки качества объектов, используемые для обоснования оценочных суждений и решений, принимаемых при стандартизации и управлении качеством.

Критерий – измеряемый признак, на основании которого производится сравнение, классификация, оценка объектов и явлений.

Количество как философская категория – то, что характеризует объект с точки зрения его измеримости.

Компетенция - отчужденное, заранее заданное социальное требование (норма) к образовательной подготовке обучающегося, необходимое для его эффективной деятельности в определенной сфере.

Компетентность (по Дж. Равену) - специфическая способность (состоявшееся качество личности), ориентированная на эффективное выполнение конкретного действия в конкретной предметной области, включающая узкоспециальные знания, предметные навыки, способы мышления, понимание ответственности за свои действия.

Компетентностный подход – освоение учащимися различного рода умений, позволяющих им в будущем действовать эффективно в ситуациях профессиональной, личной и общественной жизни.

К ключевым компетенциям относят:

-  умение учиться (learning);

-  исследование (searching);

-  думание (thinking);

-  общение (communicating);

-  кооперацию, взаимодействие (cooperating);

-  умение «делать дело», доводить дело до конца (getting things done);

-  умение адаптироваться к себе, принимать себя (adopting oneself).

Корреляционный анализ – комплекс методов статистического исследования взаимозависимости между переменными, связанными такими отношениями, при которых эта взаимозависимость является нелинейной (стандартной мерой связи переменных является коэффициент корреляции).

Корреляция бисериальная – метод корреляционного анализа отношения переменных, одна из которых измеряется в дихотомической шкале, а другая в порядковой или интервальной.

Корреляция ранговая – метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения.

Конструкт — совокупность структурных единиц знаний учебного сегмента, для измерения и оценки которых создается педагогический тест (например, знание истории, фактологический материал, понимание прочитанного, навыки обучения, способность к анализу текста, логическое мышление, интеллект и т. д.)

Коэффициент стабильности (coefficient of stability) – коэффициент надежности теста, выраженный показателем корреляции между результатами двух последовательных тестирований одного и того же контингента испытуемых одним и тем же тестом.

Коэффициент эквивалентности (coefficient of equivalence) – коэффициент надежности, который определяется корреляцией между результатами двух параллельных форм одного и того же теста одного и того же контингента тестируемых.

Конструктно-нерелевантная вариация (construct-irrelevant variance) — различия между показателями тестируемых в баллах, вызванные другими факторами, нежели различия в знаниях, умениях, навыках, или других характеристиках, включенных в конструкт теста, предназначенный для измерения. 

Контрастные группы – эмпирические выборки тестируемых, подбираемые с максимальным и минимальным проявлением критериальных признаков.

Л

Логит – интервал на логарифмической шкале, принятый за единицу и являющийся мерой сопоставимости уровней подготовленности тестируемого и трудности тестового задания (при разности между и в один логит вероятность выполнения тестируемым задания равна 0,73).

М

Матричное тестирование (matrix sampling) — метод администрирования теста, когда разным выборкам тестируемых предлагаются разные тестовые задания.

Матрица ответов тестируемого (person-item score matrix) – прямоугольная таблица (размер n х k), в каждой позиции которой указываются ответы тестируемых (номер столбца соответствует номеру задания, а строки являются профилями тестируемых).

Меры центральной тенденции – характеристики совокупности переменных, отражающие наиболее типичный, репрезентативный для изучаемой выборки тестируемых, результат (наиболее распространенными мерами центральной тенденции являются: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая, мода и медиана).

Меры изменчивости – статистические показатели вариации переменной относительно средних значений, определяющие степень отклонений от центральной тенденции распределения (размах, среднее абсолютное отклонение, дисперсия, стандартное отклонение, коэффициент вариации и др).

Модель частичного оценивания (partial credit model) – обобщенная логическая модель для политомических тестовых заданий, позволяющая дополнить альтернативную оценку выполнения задания оценкой «частично правильный ответ».

Метод доведения ответа до правильного (answer-until-correct method) – метод, используемый в компьютерном тестировании, когда тестируемый должен отвечать на каждое задание до тех пор, пока не выберет правильный ответ.

Модератор – комплексная характеристика контингента тестируемых, указывающая на практическую эффективность теста и учитывающая демографические показатели – возраст, пол, регион и т. п.

Н

Надежность (reliability) – показатель стабильности и устойчивости результатов тестирования в одинаково подготовленных группах тестируемых при неоднократном предъявлении теста.

Надежность ретестовая (test-retest method) – подсчитывается коэффициент корреляции по результатам двух тестирований, разнесенных во времени.

Надежность, определяемая методом эквивалентных форм (alternate-form reliability) ­ предполагает тестирование не по одному, а двум тестам, одинаковым по охвату материала, степени трудности, но не идентичных,

Надежность, определяемая методом расщепления (split-half method) – ­   надежность теста, основанная на сопоставлении результатов тестирования по двум или нескольким эквивалентным частям теста.

Надежность по методу Кьюдера-Ричардсона - метод, в ­ основе которого однократное предъявление единственной формы теста (задания теста предполагаются дихотомическими) и согласовании ответов по всем заданиям теста (чем однороднее тест, тем согласованнее его результаты).

Надежность по методу Кронбаха – обобщение метода Кьюдера-Ричардсона на случай, когда задания теста не являются дихотомическими.

Надежность классификации (reliability of classification) — степень соответствия результатов тестирования испытуемого определенной категории (например, базовый, средний и продвинутый уровни) при условии проведения повторного тестирования с использованием альтернативной формы теста (при этом предполагается, что изменений в способностях испытуемого не происходит)

Надежности коэффициент – количественная характеристика надежности теста, изменяющаяся от 0 до 1, показывающая меру реального результата тестирования и меру влияния на этот результат случайных ошибок.

Нормальное распределение (normal distribution) – модель распределения переменных относительно среднего случайным образом под влиянием множества независимых факторов (кривая нормального распределения описывается формулой де Муавра и имеет вид симметричной унимодальной колоколообразной кривой.)

Нормативная группа (norm group) – группа тестируемых, используемая в качест-ве основания для сравнения, при котором оценки отдельных тестируемых интер-претируются в сравнении с распределением баллов в группе.

Нормы тестовые – количественные или качественные критерии оценки результатов педагогического теста, позволяющие определить уровень академических достижений учащегося в той или иной области знаний (в качестве одного из критериев могут выступать статистические показатели выборки стандартизации).

О

Ограничение значений (restriction of range) – ситуация, в которой анализ результатов тестирования не включает в себя данные испытуемых, которые имели бы самые высокие или самые низкие оценки по одному (или более) переменным.

Однопараметрическая модель тестирования – логистическая модель, в которой функция успеха зависит только от разности ( – уровень подготовленности тестируемого, - трудность тестового задания).

Отвлекающий ответ (distractor) – вариант ответа на задание множественного выбора, похожий на правильный ответ, но таковым не являющийся.

Основа тестового задания (stem) – языковые и речевые единицы, а также цифро-буквенные обозначения, с которыми тестируемый должен проделать мыслительную или речевую операцию, заданную тестовой ситуацией и сформулированную в инструкции.

Оценивание суммативное (summative evaluation) – оценивание, используемое для принятия решений о выставлении той или иной оценки учащемуся в конце учебной деятельности или определения готовности к продвижению (на основе такого оценивания разрабатываются суждения об общем уровне успешности учащихся).

Оценивание формативное (formative evaluation) – вид оценивания, созданный для помощи учебному процессу, путем обеспечения обучаемого информацией, которая может быть использована для определения сильных и слабых мест.

П

Параллельные варианты теста – варианты теста с примерно одинаковыми статистическими характеристиками.

План педагогического теста (технологическая матрица) – таблица, в которой каждое тестовое задание соотносится с определенным элементом содержания учебной дисциплины, видом знаний или умений.

Пользователь теста - юридическое или физическое лицо, использующее тест или результаты тестирования для оценки уровня подготовленности испытуемых в определенной области знаний.

Показатель – обобщенная количественная характеристика объекта исследования, выраженная в числовой форме.

Подсчет баллов целостный (holistic scoring) - процедура оценивания результатов тестирования для тестов со свободно-конструируемым ответом, обеспечивающая одно общее суждение об успешности выполнения теста.

Последовательное тестирование – педагогическое тестирование, при котором тестовые задания с известными характеристиками последовательно предъявляются тестируемому, уровень подготовленности которого оценивается после каждого ответа с возрастающей точностью.

Претест (рretest, pilot testing) — педагогический тест, подготовленный в соответствии со спецификацией, для сбора статистических характеристик тестовых заданий и теста в целом, но не прошедший апробацию.

Процентиль (percentile)  – сотая часть условной шкалы, дробящей распределение на сто равных частей, и используемая для ранжирования тестируемых по результатам теста.

Р

Разрешающая способность теста – длина промежутка на шкале уровня подготовленности тестируемых, соответствующая изменению первичного балла тестируемого на единицу.

Рандомизация - процесс перемешивания объектов, в результате которого они располагается в случайном порядке.

Ранг (rank) - номер наблюдения в вариационном ряде.

Размах (range) - разность между наибольшим и наименьшим наблюдаемым значением количественного показателя.

Ранжир - упорядоченный по некоторому основанию ряд.

Рейтинг (rating) - индивидуальный числовой показатель оценки качества или свойства объекта, используемый при упорядочивании или классификации.

Рейтер — лицо (компьютеризированная процедура), определяющее результат тестирования в баллах исходя из правильности ответов тестируемого за каждое задание теста.

Регрессии уравнение (regression equation) — формула, вида Y = aх + b, используемая для оценки ожидаемого значения критерия, учитывающая значение одного или более наблюдаемых переменных как прогностических показателей.

Репликация - повторение исследования с целью определения степени согласованности результатов.

С

Ситуативные переменные педагогического тестирования – совокупность случайных факторов, влияющих на результат тестирования.

Сложносоставной балл (composite score) — балл, являющийся комбинацией двух или более баллов, полученной в соответствии с определенным правилом.

Смещение или систематическая ошибка оценивания (bias of estimator) – разница между ожидаемым значением статистики и истинным значением параметра генеральной совокупности, который эта статистика оценивает.

Сопоставимость — необходимое условие для сравнения статистических показателей и их анализа, требующее единства методологии расчёта показателей, единиц измерения, полноты охвата наблюдением исследуемого явления и других условий сравнимости.

Стандартное отклонение (standard deviation) — статистика показывающая, что количество вариаций в наборе тестовых баллов, выражается в тех же единицах, что и сами оценки, и рассматриваемая при этом как типичное расстояние между индивидуальным баллом тестируемого и средним.

Стандартная ошибка оценивания (standard error of estimate) — статистика, демонстрирующая степень, с которой оценка количественных тенденций меняется в выборках из одной и той же популяции.

Стандартная ошибка измерения ( standard error of measurement) — статистика, показывающая несостоятельность тестовых баллов, вызванных такими факторами, как угадывание ответов, особенности некоторых тестовых заданий, включенных в тест, лояльность или строгость в оценивании результата ( в терминах статистики стандартная ошибка измерения суть величина, которая показывает стандартное отклонение различий между наблюдаемыми и истинными баллами) .

Стандарт — нормативно-технический документ, устанавливающий комплекс норм, правил, требований к объектам стандартизации, обязательный для исполнения в определенных областях деятельности, разработанный в установленном порядке и утвержденный компетентным органом.

Стандарт организации – документ по стандартизации, утверждаемый юридическим лицом для совершенствования производства, обеспечения качества продукции, работ, оказания услуг.

Стандарт образования – диагностическое описание минимальных обязательных требований к отдельным сторонам образования, удовлетворяющее следующим условиям:

-  применимость к определенному образовательному феномену,

-  выполнение в диагностических показателях качества данного феномена,

-  ориентированность на объективные методы контроля его качества.

Стандартизация - деятельность по разработке (ведению), утверждению, изменению (актуализации), отмене, опубликованию и применению документов по стандартизации и иная деятельность, направленная на достижение упорядоченности в отношении объектов стандартизации;

Стандартизация теста  (test standardization) – процедура получения распределения индивидуальных баллов по тесту для нормативной группы испытуемых, позволяющая сопоставлять результаты у разных групп тестируемых.

Стандартизированная нормативная выборка – группа тестируемых, включающая представителей наиболее значимых страт генеральной совокупности.

Спецификация теста – документ, содержащий информацию о целях, плане, структуре теста, особенностях включенных тестовых заданий, правилах его администрирования и обработки результатов, общем сценарии тестирования

Субтест (subtest) – часть теста, состоящая из ограниченного числа тестовых заданий, допускающая независимую обработку результатов с целью решения частных задач тестирования.

Т

Тест педагогический (educational test) – система, специально подобранных, расположенных в порядке возрастания трудности тестовых заданий специфической формы, предназначенная для количественной оценки академических достижений школьников в одной или нескольких областях.

Тест педагогический стандартизированный (standardized educational test) – педагогический тест, имеющий спецификацию, тестовые характеристики, стабильно подтвержденные на нескольких репрезентативных выборках тестируемых, и являющий собой единство стандартных методов конструирования, администрирования, обработки, интерпретации и оценки результата.

Тест педагогический локально-стандартизированный (teacher-made test) – педагогический тест, апробируемый на ограниченном контингенте испытуемых (класс, параллель) и менее строгий по статистическим показателям качества, чем тест стандартизированный.

Тест гетерогенный (heterogeneuse test) – тест, позволяющий оценить уровень подготовленности тестируемого по нескольким смежным учебным дисциплинам.

Тест гомогенный (homogeneuse test) – тест, позволяющий оценить уровень подготовленности тестируемого по одной учебной дисциплине.

Тест критериально-ориентированный тест (CRT) – тест, цель которого выявить знания тестируемого в соответствии с учебной программой и оценить результаты тестирования относительно некоторого критерия.

Тест нормативно-ориентированный (NRT) – тест, цель которого сравнить академические достижения тестируемых друг с другом или дать оценку этим достижениям относительно тестовой нормы.

Тест мощности (power test) – педагогический тест, включающий тестовые задания, расположенные в порядке возрастания трудности, и не предполагающий жестких ограничений по времени.

Тест скорости (speed test) - тест, включающий задания примерно равной трудности, результат выполнения которого определяется количеством выполненных заданий за определенное время.

Тест идентификации (indification test) – тест, включающий вместо словесных ответов схемы, графики, диаграммы, чертежи, в котором испытуемому необходимо в соответствии с условием задания распознать (идентифицировать) изображение.

Тест полиморфный – педагогический тест, содержащий тестовые задания различных типов.

Тест мономорфный – педагогический тест, содержащий задания одного типа.

Тест вступительный (placement test) – проводимый с целью определения уровня обученности для распределения тестируемых по результатам теста в соответствующие группы.

Тест по аудированию (listening test) – коммуникативно-речевой тест, предназначенный для проверки орфоэпических, просодических, лексических и грамматических навыков тестируемого, уровня его понимания речевого сообщения при слуховом восприятии.

Тест тренировочный, репетиционный (mocktest) – педагогический тест, проверяющий степень подготовленности обучающихся к решающему (экзаменационному, итоговому) тестированию.

Тест прогностический – тест, определяющий успех или неуспех тестируемого в будущем.

Тестирующий (tester) – специалист, непосредственно проводящий тестирование, имеющий соответствующее квалификационное удостоверение.

Тестирование абсолютное – тестирование, предназначенное для оценивания уровня подготовки каждого обучающегося в конкретной области знаний.

Тестирование относительное – педагогическое тестирование, предназначенное для сопоставления уровня подготовки школьников относительно друг друга или относительно тестовых норм.

Тестовая батарея (test battery) – несколько субтестов, объединенных единой целью использования и предназначенных для оценки различных сторон академических достижений тестируемого.

Тестовая искушенность – индивидуальный опыт тестируемого, приобретенный в ходе неоднократного выполнения педагогических тестов.

Тестовое задание (item) – минимальная составляющая единица педагогического теста в виде задания специфической формы, отвечающая требованиям технологичности, чистоты формы и предметного содержания и, кроме того, статистическим требованиям:

1) известной трудности; 2) дифференцирующей способностью (достаточной вариации тестовых баллов); 3) положительной корреляции баллов задания с баллами по всему тесту.

Тестовое задание множественного выбора (multiple-choise item) – тестовое задание с несколькими вариантами ответа, один (или более) из которых верный.

Тестовое задание дихотомическое – задание, выполнение которого оценивается альтернативно («1» - верно решенное задание, «0» - за нерешенное задание).

Тестовое задание политомическое – тестовое задание, выполнение которого допускает несколько категорий ответа, каждая из которых оценивается по-разному.

Тестовое задание на установление правильной последовательности (sequences item) – задание, при выполнении которого необходимо установить правильную последовательность действий, операций, событий.

Тестовое задание на установление соответствия (matching item) - задание, при выполнении которого необходимо установить соотношение между элементами двух или более множеств.

Тестовое задание со свободно конструируемым (кратким или полным) ответом (free-response item, essay item) – тестовое задание без указания возможных вариантов ответа, требующее самостоятельного формулирования ответа.

Тестовое задание в виде логического соотношения – задание, при выполнении которого предполагается установить логическую связь между понятиями.

Теория моделирования и параметризации педагогических тестов (Item Response Theory) — теория тестирования, ориентированная на математические модели, параметрами которых (подлежащими определению), служат различные характеристики как тестируемых, так и самого теста (аналог данной теории – математическая теория измерения латентных качеств личности – Latent Trait Theory)

Точность измерения (рrecision) — ширина интервала, попадание в который данной величины может быть оценено с любой заданной вероятностью.

Трудность тестового задания (item difficulty) – основная количественная характеристика тестового задания, определяемая долей тестируемых, ответивших правильно на тестовое задание.

У

Учебный сегмент (domain) — определенная совокупность знаний, умений, навыков, являющихся частью содержания учебного предмета.

Х

Характеристическая функция заданного уровня подготовленности испытуемых  ­ функция характеристик заданий теста, полученная из функции успеха для тестового задания при фиксированном значении заданного уровня подготовленности испытуемых.

Характеристическая функция заданных параметров тестовых заданий ­ функция одного переменного уровня подготовленности участников тестирования, полученная из функции успеха для тестового задания при фиксированных значениях характеристик заданий.

Ш

Шкала (scale) – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную систему действительных чисел.

Шкалирование (scaling) – метод, связанный с выставлением каждому тестируемому тестового балла по единой шкале, вне зависимости от группы и варианта теста (преобразование первичных баллов в шкалированные).

Шкала процентная ( percentage mastery scale)– порядковая шкала, на которой тестовый балл тестируемого прямопропорционален его первичному баллу.

Шкала номинативная  – это шкала, в которой не выражены количественные характеристики объектов, а учитывается только то свойство объектов, что они разные.

Шкала порядковая (ранговая) -­ шкала, позволяющая ранжировать объекты (присваивать им ранги) по какому-либо признаку.

Шкала интервальная – это шкала, классифицирующая по принципу «больше - меньше» на определенное количество единиц.

Шкала отношений - шкала, классифицирующая по принципу «больше - меньше» в определенное количество раз

Шкала нормативная (normative scale) — шкала, которая определяется в терминах результативности нормативной группы (во многих случаях, шкала определяется значениями специфических величин - средних и стандартного отклонения шкалированных баллов нормативной группы)

Шкала нормализованных процентилей - порядковая шкала, тестовый балл по которой соответствует квантилям нормального распределения, в частности, квантилям стандартной нормальной переменной с нулевым математическим ожиданием и единичной дисперсией.

Шкала первичных процентилей – порядковая шкала, тестовый балл испытуемого по которой определяется соответствующим квантилю эмпирического распределения частот первичных баллов участников тестирования.

Э

Эталонный (якорный) тест – тест небольшой длины, служащий для выравнивания шкалы (вариантов теста)

Я

Якорные тестовые задания (anchor items) – тестовые задания, общие для всех или нескольких вариантов теста.