, Тягунова культуры адаптивного тестирования. – M.: Национальный институт бизнеса, 2003. – 370c (стр. 10 )

Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

1-ая комбинация

1-ый пример.

Данная комбинация соответствует общепринятой закрытой форме задания с одним правильным выводом. Для формирования истинного высказывания тестируемому достаточно пометить щелчком левой кнопки мыши окошечко рядом с правильным вариантом заключения. При разработке тестового задания с выбором одного или нескольких правильных следствий следует помнить, что: задания с двумя и более правильными заключениями целесообразно применять в процессе входного контроля для проверки исходного уровня обученности объектов. Главное достоинство в этом случае состоит в быстрой классификации тестируемых.

Для противодействия попытке угадывания тестируемым правильного вывода число строк в представляемой тестовой ситуации рекомендуется выбирать равным 5 или 6. Дальнейшее увеличение числа вариантов приводит к возрастанию громоздкости задания и затрудняет его четкое расположение на экране дисплея. Для снижения вероятности угадывания правильного заключения следует конструировать ЭФТК таким образом, чтобы испытуемый выбирал два или три правильных заключения из пяти (или шести) предложенных. Эти задания применяются для проверки классификационных или актуальных учебных достижений.

2–й пример.

3–й пример.

Повышение эффективности компьютерного тестирования и уменьшение вероятности угадывания испытуемыми правильных заключений в предъявляемых ПДТЗ достигается за счет применения конструктивно-выборочной формы представления суждений, когда тестируемый определяет свой вывод из предлагаемых элементов (символов, графических объектов), являющихся допустимыми содержательными единицами. Для выполнения такого задания индивид должен «перетащить» из верхней части поля экрана дисплея при помощи мыши элементы, входящие в структуру (например формулу), обрамленную в рамку из пунктирной линии, на соответствующие места, обозначенные кружками. Задания на конструирование правильного заключения являются традиционными для математических и естественных наук. Обычно ПДТЗ этого вида ставятся как требования на построение из заданных в условиях элементов с помощью электронной мыши некоторой геометрической фигуры, схемы или выражения. Во всяком ПДТЗ на конструирование условия задания, представленные на экране дисплея, должны обязательно содержать элементы формирования однозначного заключения.

НЕ нашли? Не то? Что вы ищете?

2-ая комбинация

1 – й пример.

В данной форме задания «обязательными» являются элементы: «сегодня», «пасмурно», «на», «небе», «тучки», «,». Порядок есть правильная последовательность слов (наличие в строке «лишнего» слова нарушает порядок). «Лишние» элементы – это слова, искажающие смысл истинного высказывания – «нет», «ни».

Задание такой формы и содержания может быть использовано при проверке общего понимания смысла текста на русском языке иностранцами. В программных средах реализация заключения тестируемого предполагает пометку (двойное нажатие кнопкой мыши на изображении) всех «лишних» элементов с последующей сменой их окраски или исчезновения.

2-ой пример.

3-ая комбинация

В задании важна последовательность операций вычеркивания. Это и есть содержание метода, следовательно, и смысл ПДТЗ. В результате выполнения данного задания тестируемый должен не только отметить составные числа, но и показать истинный порядок их вычеркивания. В программной среде это может быть реализовано путем последовательной пометки элементов задания с последующим их высвечиванием в контрольной строке.

4-ая комбинация

Данная комбинация соответствует истинному высказыванию.

5-ая комбинация

Соответствием (отношением) между множествами А и В называется тройка Г = (A,B,C), в которой A,B – произвольные множества, а является подмножеством прямого произведения А × В. В тестологии получил распространение графический способ задания соответствий, как наиболее наглядный. Графически отношения между множествами представляются с помощью рисунка, на котором все элементы из области отправления aiA изображаются в левой части экрана, элементы bj В – в правой части экрана, а каждая пара кортежа < аj, bj >С – цифрой внутри соответствующего элемента bj.

Соответствие Г = (A,B,C) называется биективным (взаимно-однозначным), если оно обладает свойствами функциональности, инъективности, определенности и сюръективности. Пример биективного соответствия приведен ниже.

В данном задании частичный порядок обусловлен разбиением элементов на две группы. «Лишние» элементы отсутствуют. Тестируемый должен установить истинные отношения между элементами первой и второй группы. В ACT респондент щелкает левой кнопкой мыши на кружке элемента из помеченной группы, затем – на кружке соответствующего элемента другой группы (круг меняет цвет и автоматически высвечивается номер его пары). Таким образом помечаются все пары. Обязательным условием является возможность автоматической перегруппировки множеств до перехода к следующему заданию.

Предложенная комбинация соответствует общепринятой форме задания на установление соответствия, когда количество элементов в обеих группах совпадает, т. е. отсутствуют элементы, не имеющие своей пары. Здесь условия ПДТЗ – два множества, между которыми необходимо установить соответствие; объект – соответствия функций и точек минимума; характеристика – отношения между парами элементов множеств; требование – необходимость однозначного установления этих отношений.

5-ая комбинация

Шестая комбинация соответствует общепринятой форме задания на установление правильной последовательности.

1-й пример.

Задание, в котором представлены все основные элементы, отсутствуют «лишние» и не определен порядок, может быть реализовано следующим образом:

Эта свернутая тестовая ситуация, когда путь к сущности ЭФТК идет от наглядного представления его содержания. Для определения порядка в данной форме тестового задания необходимо перетащить символы, расположенные слева от окна рисунка, на соответствующие места, отмеченные кружками. В среде ACT эта операция осуществляется следующим образом: испытуемый устанавливает указатель мыши на символ, нажимает левую кнопку мыши, перемещает указатель на соответствующий кружок и поднимает левую кнопку.

2-й пример.

Для формирования истинного суждения тестируемый в среде ACT последовательно, по предполагаемому им порядку, щелкает левой кнопкой мыши по сигнальному кружку элемента. При этом меняется цвет кружка и автоматически проставляется номер по порядку щелчка. После пометки всех элементов существует возможность перестановки посылок в заданном тестируемым порядке. Объект имеет возможность изменить выбранную им последовательность до ввода в программу заключения и перехода к следующему заданию.

7-ая комбинация

Заметим, что данное ПДТЗ не несет проблемной ситуации, так как испытуемый не ставится заданием в новое условие деятельности. Другой пример.

Испытуемому достаточно ввести недостающий элемент. Такая форма задания предполагает текстовое содержание недостающих «обязательных» элементов.

8-ая комбинация

Испытуемый, выполняя задание, должен определить недостающий «обязательный» элемент и его место расположение. В результате правильной будет фраза:

George Washington was a president of USA; he was president since 1980 to 1982.

Данная комбинация соответствует классическому варианту открытой формы тестового утверждения. Множество «обязательных» элементов (слов в утверждении) представлено не полностью. Так как слова в предложении установлены в правильном порядке, а месторасположение недостающего элемента не указано, то можно говорить о том, что порядок слов в предложении задан частично. «Лишние» элементы отсутствуют.

10-ая комбинация

Объект, выполняя данное задание, должен: во-первых, выбрать из предложенного списка подходящее слово, во-вторых, ввести его, изменяя в соответствии с грамматическими правилами. Можно сказать, что данная форма является комбинированной и содержит элементы открытой и закрытой форм тестового задания.

Повышение качества дидактического оценивания достигается применением ЭФТК открытой формы. Испытуемые должны самостоятельно вписать в установленном месте правильный вывод, который превращает тестовое утверждение в истинное суждение. Заключение чаще всего состоит из одного слова и располагается ближе к концу ПДТЗ.

15-ая комбинация

Проблемно – эвристические ПДТЗ включают обязательное выполнение деятельности, при которой устраняются противоречия между содержанием задания и разрешением тестовой ситуации испытуемым. Проблемная тестовая ситуация предполагает выяснение того, что неизвестно и должно быть раскрыто, а также действие, направленное на выявление сути неизвестного. Такие задания требуют от испытуемого критического мышления для формирования прагматически корректного вывода и всегда формулируются в виде неразрешенного явного противоречия. Например:

В данной форме задания объекту не представлены ни «обязательные» элементы, ни их порядок, также не даны лишние элементы. Тестируемый должен ввести с клавиатуры «not to say a single word», т. е. определить слова, входящие в корректное суждение и их порядок.

Данной комбинации также соответствует форма задания «эссе».

Категории содержания и формы (соответствие формы содержанию и возможность многообразия структур при одном и том же содержании для представления конкретного ПДТЗ), позволяют обоснованно представить методологическое следствие о зависимости различающей способности ПДТЗ от их смысла при вариантности строений. Так, например, развивающие ЭФТК отличаются тем, что в них тестируемому предлагается найти новый путь для формирования вывода на ПДТЗ. Например: .

Действуя по индукции, индивид может составить на бумаге следующую таблицу:

Сопоставляя между собой результаты сложения чисел, тестируемый способен ясно осознать смысл предположения и записать результат:

ЧЕТНОЕ ЧИСЛО, БОЛЬШЕЕ, ЧЕМ 4, ПРЕДСТАВИМО В ВИДЕ СУММЫ ДВУХ ПРОСТЫХ НЕЧЕТНЫХ ЧИСЕЛ.

Как видно, в ситуации развивающих ПДТЗ респонднент вынужден формировать истинные заключения, когда оказываются недостаточными уже имеющиеся у него дедуктивные знания, где не срабатывают автоматизмы приобретенных навыков, но необходим активный поиск нового подхода для разрешения тестовой ситуации. Это предполагает мобилизацию всех психических ресурсов отражения накопленного опыта, активного поиска ориентировки и интуиции объекта нечисловой природы.

Авторами также предлагается многоуровневая классификация рациональных форм ЭФТК, учитывающая современные возможности программных средств, обеспечивающие возможность отображения заданий, восприятия, анализа и визуализации заключения испытуемого. Данная классификация, основанная на анализе внешнего отображения диалога испытуемого и компьютера, определяет требования к структуре ЭФТК, технологии тестирования и может служить руководством для разработчиков интерактивных систем компьютерного тестирования. Рассмотрим формы тестовых заданий с точки зрения их реализации в компьютерном варианте.

Подытожим для ясности результаты данного раздела. Разработчик ЭФТК из ограниченного разнообразия тестовых форм совершает редуцирование, то есть выбирает ту структуру ПДТЗ, которая наиболее адекватно отражает содержание конкретного фрагмента учебного материала. Ясно, что наблюдение тестируемым сложной и необычайной формы несет для него высокую степень неопределенности, требует необоснованных затрат времени. Отсюда появляется потребность ограничения разнообразия строений ЭФТК на основе применения стандартов. Особую важность приобретает при этом наглядное выражение тестовых ситуаций. ЭФТК будет значительно короче и яснее выглядеть, если вместо описательной формы оно будет представлено в подлинной. Более того, при формировании заключения на тестовую ситуацию в описательной форме тестируемому приходится находить соответствующую этой ситуации вспомогательную модель. Наглядные знаковые модели позволяют, во-первых, конкретизировать исходные условия, придать тестовому суждению явный и ясный смысл, а во-вторых, представить условие задачи в легко обозримой узнаваемой для тестируемого форме. Единство духовной и материальной компонент ПДТЗ в сочетании со стандартизированным представлением последних образуют сущность проектирования ЭФТК, являющихся единицами дидактической оценки достижений. Подчеркнем, что цель конструирования профессиональных ЭФТК двоякая – материально фиксировать содержание задания, передавать понимание его смысла и значения тестируемым.

Исходя из необходимости сделать содержания ПДТЗ и процедуру формирования вывода понятными для тестируемых, представляется обоснованным создание инструкции по выполнению действий с целью разрешения тестовых ситуаций, представленных различными формами. Инструкция должна содержать указания на то, что испытуемый должен предпринять в конкретной ситуации, каким образом выполнить требования задания, где и как отметить заключения и как его ввести в компьютер. Респондент должен знать, что до тех пор, пока он не нажал клавишу готовности ввода заключений, у него есть возможность либо изменить ранее введенное заключение или пропустить данное задания и перейти к следующему. Все пропущенные тестируемым ПДТЗ будут предъявлены ему тестирующей программой в конце сеанса проверок (например, в среде ACT). Для тренировки испытуемых работе с различными формами ЭФТК, целесообразно предоставить им возможность проверить усвоение положений инструкции на 8-10 примерах (по 2 задания различной формы, отличающихся способом ввода заключений) непосредственно перед началом сеанса компьютерного тестирования.

Располагая ПДТЗ на экране дисплея, необходимо помнить, что:

· тестовое утверждение должно полностью отображаться на экране дисплея;

· место для ввода заключения должно выделяться однообразно для каждой их форм;

· размер шрифта текста и полиграфическое оформление должны соответствовать рекомендациям санитарных служб;

· посылки тестовой ситуации желательно выделять шрифтом.

Каждое ПДТЗ включает в себя:

· инструкцию по выполнению требований задания (в явном виде – в тексте задания, или неявно – как следствие конкретной формы задания);

· посылки задания (содержательную часть) и требования;

Каждый ЭФТК характеризуется:

· логичностью и содержательностью суждения для испытуемого с фиксированной степенью обученности;

· конкретной формой представления содержания;

· уникальным идентификатором (или авторским именем) задания;

· мерой трудности проблемной тестовой ситуации;

· средним временем формирования вывода испытуемым на требование тестового задания;

· ограничением по времени на формирование следствия (при необходимости);

· краткостью, наглядностью и ясностью.

Культура формирования ПДТЗ предполагает:

· возможность формулировки тестируемым однозначного заключения;

· анализ содержания тестового утверждения в строгом соответствии с правилами его проектирования;

· воспроизведение тестовой ситуации с учетом методологических правил и требований стандарта с целью корректного представления ЭФТК и узнаваемости формы любого задания испытуемым;

· максимальную степень приближения смысла и значения задания к содержанию исходного фрагмента учебного материала;

· соответствие каждого задания требованиям эстетических и эргономических показателей, когда его элементы не содержат ничего лишнего, а подчеркивают ясность и четкость смысла тестового утверждения;

· учет разработчиками всех возможных форм, которые им предоставляются инструментальными средствами;

· проникновение разработчика, эксперта и тестируемого в сущность и значимость требований задания.

Содержание ЭФТК должно быть ясным и кратким. Количество слов в задании не должно превышать 10. Среднее время, затрачиваемое испытуемым на формирование и ввод заключения на требование одного ПДТЗ, должно составлять 1,5 минуты.

Рассматривая структуры представления свернутых кратких тестовых суждений как феномены культуры, можно утверждать, что качественная определенность их строений отображает относительную устойчивость форм на определенном этапе развития инструментальных средств. Существенным здесь является то, что форма всегда выступает как единство связи элементов содержания ПДТЗ и восприятия его внешнего строения тестируемым с целью установления операций, выполняемых им в процессе формирования концептов и заключения. В основе этой целостности лежат четыре подхода: материальный, структурный, функциональный и культурологический. Материальный подход определят возможности инструментальных средств отображать тестовые ситуации из различных областей знаний в конкретных стандартизированных формах.

В свете структурного подхода качество выступает как категория описания совокупности относительно устойчивых связей, обеспечивающих целостность и узнаваемость той или иной формы выражения ЭФТК. Структура тестовой ситуации определяет способ размещения элементов ПДТЗ на экране дисплея и характеризует отношение между его посылками.

Функциональный подход устанавливает характер взаимодействия тестируемых с формой ПДТЗ, поясняет логику и последовательность операций, которые необходимо выполнить респонденту в процессе анализа содержания исходных посылок, коррекции собственных выводов (при необходимости), ввода заключений в тестирующую систему, пропуска недоступных (на данный момент времени) для формирования корректного вывода тестовых ситуаций и перехода к выполнению следующих ЭФТК. Культурологический подход к изучению форм тестовых ситуаций рассматривает эти три подхода как целостную характеристику ЭФТК. Дальнейшее развитие качественно новых форм представления ПДТЗ предполагает привлечение генетических методов, что имеет важное значение для развития тестологии и для создания перспективных программно-аппаратных средств, которые будут работать с новыми строениями тестовых утверждений.

Используемая форма тестового задания определяется содержанием фрагмента учебного материала. Форма T3 должна быть легко узнаваемой и не требовать дополнительных пояснений по способу ввода тестируемым заключения. Инструкции по вводу тестируемым заключения на требования ПДТЗ должны визуализироваться только при специальном вызове (нажатии одной или комбинации нескольких клавиш) и соответствовать отображаемой в данный момент времени на экране дисплея форме задания.

Элементы тестового задания могут содержать текст, формулы, графические изображения, мультимедийные компоненты. Аудиокомпоненты и видеофрагменты при визуализации тестового задания должны представляться в виде условного общепринятого и понятного тестируемому графического символа и активизироваться тестируемым (например, щелчком мыши). Количество активаций аудио и видеофрагментов может быть ограничено.

Обязательно соблюдение единого стиля оформления заданий, входящих в один тест. На экране во время предъявления заданий из теста не должно присутствовать никаких графических и мультимедийных элементов, не имеющих прямого отношения к пониманию содержания тестового задания.

Тестовые задания закрытой формы

Состоит из неполного тестового утверждения с одним ключевым элементом и множеством допустимых заключений, одно или несколько из которых являются правильными. Тестируемый определяет правильные заключения из данного множества. Рекомендуется предлагать пять или шесть вариантов заключений, из которых два или три являются правильными.

Недопустима ситуация, когда все перечисленные заключения являются либо правильными, либо неверными.

При компьютерном тестировании отметка верных заключений осуществляется тестируемым с помощью мыши.

Предлагается использовать два варианта представления на экране дисплея закрытой формы тестового суждения. Первый вариант (А) не предполагает обязательной фиксации взаимного расположения элементов множества допустимых вариантов заключений тестируемого. Во втором варианте (В) расположение элементов из множества допустимых значений фиксировано по условию тестового суждения.

Вариант А закрытого тестового задания

На месте ключевого элемента в содержании задания необходимо поставить прочерк или многоточие. При каждом предъявлении тестового задания порядок расположения элементов из множества допустимых заключений должен изменяться. Элементы группы не маркируются.

С левой стороны каждого элемента располагается графическое изображение логического идентификатора, состояние которого тестируемый изменяет при выборе корректного заключения. Пометка верных заключений осуществляется испытуемым с помощью мыши.

Допустимо использование двух вариантов заданий данного типа:

допускающих выбор только одного элемента из множества (одно правильное заключение)

позволяющих выбрать одновременно несколько элементов (несколько правильных заключений)

Вариант В закрытого тестового суждения

В ПДТЗ данного варианта взаимное расположение элементов из множества допустимых значений фиксировано по условию задания.

Индикация выбора одного или нескольких элементов из множества заключений может осуществляться изменением состояния логических идентификаторов:

а) допускающих выбор только одного элемента из множества допустимых заключений

б) позволяющих выбрать одновременно несколько элементов из множества допустимых заключений

Фиксация правильного вывода может осуществляться также путем изменения окраски отмеченных объектов:

Тестовые задания открытой формы

Требует сформулированного самим тестируемым заключения на требования ПДТЗ. Имеет вид неполного утверждения, в котором отсутствует один или несколько ключевых элементов. В качестве ключевых элементов могут быть: число, буква, слово или словосочетание. При формулировке задания на месте ключевого элемента, необходимо поставить прочерк или многоточие. Отсутствующий элемент (правильный вывод) в задании открытой формы вводит тестируемый, при этом вводимое заключение отображается на экране монитора на месте прочерка и/или в специальном поле, хорошо видимом испытуемым.

до ввода тестируемым заключения

после ввода тестируемым заключения

Россия подписала мир с Францией в Тильзите в... году.

Россия подписала мир с Францией в Тильзите в 1 807 году. |

В том случае, когда количество ключевых элементов более одного, а вводимые тестируемым значения отображаются не на месте их реального расположения, а во вспомогательном, специальном поле, необходимо исключить возможность неоднозначной трактовки действий тестируемого. Для этого следует маркировать место расположения ключевых элементов и соответствующих им полей ввода.

Требования к системе оценки правильности вводимых значений (результату заключения тестируемого на требования тестового задания) очень жёсткие, поскольку отклонения вывода от эталона (правильного варианта) фиксируются системой как неверные.

Тестовые задания на установление правильной последовательности

Состоит из однородных элементов некоторой группы и четкой формулировки критерия упорядочения этих элементов.

Допустимы два варианта компьютерной реализации задания на установление правильной последовательности. В варианте А не предполагается обязательной фиксации взаимного расположения элементов группы. Вариант В предполагает фиксированное условием ПДТЗ взаимное расположение элементов группы.

Вариант А

При каждом предъявлении тестового задания порядок расположения элементов группы должен изменяться. Элементы группы не маркируются, могут располагаться вертикально, горизонтально или хаотично в специальном поле, но обязательно полностью отображаться на экране монитора. При этом тестирующая программа должна иметь возможность расставить элементы в порядке, указанном тестируемым.

Для ввода заключения могут быть использованы следующие технологии:

а) последовательной пометки щелчком мыши каждого элемента, при этом у элемента автоматически визуализируется номер, соответствующий порядку пометки.

б) «подхватил и тащи» («drag and drop»), когда тестируемый щелкает мышью на каждый элемент и перемещает его в нужную позицию

до ввода тестируемым заключения

после ввода тестируемым заключения

Порядок смены времен года

Зима

Порядок смены времен года

Осень

Вариант В

Для ввода заключения используется технология последовательной пометки элементов группы щелчком мыши. Отображение действий тестируемого может выполняться следующими способами:

а) автоматической маркировкой последовательно помечаемых тестируемым элементов группы порядковым номером

б) последовательным соединением помечаемых тестируемым элементов группы линией

в) последовательным соединением линией и автоматической маркировкой порядковым номером помечаемых тестируемым элементов группы.

Тестовые задания на установление соответствия

Состоит из двух групп элементов и четкой формулировки критерия выбора соответствия между ними.

Соответствие устанавливается по принципу 1:1 (одному элементу первой группы соответствует только один элемент второй группы) или 1:M (одному элементу первой группы соответствует M элементов второй группы). Внутри каждой группы элементы должны быть однородными. Количество элементов во второй группе должно превышать количество элементов первой группы, но не более чем в 1,5 раза. Максимально допустимое количество элементов во второй группе не должно превышать 10. Количество элементов в первой группе должно быть не менее двух.

Допустимы три варианта компьютерной реализации задания на установление соответствия:

· содержание ПДТЗ не предполагает обязательной фиксации взаимного расположения элементов обеих групп (вариант А);

· взаимное расположение элементов одной из групп фиксировано по условию ПДТЗ (вариант В);

· взаимное расположение элементов обеих групп фиксировано по условию ПДТЗ (вариант С).

Вариант А

При каждом предъявлении тестового задания порядок расположения элементов в обеих групп должен изменяться. Элементы первой группы маркируются в порядке их представления. Маркировка элементов второй группы осуществляется тестирующей программой при определении тестируемым пар из двух приведенных множеств.

Вариант В

Для ввода заключения могут быть использованы технологии: а) «подхватил и тащи» («drag and drop»)

Тестируемый последовательно щелкает мышью на каждый элемент из одной группы и перемещает его в нужную позицию изображения другой группы.

б) последовательной пометки

Элементы первой группы маркируются. Маркировка второй группы осуществляется тестирующей программой при определении тестируемым пар из двух приведенных множеств элементов.

Задания на конструирование

Задание должно состоять из элементов некоторой группы и четкой формулировки критерия создания некоторого объекта (формулы, фразы, изображения и т. п.). Из элементов группы по технологии «подхватил и потащил» («drag and drop») формируется объект в соответствии с заданием. Предъявляемая тестируемому группа исходных данных должна также содержать элементы, не входящие в объект.

При предъявлении задания на экране дисплея должны быть четко выделены две области: «поле конструирования» и «поле исходных элементов»

В процессе конструирования ЭФТК исходное суждение должно приобрести конкретную знаковую форму, получить смысл и значение. Форма выступает здесь как фактор внутренней организации контента. Категории содержания и формы выражают разные, но связанные аспекты одного и того же ПДТЗ. Корректно созданный ЭФТК характеризуется единством содержания и конкретной формы – заданным строением тестовых посылок и ясного требования. Поиск рационального способа существования и выражения содержания ПДТЗ, позволяющего в одном суждении сконцентрировать смысл (или значение и требование на заключение задания, является предметом тестологии.

ЭФТК определяется «языком» представления некоторой проблемной тестовой ситуации, требующей от респондента адекватной деятельности для ее разрешения. Это затруднение основано на необходимости выполнения индивидом последовательности общих положений (теорем, правил, фактов, законов, вычислений, построений и т. п.), применяя которые к требованиям тестовых заданий или к их концептам (промежуточным результатам), он получает то, что необходимо выполнить в ЭФТК, т. е. заключение. При этом любая тестовая ситуация, облеченная в конкретную форму, предполагает наличие некоторых знаний, умений или навыков тестируемого из заданной предметной области, когда одно или несколько неизвестных следует найти или требуется установить соответствие, или правильную последовательность между посылками задания.

В заключении еще раз следует отметить, что формы ПДТЗ – это не просто описание взаимосвязей и отношений между посылкам, а скорее каркасы представления тестовых ситуаций, реализующих на компьютерах проверки таких компонентов степени обученности как знания, интеллектуальные умения или практические навыки тестируемых. Так, например, ЭФТК закрытой формы ориентированы на оценку качества знаний, в то время как тестовые утверждения открытого типа – на анализ качества интеллектуальных умений. Рациональное сочетание различных строений ПДТЗ при формировании КФТ – важная составляющая в процессе композиции ПДТ с заданной валидностью.

Идеализированное конструктивное представление ЭФТК обеспечивает стандарт, если он содержит ясное изложение условий и операций, при которых и с помощью которых должны быть разрешены вопросы, относящиеся к проектированию форм тестовых ситуаций. Стандарт может быть совершенным только относительно современного состояния наших знаний о возможностях· инструментальных средств КТ. Мы не вправе рассчитывать на то, что они вызовут полезные дискуссии, которые приведут к их быстрому совершенствованию.

VI. ФОРМИРОВАНИЕ БТЗ

Культура разработки программно-дидактических тестовых материалов (ЭФТК, KCT3 и КФТ) характеризует уровень развития тестологии, выраженный в формах организации и деятельности проектантов БТЗ, а также в создаваемых ими социальных и духовных ценностях. В современных исследованиях по тестологии обнаруживается некоторое разнообразие определений теста. Для иллюстрации сказанного приведем некоторые примеры.

«Тест – это стандартизированные задания, по результатам выполнения которых судят о знаниях, умениях и навыках испытуемого» (Советский энциклопедический словарь, 1987).

«Тест – это объективное и стандартизированное измерение, легко поддающееся количественной оценке, статистической обработке и сравнительному анализу»;

«Тест – это система знаний, позволяющих измерить уровень определенного свойства личности».

«Тест – это специфический инструмент, состоящий из совокупности заданий или вопросов и проводимый в стандартных условиях, позволяющий выявить уровень владения какими-либо видами деятельности».

«Тест состоит из заданий, правил их применения, оценок за выполнение каждого задания и рекомендаций по интерпретации тестовых результатов» (B. C. Аванесов).

«Педагогический тест – это комплекс заданий, измеряющих уровень учебных достижений, обученности, прогресс в учебной деятельности, эффективность учебного процесса» (T. M. Балыхина, 2000).

«Тест – это инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизированной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качеств и свойств личности, измерение которых возможно в процессе систематического обучения» (,2001).

«Дидактические тесты – метод (средство) проверки результатов обучения – представляет собой совокупность стандартизированных заданий по определенному материалу, устанавливающему степень усвоения его учащимися» (Основы открытого образования, т. I, 2002).

Рассмотренные дефиниции термина «тест» дают представление о взглядах авторов на это понятие. Смысловые оттенки, вносимые каждым новым определением, позволяют лучше понять сущность данного феномена, более полно осветить определенные стороны исследуемого явления. Такой подход к установлению понятий Д. Келли (1963) назвал конструктивным альтернатизмом. Однако ни одно из приведенных определений не может дать исчерпывающего представления о понятии «программно-дидактический тест».

Мы будем исходить из того, что дефиниция понятия (термина) «ПДТ» есть процесс фиксирования с помощью слов специфических признаков, отображаемых определяющие термины, смысл которых уже известен. Тогда определение термина «программно-дидактический тест» будет процессом придания ему смысла и значения, когда определяющие понятия несут новую информацию об определяемом термине. С этой точки зрения дадим реальное определение исследуемого понятия.

Программно-дидактический тест (КФТ – выборка) – это целостная система стандартизированных по форме программно-дидактических тестовых заданий определенного смысла и заданной меры трудности, ориентированная на конкретный результат, позволяющая с требуемой верностью и объективностью оценить степень обученности тестируемого путем обработки качества его заключений в течение ограниченного интервала времени.

Из этого определения видны специфические признаки КФТ:

· наличие в тесте ПДТЗ – свернутых кратких суждений – с заданными смыслами и известными значениями меры трудности;

· нацеленность теста на требуемый результат, определяемый спецификацией исходного учебного материала и композицией выборки;

· ориентация теста на спроектированную априорно компьютерную технологию проверок УУД объектов нечисловой природы;

· отработанная система анализа качества заключений тестируемых на требования ПДТЗ, позволяющая установить степень обученности индивида с заданными показателями качества.

Единство этих признаков и составляет основу генерации качественных выборок – КФТ – из KCT3. Если такая система ЭФТК отвечает требованиям стандартов по конструированию профессиональных компьютерных тестов, выполнена по правилам и записана в банк тестовых заданий, то она образует культурную систему программно-дидактических тестовых заданий (KCT3).

Термин «дидактический» говорит о том, что тесты используются для оценки (но не измерения, так как у нас нет эталона) степени обученности объекта/образа. Тем самым сужается область применения КФТ только оценкой знаний, интеллектуальных умений и практических навыков (уровень воспитания, развития и т. д. остаются за пределами анализа). Кроме того, речь идет о дидактических тестах, а не о медицинских, психологических, вычислительных и т. п. Термин «программно» означает специфический признак отличия ПДТ от тестов, представленных на бумажном носителе. Понятие «обработка» говорит о том, что данные о ходе тестовых испытаний подвергаются статистическому анализу. Ориентация на оценку УУД предполагает, что в рассматриваемом случае ПДТ включает в себя ограниченное количество стандартизированных заданий, по результатам выполнения которых судят о степени обученности целеустремленных объектов нечисловой природы.

По видам предполагается разделение тестов на гомогенные, гетерогенные, моноформные и полиформные. Гомогенный ПДТ – это система ЭФТК, позволяющая объективно установить УУД тестируемых по одной учебной дисциплине. Гомогенная культура создания ПДТ характеризуется тем, что при наличии в сфере КАТ различных подходов к технологии и организации тестовых испытаний большинство разработчиков проектируют компьютерные тесты достижений по конкретным областям знаний, соблюдают общезначимые нормы деятельности и методологические правила конструирования ПДТЗ, придерживаются одних и тех же стандартов и ценностей, признают незыблемость основных принципов дидактической компьютерной оценки.

Гетерогенный ПДТ – это система ПДТЗ для объективной оценки УУД индивидов по нескольким учебным дисциплинам. Фрагментированная (по Г. Алмонду) культура формирования гетерогенных КФТ отличается существованием среди тестологов различных представлений о содержании, нормах и ценностях таких тестов. Гетерогенные тесты могут применяться в процессе промежуточной аттестации учебных заведений с целью оценки уровня достижений тестируемых по фундаментальным наукам. Отсутствие единых правил конструирования подобного рода ПДТ, разногласие между представителями различных школ приводит к тому, что разработка профессиональных гетерогенных КФТ в настоящее время затруднена.

Моноформный ПДТ состоит из ЭФТК одной формы, а полиформный ПДТ – из ЭФТК двух и более форм. В настоящее время широкое распространение получили моноформные тесты. Современные компьютерные средства, например, версии инструментальной среды ACT, позволяют конструировать и использовать все существующие стандартизированные формы представления содержания ПДТЗ. Поэтому в дальнейшем изложении рассматриваются полиформные ПДТ, обеспечивающие адекватное отображение содержания различных фрагментов учебных дисциплин.

Тест всегда ориентирован на конкретный результат (отбор – трудные задания, отсев — легкие задания, классификация — задания разной меры трудности и т. п.), а качество заключений на требования ЭФТК, образующих данную выборку, – на применяемую в системе КАТ программу вычисления оценки. В зависимости от объема выборки, алгоритма тестирования и метода шкалирования результат установления латентного параметра обученности индивида может отображаться с различной степенью верности и объективности (доверия).

Время проведения тестовых испытаний – важный фактор, определяющий значения качественных показателей оценки УУД. При фиксированной степени обученности тестируемого коэффициент доверия к результату полученной оценки напрямую зависит от объема выборки, т. е. от продолжительности сеанса КАТ. В инструкции организации NEAB подчеркивается: «Единство требований к тестируемым не может быть осуществлено, если сама схема оценки может толковаться специалистами по-разному».

В исследуемой ситуации KCT3 представляет собой рабочую дидактическую модель, отражающую системное содержание учебной дисциплины, предназначенную для объективной проверки степени обученности тестируемых. Первым признаком валидного ПДТ является то, что он субъективно правилен, т. е. дидактически рационален. Совокупность ПДТЗ в выборке есть некая целостная пространственно-временная сущность. Целостность содержания КФТ является отправной точкой всех представлений о качественных показателях БТЗ. В этом смысле каждое ПДТЗ должно рассматриваться в своем единстве по принципу соразмерности с валидностью выборки – КФТ.

КФТ рассматривают как случайную выборку из конечной совокупности ЭФТК, хранящихся в KCT3. Эта выборка формируется тестирующей системой таким образом, что любой из хранящихся в БТЗ ЭФТК имеет известную вероятность быть представленным в ПДТ. Для корректного суждения о свойствах конечной совокупности ПДТЗ необходимо, чтобы КФТ достаточно точно отражала эти свойства, т. е. была репрезентативной.

Отличие характеристик, полученных путем обработки выборки, от тех, которые свойственны конкретной совокупности (валидной по содержанию и значимости исходному учебному материалу), может быть вызвано неопределенностями:

· типичности – отбором несвойственных для исходного набора спецификаций фрагментов учебного материала;

· представительности, когда в КФТ включены ЭФТК, недостаточно строго отвечающие значимости тестовых ситуаций из конкретного набора ПДТЗ.

ПДТ, формируемый из БТЗ, должен обладать целостностью относительно содержания учебной дисциплины, раздела или темы, которая предполагает взаимную связь и обусловленность составляющих выборку ЭФТК. В противном случае, т. е. если для проверки усвоения содержания учебной дисциплины предъявляются задания, не охватывающие содержание данного предмета, это не будет КФТ. ПДТ – не исчерпывается только суммой своих ПДТЗ, а, наоборот, каждое задание отражает в себе силу этой целостности, а их разумный набор включает в себя заранее обусловленные понятия и темы из разделов конкретной области знания. Следовательно, в целом (валидном) ПДТ задания воспринимаются, а заключения тестируемого на них оцениваются не такими и не так, какими и как они существуют порознь.

Культура формирования БТЗ заключается в том, что конечные наборы ПДТ представляют собой упорядоченные системные образования. Конечно, любое беспорядочное множество ПДТЗ можно систематизировать (хотя бы по разделам), но целостность БТЗ этим не достигается. Искусственно упорядоченные множества ЭФТК образуют абстрактные, а не реальные системы ПДТ. Если совокупность разнокачественных элементарных феноменов культуры в организации БТЗ есть лишь комбинация разнородных и плохо согласованных друг с другом ПДТЗ, собранных вместе более или менее случайно, то никакая систематизация их не образует закономерных внутренних связей, скрепляющих эти задания в целостные ПДТ, и не превратит этот набор в реальную КСТЗ. Только логически упорядоченные конструкции структурированных и специфицированных ЭФТК с определенной валидностью и установленной мерой трудности, в которых отдельные задания, входящие в состав генерируемых КФТ, логически взаимосвязаны, образуют культурные системы тестовых заданий.

В КСТЗ реализуется культурный принцип неразличимости части и целого. Парадигма «часть меньше целого» уступает в культурной форме или системе место парадигме «ПДТЗ репрезентует ПДТ или КСТЗ», когда валидность каждого ПДТ обусловлена аналогичными показателями ЭФТК. При этом культурные тестовые материалы включают в себя проблемные ситуации, отображающие статическую (знания) и динамическую (умения, навыки) компоненты учебного материала.

Неоднозначность содержания и форм тестовых заданий, разработанных различными проектантами по конкретной учебной дисциплине, очевидна. Но как бы много их не было, КСТЗ и КФТ дополняют друг друга, и, вместе с тем, эти тесты не могут отразить все богатство содержания оригинала. Оригинал (содержание предметной области знаний) не эквивалентен ни этим КФТ, ни их комментариям. Можно лишь стремиться к этой эквивалентности за счет вариации количества ЭФТК и применения различных форм заданий, никогда, однако, ее не достигая. Объединение ПДТЗ в КСТЗ не просто их заданная последовательность, а нечто большее, содержательное. Синтез ПДТЗ в целостные БТЗ и ПДТ предполагает представление в системно-структурных характеристиках последних основного содержания учебного материала, качество усвоения которого должно быть установлено в процессе тестовых испытаний.

Трудный ПДТ имеет вогнутую характеристическую кривую и может применяться для проведения отборочных проверок. Если КФТ содержит легкие задания, то он обладает выпуклой характеристической кривой и пригоден только для отсева тестируемых с недопустимо низкой степенью обученности. Для классификации поведения целеустремленных объектов в процессе компьютерного адаптивного тестирования применяется КФТ с заданиями различной меры трудности. Характеристическая кривая такого теста располагается между аналогичными зависимостями для легкого и трудного ПДТ (рис.1)

Учебные типовые ситуации должны выбираться по категориям трудности только с учетом результата предварительных тестовых проверок (на стадии планирования эксперимента). Кроме того, ПДТ валиден относительно своего содержания только в том случае, когда он формируется с учетом заданного результата тестовых испытаний. Содержательная валидность теста проверяется экспертами на этапе сертификации КСТЗ.

Рис.1. Характеристические кривые ПДТ

Зависимости распределения реальных баллов тестируемого от характеристической кривой теста приведены ниже, где представлены распределения частот баллов в зависимости от характеристик теста (предполагается, что способности тестируемых в группе распределены по нормальному закону).

Основные этапы формирования KCT3 отражаются в перечислении требований, на которые необходимо обратить особое внимание при описании атрибутов ПДТ. Сюда относятся:

· наименование специальности, название учебной дисциплины и объем часов по ней;

· выбор результата проверки;

· постановка целей;

· указание фамилий, имени, отчества коллектива разработчиков, времени создания и сертификации ПДТ;

· отбор и структурирование содержания учебной дисциплины;

· составление спецификации KCT3;

· выбор структуры банка ПДТЗ;

· проведение порядковой нумерации ЭФТК;

· декомпозиция ЭФТК по мерам трудности;

· указание количества форм ЭФТК в банке данных;

· установление среднего времени выполнения каждого задания;

· подготовка ПДТЗ и заключений на них для ввода в банк тестовых заданий;

· проведение экспертизы KCT3 на полноту и валидность;

· установление числа заданий в одном тесте, а также показателей верности и объективности;

· разработка инструкций для испытуемых, преподавателей и администратора тестирующей системы;

· установление соотношения ПДТЗ по разделам учебной дисциплины;

· ввод ЭФТК в банк тестовых заданий;

· корректировка ПДТЗ, эстетических и эргономических характеристик заданий;

· выбор алгоритма шкалирования;

· описание технологии и организации тестовых проверок;

· проведение предварительного компьютерного тестирования, сбор эмпирических данных по результатам репрезентативного отбора тестируемых, констатация показателей качества классификации и аттестации;

· анализ результатов предварительного компьютерного тестирования, модификация ЭФТК и процедуры оценки;

· формирование банка ПДТЗ по конкретной учебной дисциплине;

· распечатка содержания KCT3, утверждение состава и содержания БТЗ компетентным лицом;

· подготовка протокола испытаний и инструкций для участников процесса тестирования;

· сертификация KCT3 и установка ее на сервер вычислительной сети.

Характер проектирования KCT3 таков, что прежде чем формировать тест из KCT3, надо иметь некоторый результат, т. е. тот итог, который должен быть достигнут в процессе испытаний. В частности, если результатом выбора ПДТ является утверждение относительно исходного балла – классификации объектов, то правильно отобранный программно-дидактический тест должен содержать ЭФТК разной меры трудности и различной различающей способности. Такой ПДТ способен разделить поведение телеологических объектов на классы по уровню их достижений. Например: КФТ «Управление персоналом» – классификация.

Во втором случае, когда речь идет о выборе ПДТ, ориентированного на результат оценки реального УУД испытуемых, тест должен содержать задания, категория трудности которых строго соответствует исходному уровню обученности испытуемых внутри каждого класса (образа).

Например: KCT3 «Управление персоналом» – оценка реальной степени обученности.

П16: Наименование KCT3 должно представлять собой предложение, отражающее ожидаемый результат.

Отсюда следует, что при создании (или выборе наименования) KCT3 необходимо:

· сформировать основной результат;

· желаемый результат облечь в предложение.

Существующие подходы к формированию тестов разделяются на две группы. Сторонники первого подхода используют «пороговые тесты», включающие в себя тестовые задания, мера трудности которых составляет 50%. Такие тесты непосильны по степени трудности для слабо подготовленных испытуемых и, следовательно, могут служить для оценки уровня достижений только хорошо обученных индивидов. Сторонники второго подхода рекомендуют применять беспороговые тесты, содержащие задания различной категории трудности. При этом подчеркивается, что «... у мотивационных беспороговых тестов нет альтернативы: они имеют все достоинства пороговых и лишены их недостатка – способности отучивать от учебы слабых» [34, c.37].

На наш взгляд оба подхода являются неправомерными для формирования программно-дидактических тестов. Безотносительно к результату, поставленному субъектом тестирования, ничего нельзя говорить о рациональном формировании ПДТ. Если результатом СКДО является разбиение качества заключений целеустремленных объектов на классы обученности (самотестирование), то тест должен содержать ПДТЗ различной предпочтительности. Адаптивный алгоритм тестового контроля обеспечит по результатам анализа поведения объектов генерацию заданий определенной меры трудности и принятия решения об отнесении их к тому или иному классу. В этом случае каждый тестируемый получит свою оценку, которая однозначно определяет его исходный УУД. Классификационный ПДТ нацелен на дифференциацию объектов по степени их обученности.

Если результатом СКДО является установление реальной оценки поведения испытуемых, то ПДТ должен включать ЭФТК, категория трудности которых строго соответствует уровню их исходных учебных достижений. Это значит, что мера трудности ЭФТК при промежуточной аттестации должна однозначно определяться классом обученности образов. ПДТЗ повышенной трудности бессодержательны для образов с низкой степенью обученности, в то время как ПДТЗ с низкой мерой трудности бессодержательны для испытуемых с высокой степенью обученности. Промежуточная аттестация выступает здесь как характеристика разумности поведения испытуемого, его возможности действовать в заданной предметной области (с фиксированной мерой трудности ЭФТК). В этой связи рациональная технология компьютерного тестового контроля может быть реализована только в адаптивных тестирующих системах, формирующих в памяти дидактическую модель поведения каждого конкретного испытуемого. При этом тестирующая система обеспечивает не только предъявление ЭФТК, соответствующих его текущему поведению (структурная адаптация), но и автоматическую корректировку значений (веса) ПДТЗ на основании анализа выводов испытуемых (параметрическая адаптация) (рис.1).

Рис. 1. Разделение тестов достижений

Цели ПДТ отражают мысленное предвосхищение ожидаемого результата компьютерных тестовых проверок и представляют собой краткую формулировку тех задач, которые должны быть решены благодаря достижению заданного итога. Цели должны конкретизировать задачи, сделать их явными и ясными. Такая конкретизация производится на основе правила П17.

Π17: Цели выборки отражают сведение достижимого результата к вспомогательным концептам ближайшего к основному вопросу (наименованию теста) уровня.

Из П17 видно, что относительно вопроса «Какие задачи решают с применением ПДТ?» подвопросами являются: разделение объектов на классы в соответствии с уровнем их достижений; оценка реального УУД каждого образа внутри его класса обученности.

Структуризация и спецификация бтз

Важной характеристикой KCT3 является её валидность, которая означает, что при спецификации теста ничего существенного из исходного учебного материала не упущено. Понятие валидности КФТ интуитивно ясное и содержательно важное, поскольку она в значительной степени определяет показатели качества результатов дидактической оценки

Здесь Рпр – вероятность правильной оценки степени обученности тестируемого;

Рвал – вероятность валидности ПДТ;

Роц – вероятность верности оценки.

Содержательная валидность ПДТ определяется величиной процента охвата ПДТЗ контента конкретной области знания. Содержание КФТ предполагает рациональное отображение семантики фрагментов учебного материала в систему ЭФТК с различными мерами трудности. Эта система должна охватывать основное содержание конкретной учебной дисциплины и обеспечивать понятийную валидность КФТ относительно проверок уровня знаний, умений и навыков. Рациональность рассматривается здесь в двух направлениях. Первое направление связано с проверкой усвоения объектами нечисловой природы устойчивого ядра знаний по конкретной учебной дисциплине, а второе – характеризуется отражением в содержании выборок результатов развития науки и применение ее методов в практической деятельности.

Содержание учебного материала представлено в его описании с помощью тезауруса, специальным образом организованного и контролируемого словаря ключевых терминов. Соответствие ключевых слов отдельной выборки с контентом тезауруса служит одним из оснований для определения валидности теста. Синхронный срез смысла учебной дисциплины может рассматриваться в качестве своего рода информационного отражения, в организации проверки усвоения которого оценивается телеологическое состояние обученности индивида.

Структурирование содержания учебной дисциплины требует от преподавателя-разработчика учета большого числа понятий заданной области, знания и выявления функциональных зависимостей между её элементами. Первую попытку поставить и решить дидактическую проблему отбора содержания образования сделал (1745 – 1827).

Структурирование исходной области знания – это конкретно – научная методологическая процедура, выдвигающая в качестве задачи научного исследования выявление единства устойчивых взаимосвязанных между собой элементов содержания учебной дисциплины [1]. Эта процедура является неотъемлемым атрибутом при конструировании KCT3, для которой характерны (рис.2):

· фрагментарное (грубое) внимание к описанию состояния декомпозируемой области знания;

· стремление к четкому и наглядному представлению фрагментов учебного материала;

· фиксирование отношений между разделами и темами предметной области;

· установление иерархии между элементами знания

Рис.2 Структура формирования совокупности ЭФТК

Центральной идеей структуризации предметной области является рациональное разделение последней на разделы и темы с целью возможности их дальнейшего соединения и комбинирования нужными способами, поскольку известно, что «хорошее соединение (синтез) требует качественного разделения (анализа)». Этот прием представляет собой переход от модели конкретной предметной области к структурированной модели содержания знания (рис.3).

Рис. 3. Переход к понятийной и технологической средам спецификации

Наиболее часто организация содержания учебной дисциплины представляется в виде дерева – связного графа, не содержащего циклов. Описание смысловой структуры учебной информации с помощью дерева позволяет компактно и наглядно отобразить разделы, темы и понятия по конкретной области знаний. При таком моделировании структуры учебного материала вершины графа и связи между ними располагаются по соответствующим уровням иерархии. Учебно-информационные элементы каждого раздела, темы и понятия представляются в виде вершин дерева, а логические связи – ребрами графа. На нулевой горизонтали помещаются разделы, подвергающиеся декомпозиции, на первой горизонтали – учебно-информационные элементы, которые служат опорными только для разделов; на второй горизонтали – учебно-информационные элементы, являющиеся опорными для элементов первого уровня и т. д. Декомпозиция завершается, когда в дереве образуются базовые вершины (первичные понятия), не имеющие исходящих ребер. Термин «базовый» подразумевает минимум входящих в него смысловых единиц минимальной трудности. Например, для учебной дисциплины «Теория вероятностей» к таким элементарным семантическим единицам относятся: случайное событие, опыт, исход опыта, случайная величина и т. п.

При создании систем КАТ для хранения, модификации и обработки информации важное значение имеет решение теоретических и практических вопросов применения концепции использования банков программно-дидактических тестовых заданий для динамического (в процессе тестирования) формирования тестов. Создание БТЗ – культурной системы тестовых заданий (КСТЗ) – проектная задача, решение которой связано с корректной организацией работ при переходе от информационного обеспечения систем тестирования в форме файлового построения к проектированию систем адаптивных тестовых проверок, ориентированных на использование современных средств баз данных.

Принципиальное отличие КСТЗ, основанное на концепции применения банков тестовых ситуаций состоит в том, что она формирует ресурс коллективного пользования, необходимый для принятия решений позиционерами различной категории. Очевидно, что у этого информационного ресурса должен быть администратор, умеющий организовать рациональное взаимодействие между пользователями и способный принимать обоснованные решения с целью достижения максимальной эффективности функционирования системы КАТ.

В широком смысле слова КСТЗ радикально отличается от традиционного подхода в определении того, что образует БТЗ, и в управлении последним. Концептуально система КАТ содержит информацию о поведении тестируемых, категории трудности ПДТЗ, спецификации тестовых материалов, механизмах адаптации и оценки, атрибутах тестируемых и т. п. БТЗ образует совокупность данных:

· интегрированных: при малой или отсутствующей избыточности;

· семантически связанных в той степени, в какой может быть обеспечена полная и непротиворечивая информация о функционировании системы КАТ;

· информационно ориентированных;

· независимых от процессов, которые они поддерживают.

Более того, для образования КСТЗ эти данные должны быть построены с применением методологических правил и стандартов, а также подвергнуты структуризации и спецификации. Управление БТЗ призвано обеспечить разделение данных, сохранение их независимости, доступность и уменьшение избыточности в прикладном программировании. Системы управления КСТЗ предоставляют общие описания данных и их интегрированное хранение.

Под независимостью данных понимают условия, при которых модификации в форматах данных и методах доступа, не влекут за собой изменений в прикладных программах использующих эти данных. Это достигается путем удаления из прикладных программ элементов низкоуровневого программирования процессов управления ими. Управление осуществляется командами манипулирования данными, которые выполняют универсальные элементы управления (как локальными, так и удаленными), что позволяет изолировать прикладные программы от влияния большинства изменений в структуре БТЗ, а также в процессе его развития или модификации. Обобщенное интегрированное описание КСТЗ обеспечивает доступность данных, а обобщенные команды манипулирования последними упрощают разработку прикладных программ, которым требуется доступ к БТЗ. Системы, реализующие запросы КСТЗ и языки генерации протоколов результатов тестовых испытаний предоставляют доступ к инструментальным средствам тестирования пользователям-непрограммистам для ввода ПДТЗ и распечатки выходных документов. Для успешной реализации этих принципов необходима координация деятельности позиционеров, а также централизация управления целостностью и защитой БТЗ от несанкционированного доступа.

Дидактическая организация БТЗ представляет основание, на котором в процессе взаимодействия тестируемого и квазисубъекта формируется траектория поведения каждого объекта нечисловой природы. Дидактическая организация системы выступает при этом как идеализированная объективность, обеспечивающая заданный уровень коммуникации. Культура дидактической организации БТЗ основана на регуляризации знаний, представляющей собой систему процедур, позволяющих путем сравнения выводов тестируемого с образцами ПДТЗ и принятыми в системе КАТ алгоритмами обработки результатов этого сопоставления представить отдельные знания в виде модели поведения тестируемого. Поэтому такая организация БТЗ приводит к созданию адекватных алгоритмов, тестирующих программ, последовательности взаимосвязанных правил и, наконец, технологии КАТ, реализующей эти закономерности и правила.

Модели в человеко-компьютерных системах включают поведенческие переменные. Поэтому с такими переменными следует обращаться телеологически. Тем самым достигается понимание содержания процесса КАТ и появляются дополнительные возможности для управления им. Недостаточно только предсказывать поведение – его надо уметь объяснять. И в этом смысле цифры, определяющие категории трудности, хранящиеся в банке данных ЭФТК, необходимо понимать как числа, но не как символы.

Модель тестируемого выполняет ряд дидактических функций. Прежде всего она служит мерой дидактической спецификации БТЗ. Во-вторых, она выполняет роль средства обмена данными в ходе адаптивного тестирования. В-третьих, дидактическая модель является средством накопления знаний о качестве образцовых ПДТЗ из БТЗ. В-четвертых, она способствует формированию валидно-содержательного БТЗ по каждой учебной дисциплине. Логико-дидактическая структура поведения тестируемого выступает здесь как траектория, которая задает направление процесса тестовых испытаний для каждого конкретного индивида, устраняя противоречия между его поведением и мерой трудности предъявляемых заданий. Главным при этом является то, что характеристика приобретаемых системой КАТ знаний о содержании БТЗ является формой выражения дидактической организации массива ПДТЗ. Отсюда качество дидактической оценки во многом определяется качеством логико-дидактической структуры БТЗ – спецификацией.

Спецификации БТЗ – это исходное детальное описание смысла и значения совокупности ПДТЗ, отражающих содержание исходной предметной области с заданной валидностью. Спецификации как вид деятельности представляют собой декомпозицию конкретного знания, осуществляемую разработчиком KCT3, а как результат – композицию множества тематических единиц учебного материала, которые должны быть представлены в виде упорядоченной совокупности ЭФТК. Эта композиция обращена к проектанту, ориентирована на знание им содержательной стороны проблемы, результата и целей СКДО УУД тестируемых. Культура обращения с основными атрибутами содержания структурированного материала и знание возможностей инструментальной среды КАТ применимы к разработке понятийной или технологической спецификаций в большей мере, чем в создании KCT3 с учетом методологических правил и стандартов [1].

Цель спецификации – отобразить, систематизировать и организовать сведения, относящиеся к гипотезам, методам и средствам из конкретных разделов и тем конкретной учебной дисциплины, установить количество форм ЭФТК и их категории трудности, добиться требуемой степени валидности KCT3.

Спецификации KCT3 – это документы, которые служат основой для разработки ПДТ с заданными показателями качества. Их качественная разработка значительно уменьшает вероятность того, что будет создана БТЗ с низкими показателями валидности КФТ.

Полнота спецификации духовной компоненты знания характеризует глубину охвата содержания исходного материала, применения стандартизированных форм представления ЭФТК в нужной пропорции, наличие в KCT3 тестовых ситуаций с различными мерой трудности и различающей способностью. В инструкции no построению тестов Northen Examination and Assesment Board рекомендуется, чтобы весь учебный материал был «охвачен предлагаемыми вопросами. Содержание предмета должно полностью покрываться матрицей по всем темам». При такой постановке проблемы невозможно создать тесты с высокими показателями полноты и валидности даже для хорошо структурируемых учебных дисциплин. На наш взгляд содержание теста должно строго соответствовать результату (отбор, отсев, классификация, аттестация) и требованиям образовательных стандартов. Так, например, при составлении композиций тестов по высшей математике спецификации и план теста для студентов всех факультетов (кроме математических, где математика – будущая специальность обучаемых) тестовые задания не должны включать в себя доказательства теорем, вывод формул и решение сложных задач. Отсюда следует, что композиция КФТ обусловлена его содержанием и назначением, в то время как формы ПДТЗ, образующие данный тест, являются важнейшими, организующими элементами, придающими тесту заданную валидность, соподчиняющий его компоненты друг другу и целому.

Валидность определяет степень соответствия контента KCT3 содержанию исходного учебного материала. Результативность – означает возможность применения совокупности ПДТЗ для формирования из нее множества выборок (КФТ), нацеленных на достижение ожидаемого итога.

Чем детальнее проведена операция декомпозиции, тем большей будет валидность KCT3, а чем больше количество заданий (в разумных пределах) будет включено в КФТ, тем больше выше вероятность правильной оценки степени обученности индивида. Основополагающая идея при этом весьма тривиальна: за повышение правильности отображения значения латентного параметра тестируемого приходится больше «платить». В контексте параметризации модели поведения целеустремленного объекта это означает тратить силы проектантов и тестируемых на генерацию требуемой информации. Поэтому от преподавателя (экзаменатора) требуется найти некоторый компромисс между числом заданий в ПДТ и требуемой верностью оценки результатов тестовых проверок.

Однако процедуры представления содержания ЭФТК, отражающие конечную совокупность тестовых суждений, столь сложны, что требуют участия в процессе оценки валидности БТЗ экспертов, которые хорошо осведомлены о методах принятия решений, приемлемых для разных типов критериев, способах оценки качества ПДТЗ и ПДТ в целом, возможностях конкретных инструментальных средств, стандартизированных формах представления ПДТЗ и методологических правилах конструирования профессиональных компьютерных тестов.

Возникает вопрос: «Каким образом построить исходные спецификации КФТ?» Поскольку качество понятийной (содержательной) спецификации непосредственно влияет на валидность теста, весьма важен способ ее получения. Однако универсальных методов построения правильных спецификаций ПДТ не существует (по крайней мере, пока они еще не найдены). Следовательно, такая модель может быть только результатом высокоуровневых выводов человека. Но даже профессиональному тестологу трудно сразу же отыскать подробные спецификации на основе одних только умозаключений, одними только умозрительными методами. Метод, который принимается в действительности, представляет собой процесс последовательного приближения к такой спецификации, в которой сначала составляется приближенная (грубая) модель, затем, исходя из этой структуризации, на основе результатов анализа проводятся подобные спецификации. В этом процессе трудно отделить анализ от синтеза. Очевидно, правилен такой подход, при котором система обработки знаний объединяет задачи анализа и синтеза и принимает форму системы поддержки процесса спецификации (рис.4.).

В спецификациях от содержательных средств требуется выразительность и гибкость стандартизированных форм представления исходного материала. Степень и способ декомпозиции на этом этапе должны облегчать ее написание и понимание, служить инструментом объяснения, детализации и валидизации контента и значения тестовых заданий. Пример спецификации теста «Математика-2» читатель может найти в [14].

В практической деятельности спецификации не всегда могут быть заданы в полной форме, позволяющей определить структуру модели KCT3. В частности, в таких задачах синтеза как проектирование несложных тестовых ситуаций, так или иначе, отсутствуют творческие элементы. Однако если проблема становится сложнее, то с самого начала требования к проектированию спецификации не ясны. Любые получаемые результаты декомпозиции учебного материала служат некоторым промежуточным, временным целям, носят локальный характер и подвержены влиянию последующих уточнений. Следовательно, роль экспертов заключается в том, чтобы эффективно помогать деятельности проектантов и в конечном итоге получать спецификации на KCT3 в их окончательном виде. Стиль работы, координирующий действия разработчика и эксперта, состоит в том, что проектант выдает эксперту идеи, на основе которых осуществляется интерактивное построение спецификации БТЗ. Эксперт изучает построенную модель, оценивает результаты анализа и выдает их разработчику. Последний, рассматривая полученные результаты, выносит суждение о том, насколько точно они соответствуют его собственным представлениям, является ли модель KCT3 верной и вносит частичные коррективы в спецификации (рис.4).

Рис.26 Процесс формирования спецификации

В идеале весь процесс решения проблемы разделяется на ту часть, где спецификации определяются проектантом – в первой половине этого процесса, и ту часть, где проводится оценка экспертом-тестологом – во второй его половине. Моделью проблемы условимся называть завершенные спецификации KCT3, детализированные настолько, что они содержат всю необходимую для достижения требуемого результата информацию. Из приведенного объяснения может показаться, что построение спецификации – это выбор в группе всех завершенных моделей той из них, которая отвечает намерениям исследователя. Однако если быть более точным, следует сказать, что построение БТЗ есть лишь выбор одного пути, которым достигаются правильные завершенные спецификации.

Следовательно, результаты оценки завершенной спецификации – не более чем некоторые предположения о конечных результатах решения проблемы. О том, сохранится или не сохранится это предположение в течение всего последующего процесса детализации, могут сказать только очень опытные тестологи. Это объясняется тем, что вывод о заданной валидности БТЗ превышает возможности разработчика KCT3. По этой же причине первая половина процесса решения проблемы не может быть полностью автоматизирована. С другой стороны, чрезвычайно важно обратить внимание на уровень возможной автоматизации второй половины процесса анализа при разделении работ между проектантом и экспертом как на необходимое условие реализации системы поддержки решения проблем с использованием обработки промежуточных результатов декомпозиции.

Привлекаемые к процессу принятия решения о качестве спецификации учебного материала специалисты помогают разработчикам выявить наиболее обоснованный вариант наилучшего с точки зрения валидности решения из множества допустимых альтернатив. Сбор и обработку информации от нескольких экспертов необходимо производить при помощи специальных вычислительных процедур на персональных компьютерах. Тем самым обеспечивается конфиденциальность сведений, учет качества экспертизы каждого специалиста, хранение и возможность коррекции экспертной информации.

В основе умения составления спецификаций лежит принцип иерархической декомпозиции сложных понятий. Разбивая эти понятия на части, следует руководствоваться правилом: частей должно быть «не слишком много и не слишком мало, но не больше шести» [1]. Декомпозиция проводится до тех пор, пока на каждом ярусе иерархии не появятся ЭФТК оптимальной энтропии для испытуемых с фиксированными степенями обученности. В этом случае смысл и значение ПДТЗ будут логичными, содержательными, понятными и мотивированными для испытуемых.

Удобное описание спецификации дают графы, называемые деревьями. Дерево – это система описания узлов и связывающих их ребер. Различным ребрам, выходящим из одного узла, соотносятся различные заглавия (разделы, темы, понятия). На рис.5, приведен лес спецификаций, состоящий из двух деревьев. Узлы дерева, отстоящие от корня на i ребер, образуют ярус порядка i. Порядком узла называют номер его яруса. Порядком дерева называют максимальный из порядков его узлов. Узел, из которого не выходит ни одно ребро, – нулевой.

Рис.5. Лес из двух деревьев

Для предоставления возможности формирования корректного заключения на требование ПДТЗ корневое заглавие подвергается декомпозиции. Номер яруса группировки ЭФТК свидетельствует о мере их трудности. По этому основанию ПДТЗ разделяются на доступные и недоступные для корректных заключений на них испытуемых. Принципиально доступными для правильного заключения будем считать ПДТЗ, расположенные на данном ярусе, когда тестируемые из конкретного класса обученности могут формировать истинные выводы с вероятностью, равной 0,5.Такие ЭФТК будем называть заданиями оптимальной энтропии для испытуемых с фиксированной степенью обученности. Чем выше уровень узла яруса, тем меньше предпочтительность ПДТЗ.

Для перехода ко второму узлу яруса необходимо применять операцию деления (группировки) исходного заглавия. При этом будут образованы вспомогательные, более доступные для правильного заключения темы или понятия. Проводя дальнейшую группировку из узлов 2-го яруса, образуем соответствующие понятия третьего (еще более низкой по мере трудности) яруса сведения. В результате деления ПДТЗ на ярусы мы получим спецификации KCT3 принципиально доступные для испытуемых из различных классов обученности.

Деление учебного материала базируется на применении следующих правил:

· подмножества разбиения должны быть непересекающимися;

· деление на каждом этапе должно производиться по одному основанию;

· объем делимого должен быть равен объединению объемов подмножеств.

Например, корректные и ошибочные спецификации понятия «Натуральные числа» имеет вид:

Спецификации позволяют создавать последовательности логически связанных и организованных в банк ПДТЗ, начиная от корневых узлов и кончая вспомогательными ЭФТК низшего яруса сведения. Однако следует помнить, что эта процедура не является формализованной. Спецификации всегда содержательны, а поэтому не могут претендовать на формализацию конструирования проблемных тестовых ситуаций. В этой связи умение проектировать рациональные спецификации в значительной степени зависит от уровня культуры логичного мышления разработчика и глубины знания им соответствующей предметной области.

Степень разнообразия KCT3 выражается в диверсификации культуры, когда создаются ареалы, отличающиеся друг от друга содержательным наполнением и значениями качественных показателей композиций КФТ. Такие распределенные БТЗ рассредоточены в пространстве, работают сравнительно автономно с использованием средств типового банка данных и имеют специальную информационную структуру сетевого вида, вершинами которой на нижнем уровне являются описания технологий тестовых проверок, а на остальных уровнях – описания укрупненных процессов с набором характеризующих их показателей.

Разделение учебного материала на ярусы составляет основу культурной дифференциации тестируемых. Последнее достигается применением к объектам нормативно – ориентированного ПДТ, в котором генерируемые в композиции теста ЭФТК имеют различную предпочтительность по трудности. Благодаря структурной адаптации, тестируемые разбиваются КФТ на классы, что и отражает разделение их по степеням обученности. Если образам из заданного класса предъявляется личностно-ориентированный ПДТ, в котором тестовые ситуации имеют близкие со степенями обученности испытуемых категории трудности, то появляется возможность социальной дифференциации каждого испытуемого внутри конкретного образа.

При выполнении спецификации KCT3 разработчик выражает свой взгляд на то, что он считает важным проверить в результате КАТ. Здесь важна глубина проникновения проектанта в содержание конкретной области знания, умение отобразить смысл и значение каждого раздела, темы и понятия в адекватные им формы ЭФТК. Но людям свойственны субъективные взгляды на предметные области, поэтому неопределенности и ошибки в спецификациях неизбежны. Об этом говорил еще Д. Парнас: «Без человеческих ошибок можно обойтись только тогда, когда можно обойтись без человека». Поэтому надо предусмотреть обсуждение спецификаций KCT3 в группах специалистов, проверить синтаксическую и логическую правильность декомпозиции учебного материала, обеспечить их сертификацию.

Конечным элементом спецификации KCT3 является ее композиция, придающая БТЗ единство и целостность, соподчиненность ее компонентов друг другу и результату тестирования. Компонентом (единицей композиции) KCT3 являются КФТ, где ПДТЗ сведены к ситуациям, постановки которых детерминируются результатами КАТ. Качественные композиции КФТ являются следствием логически правильной спецификации БТЗ. В принципе может быть составлено множество вариантов композиций ПДТ. Выбор необходимой композиции зависит от результата тестовых испытаний и заданного качества оценки.

Требования к банку тестовых заданий (БТЗ).

Тематическое содержание БТЗ определяется Государственным образовательным стандартом (ГОС).БТЗ должен быть структурирован по разделам, темам и понятиям. Каждое тестовое задание может иметь маркировку только одного элемента каждого уровня структуры.

Спецификации БТЗ должны строго соответствовать своему назначению и отвечать заданной величине содержательной валидности. Тестовые задания в БТЗ должны быть представлены в различных формах и ранжированы по трем категориям трудности.

БТЗ должен пройти экспериментальную проверку, на основании которой будут определены показатели валидности и верности оценки, зафиксированные в сопроводительной к тесту документации.

Количество заданий в БТЗ должно превышать длину формируемого на его основе теста не менее, чем в 10 раз. Каждый БТЗ должен сопровождаться спецификацией с информацией о содержательной части, его качественных показателей и физических характеристик:

· цели применения теста,

· предметная область,

· авторский коллектив,

· структура и спецификации теста,

· дата сертификации и утверждения БТЗ,

· содержательная валидность,

· уровни интервалов обученности,

· наименование и размер тестов (файлов) необходимых для проведения тестирования.

На БТЗ должны быть представлены документы об авторских правах его разработчиков

Требования к технологии компьютерного тестирования

Тестируемый до начала проверки должен быть уведомлен о количестве заданий в тесте и временных ограничениях. При адаптивном тестировании количество заданий в тесте заранее не оговаривается. У тестируемого должна быть возможность перед началом официального тестирования выполнить по крайней мере один раз демонстрационный тест для ознакомления с интерфейсом тестирующей программы и способами ввода заключений. Демонстрационный тест должен быть небольшим, содержащим не более чем по два задания различных форм и способов ввода заключений, встречающихся в данном тесте. Содержание демонстрационного теста должно быть отвлеченным, простым и понятным тестируемым с различной степенью обученности.

Во время тестирования на экране монитора должно располагаться только одно тестовое задание. Все элементы ПДТЗ должны отображаться на экране монитора. Для отображения элементов группы не должны использоваться раскрывающиеся списки.

Способ ввода заключения должен быть прост и удобен. Введенное тестируемым заключение должно отображаться на экране монитора и быть понятно тестируемому.

Тестируемый должен иметь возможность:

· подтвердить окончание ввода заключения на задание; после подтверждения окончания ввода заключения, тестовое задание вновь не предъявляется и исправить введенное заключение невозможно;

· исправить введенное заключение до момента подтверждения окончания ввода его заключения;

· неоднократно пропускать задания; пропущенные задания должны быть обязательно вновь предъявлены тестируемому; если время, отведенное на выполнение теста, закончилось, то все пропущенные задания засчитываются как тестовые с неверными выводами;

· самостоятельно устанавливать параметры информационного освещения процесса тестирования: отображение длительности (или оставшегося времени) тестирования, количества предъявленных (или оставшихся для предъявления) заданий;

· по окончании тестирования немедленно просмотреть результат: полученную оценку, длительность сеанса тестирования, общее количество заданий в тесте (для неадаптивного режима), число предъявленных заданий, количество заданий с верными и неверными заключениями;

· в любой момент времени вызвать на экран монитора инструкцию по способу ввода заключения. Инструкция должна отображать информацию о способе ввода заключения на задание только той формы, которая представлена в данный момент времени на экране дисплея.

Механизм оценки поведения тестируемого должен обеспечивать заданную верность тестовых испытаний и требуемую величину объективности.

Инструментальная среда компьютерного тестирования должна обеспечивать:

· ввод, хранение, модификацию и распечатку тестовых заданий;

· возможность возврата тестируемого к ранее пропущенным им тестовым ситуациям;

· возможность самостоятельного регулирования испытуемым темпа тестирования;

· дружественный интерфейс к разработчику БТЗ и тестируемому;

· возможность формирования БТЗ для любых областей знаний с заданной спецификацией;

· генерацию множества тестов из банка тестовых заданий в соответствии с заданной спецификацией теста;

· приспособление меры трудности тестовых ситуаций к качеству заключений респондентов на требования тестовых утверждений;

· автоматическую обработку заключений тестируемого и предъявление протокола сеанса тестового испытания в реальном времени;

· возможность изменения шкалы оценки результатов тестирования,

· совместимость программного обеспечения со стандартами ISO и POSIX; гармонизацию форм представления тестовых материалов со стандартом IMS.

Приведем несколько фрагментов спецификаций БТЗ на примере дисциплин экономического направления, отличающихся уровнем детализации.

Спецификации учебной дисциплины обладают четко выраженной целостностью. Последняя обнаруживает себя, с одной стороны, в наличии свойств и закономерностей, которые, характеризуя, конкретную область знания в целом, отсутствуют у отдельно взятых связей целого, а с другой стороны, в сложности и иерархичности строения учебного знания, в наличии нескольких уровней его организации, находящихся в многогранных взаимозависимостях – причинных, структурных, функциональных, включая циклы взаимодействий по принципу обратной связи.

Композиции пдт

Умение, составлять или выбирать КФТ, ориентированные на заданный результат, весьма важно при подготовке испытаний. Некорректно (т. е. с нарушением правил практической логики) составленные ПДТ – явление массовое. Недостатками здесь являются: несогласованность содержания теста с результатом (задание различной трудности используется для оценки реальной степени обученности); ориентация только на задания в закрытой форме (моноформные тесты); малый объем выборки ПДТЗ; низкая разрешающая способность теста; отсутствие предварительных параметров качественных показателей теста и интервалов качества оценки в тестирующей системе (верности, валидности и эффективности). Содержание таких ПДТ логически не связано и не упорядочено, т. е. тесты являются нелогично построенными. B. C. Аванесов называет подобные ПДТ псевдотестами и указывает, что «...практика создания так называемых тестов по множеству учебных дисциплин и, комплексных междисциплинарных тестов вне культуры дидактических измерений бесперспективны, они способствуют профанации как самой идеи комплексной оценки, так и тестового метода». Псевдотесты не могут использоваться для СКДО УУД испытуемых и их применение в системе образования приносит только вред.

Композиция ПДТ — синтез структуры КФТ на основе рационального объединения ЭФТК (из БТЗ) в единое целое, исходя из достижимого результат и требуемой верности оценки УУД тестируемых.

В культурной форме все тестовые ситуации должны быть согласованы. Вместе они составляют логично связанное, целостное образование, определяемое спецификацией ПДТ. При композиции КФТ принимают во внимание определенные критерии в зависимости от принятой таксономии целей тестовых испытаний. Сюда относятся:

· знание фактов, понятий, закономерностей, законов, теорий, принципов, правил и взаимозависимости между ними;

· умение выполнять мыслительные действия;

· умения давать критические оценки;

· умения применять знания в новой (конкретной) ситуации;

· навыки выполнения конкретных операций.

Цели применения полиформного ПДТ определяют его содержание – обоснование желаемого ответа на его основной вопрос, выраженного наименованием и назначением данного теста.

Содержание теста представляет собой сведение его целей к выбору (или построению) системы тестовых заданий специальной формы, различного уровня трудности и получение из анализа выводов объектов/образов на последние ожидаемого результата.

Отсюда следует правило организации ПДТ

Π15: Для композиции КФТ необходимо:

· указать требуемый результат;

· в соответствии с этим результатом уточнить цели теста;

· исходя из выбранных целей сформировать на основе банка тестовых заданий программно-дидактические тесты, обеспечивающие достижение заданного результата;

· проверить качественные показатели выборки.

Из формулировки правила Π15 видно, что первые две позиции достаточно подробно рассмотрены ранее. Оставшиеся ситуации Π15 требуют дополнительного рассуждения.

В процессе анализа качества КФТ возникает вопрос об оценке различающей способности тестов. Чтобы уяснить сущность этой задачи, рассмотрим следующий гипотетический пример. Пусть даны результаты оценки качества заключений пяти испытуемых по трем тестам (табл.1) [25].

Таблица 1

Испытуемые

ПДТ

1

2

3

1

4

5

4

2

5

3

4

3 _

4

4

4

4

2

4

4

5

5

4

4

Средние оценки по тестам

4

4

4

Средние оценки по тестам оказались одинаковыми. Можно сделать вывод о том, что все ПДТ, в среднем, дают одинаковые результаты по анализу УУД тестируемых. Однако из табл. 1. даже визуально видно, что этот вывод является ошибочным.

Чтобы убедиться в этом, воспользуемся формулой К. Шеннона

и найдем степень разброса оценок, полученных тестируемыми для каждого из трех ПДТ. В этой формуле рi – вероятность i-ой оценки в j-м тесте. Значения энтропии для ПДТ будут равны:

Несмотря на то, что средние оценки испытуемых по различным ПДТ одинаковы, эти тесты отличаются друг от друга различающей способностью:

· первый тест обладает высокой различающей способностью;

· второй текст позволяет различать степень обученности индивидов;

· третий тест не дает возможности различить поведение респондентов.

Как система проверки уровня учебных достижений, ПДТ характеризуется назначением, составом, системностью и структурой. Назначение компьютерного дидактического теста определяется результатом проверки (классификация объектов или аттестация образов). Спецификации ПДТ по каждой учебной дисциплине включает наименование теста, цели, содержание ПДТЗ по темам и разделам, среднее время выполнения отдельных заданий и теста в целом, меру трудности теста, количество ЭФТК и многообразие их форм. Системность ПДТ означает соответствие содержания ПДТ поставленным целям и возможностям СКДО телеологического состояния обученности объекта с заданной верностью. Гомогенность ПДТ – важное проявление его системного качества. Существенным отличием ПДТ от дидактических тестов на бумажном носителе является то, что порядок предъявления ПДТЗ и мера их трудности зависят от качества выводов каждого конкретного объекта или образа на предыдущие задания.

Структура выборки определяется алгоритмом компьютерного адаптивного тестирования и устанавливает порядок предъявления заданий объекту на экране дисплея. Существенным здесь является то, что при детерминированном или случайном предъявлении тестовых заданий, ПДТ должен с заданной валидностью охватывать требуемую глубину содержания учебной дисциплины.

Исходными посылками при формировании полиформного ПДТ является наличие банка ПДТЗ по рассматриваемой области знаний, которые являются правильными и доступными (в принципе) для формирования выводов тестируемых с различными уровнями достижений. Это означает, что тестовые задания отображают не только содержание разделов, тем и понятий конкретной учебной дисциплины, но группируются в банке данных по категориям трудности. Поскольку ПДТЗ представляются истинными утверждениями, остается корректно выбрать из банка ЭФТК задания, которые в своей совокупности образуют полиформный ПДТ, пригодный для обеспечения заданного результата. Чем полнее ЭФТК отражают содержание учебной дисциплины, тем выше уровень валидности ПДТ. Валидность компьютерного теста зависит не только от глубины охвата содержания конкретной учебной дисциплины, но и от числа заданий, предъявляемых объекту или образу в процессе сеанса тестовых испытаний.

Предположим, что целью выбора (или разработки) ПДТ является разбиение поведения телеологических объектов на классы. В этой ситуации формирование структуры испытательного модуля (КФТ) организуется следующим образом. Прежде всего, преподаватель осуществляет выбор тех разделов, содержание которых соответствует заданной области знаний. В соответствии с ожидаемым результатом ПДТЗ подбираются из массива тестовых заданий различной меры трудности. Такой подбор КФТ является основой для организации технологии адаптивного тестирования, призванной обеспечить выделение образов с заданными УУД.

Для изучения состояния обученности целеустремленного объекта следует задать закон изменения тестирующих воздействий в соответствии с поведением каждого индивида. При этом наблюдения учитываются с различными весовыми множителями, которые зависят от меры трудности ПДТЗ и качества выводов респондентов. По такой ситуационной модели, включающей в себя описание предыстории действий системы КАТ, прогноз поведения тестируемого можно составить для некоторого последующего момента времени. Необходимо иметь в виду, что все факторы, влияющие на состояние обученности тестируемого в исследуемом периоде должны быть неизменными.

Уточнение прогноза производится по принципу обратной связи – новые прогнозы поведения индивида корректируются на основе учета качества его заключений в предшествующих периодах наблюдений. Существенным является то, что в каждом тренде наблюдений целесообразно использовать последовательность коэффициентов, придающую более высокий вес более поздней информации и позволяющую относительно просто строить дидактическую модель поведения объекта нечисловой природы.

Адаптивная система тестового контроля оценивает выводы тестируемого и при необходимости (если число неверных заключений превышает допустимую величину) производит подключение модели объекта к массиву заданий с меньшей мерой трудности (структурная адаптация). Если объект снова допускает долю неверных заключений выше допустимой, то происходит автоматическое переключение к банку тестовых заданий с еще более низкой мерой трудности. Положительные выводы, полученные ранее объектом, сохраняются программой и используются при вычислении оценки за весь период испытаний.

Количество ЭФТК в полиформном тесте должно обеспечить качественную оценку уровня достижений. Объекты с близкими степенями обученности одинаково классифицируются различными нормативно-ориентированными тестами, выбранными из банка ПДТЗ. Только в этом случае KCT3 будет считаться объективной. ПДТ относится к профессионально составленному, если его показатели валидности, верности и объективности оценки не ниже заданных. Если нормативно-ориентированный тест предполагается использовать в процессе самостоятельного адаптивного тестирования, то количество ЭФТК должно быть достаточно большим.

Так, например, при формировании выборок в области математических и естественнонаучных учебных дисциплин, число ПДТЗ может колебаться от 80 до 100 заданий. Тест, предназначенный для разбиения тестируемых на классы в области гуманитарных учебных дисциплин, должен содержать не менее 130-150 заданий. Отсюда следует, что общее число ПДТЗ различного уровня трудности, хранящихся в банке данных, должно быть в 10 раз больше, чем количество тестовых заданий в компьютерном тесте. Это позволит генерировать различные по содержанию, но эквивалентные по мере трудности КФТ при неоднократном самотестировании объектов. Если респондента устраивает результат классификации (исходный балл), то первый этап (самотестирование) считается завершенным. В противном случае, объект может продолжить дальнейшее изучение учебного материала с целью повторного самотестирования для перехода в более высокий класс обученности.

Второй этап компьютерного адаптивного тестирования (КАТ) связан с параметрической адаптацией и состоит в предъявлении образу теста, соответствующего его уровню достижений (классу). При этом удается избежать аномальных эффектов, когда θi ≠ βj. ПДТЗ, категория трудности которых не соответствует образу с фиксированным уровнем обученности, не должны предъявляться испытуемому. Динамический ряд у1,y2,...,уn из n последовательных наблюдений рассматривается при промежуточной аттестации испытуемого как выборочная реализация из конечной совокупности ЭФТК заданной меры трудности. Для постоянного уровня обученности испытуемого (в течение сеанса тестирования) выполнение условия θi ≈ βj обеспечивает заданную верность оценки его достижений.

Результатом тестирования в данном случае является определение реального УУД испытуемого. При этом системой формируется личностно-ориентированные ЭФТК из банка тестовых заданий, что требует от тестируемого максимального напряжения критического мышления при формировании прагматически корректных выводов. Личностно-ориентированные выборки повышают интерес образов к деятельности, увеличивают мотивацию их в процессе всего сеанса тестирования, стимулируют саморазвитие и самосовершенствование испытуемых. Более того, требование обеспечения оптимальной энтропии предъявляемых заданий гарантирует получение реального балла для каждого испытуемого с фиксированной степенью обученности.

Из за большого объема эта статья размещена на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12

, Тягунова культуры адаптивного тестирования. – M.: Национальный институт бизнеса, 2003. – 370c (стр. 10 )

Партнерка на США и Канаду по недвижимости, выплаты в крипто

Тестовые задания закрытой формы

Тестовые задания открытой формы

Тестовые задания на установление правильной последовательности

Тестовые задания на установление соответствия

Задания на конструирование

VI. ФОРМИРОВАНИЕ БТЗ

Структуризация и спецификация бтз

Требования к банку тестовых заданий (БТЗ).

Требования к технологии компьютерного тестирования

Композиции пдт

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы

до ввода тестируемым заключения	после ввода тестируемым заключения
Россия подписала мир с Францией в Тильзите в... году.	Россия подписала мир с Францией в Тильзите в 1 807 году. \|

Испытуемые	ПДТ
	1	2	3
1	4	5	4
2	5	3	4
3 _	4	4	4
4	2	4	4
5	5	4	4
Средние оценки по тестам
	4	4	4