В философии дихотомии соответствуют парные диалектические противоречия объект-субъект, причина-следствие, необходимость-случайность, теория-практика и т. д. На бытовом уровне здравый смысл типа «да-нет» совместим с однозначностью причинно-следственной картины мира Галилея. У человека немало симметричных парных органов, выполняющих одни функции. При нарушении деятельности одного органа человек сможет обойтись с помощью дублера. В этом смысле исключение составляют лишь два полушария головного мозга, которые не могут заменить друг друга. Согласно данным В. Геодакяна, левое полушарие мозга служит для последовательной обработки информации, в то время как правое полушарие воспринимает информацию одномоментно.
Диада высвечивает в пространстве решений резкое разграничение – ось. Противоположности занимают на некоторой шкале оценки крайние места, взаимоисключают и взаимопредполагают друг друга. В динамическом характере столкновения противоположных сил происходят процессы изменения и развития. Приведенные антимологии-проблемы выражают диалектические ситуации познавательного отношения между понятиями в наиболее резкой форме. Этому соответствует и жизненная мудрость, которая указывает, что «крайности сходятся». Однако, в случае высказывания типа «да» и «нет», когда один говорит одну правду, а другой противоположное, проблема всегда находится посередине.
Неопределенность диады в рассматриваемых случаях подразумевает возможность выхода за рамки формально-логического «да-нет» в другое измерение, в новую сферу понятий. Так, например, создатели неэвклидовой геометрии, уйдя от оппозиции «да-нет», открыли новую область знаний. Ограниченность метода парных оппозиций при выборе стратегии оценки учебных достижений очевидна, поскольку двоичные суждения слишком категоричны. В них не учитываются корреляционные связи между противоположными полюсами атрибутов. Сохраняя антропоморфную ограниченность двоичного мышления, нельзя выйти из получающихся при этом тупиковых ситуаций. Этому образу привычного бытовизма диады, где все определено в соответствии с нормами повседневности типа «да – нет», и противостоит многоуровневая оценка. Поэтому первым шагом на пути разрешения этой антиномии является переход к исследованию более сложных взаимодействий применительно к анализу результатов компьютерного тестирования.
В свое время Гегель представлял выявление и разрешение антиномий – проблем в схеме триады: «тезис-антитезис-синтез», которую он назвал «отрицание отрицания». Наиболее часто в наше поле зрения попадает триадная структура. Здесь умение понять диалектическое единство противоположностей обеспечивает их синтез. «Синтез», в свою очередь, порождает переход от диады к триаде и осуществляется всякий раз на пути поиска решения, в рамках которого достигается единство противоположностей тезиса и антитезиса.
Понятие «триада», как описание троичности, впервые было применено древнегреческим философом Платоном. Назовем триадой три элемента, связанные между собой в единый целостный комплекс. В поисках общих закономерностей трихотомии, т. е. расщепления понятия на три части, обратимся к истории стихийно сложившихся систем триад. Прежде всего следует описать массовые примеры, в которых используется процедура сопоставления сравниваемых объектов произвольной природы [11].
В математике различают топологические, порядковые и алгебраические структуры. Особенностями интерактивных алгоритмов оценивания считают: универсальность, простоту реализации, ориентированность на сложные задачи. Психологической, математической или статистической модели в системе «человек – машина» соответствуют три вида моделирования деятельности оператора: психологическое, математическое и статистическое. Любое тестовое суждение состоит из трех частей: условия, требования и оператора задания. Отношения рефлексивности, симметричности и транзитивности являются формальными правилами, указывающими на пределы логически возможного в количественных взаимоотношениях. Имеются три эквивалентных способа анализа множества данных в зависимости от того, делается ли акцент на структуре (логическая точка зрения), содержании (теоретико – множественная точка зрения) или на ее отношении к действительным фактам (событийная точка зрения). Главные затруднения, связанные с применением математических методов в тестометрии, определяются недостаточной разработкой трех групп вопросов:
· методологии построения «идеализированных» понятий;
· терминологических проблем языкового барьера между математикой и педагогикой;
· специального прикладного математического аппарата и путей его применения в процессах КАТ.
При создании математической модели рассматривают три основные ступени: построение математической теории; сопоставление теоретических и экспериментальных понятий; установление границ применения теории. Динамика системы КАТ описывается математической моделью, которая отражает зависимости между тремя множествами переменных: входа, состояния и выхода. Три кита лежат в основе вычислительной задачи: существование, единственность и алгоритм. В этом смысле проблема безусловной минимизации непрерывной органической функции характеризуется триадой: «Имеет ли задача минимизации решение?» «Является ли минимизирующая функция одноэкстремальной?» «Можно ли найти сходящийся эффективный алгоритм вычисления хотя бы одного локального минимума заданной функции?» Назначение трансцендентальной логики И. Кант усматривал, во-первых, в установлении источника знания, во-вторых, в определении его объема и, в-третьих, в выявлении границ разумного мышления.
Развитие геометрии шло от псевдоэвклидовой плоскости к трехмерному пространству и далее к четырехмерному миру Г. Манковского, скрытого от непосредственного зрительного восприятия. Через три операции – отрицание, конъюнкцию и дизъюнкцию – выражаются многочисленные высказывания. Термины связность, сложность и катастрофа охватывают атрибуты процессов, пронизывающих различные направления теории систем.
Методология научного познания в зависимости от того, какая сторона явления считается наиболее существенной для данного исследования, позволяет выделить три типа моделей: концептуальные (феноменологические), эмпирические (физические) и математические (аналитические). Структура науки сводится к трем взаимодействующим между собой компонентам знаний: эмпирическому, теоретическому и философскому.
Имеют место три модуса времени: постоянность, последовательность и одновременность. В постулатах эмпирического мышления формулируются три вида условий: формальные, материальные и их сочетание. Разум мыслит посредством категорических, гипотетических и дизъюнктивных умозаключений. Переход от физической модели к математической совершается посредством трех операций: абстрагирования (выделение одного свойства объекта), обобщения (распространение выделенного свойства на другие объекты) и идеализации (логической операции, определяющей предел выделенного свойства).
Для выбора методологического подхода, разработки технологии и инструментальных средств компьютерного тестирования целесообразно исследовать практические задачи совместимости программ и данных в трех аспектах.
· Создать программы и базы ПДТЗ, обладающие свойством рентабельной переносимости в заданных пределах.
· Перенести в создаваемую инструментальную среду тестовых проверок существующие ЭФТК, которые разрабатывались без учета всего комплекса факторов, влияющих на эффективную переносимость.
· Оценивать эффективность разработки KCT3 и переноса ПДТЗ при управлении проектом, учитывая выигрыш от простоты ввода ЭФТК, переноса ранее созданных тестовых ситуаций и затрат на перенос, а также выигрыш и потери в функциональных возможностях приложений за счет их переноса e исходных на новые платформы.
В экспертных системах для записи различных типов решений об оценке меры трудности ПДТЗ используется «доска объявлений», на которой могут быть записаны три типа представлений: элементы плана, заявок и решений. Первые описывают способ решения задачи анализа категории трудности ЭФТК, включая текущие планы, цели и контексты. Второй тип представлений несет информацию о потенциальных действиях, ожидающих выполнение, которые соответствуют правилам вычисления коэффициента согласования оценок экспертов и установления интервалов качества. Элементы решения представляют собой гипотезы и выводы, генерируемые экспертной системой в качестве возможных вариантов вместе с зависимостями, связывающие эти решения между собой.
Для реализации экспертных систем принятия решений о мере трудности ПДТЗ существуют различные возможности формирования программной оболочки, основанные на:
· применении языков высокого уровня;
· использовании специальных языков программирования;
· выборе пакета прикладных программ.
Три типа коммуникаций характерны для информационного общества: между людьми, между людьми и информационными системами и между самими системами. Триада «вход-процесс-выход» описывает информационные процессы. Цели субъекта при организации управления сводятся к одной из трех форм «приравнять – ограничить – минимизировать». Целостная система включает три компонента и их модели: «человек – управляемый объект и процесс управления». Информация получает статус равноправного члена триады «масса – энергия – информация», как это следует из работ Н. Винера и А. Берга. Развитие организационно-технической системы представляется во времени траекторией трех групп показателей: входные, внутренние и выходные состояния. Производственные процессы объекта управления характеризуются триадой «ресурсы-процесс-продукт».
В искусстве и литературе трихотомия встречается еще чаще: «Три танкиста», «Три тополя на Плющихе», «...У отца было три сына», «Три девицы под окном», Три богатыря, «Змей трехглавый», «Три попытки», «Русская тройка удалая», «Три поросенка» и т. п. Работая в различных живописных манерах, Леонардо да Винчи, Микеланджело Буонарроти и Бартоломео дела Порта сходились в поисках изобразительных средств, с помощью которых можно было достичь единства и свободы в передаче пространства. Тринитарное мышление мы наблюдаем на примере изображения девы Марии: молящейся, указывающей, умиляющейся. Часто говорят, «бог троицу любит». Изобразительное искусство расщепляют на композицию, рисунок и живопись. Достижение формального равновесия, согласия и спокойствия прослеживается в трихотомии творчества Рафаэля: Три грации, Сон рыцаря, Мадонна в зелени, Мадонна со щегленком и Прекрасная садовница.
Лучший путь к постижению творчества – через триаду братьев Карамазовых. Триада «вера – долг – тоска» характеризует «Три сестры» . Три новеллы Эдгара По «Убийство на улице Морг», «» и «Похищенное письмо» образуют первый канон, на котором строится сюжет классического детектива. Требование нравственности определяется такими нормами, как «не лги», «не воруй», «не чини насилия», а совестливость – интеллигентностью, духовностью и порядочностью. Рейнгардт свел «возвышенные» женские характеры к трем типам: Эгерии, Пенелопы и Сивиллы. Триединство истины, доброты и красоты – это вершина Единого, о котором говорит «Троица» Рублева. Творчество великих писателей венчает трилогия.
Ф. Шеллин в книге «Философия искусства» указывает, что идея триединства имеет философский смысл: «Вечное есть Отец всех вещей, никогда не выходящий из своей вечности, но рождающий себя от вечности в двух формах: конечное, которое есть сам по себе абсолютный, но во внешнем явлении страдающий и очеловечивающийся Сын, а затем вечный Дух, бесконечное, в котором все вещи суть Единое». Трехгранность культуры отражается в разнообразии подходов к ее определению (антропологический, философский, социологический). С помощью категории бытия интегрируются три идеи о существовании мира: целостность – единство – реальность. В специфике рассуждений содержания философской категории бытия возникает триада: трудность – вопросы – сомнения. Триада «вера – надежда – любовь» подчеркивает диалектическое единство тела и духа человека. Строение материи можно представить как иерархию трех уровней: «метагалактика – неживая природа – биосфера». Формы движения материи сводятся к трем сферам материального мира: неживой природе, живой природе, обществу. Материальными носителями биологического движения выступают белки, ДНК, РНК. Для описания целостной картины Мира объединяются ценности духовные, культурные и нравственные. Духовное освоение мира и самопознания человека происходят на общефилософском, социально-философском и культурологическом уровнях. Разум – это триединство мышления, нравственности и системы знаний.
Великий Конфуций (Кун-фу цзы, 551г. до н. э.) различал три полезных друга – справедливый, чистосердечный, знающий, – и три друга, приносящих вред – льстивый, двуличный и красноречивый. Он утверждал, что существует триада полезных (музыка, речь о чем-нибудь хорошем в людях, дружба с достойными людьми) и триада вредных радостей (тщеславие, безделье, застолье). Конфуций предостерегал: рядом с благородным мужем допускают три ошибки – опрометчивость, скрытность и слепота. Китайская классическая «Книга перемен» содержит высказывание о том, что в мире действуют три потенции – небо, человек и земля.
Существует три уровня понятия: бытовой, научно-рациональный и творчески-духовный. Связям «строение, функционирование и развитие» соответствует структурный, функциональный и генетический типы целостности как единство частей в многообразии их взаимодействий. Только в совокупности эти три понятия дают целостную практику факторов, от которых зависит качественная определенность системы компьютерного тестирования. Диалектическое «отрицание» включает в себя триаду «деструкция, кумуляция и конструкция». Реальным аналогом «отрицания отрицания» являются «спиралевидные» процессы, включающие в себя цикличность, повторяемость и поступательность.
Единство сил, определяющих циклические периоды Хаоса и Порядка, прослеживаются в индийской философии, где выделяются три мифических образа: творец мира (Брахма), хранитель мира (Вишну) и разрушитель мира (Шива). Этим образам свойственны три качества: активность, уравновешенность, неустойчивость. Они прослеживаются в различных модификациях во многих легендах и учениях: плодородие – жизнь – смерть; творец – хранитель – разрушитель; бог – пророк – дьявол; идея – память – забвение; возбуждение – невосприимчивость – покой. Духовное освоение мира и самосознание человека происходит на трех уровнях – общефилософском, социально-философском и культурологическом. Признание необходимости существования триадной Европы «Западная – Центральная – Восточная» выступает как предпосылка идентификации и целостности народов континента.
Самосознание человека происходит на общефилософском, социально-философском и культурологическом уровнях. Чувственное познание включает в себя три формы отражения: ощущение, восприятие и представление. Неотъемлемой частью человеческого познания являете абстрактное мышление, которое осуществляется в формах понятия, суждения и высказывания. В психологии принято различать три ступени человеческой памяти: мгновенную, оперативную и долговременную.
Лингвисты, антропологи, культурологи, этнографисты и др. отмечают особые свойства числа три в плане обязательного присутствия в сознании трех признаков, трех главных осей и т. п. Окружающий мир человек воспринимает как трехмерный. Для всех примитивных культур характерно наличие символической цветовой триады «белое, красное, черное». Цвет также описывают три параметра: спектральный состав, насыщенность и светосила.
В философско-образовательных исследованиях рассматриваются три взаимосвязанных друг с другом объекта – «человек – социум – цивилизация». Единство трех аксиологических составляющих – государственной, общественной и личностной – образуют категорию ценности образования. Благодаря способности к творчеству человеческая деятельность обладает триадой универсальных качеств: преобразующих, универсальных и динамических.
Методологическая культура преподавателя высшей школы – системная триада «наука – обучение – воспитание»; аспекты педагогической деятельности заключены в единый смысл «методика – дидактика – педагогика». В педагогике замкнутые триады образуют антитезы «учение – преподавание – научение», «простота – точность – локальность», «целостность – элементарность – связанность», «представление – знание – умение». Выдающийся педагог эпохи Каменский соль жизни видел в сочетании разума, действия и речи. В психологической концепции выделены три «образующие» сознания – личностный смысл, значение и чувственная ткань.
Мировоззренческие аспекты духовной сферы образования рассматриваются в триаде «наука – образование – религия». Образование синтезирует триаду «наука – образование – производство», а синтез знания и веры соединяются в триаде «знание – смысл – вера». Среднее образование связывает триаду «начальное – среднее – высшее» в единую сферу образования. Содержание образовательных программ определяет подготовку бакалавров, специалистов и магистров. Гармонию аксиологических блоков «государственная – общественная – личностная» составляет категория ценности образования. Философия образования реализуется через триаду «статус – проблемы – перспективы», а менталитет социума – «знания – познания – преобразования». Применение тестов с целью прогнозирования профессиональной пригодности осуществляется на основании триединства аналитического, синтетического и комплексного подходов. Формирование механизма моральной мотивации у тестируемых определяется триадой: «элементарная нравственность, конвенциональная нравственность и автономная нравственность».
M Вебер различает политиков «по случаю», «по совместительству» и «по профессии». С математической точки зрения установление типа шкалы дидактической оценки определяет способ, обеспечивающий переход от одной числовой системы к другой, если они «включают одни и те же отношения и гомоморфны одной и той же эмпирической системы». П. Суппес и Дж. Зенис подчеркивали, что «числовое представление – это функция, гомоморфно отражающая эмпирическую систему на числовую, шкала – это кортеж длинной три, один из элементов которого есть числовое представление [Суперс C., Зинес Дж. Основы теории. Психологические измерения. M., 1967].
Приведенный список триад выглядит бессмысленным до тех пор, пока не уточнено внутреннее содержание каждой триады, не выяснено введение третьего понятия, которое уменьшает противоречия между «крайними терминами». Так, если генезис диады «статика – динамика» антитетичен, то в плоскости триады одновременно существует три парных отношения «статика – кинематика – динамика», смещенные относительно центра. Введение третьего измерения в антитез «явление – сущность» замыкается аналитически через понятие «структура». Резкие грани дня и ночи устраняет рассветно-сумеречная зыбкость. Язык превращает диаду индивидуализированного и объективизированного духовного в единую триаду «сознание – язык – мысль». Связка «есть» замыкает высказывания «роза белая», «калина красная» и т. д. Она приписывает субъекту всеобщую характеристику свойства «быть».
Системная триада характеризуется целостностью и единством содержания, устойчивостью составляющих ее частей. Если генезис диады изначально антитетичен (сильный-слабый, добрый-злой), то в плоскости триады одновременно существуют три парных отношения, смещенные относительно центра. Триады образуют путем расщепления доминирующей части диады или путем дополнения последней до триады. При этом её жизненность обеспечивается наличием корреляций между частями тройного комплекса. Так, обогащение категорий «часть-целое» понятием связи открыло путь к формированию трех взаимосвязанных категорий: элемент, структура, система; общее и единичное синтезируется в категории особенного, отражающей меру и способ их целостности.
Разработан ряд шкал порядка для анализа профессиональной пригодности или достижений испытуемых. Так, например, для вычисления оценки использует девятибалльную шкалу. В ней по результатам тестовых проверок с учетом диагностических коэффициентов подсчитывается интегральная оценка, включающая в себя беседы с абитуриентом, наблюдения за ним в процессе выполнения заданий, методику исследования оперативной памяти и другие параметры личности.
Тринадцатибалльная система была введена (1832) в Царскосельском лицее и представляла собой шесть ступеней: «0 – худой успех; 1 и 2 – слабый; 3, 4 и 5 – посредственный; 6, 7 и 8 – хороший; 9, 10 и 11 – весьма хороший и 12 – отличный». В 1834 г. система баллов была изменена: «12 оставлено для обозначения отличных успехов, 11 и 10 принято за весьма хорошие успехи; 9 и 8 – хорошие; 7 и 6 – удовлетворительные; 5 и 4 – посредственные; 3 и 2 – худые; 1 и 0 – для обозначения безуспешности [Исторический очерк Императорского лицея 1811 – 1861 С. – Петербург, 1861]. Применительно к педагогическим измерениям B. C. Аванесовым предложены десятибалльная и одиннадцатибалльная шкалы оценки. Шестнадцатибальная шкала описана A. O. Татуром. В соответствии с предложениями специальной группы Task Group on Assessment and Nesting в Англии результаты уровней достижений школьников определяются по 10-балльной шкале.
Переходя к триадной сущности шкалы оценки, мы выдвигаем версию, что триада, как одно из возможных логичных объяснений представления результатов СКДО, может быть использована при установлении УУД тестируемого. Третий фактор здесь выступает в роли регулятора, а учет всех частей триады ведет к построению симметричной формы принципа неопределенности. Отсюда следует, что если подойти к проблеме культуры оценки более широко и откорректировать соответствующим образом смысл используемых терминов, то получается не тупик, а диалектическая перспектива шкалирования.
Рассмотрим в качестве триадной структуры шкалу оценки поведения респондента на уровне отличника. За традиционной отметкой не удается различить индивидуальные состояния обученности целеустремленных объектов. В системе обучения отметка выражает атрибут анонимного множества экзаменуемых без учета их индивидуальности. Здесь невозможно обнаружить никаких специфических черт, характерных, например, для почти отличников и превосходно обученных испытуемых. В триаде необходимо предусмотреть традиционную отметку и ввести необходимые рациональности. Расщепляя понятие «отличник» на части, получим оценочную триаду типа «превосходно – отлично – почти отлично». Такому подходу соответствует общепринятая оценка преподавателя, когда он уточняет качество проверки достижений студента знаками « – и +» (т. е. – 5, 5 и 5+). Здесь здравому рассудку экзаменатора, ориентированного на однозначность оппозиции «соответствует – не соответствует», противостоит триада «почти отлично – отлично – превосходно». Если есть культура оценки, то есть и диахронизм, наличие не одной, а нескольких оценок (как нет личности, тождественной другой личности). Раскрывая внутренние связи триады с учетом их содержания, можно более точно различить испытуемых одного класса обученности. В свою очередь, если вся триада тяготеет к другой отметке, то ее можно замкнуть в системную триаду более низкого уровня. В результате приходим к тетраэдру триад (рис.10).

Рис.10 Двенадцатиуровневая шкала оценки
Двенадцатиуровневая шкала позволяет усилить различающую способность оценки поведения эмпирических объектов, не создавая при этом проблем для преподавателей, традиционно использующих пятибалльную (а точнее четырехбалльную) систему отметок. Базовые точки на рисунке составляют привычную систему отметок, а скачки характеризуют переход количественных изменений оценки в качественные, когда незначительные изменения поведения испытуемого являются источниками его перехода из одного класса обученности в другой. Скачки определяют критические моменты «перехода» поведения тестируемого из одного класса обученности в другие, когда в точках «разветвления» (бифуркации) возможных путей эволюции качества заключений индивида тестирующая система принимает соответствующие решения. Связь количественных и качественных противоположностей выражается понятием меры, которая определяет интервал изменений оценки, в пределах которого сохраняется заданный уровень достижений.
(1775 – 1854) отрицал скачки, перерывы в постепенном развитии. Он исходил из мысли (1646 – 1716) о том, что природа не делает скачков. Отсюда следует и ошибочное заключение Шеллинга – все различия в природе и мире носят лишь количественный характер. Ф. Гегель () впервые разработал категорию меры, выражающую гармоническое единство качественной и количественной определенностей. В соответствии с этой категорией каждому качественному уровню-интервалу оценки в триаде присущи определенные количественные характеристики. Баллы изменчивы и подвижны. Однако эта изменчивость ограничена уровнем-интервалом триады, за границами которого количественные изменения приводит к появлению нового качества оценки.
Примером того, как накапливающиеся количественные изменения в течение сеанса компьютерных тестовых испытаний приводят к скачкам, является структурная адаптация системы КАТ, когда в результате анализа заключений объекта нечисловой природы на требования тестовых заданий происходит автоматическое изменение категории трудности предъявляемых ему тестовых проблемных ситуаций. Гегель в связи с этим отмечал: «Кажущееся невинным количественное изменение представляет собой хитрость, за которой улавливается качественное изменение». В рассматриваемом нами случае оценки описание закона взаимного перехода подчиняется триаде: качество – количество – мера.
Образование триадной шкалы порядка дает возможность организовать в процессе КАТ различение испытуемых по УУД внутри каждого таксона. Это позволяет утверждать, что культура вариативности степени обученности испытуемых может быть достигнута только на основе различия поведения испытуемых внутри данного класса обученности. Отсюда следует вывод: механизм культуры оценки работает не в направлении стандартизации образа тестируемого и подгонки его поведения к общепринятой отметке, а в направлении роста оригинальности, возрастания различий в поведении испытуемых. Здесь действует принцип неразличимости части и целого, когда, входя в целое как часть, отдельная индивидуальность не перестает быть целым. Находясь на этой позиции, можно с полным правом говорить о культуре триад в образовании, если иметь в виду не традиционную отметку, а прогностический смысл культуры оценки. Суть вопроса заключается в индуктивном механизме того, что принимается нами как правдоподобное основание для интерпретации поведения целеустремленных объектов.
Триадная сущность шкалы оценки состоит в том, что результаты СКДО между уровнями-интервалами отдельных триад можно отнести к оценкам на порядковой шкале, когда в зависимости от собственных достижений тестируемый относится системой КАТ к тому или иному классу обученности. Это позволяет упорядочить объекты на этапе кластеризации. Более того, внутри каждой триады поведение испытуемого оценивается на интервальной шкале, когда для любых значений оценок θ1 и θ 2 содержательный смысл имеют не только соотношения типа θ1 = θ2 или θ1 > θ2, но и разность между ними.
Особенно важным для тестируемых представляется выбор ими меры трудности заданий в период рациональной аттестации. Ведь полученная им на этапе типологической классификации оценка является приближенной. Если количественное изменение переходит ту или иную границу (в случае, когда полученные тестируемым баллы находятся на границах скачков), то при незначительных отклонениях поведения испытуемого происходит нарушение меры и действия тестируемого элиминируются.
Приведенный системный тетраэдр триад оценки УУД телеологических объектов сохраняет качественную картину проверки достижений и обеспечивает естественное различение их качества обученности на каждом уровне иерархии шкалы, представляющей собой совокупность возможных цифр и уровней-интервалов, соответствующих качеству заключений тестируемых. В каждой триадной дефиниции, например, «почти хорошо – хорошо – более чем хорошо» и т. д. существенно новым является понятие целостности. Уровень достижений каждого образа отмечается теперь не точкой в плоскости отметок, а окружностью на шкале оценок. Окружность выделяет в рабочем пространстве «хорошиста» область целостного УУД индивида. Триада выступает здесь как фундаментальная структурная ячейка синтеза, кристаллизующая в себе значение латентного параметра обученности конкретного испытуемого.
Доминирование отдельных частей в каждой триаде приводит к изменению ее роли, значимости и «удельного веса» других компонентов, обеспечивает целостность связей, адекватность и образность оценки. Вместе с тем элементы триады неразрывно связаны (скоррелированы) друг с другом, выражают взаимодействие диалектических понятий в пределах заданного уровня достижений тестируемого. Конкретная отметка занимает в триаде соответствующее ей среднее положение, сохраняя при этом свою смысловую нагрузку (отличник, хорошист и т. д.). Триада сопоставляет, соединяет индивидов одного класса обученности, уточняет и индивидуализирует их УУД. При всей размытости понятий триадических процедур степень их точности описания уровня знаний, интеллектуальных умений и практических навыков соответствует естественной оценке, устанавливаемой экзаменатором.
Приведенные рассуждения позволяют обосновать вывод: только избегая двух крайностей – количественного и качественного подходов к установлению значений латентных параметров целеустремленных объектов, – можно применять культуру оценки для проведения объективного компьютерного тестирования уровня обученности каждого конкретного испытуемого. Исследуя структуру культуры оценки, замечаем, что помимо целостности каждая триада обладает свойством симметрии относительно базовой отметки. В нарушении симметрии триады можно усмотреть скрытое за этим проявление симметрии другого типа, в переходе от одиночной триады к тетраэдру триад. Речь идет об иерархии симметрии триад, зацепленных друг за друга и соединяющих разные уровни достижений. Эта идея переходящих друг в друга триад заимствована из рассмотрения широкого круга вопросов, связанных с их построением и изложенных в [11]. Строение оценки УУД телеологического объекта (рис.10) есть синтез вычисления (количества) и классификации (качества). В рассматриваемом нами случае оценки понимаются не как противоположные друг другу понятия «соответствует – не соответствует», а как иерархия переходящих друг в друга различных (но близких) уровней обученности. Здесь же следует еще раз подчеркнуть, что идея замыкания оценки внутри каждой триады и связей между триадами приобретает в последнее время все большую и большую популярность. Конечно, в этом случае требуется наличие машинной программы для установления оценки, чтобы в каждом треугольнике триады представить поведение конкретного объекта нечисловой природы.
Триадный подход к стратегии оценки достижений позволяет перейти к интервальной шкале. Действительно, если производить различение испытуемых внутри любой из триад, то разность между оценками уровней достижений любых двух индивидов имеет вполне осмысленное значение.
Отказ от привычных для преподавателей отметок – цифрового аналога оценки и признание существования триад – является новым шагом на пути объективизации учебных проверок и способствует совершенствованию культуры регулирования процессом обучения. Таким образом, переход к культуре оценки оказывается неотделимым от проблемы культуры КАТ в целом.
Развивая диалектический метод, можно утверждать, что системно-триадный синтез открыт для преодоления. Однако следует помнить, что идеал всегда хорош, пока мы не слишком к нему близки, что даже переход при аттестации испытуемых от двух компонентов к трем имеет большое значение: «Задача взаимодействия двух тел была решена еще И. Ньютоном, а проблема трех тел не решена до сих пор». Безусловно, речь идет только о некоторой степени упорядочения стратегии оценки поведения испытуемых, а не о завершенном исследовании. Согласно принципу , полный порядок во всем равноценен полному хаосу, неопределенности. Надо лишь помнить, что в истории культуры диалектические противоположности всегда понимались в смысле взаимодополнительности, симметрии и взаимоуравновешенности. В тетраэдре триады взаимосвязаны настолько, чтобы обеспечить различение поведения испытуемых как внутри каждой триады, так и дифференциацию поведения тестируемых с различными уровнями-интервалами обученности.
Шкалирование при анализе дидактической информации
Теория тестирования, каким бы строго дедуктивным не было ее изложение, не есть ее априорная конструкция. Ее дедуктивным образом изложенные результаты ни в малейшей степени не исключают генетического отношения теоретического к эмпирическому в самой фундаментальной теории КАТ, типичные характеристики которой не сводимы к системе одних лишь логических выводов.
Научная теория, во-первых пользуется абстракциями более высокого порядка, чем эмпирическое исследование; она восходит от эмпирических данных к идеализированным объектам, широко применяет понятия, не имеющие реальных коррелятов; ее объяснения и выводы включают в себя гипотетические представления.
Второе существенное отличие научной теории состоит в том, что она – продолжение предшествующих теорий, которые непрерывно перерабатываются и развиваются. Масштабность, уровень объяснения, глубина проникновения в сущность явлений, обобщение качественно разнородного фактического материала отличают переход от эмпирического к теоретическому знанию. Здесь важно уметь вскрыть специфическую форму единства этих категорий научного познания.
Эмпирический фундамент оценки несравненно многообразнее, чем материал экзаменационной отметки, сознательно ограниченной необходимым минимумом фактических данных.
Традиционные баллы – наиболее наглядный пример в определении УУД экзаменуемого. Значение этого параметра отражает форму и отношение качества заключений тестируемого на ПДТЗ различной или конкретной меры трудности безотносительно к эмпирическому объекту, к которому они могут быть применены. Количество баллов – идеализированная цифра, не обладающая физическими свойствами обученности индивидов. Безусловно, количественные отношения и формы их представления наличествуют в самой объективной действительности, но методы их вычисления «имеют своим непосредственным предметом не сами объекты и явления действительности, а идеальные объекты, которые они рассматривают умозрительно, исключая из своих аргументов ссылку на опыт» (. Математика. «Философская энциклопедия», т.3).
Данные наблюдений, послужившие исходным материалом для вычисления баллов, разумеется недостаточны для объяснения состояния обученности конкретного индивида. Чтобы понять закономерность этих величин, необходимо уяснить тот факт, что математика изучает логически возможное «безотносительно к тому, возможно ли его действительно осуществить». Логическая сущность баллов стремится выявить, исчерпать мысленно значение латентного параметра обученности индивида. Дедуцируя формально возможное, установление балла учебных достижений представляет реальную возможность их эмпирической интерпретации. В этом смысле можно сказать, что абстрактные математические положения опосредованным образом связаны с определением состояния обученности тестируемого. Эту связь необходимо исследовать с позиции категории качества. Утверждать, что состояние обученности объекта нечисловой природы может быть описано только количественно баллами, значит полностью устранить информационно-эпистемологическую проблему, значение которой для понимания сущности шкалирования трудно переоценить.
Задача шкалирования состоит в том, чтобы построить оценки качества заключений тестируемых в числовых или номинальных шкалах. Целью шкалирования является проектирование пространства научных наблюдений за поведением тестируемых. Пространства могут быть метрическими (чаще эвклидовым) или метрика может задаваться только путем упорядочения оценок поведения телеологических объектов по осям. Рациональными с точки зрения представления результатов КАТ являются методы шкалирования, в которых УУД индивидов не менее, чем интервальный.
В зависимости от вида исходной информации методы шкалирования делятся на метрические и не метрические. Если качество заключений тестируемых на требования ПДТЗ различной категории трудности предлагается оценить в шкале от 1 до 3, причем 1 – значение самого легкого тестового суждения, а 3 – самого трудного тестового утверждения, то предлагается оценить выводы индивидов в интервальной шкале. С информацией такого рода работают метрические способы, и с этими данными проводятся соответствующие арифметические операции. В другом случае предлагается упорядочить качество заключений респондентов по предпочтению. Информацию такого вида обрабатывают с помощью неметрических методов шкалирования (ранговая шкала). С подобными данными не производится никаких незаконных для порядковой шкалы арифметических операций.
Поскольку тестометрия занимается анализом поведения как отдельных респондентов, так и групп индивидов, то дидактическая оценка исходного уровня их учебных достижений связывается с вычислением баллов, полученных целеустремленными объектами в процессе обработки их заключений на ПДТЗ различной категории трудности, а также взаимным расположением результатов КАТ вдоль некоторой шкалы отсчетов. Тестометрическая концепция такого шкалирования заключается в содержательном разделении поведения объектов нечисловой природы на классы, определяемые заданием качественных уровней-интервалов, когда количественное различие определяется полученными респондентами баллами и трактуется как степень выраженности числового аналога этого качества. Отображение эмпирической системы с отношениями обученности между объектами в числовую и интервальную шкалу будем называть шкалой оценок. На этой шкале расположены отсчеты (деления) для вычисления баллов и уровни-интервалы для отнесения поведения эмпирического объекта к тому или иному таксону (рис. 11).
Оценка УУД тестируемого – категория качественная. До тех пор пока полученные индивидом баллы не получат смысловую окраску, невозможно судить о значении латентного параметра обученности респондента. Поэтому отнесение количественных данных характеризующих поведение респондента, к конкретному качественному уровню-интервалу его обученности – постижение смысла оценки для заданной процедуры шкалирования. Постигая сущность оценки, мы как бы переносим замысел исходного знания проектировщика алгоритма отображения УУД объекта нечисловой природы, обогащая это знание собственным суждением.
Желательно, чтобы шкала оценки, уточняя традиционный подход к отметке, была принципиально доступна пониманию позиционеров, психологически воспринималась как утверждение справедливости, подъем на новую ступень установления действительной степени обученности респондента. Более высокий уровень понимания алгоритма шкалирования связан с новой познавательной позицией, задающей интеллектуальную перспективу видения изучаемой реальности. Вне этой рациональной позиции исследователя вопрос о понимании качества отображения поведения тестируемого на шкалу оценки не может иметь адекватного решения. Рациональность есть, прежде всего, сфера принципов, допущений и процедур, обеспечивающих требуемую объективность и результативность процесса КАТ.
Если толковать процедуру шкалирования произвольно, как некое чисто субъективное образование, никак не обусловленное принятой в сфере обучения и исторически сформулированными методами оценки УУД индивидов, то неизбежно придется либо отказаться от научной рациональности как регулятивного принципа, либо этот принцип истолковывать каждый раз в субъективистском духе.
Разумеется, выбор алгоритма шкалирования может оказаться и неадекватным, так или иначе деформирующим отображаемую степень обученности объекта нечисловой природы. Но для системы образования принципиальное значение имеет решение вопроса о возможности адекватного понимания сущности оценки УУД индивидов. В этом случае шкалирование приобретает новое в информационно-эпистемологическом смысле качество: с одной стороны, оно есть некоторая «точка зрения» познающего субъекта, задающая интеллектуальную перспективу видения реальности оценки, с другой – оно является некоторой объективной мерой, обуславливающей масштаб подхода к изучаемому процессу, некий его аспект, высвечиваемый субъектом с помощью имеющихся у него инструментальных и концептуальных средств. Объективно задаваемую познавательную процедуру шкалирования целесообразно обозначить как «смыслообразующий уровень-интервал качества обученности тестируемого».
Рассмотрим основные средства качественного уровня-интервала обученности:
· интервал представляет собой относительно замкнутую целостность качественной оценки УУД каждого целеустремленного объекта;
· представление в оценке поведения тестируемого имеет место внутри каждого уровня-интервала. Так, нельзя понять, что такое «почти отличник», если не указано относительно какого уровня-интервала обученности идет речь;
· переход от одного уровня-интервала обученности к другому осуществляется в виде скачка и объективно детерминирован. Хотя научный смысл шкалирования носит интервальный характер, это не приводит к ситуации «несовместимости» парадигма традиционной отметки и нового механизма качественной оценки, что позволяет обоснованно говорить о семантической преемственности триадного подхода к выбору шкалы оценки;
· смыслообразующие уровни-интервалы устанавливают информационно-эпистемологическую границу между объективным и субъективным;
· качественный уровень-интервал оценки достижений имеет культурно-историческую нагруженность. Это отчетливо видно на примере перехода от качественной традиционной четырехбалльной оценки, когда количество (баллы) и качество (уровни-интервалы) рассматриваются как единое целое.
Предикаменты (категории) количества – «сколько» и качества – «какое», введенные Аристотелем, образуют диалектическую пару и имеют собственную, реализующую их схему. В категории качества отражается специфика оценки, а в количестве — ее значимая определенность. Так, схема количества есть число, а схема качества – синтез ощущений, т. е. отражение свойства степени обученности эмпирического объекта. Категория «количество» выражает УУД тестируемого в баллах, в то время как предикамснт «качество» объединяет сходные достижения респондентов. Качества допускают большую или меньшую меру УУД. Им также присущи противоположности: если одна противоположность качества есть «аттестован», то другая будет – «неаттестован».
В рассматриваемом нами случае процедура шкалирования опирается на качественный (логичный) и количественный (логический) анализ. Игнорирование качественного подхода для оценки поведения объектов нечисловой природы затушевывает реально существующие дидактические процессы и находит лишь абстрактные числа – «Ряды чисел увлекают» (). На рис. 11 приведена модель процесса установления оценки (оценивания и типологической классификации). Множество делений шкалы оценки (например 100) характеризует баллы, а множество уровней-интервалов обученности определяет качество полученной тестируемым оценки.

Рис. 11 Модель оценки
Отказ от принципа постулирования традиционной шкалы отметки, т. е. переход к содержательной методологии шкалирования означает перевод теории тестометрии на позиции гармоничного синтеза категорий количества и качества оценки. Процесс приписывания чисел поведению конкретных эмпирических объектов в соответствии с разработанным методом шкалирования будем называть оцениванием. Назовем шкалой отображение множества заключений тестируемого на требование ПДТЗ различной меры трудности в числовую систему с отношениями, носителем которой является совокупность действительных чисел.
Шкала определяется триадой <Я, Ч, Ц>, где Я – исследуемая эмпирическая система с отношениями (описание поведения тестируемого); Ч – некоторая числовая система с отношениями; Ц – отображение первой во вторую. С помощью этой шкалы каждому результату тестовой проверки ставится в соответствие некоторое число. Будем называть эту квазичисловую оценку балльным значением поведения объекта. На рис. 11 указаны эмпирически установленные границы действительной степени обученности тестируемых:
θmax – верхняя граница, за которой присваивается высшая количественная отметка (θmax = 100);
θmin – низшая граница количественной отметки (θmin = 0).
Обозначим размах выборки r = θmax – θmin , найдем длину качественного уровня-интервала
![]()
и запишем формулу перевода количественного значения отметки Q. в ее качественный аналог:

Пусть 10 испытуемых получили в течение сеанса компьютерного тестирования следующие баллы (табл.1). Для наглядности данные в табл.1 упорядочены.
Таблица I
|
Количественные значения баллов | ||||||||||
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 | |
|
θi |
16 |
27 |
31 |
44 |
55 |
66 |
78 |
83 |
92 |
98 |
Требуется найти значение качественных аналогов для этих количеств, если максимальное число баллов, которое может получить тестируемый, равно θmax =100. Размер используемого уровня-интервала телеологического состояния обученности объекта зависит от наших целей. Предположим, что нижняя отметка границы θmin =0, а число качественных уровней – интервалов оценки К = 12. Тогда в соответствии с (1) длина уровня-интервала

По формуле (2) переведем количество баллов полученных индивидами в их качественные аналоги.
Границы уровней-интервалов и соответствующие им качественные оценки сведены в табл.2.
Таблица 2
|
Количество (θi) |
16 |
27 |
31 |
44 |
55 |
66 |
78 |
83 |
92 |
98 |
|
Качество (Кi) |
2.8 |
4,0 |
4,4 |
5,8 |
7.0 |
8.2 |
9,6 |
10,1 |
11,1 |
11,8 |
|
3 |
4 |
4 |
6 |
7 |
8 |
10 |
10 |
11 |
12 | |
|
Оценка |
2+ |
3 – |
3 – |
3+ |
4 – |
4 |
5 – |
5 – |
5 |
5+ |
Предлагаемая двенадцатиуровневая шкала оценки учитывает количественные и качественные свойства обученности тестируемого и способна разрешить противоречие между оцениванием и классификацией его поведения. Она сочетает в себе функцию смыслового анализатора значения латентного параметра индивида и функцию корректного статистического оценивателя количественных характеристик этого свойства. Такой компромисс возникает с первых шагов разработки алгоритма шкалирования, который состоит из двух частей: способа оценивания поведения тестируемого, выраженному в сырых баллах, и метода перехода от этих баллов к качественной оценке.
Обращение тестометрии к целенаправленному исследованию свойства обученности объекта нечисловой природы позволяет не только более содержательно отразить его поведение в модели, но и в существенной степени корректировать требования к алгоритму шкалирования. Интересующие исследователя или тестирующего отношения в эмпирической системе проверок могут быть конкретизированы в процессе моделирования. В таком случае приписывание поведению целеустремленного объекта шкального значения и отнесение этой величины к тому или иному качественному уровню-интервалу можно считать оцениванием УУД тестируемого, соответствующим его скрытому параметру обученности.
Под предметом моделирования понимается некоторый условный процесс компьютерного адаптивного тестирования, качественные свойства которого отражены в уровнях-интервалах обученности, а количественные – в баллах, полученных за некоторый период времени. Целью моделирования является установление новых знаний о латентном параметре индивида.
Будем считать, что изменения степени обученности объекта носят эволюционный характер и в отсчетный период остаются неизменными. В отличие от ряда научных наблюдений физических, технических или биологических процессов с их возможностью планирования эксперимента и известной точности средств измерений, дидактические временные ряды заключений индивидов представляют собой принципиально неповторимые реализации показателей тестирования с отсутствием информации о статистических атрибутах ошибок оценивания. Поэтому говорить, как это имеет место в традиционной теории тестов и квалиметрии, что целью анализа поведения целеустремленных объектов является отыскание их математических ожиданий, корреляционных функций и прочих статистических характеристик, – значит ставить принципиально некорректную задачу.
В этих условиях наиболее целесообразным является использование методов непараметрической и интервальной статистики. Математическая статистика интервальных данных применяется в тех случаях, когда на знания неконтролируемых заключений тестируемых накладываются неопределенности учебной среды. Интервальный метод позволяет сгладить эти непредсказуемые воздействия на результаты оценивании, найти компромисс между тестометрией и статистикой.
Оценку в тестометрии можно сравнить с механической силой, имеющей направление и величину: направление соответствует уровню-интервалу, а величина – количеству баллов. Уровень-интервал следует из степени обученности, а число баллов нет. Уровень-интервал объективен, а количество баллов субъективно. Однако качество заключений – баллы существенно. Определяя количество уровней, мы «открываем дверь» для субъективных различий в поведении испытуемых. Рассматривая примеры триад, мы пытались увидеть логичные рассуждения в действии, конкретно, в описании процесса шкалирования. Безусловно, правдоподобные рассуждения не могут претендовать по точности с теорией доказательных выводов. Гипотетические рассуждения о многообразии триад близки к силлогизмам Аристотеля и Д. Пойа, построенных с помощью индуктивных методов.
В заключении этого раздела отметим, что участники культурного пространства тестовых испытаний приписывают различные значения и символический смысл феноменам этого комплекса. Культурный процесс КАТ превратился бы в неуправляемый хаос, если бы каждый раз позиционерам приходилось во всех деталях выяснять значение любого своего действия, прежде чем совершить его. Профессиональная культура тестолога, эксперта или разработчика ПДТЗ включает совокупность специальных знаний и интеллектуальных умений, связанных с проектированием содержания и формы, содержательности и логичности, а также выбор рационального объема представления тестовых ситуаций. Исследователи сталкиваются здесь с необходимостью применения методологических правил и норм, которые упорядочивают их деятельность. Совокупность этих культурных правил и норм образует культурные конвенции.
Процедура формирования тестируемыми концептов и выводов есть процесс познания, поскольку при этом респондент узнает (в случае содержательного и логичного для него ПДТЗ) что-то для себя новое. В качестве средства познания здесь выступает моделирование мыслительной деятельности эмпирического объекта, когда он преодолевает трудности при выполнении тестовых заданий.
Мысли, чтобы предстать в виде заключения, должны материализоваться, принять форму одного из значений признака сигнала. Материализация имеет две стороны: содержательную и логичную. Содержательный аспект материализации связан с выполнением отношения, существующего между смыслом ПДТЗ и возможностью тестируемого понять его. Логичность характеризует наличие соответствия между мерой трудности тестовой ситуации и действительной степенью обученности испытуемого. Когда мысль воплощается в конкретное следствие, то тем самым решается вопрос об ее объективной истинности. Этот процесс обнаруживает определенное несоответствие между образцовым выводом на требования ПДТЗ и полученным от тестируемого заключением, которое возникает вследствие либо недостаточности знания, либо незнании способов его реализации индивидом.
Содержание ПДТЗ включает в себя смысл и значение конкретной тестовой ситуации. Оно определяется контентом исходного знания и представляется в кратком тестовом суждении в свернутой и стандартизированной (для данного фрагмента учебной дисциплины) форме.
Степень валидизации KCT3 в значительной мере определяется содержанием, содержательностью и логичностью множества образцовых тестовых суждений. Процедура конструирования этих образцов проводится на этапе понятийной спецификации БТЗ. Поэтому при решении задачи анализа качественных показателей образцовых таблиц – KCT3 – в конкретных областях знаний используется опыт групп экспертов.
Содержательность определяет смысл тестового утверждения для испытуемого с фиксированной степенью обученности. Прагматически доступная тестовая ситуация бессодержательна для испытуемого, если ее энтропия (степень неопределенности) равна нулю. Энтропия проблемной тестовой ситуации может быть использована как мажоранта содержательности ПДТЗ и как оценка количества информации, необходимого для восстановления прагматически корректной ситуации.
Логичность ЭФТК устанавливает соответствие меры трудности тестовой ситуации латентному параметру обученности испытуемого. Простые задания для отличников и xopo-шистов являются нелогичными. Аналогичная ситуация наблюдается, если слабо подготовленные индивиды получают ПДТЗ с высоким для них уровнем трудности.
Документальными носителями содержания, содержательности и логичности тестовых материалов, в зависимости от степени их декомпозиции, выступают структуризация, понятийная и технологическая спецификации KCT3. Эти дидактические материалы задают результат, цели, разделы, темы, категории, понятия, последовательность, преемственность между ними и т. п.
В контексте содержательности и логичности интеграция тестируемых изучается через эмпирическое сходство их поведения. Здесь культурная дифференциация предполагает, что испытуемые с различными в некотором смысле латентными параметрами будут разделены системой КАТ и отнесены к различным образам. И в этой связи культура тестолога – творческая, ценностно-ориентированная способность к созданию валидных, содержательных и логичных для тестируемых KCT3.
Из содержательных истинных посылок ЭФТК можно вывести корректные заключения. При этом тестовые ситуации должны быть тщательно подобраны по смыслу и значению, логичными и содержательными для испытуемых с фиксированными уровнями обученности.
Когда мы говорим о мере трудности тестовой ситуации, то применяем эту философскую категорию для каждого конкретного содержания особым образом, и в качестве таковой она имеет значение только вместе с особым способом своего применения и воплощения. Мы не можем выразить эту меру в виде эталона, подобно эталону длины того метра, который хранится в Париже. Мера предпочтительности каждой тестовой ситуации устанавливается субъектом и поэтому она является категорией качественной.
Исключить факторы содержательности ПДТЗ и логичности нельзя в принципе, поскольку они имеют важное значение не только в процессе типологической классификации поведения объектов тестирования, но и при различении системой КАТ поведения испытуемых из одного образа. Для корректного проектирования и оперативного обновления содержания ЭФТК на этапе их наполнения или модификации целесообразно обращение к оценочным суждениям компетентных экспертов, использованию их профессиональных знаний и творческих потенций с целью внесения изменений в смысл и значение каждой тестовой ситуации.
В рассматриваемом здесь смысле культурное пространство КАТ настолько реально и полезно, насколько оно информативно. Поэтому содержательность и логичность есть сама реальность в том ее синтезе пассивности и активности испытуемого, который проявляется в качестве его поведения.
Изложенное позволяет заключить: обеспечение содержательности и логичности ЭФТК для испытуемых с фиксированными степенями обученности достигается только в том случае, когда смысл задания им понятен, а мера трудности ПДТЗ приближается к значениям латентных параметров обученности этих респондентов. Последнее достигается только в том случае, когда система КАТ может приспосабливать категории трудности тестовых суждений к качеству заключений каждого конкретного объекта нечисловой природы.
Стабилизация неустойчивого состояния системы КАТ, когда β → θ, есть принцип максимума эмоциональных переживаний индивида. В этом случае осуществляется наибольшая неопределенность микросостояния эмпирической системы КАТ, поскольку наблюдается максимально возможное мысленное напряжение испытуемого.
Во второй части книги описан нетрадиционный подход, позволяющий существенно уменьшить степень некомпетентности экспертов в оценке качества ПДТЗ. Анализ основан на применении сходства их мнений при оценке рассмотренных нами показателей ЭФТК. От того, насколько удачно сформировано множество образцовых тестовых утверждений, во многом зависит успех типологической классификации и рациональной аттестации УУД объектов нечисловой природы. Здесь нужна система понятий и способов оценки, которая выходила бы за пределы количественной статистики и учитывала бы интересы специалистов, изучающих поведение тестируемых, как типологическое, так и индивидуальное.
Эта книга продолжает развивать тезис: исчисление вероятностей к результатам оценки тестовых испытаний применять следует, но только с учетом гармоничного единства категорий количества и качества. По этому вопросу Д. Пойа высказывался так: «Приписывание правдоподобности числового значения на основании какого-либо допущения или симметрии следует здесь рассматривать как тривиальное: чтобы оправдать количественные правдоподобности, требуется что-то большее и более новое» [33].
Действительно, поведение телеологического объекта должны изучать тестолог и экзаменатор с точки зрения качества, в то время как математик призван находить методы численной оценки качества заключений тестируемых. Первая из этих проблем относится к гипотетическим (качественным) рассуждениям, а вторая – к теоретическим (количественным) доказательствам и вычислениям. Чтобы оценить меру трудности ЭФТК, надо быть знакомым с данной областью знания; чтобы оценить категорию трудности тестовых суждений с уверенностью, следует быть специалистом в этой области. Формальный подход к оценке конституирует необходимую связь между степенью обученности индивида и качеством его заключений только с количественной стороны, не отражая реального смысла.
Поскольку процесс тестирования подчинен целям индивида, выраженным в его выводах, он может быть логичным и нелогичным. Логичность мышления испытуемого – это единство его рассудочной и разумной деятельности, которая лежит в основе вычисления реальной степени обученности испытуемого, определения пути рациональной траектории каждого конкретного эмпирического объекта. Если для рассудка характерен анализ, когда индивид оперирует абстракциями по строго заданной схеме, известной ему заранее, то для разума характерен синтез, «как доведенная до самого высшего уровня человеческая способность». Разумное мышление требует от тестируемого максимального напряжения творческих сил, оно является орудием формирования истинного суждения, когда значение признака заключения испытуемого соответствует мере трудности конкретной тестовой ситуации.
В процессе перехода к логичному мышлению происходит и изменение форм представления тестовых суждений. Ведущим при этом является движение от ПДТЗ, в котором фиксируется какой-либо факт, к ЭФТК, устанавливающим соответствие между элементами двух множеств и выбор правильной последовательности исторических дат каких-либо событий или действий. Здесь по мере перехода от простого суждения к более сложным формам представления содержания ЭФТК наблюдается и возрастание степени трудности ПДТЗ. Формирование тестовой ситуации с различной мерой трудности должно стать главной целью тестологов, поскольку оно является основой, на базе которой возможно будет успешно формировать частные ПДТ для каждого тестируемого с конкретной степенью обученности. Значение признака заключения тестируемого на требование ПДТЗ несет в себе информацию о категории трудности конкретной тестовой ситуации.
Существуют правила логические и логичные. Пойа и Аристотель собирали свои силлогизмы, их намерения, по-видимому, состояли в том, чтобы найти общности, которые « в соответствии с обычаями хороших ученых допустимы в научной дискуссии и имеют целью оказать разумное влияние на правдоподобность» обсуждаемых предположений. Подтверждение примерами рассматривается как разумный довод в пользу корректности разработанных авторами данной книги гипотетических правил и приведенных логичных рассуждений.
Исследования свойств и поведения объектов нечисловой природы основаны на наблюдении и обобщении. И самое главное, что основной итог применения качественного анализа должен быть связан с сохранением смыслового значения параметра обученности, а также свойств тестовых утверждений. Эту проблему убедительно обосновывает , непараметрический подход которого к анализу поведения объектов нечисловой природы авторы использовали при оценке сходства мнений экспертов [25].
Заключение на требование ЭФТК – это мысль, достигшая заданной степени объективности и нацеленная на практическую реализацию правильного формирования суждения. Следовательно, заключение, чтобы быть рациональным (отображать латентный параметр обученности с заданной верностью), должно отражать четыре момента:
· конкретное, целостное знание содержания ПДТЗ;
· стремление к материальному воплощению;
· план формирования истинного суждения;
· значение признака вывода тестируемого на требования ЭФТК.
Тестология и тестометрия, которые исследуют процессы установления степени обученности индивида путем научных наблюдений и математических методов, отвлекаются от некоторых эмпирически конструируемых свойств и отношений. Последнее, однако, становится предметом специального изучения, как только теория тестирования делается основой прикладного исследования. Теория КАТ, как бы ни был совершенен ее математический аппарат, проверяется, подтверждается, и следовательно, в конечном итоге и доказывается эмпирически.
В объективной телеологии свойства обученности индивида выводятся на основе восприятия регулярности его поведения при изменяющихся, но определенных условиях учебной среды. Характеристики человеческого поведения выводятся из того, что мы можем описать в процессе научных наблюдений. Форма наблюдений отражается в структуре сообщений об этих наблюдениях, что приводит к открытию в эмпирическом материале регулярностей и закономерностей
V. ФОРМА ТЕСТОВОЙ СИТУАЦИИ
Разработчик KCT3 всегда стремится к максимальной «власти» над учебным материалом. Он творит тестовые ситуации, используя материал как сырье, не отображая, а преобразуя его, вкладывая в каждый ЭФТК свои убеждения и мысли. И поэтому форма представления тестового утверждения в зависимости от его замысла поддается столь же решительной деформации, как «черты лица на шаржах Домье».
Процесс отображения содержания фрагмента учебного материала во множество тестовых ситуаций можно в общем виде понимать как приведение его к некоторой структуре, образованию порядка. Единство психического и логического, обусловленное категорией формы, можно видеть и в том, что отраженное испытуемым содержание ПДТЗ составляет индивидуальный опыт конкретного разработчика, когда строение представленного ЭФТК акцентирует процесс мышления тестируемого на восстановление корректного порядка в тестовом утверждении. Понятие формы содержит достаточную степень ограничений и вместе с тем отражает смысл и значение исследуемого фрагмента конкретного знания.
Любое ПДТЗ является выбором из пространства возможных стандартизированных сообщений, и, следовательно, оно имеет определенное строение (структуру) – форму. Понимание содержания и требований ЭФТК индивидом тесно связаны фактом наличия неразрывной связи между чувственной и логической ступенями процесса познания. Поэтому форму тестового задания можно воспринимать как характерную структуру не только для чувствительного наблюдения, но и как раздражение испытуемого для возникновения у него мыслительных процессов. Постижение аналогии в наблюдаемых строениях ПДТЗ обуславливает появление в рассуждениях тестируемого определенной упорядоченности.
И в этом контексте культура создания ЭФТК образует нерасторжимое единство духовной и материальных сторон, проявляющихся в отображении смысла и значения тестовой ситуации. Чисто духовное начало – содержание тестового суждения — не может стать достоянием культурного потребления, не будучи воплощенным в материальном носителе – форме. Только таким путем духовное творчество коллектива разработчиков ЭФТК может приобрести общечеловеческую значимость, стать доступным для тестируемых, распространяться про каналам социальной и культурной коммуникации. Содержание без формы – бесплотно.
Выявляя способы представления содержания учебных дисциплин в систему тестовых суждений, информационная эпистемология рассматривает структуру ПДТЗ как инвариантный аспект отображения понятий, явлений или процессов, поскольку стандартизированные формы тестовых утверждений могут «покрывать» содержание различных предметных областей знаний. Для установления понятия «форма ПДТЗ» воспользуемся следующим формальным правилом:
Π15: Отображение фрагментов учебною материала из различных областей знаний представимо в одной из конкретных форм с учетом сохранения семантики исходного знания.
Это правило применимо к любым по содержанию тестовым ситуациям, и «можно быть уверенным, что из истинных суждений мы получим снова истинные суждения».
В Советском энциклопедическом словаре (1987) под формой понимают «внешнее выражение содержания». Отсюда трудно сделать какое-либо утверждение о понятии «форма», поскольку она определяется через другой термин «содержание» в неявном виде. Более того, строение тестового утверждения в данном контексте является выражением, отвлеченным от контента (содержания). Иногда в обыденных ситуациях используют интуитивное (неточное) понятие формы как структуры (внутренней формы) – способа организации содержания. Такое неявное определение формы задания мы находим у : «Форма тестового задания – это способ организации, упорядочения и существования содержания теста». С этой дефиницией формы ПДТЗ также нельзя согласиться, поскольку непонятно, что представляет собой структура. Оба понятия в равной мере известны и неизвестны, а, следовательно, определение одного из терминов через другой представляет собой простое переименование исходного термина близким ему по смыслу. Это номинальное определение формы не содержит специфического и существенного признака и принято нами быть не может.
Понятие «форма тестовой ситуации» не может основываться на ее интуитивном понимании, а должно выражаться реальным (эффективным) определением. Это необходимо сделать и по той причине, что чем точнее представлены понятия в суждениях, тем качественнее можно устанавливать истинность тестовых утверждений. Ведь только на основе точного выражения содержания задания через его форму можно обеспечить возможность для логичного рассуждения тестируемого.
В соответствии с Π12 одна и та же форма задания может представлять контент ЭФТК из различных предметных областей, выражая тем самым тождество их строения. Как метод внешнего выражения смысла фрагмента учебного знания, форма ПДТЗ отражает тип и структуру содержания, а как способ связи элементов этого конетента, она определяет строение ПДТЗ и выступает как нечто внутреннее. В то же время форма представляет собой отражение смысла ЭФТК и устанавливает способ связи содержания конкретного суждения с запрашиваемой от индивида информацией Ограниченное многообразие строений ПДТЗ – унификация – оказывает активное влияние на возможность адекватного представления содержания учебного знания, способствует узнаваемости респондентами структур представления тестовых утверждений.
Мы будем пользоваться как реальным, так и номинальным определением формы ПДТЗ. Реальная дефиниция формы характеризует то общее, что имеют все структуры изоморфных по представлению ЭФТК. Индуктивное (номинальное, неточное) определение формы рассматривает последнюю как структуру, как строение, как способ организации содержания ПДТЗ. Здесь задача реальной дефиниции формы «подменяется более простой задачей переименования» [31]. Эта операция используется нами лишь для того, чтобы избежать тавтологии изложения материала без ущерба для его сущности, когда термины «форма», «структура», «строение» и «организация содержания» считаются синонимами понятий.
Исследуя строение ЭФТК со стороны возможности целостного представления содержания, можно определить форму ПДТЗ как относительную выделенность в фрагменте учебного материала существенных его частей и соответствующий порядок материальных взаимодействий данных частей, посредством которых они соединяются в то единство, которое отображает содержание единицы учебного знания. Эта дефиниция формы относится к структуре ПДТЗ для физических объектов, а не к теоретическим построениям. Структура ЭФТК в данном контексте устанавливается выбором тех или иных существенных посылок и типом логического вывода.
С методологической точки зрения рассматриваемую дефиницию можно представить как относительно устойчивое единство посылок и требований, а также их отношений в стандартизированном целостном тестовом суждении. Данное определение формы позволяет отображать в виде ЭФТК широкий круг явлений, предметов и процессов как материального, так и идеального характера. В данном случае структуру (форму, строение) ЭФТК образует совокупность тестовых посылок, которые имеют конкретную эмпирическую и семантическую интерпретацию. Заключения на требования ПДТЗ формируются тестируемыми по правилам вывода из корректных посылок тестовых ситуаций. Из сказанного следует, что строение ЭФТК определяется набором исходных посылок и типов логических, логичных или математических заключений респондентов. Духовная культура формирования БТЗ в пространстве КАТ представляется нами как знаковая система, воспринимая которую испытуемый осознает содержательную сторону каждого ЭФТК и формирует к их требованиям свое отношение. Культурное начало выступает здесь как смысл ПДТЗ, а материальное, выраженное в знаковой системе, – как конкретная форма ЭФТК. Если содержание тестового утверждения есть подвижное единство необходимых, существенных свойств и отношений между знаками ПДТЗ, то форма выражает внешнее представление этого единства, его стандартизированное проявление во взаимодействии респондента и тестирующей системы. И здесь стандартизированные формы характеризуют повторяющиеся связи или отношения между исходными элементами (посылками) тестовых суждений [10].
«Неуважительное отношение» к методологическим правилам представления содержания ПДТЗ и правовой нигилизм по отношению к стандартам при конструировании форм тестовых суждений – лейтмотив производства псевдотестов. Эту национальную беду в нашем социуме поэт прошлого века Б. Алмазов выразил так [19]:
Широки натуры русские, Не влезают в формы узкие
Нашей правды идеал Юридических начал...
В этом смысле при проектировании профессиональных компьютерных тестов можно выделить три группы разработчиков ПДТЗ: «по принуждению», «по совместительству» и профессиональных тестологов. Представители первой группы участвуют в создании тестов стихийно в соответствии с приказами руководителей. Они, как правило, не имеют представления о правилах и стандартах конструирования ЭФТК и рассматривают свою деятельность в этом направлении как досадную акцию. К разработчикам ПДТЗ «по совместительству» относятся более или менее активные позиционеры, которые пытаются самостоятельно совершенствовать процесс контроля УУД учащихся, студентов или специалистов за счет применения высоких технологий проведения тестовых проверок. Они опираются в основном на собственный опыт в формировании тестовых материалов (ПДТЗ, ПДТ и KCT3) и слабо осведомлены о нормативной системе культуры представления тестовых заданий. Профессиональные тестологи – это позиционеры, для которых деятельность по созданию или экспертизе стандартизированных тестовых утверждений составляет основное занятие. Для некоторых представителей этой группы конструирование и экспертиза ЭФТК является основной работой, а другие видят смысл своей деятельности в том, чтобы, в соответствии со стандартами и правилами, создавать культурные системы ПДТЗ – KCT3.
В процессе отражения контента ЭФТК неизбежно осуществляется передача информации, т. е. такое восприятие структуры ПДТЗ, на основе которой тестируемый может судить о содержании и требовании конкретного задания. Обладая стандартизированной формой, знаковое текстовое утверждение, содержащееся в том или ином сигнале, несет в себе информацию о смысле и значении ЭФТК.
При переработке содержания ЭФТК тестируемым действуют две дополняющие друг друга тенденции:
· аналитическая, т. е. стремление к расчленению, к установлению порядка элементов тестового суждения;
· синтетическая, т. е. тенденция к постижению взаимозависимостей между посылками тестового утверждения.
Эти тенденции лежат в основе создания форм ЭФТК, когда целостность, иначе говоря, качественность отображения содержания фрагмента учебного материала, следует из объективного единства строения и смысла ПДТЗ. Требования логичного мышления индивида связаны с наличием у него определенного равновесия между расчлененностью, взаимосвязью и взаимозависимостью между элементами структуры тестового утверждения.
Мы хотим предостеречь разработчиков от бытующей точки зрения, одной формы конструирования ЭФТК, побудить их к выявлению связей между содержанием учебного материала и моделированием его в виде KCT3, облегчить переход к применению различных стандартизированных построений тестовых ситуаций. Взаимопонимания следует добиваться не столько путем жесткой унификации и единообразия, сколько с помощью налаживания обозримой и упорядоченной системы правил, позволяющих проектанту «перемещаться в пространстве» структур представления стандартизированных кратких тестовых суждений.
Свертывание проблемных тестовых ситуаций – вариантность форм – является мощным средством конструирования разнообразных ЭФТК, менее утомительных и интересных для тестируемых. Более того, невербальное представление ПДТЗ в виде рисунка, таблицы, схемы, географической карты, графика и т. п. позволяет формулировать тестовые утверждения для проверки знаний и умений респондентов, причем в различной форме может быть отображено не только содержание тестовых ситуаций, но и заключения на них [3,10]. Строение тестового утверждения выступает как внешнее выражение определяющей стороны знания и как бы «покрывает» содержание конкретного факта, закона и т. п. Различие форм при одном и том контенте – есть различающая способность тестового задания для испытуемых с фиксированным уровнем обученности.
Форма ПДТЗ раскрывает только существенные стороны содержания фрагмента из конкретной области знания в пределах обусловленных возможностями инструментальной среды тестовых испытаний. Как результат деятельности мышления разработчика или эксперта, отражающий проявления причинно-следственных отношений в заданной предметной области, форма ЭФТК всегда субъективна. Существенным здесь является то, что каждая структура ЭФТК обладает своей качественной спецификой, возникающей в результате внутренних взаимодействий между элементами ее материального носителя. Более того, применение конкретных форм представления контента позволяет осуществлять проверку знаний, интеллектуальных умений и практических навыков респондентов.
Анализ строений тестовых заданий необходимо отнести к предмету тестологии и по логико-методологическим соображениям. Безусловно, форма накладывает некоторые ограничения на возможность представления содержания ПДТЗ из различных областей знаний. И, как указывает B. C. Аванесов, «Дело, следовательно, состоит не столько в исследовании содержания теста, как и любого другого контрольного материала, сколько в изучении специфической формы, обеспечивающей взаимосвязь между содержанием и формой». Из его же рассуждений следует, что не существует одной какой-либо формы, которая могла бы рационально выразить богатство содержания даже отдельно взятой учебной дисциплины [1].
В методологии логичного мышления понятию «форма» соответствуют термины эффективного и неэффективного определения. Эффективное определение указывает на рациональный способ выражения смысла и веса (значения) проблемной ситуации в одной из форм ПДТЗ. Под рациональным представлением содержания будем понимать отражение фрагмента учебного материала в одну из структур тестового утверждения для испытуемых с фиксированным уровнем обученности. Рациональность фиксирует два момента: внутренний и внешний. Первый детерминируется совокупностью рекомендаций, правил и культурных норм, общезначимых для выбора той или иной структуры представления ЭФТК. В соответствии с этим моментом разработка ПДТЗ рассматривается как деятельность по правилам. Второй момент устанавливает отличия предлагаемой рациональности от всех остальных, когда появление новых форм демонстрирует плюрализм рациональностей. Рациональная форма выражения содержания проблемной тестовой ситуации для оценки поведения тестируемых характеризует максимальную близость энтропии ЭФТК к степени обученности испытуемых (например, отличников).
В соответствии с методологическими правилами Π7 – Π10, Π11 и Π12 дадим эффективную (реальную) дефиницию формы ПДТЗ:
Структура ПДТЗ — это то рациональное, целостное и общее, что имеют все изоморфные тестовые утверждения, преобразованные по формальному правилу.
Из этого определения следует, что важным фактором качественного установления формы ПДТЗ является заданный способ связей (или отношений) между элементами задания в конкретной тестовой ситуации. В свете структурного подхода строение ЭФТК выступает как устойчивое взаимоотношение посылок задания, характеризующее его специфику представления и позволяющее отличить форму одного ПДТЗ от другого; при этом в явном виде существует подобие (изоморфизм) структуры задания по отношению к содержанию различных предметных областей. Восприятие упорядоченности стандартизированной формы приводит к гносеологическому выравниванию, приспособлению респондентов к структурам тестовых утверждений.
Композиция посылок ПДТЗ должна быть доведена до такого состояния, чтобы ничего нельзя было выбросить и нечего прибавить без того, чтобы не нарушилось семантическое содержание проблемной тестовой ситуации. Следует всегда помнить, что нет антропоморфной формы, но существует информационное содержание. Очищенные от инородных контекстуальных наслоений ПДТЗ, представленные в конкретных формах, образуют массив стандартизованных ЭФТК. Эти элементарные феномены культуры – краткие тестовые суждения – существенно отличаются от других менее четких и неоднозначных форм мышления.
Негативной стороной подобной «деконтекстуализации» содержания ПДТЗ является то, что в результате ее проведения происходит определенная смысловая деформация исходной проблемной ситуации. Эта трудность может быть преодолена путем рационального ограничения (унификации) количества конкретных форм представления ЭФТК, для которых указанная модификация содержания не приводит к потере эпистемологического статуса тестового суждения. Неизбежные ограничения, накладываемые на область конкретных структур ПДТЗ в различных областях знаний, компенсируются наглядностью, четкостью, выразительностью и ясностью расположения элементов тестового задания на экране дисплея, позволяющих включить их в различные альтернативные модели ЭФТК, а проблема «деконтекстуализации» легко решается на начальном этапе ознакомления испытуемых со стандартными формами конкретных тестовых ситуаций (см. Приложение).
У каждого ЭФТК, соответствующего по мере трудности фиксированной степени обученности тестируемого, есть свой «ритм», который требует такого размещения на экране дисплея системы знаков (символов, рисунков и т. п.), чтобы задание воспринималось испытуемым без лишнего напряжения, целостно. Тестируемый не должен останавливаться над анализом формы ПДТЗ, восстанавливать правильное расположение знаков, соответствующих характеру представления того или иного смысла. Разрешение антиномий – проблем подчиняется общему ритму, открытому еще в античности при проведении творческого диалога. Этот процесс взаимного общения Гегель развернул во времени, представил его как обобщенное выражение «внутренне полемического развития духовной культуры».
Каждое ПДТЗ, особенно на этапе промежуточной или итоговой аттестации, должно держать респондента в максимальном напряжении, вести его за собой и не допускать в своем тексте неясных и неритмичных мест, чтобы тестируемый не тратил время на разбор структуры задания. В этом интеллектуальном напряжении, в обладании мышлением индивида над содержанием ЭФТК, чтобы заставить его находить корректный вывод одинаково с составителем задания, и состоит задача разработчика и действенность композиции ПДТ. Умение выбирать форму, соответствующую наилучшим образом смыслу исходной темы, ритму конкретной тестовой ситуации, составляет сущность деятельности проектировщиков ЭФТК.
Формальное правило представления ПДТЗ связано с применением стандартов. Стандартизация предполагает и изыскивает однообразия, закономерности в представлении содержания фрагментов учебною материала в конкретных формах, дающих возможность тестируемому легко узнавать (экстраполировать) предъявляемое ему сообщение и судить по частям о целом. Установление сходных черт предполагает наличие существенных признаков у различных строений ПДТЗ и выявление общих структурных закономерностей (форм), близких для многих тестовых ситуаций. В этом смысле содержание ЭФТК образует форму не на аморфном основании, а устанавливает ее соответствие стандартным представлениям о строениях ПДТЗ, хранящихся в памяти тестируемого. Так разрешаются крайние границы размытости и случайности, достигается некоторая ограниченность путем образования конечного числа разнообразия структур представления ЭФТК.
Для испытуемого важна не просто возможность различения формы ЭФТК, но и узнавание его структуры. Здесь восприятие строения тестовой ситуации означает постижение гомоморфизма, подобия и связи, обработку и усиление мыслительной деятельности тестируемого для формирования им корректного заключения. Например, если индивид делает заключение – «задание открытой формы», то это означает, что идентичность структуры ЭФТК обусловлена тем, что ее части имеют ограниченную возможность строения и что эта возможность конкретным образом влияет на формирование заключения на суждения этого вида. Следовательно, на эту конкретную форму распространяется определенное представление, сложившиеся у объекта нечисловой природы шаблоны, имеющие конкретную структуру, отличающие эту организацию тестовой ситуации от других. Таким образом, строение ЭФТК должно быть легко узнаваемым для испытуемого. По Берталанфи, первой ступенью описания любого объекта является установление аналогии, выявление сходных внешних свойств формы и шаблона; второй ступенью считается обнаружение логичных гомологии и изоморфизмов; третьей ступенью – установление содержания явления или процесса в целом.
В. Лауфбергер утверждает, что нервная система человека производит три типа интегрирования формы: чувственное, смысловое и целостное. Целостная форма возникает в результате интегрированного восприятия ЭФТК на экране дисплея и является временной средней из прошлых событий, выраженных в памяти тестируемого соответствующими стандартами. Это дает возможность экстраполяции, позволяющей предвидеть, узнать структуру ПДТЗ. Здесь выражается мысль о том, что запомнившиеся в стандартизированном виде конкретные формы тестовых суждений создают у респондента негативную энтропию, обеспечивают начальные условия движения его мысли к формированию вывода. Если восприятие содержания ЭФТК означает приращение энтропии (по Пригожину) у индивида, то узнавание целостной стандартизированной формы связано с отрицательной избыточностью и с созданием негэнтропии (по Жинкину). При наличии в памяти тестируемого внутренней избыточности (стандартных форм представления ЭФТК) негэнтропия выступает как мера организованности целостного тестового утверждения и реализуется в практической деятельности, приводя к упорядоченности индивидом тестового суждения.
Отношения между философскими категориями содержания и формы выражаются законом доминирования содержания – «всякая форма имеет особое содержание, определяющее ее». В диалектической паре содержания и структуры фиксируется, с одной стороны, сущностное единство ПДТЗ и, с другой, способ его организации. Корректная, ясная и явная форма представления конкретного содержания ПДТЗ – это, прежде всего, чувство меры, сопричастность действий разработчика с ожидаемым поведением каждого испытуемого. Эти принципы соразмерности частей и целого можно наблюдать, вглядываясь на Дворцовой площади в C.–Петербурге в архитектурную тайну Главного штаба. Соразмерность, гармонические пропорции строений и отсутствие излишеств делают это четырехэтажное здание гораздо величественнее любого высотного сооружения Москвы.
Исходное содержание посылок о качественных атрибутах тестового суждения структуризовано априорными формами чувственности. Однако источник априорного синтеза представлений тестовых ситуаций скрывается в «единстве деятельности», подводящим эти созерцания под одно из стандартных строений, т. е. в единстве функции, отвечающей за то, чтобы заключение на требование ПДТЗ было синтезом содержания, а не формы. Относительная самостоятельность структуры и содержания ПДТЗ выявляется и в том, что:
· форма может отставать от контента;
· не всякое содержание учебного материала может быть представлено в адекватной ему форме;
· одно и то же содержание может облекаться в структуры тестовых утверждений с различной различающей способностью;
· одно и то же строение ЭФТК способно отражать контент различных по своей природе явлений, понятий или событий.
В процессе компьютерного тестирования движение мысли индивида идет от восприятия внешней формы ПДТЗ к пониманию его внутреннего содержания. Установление внешних свойств и отношений, отражаемых структурой тестового утверждения, является переходом к раскрытию сущности и формированию истинного или ложного утверждения тестируемым.
Критический поиск соединения содержания и формы — сущность творческой деятельности разработчика ПДТЗ. Однако это требование часто выполняется неудовлетворительным образом по той причине, что весьма трудоемкая изобретательская работа по формулированию профессиональных KCT3 подменяется составлением заданий на более легком бытовом уровне. Примером такого рода подмены могут служить псевдотесты, в которых тестовые утверждения представляются не в виде суждений. В них «форма» фиксирует внимание реципиентов на представлении содержания какой-либо темы без учета новизны и рациональности представления этого содержания именно в наилучшей для данного контента форме краткого суждения. Выбор рациональных форм представления содержания тестовых ситуаций – конструирование цепи валидных моделей конкретной области знания.
В профессиональной деятельности тестологов понятие формы тесно связано с законами, упорядочивающими, регулирующими возможные виды строений ПДТЗ. Отношение содержания и структуры ЭФТК отражается в законе: если форма существует, то она обусловлена некоторым содержанием; и наоборот, если имеется некоторое содержание, то оно обязательно должно явиться тестируемому в конкретной форме. В познании индивида содержание и форма выступают как ступени постижения смысла и значения тестового суждения (от явления к сущности). Строение ЭФТК представляет собой субстанцию чувственно воспринимаемых позиционером свойств знаков и отношений как действительных. Изменение структуры формы представляет собой перестройку связей внутри элементов ПДТЗ. На рис. приведены формы представления контента проблемных тестовых ситуаций [26].

Рис. 1. Схема форм тестовых утверждений
Разработка международных стандартов но компьютерным тестам, которые утверждают обшие для всех разработчиков ПДТЗ регулятивы и ценности, одно из главных культурных достижений нашего времени. Так, на основании стандартов корпорации IMS (Instruction Management System) – Question and Test Interoperability (QTI), создается рациональная номенклатура заданий, что обеспечивает технологичность их ввода и узнаваемость тестируемыми их строения. Разновидность стандартизации, заключающаяся в рациональном сокращении числа форм представления ПДТЗ, называется унификацией.
В рекомендациях стандарта IMS и Голландского института CITO предлагается строить ПДТЗ с использованием прямых вопросов. На это указывает и A. H. Майоров: «Хорошо сформулированное задание в вопросительной форме ничем не уступает хорошо сформулированному вопросу в форме утверждения» [26]. Мнение авторов по данной проблеме представлено в части II. Здесь мы лишь подчеркиваем, что вопрос и тестовое задание – разные формы мышления и смешивать их не следует. Вопрос – это не требование, а тестовая ситуация всегда связана с требованием от тестируемого вывода. Отказавшись в полемике с B. C. Аванесовым [26, стр.117] от представлений тестовых заданий в виде утверждений, A. H. Майоров проектирует задание в форме вопросов, высказываний и задач. В то же время на стр. 30 он же говорит о тесте как инструменте, состоящем из «Квалиметрически выверенной системы тестовых заданий ...» (заданий, а не вопросов).
Важнейшей особенностью (уходящей корнями в классическую теорию тестов) современной культуры представления тестовых утверждений является своеобразное сочетание их гомогенности и фрагментированности. Гомогенная культура продуцирования ПДТЗ заключается в том, что, несмотря на наличие в международных стандартах (например, IMS) различных строений отображения тестовых суждений, большинство проектантов формулируют задания только в закрытой форме. Так, в [34, c.35] предлагается: «Из большого числа реализованных форм тестовых заданий рекомендуем выбрать каноническую форму: ВОПРОС и к нему несколько готовых ОТВЕТОВ». Здесь же утверждается, что «Специальные исследования доказали исключительно слабое влияние осложняющих процедуру тестирования «усовершенствования» на валидность и надежность». А. Бигбаум, наоборот, убедительно обосновывает практические преимущества представления тестовых заданий в открытой форме. Утверждается, что задания закрытой формы с двумя ответами сильно снижают эффективность тестовых оценок [40, c.29], а на с. 21 подчеркивается, что математические модели современной теории тестов «...не рекомендуется использовать в том случае, если в тесте отдано предпочтение заданиям в закрытой форме». Подобного рода суждения являются неправомерными. Здесь форма превалирует над содержанием. Как справедливо отмечено в [2,3], «Часто бывает так, что какое-то содержание адекватно выражается в одной форме и не выражается корректно в другой».
Представление содержания различных фрагментов учебного материала не может по аналогии с лапласовско-ньютоновским детерминизмом жестко привязываться только к одной форме. Философский принцип закономерности устанавливает совместимость контента в зависимости от выбора наилучшей именно для него формы отображения. Это не отрицание, а расширение детерминизма, переход к более богатым, диалектическим моделям конструирования ЭФТК, четче и яснее отражающих содержание различных областей знания. При этом следует помнить, что:
· прежде чем осуществить выбор той или иной формы представления ПДТЗ, надо знать методологические правила (Π1-Π12) и стандарты;
· проектирование следует начинать от простых форм (открытой и закрытой) к сложным (установлению соответствия и правильной последовательности).
Фрагментированная культура отличается от гомогенной тем, что в ней присутствует ограниченное в процессе унификации количество форм представления ЭФТК, что расширяет возможность отображения в ПДТЗ содержания учебного материала и повышает различающую способность проблемных тестовых ситуаций. Вариантность стандартизированных структур ЭФТК — средство для рационального установления их разнообразия, интереса к ним со стороны испытуемых и дифференциации тестовых утверждений по мере их трудности.
Значительный вклад в разработку классификации форм тестовых заданий внес B. C. Аванесов. Проанализировав дидактические функции ЭФТК, он выделил четыре их структуры: открытую, закрытую, на соответствие и на установление правильной последовательности [3]. Эта классификация построена по признаку действий, выполняемых тестируемым в процессе формирования заключений. Такой подход, безусловно, сыграл положительную роль в стандартизации ПДТЗ, что обеспечивает распознаваемость («определенность» по Гегелю) последних объектами нечисловой природы.
Назовем рациональными привычные нам формы тестовых заданий (закрытая, открытая, на соответствие и на установление правильного порядка) и рассмотрим их подробнее. Безусловно, что рациональная форма и инертное содержание понимаются сегодня не в духе механизации Лапласа, а как максимальное совпадение контента ПДТЗ с адекватной формой выражения фрагмента учебного материала.
Открытая форма тестового утверждения требует сформулированного самим индивидом корректного заключения. Она имеет вид неполного суждения, в котором отсутствует один элемент. Обычно тестируемый подставляет число или слово (допустимо словосочетание, состоящее не более чем из двух слов). Ввод заключения может осуществляться с помощью мыши или с клавиатуры (Short text).
Закрытая форма предполагает выбор тестируемым правильного заключения из предложенных (Single Choice – выбор одного верного вывода; Multiple Choice – выбор нескольких верных заключений из многих, рекомендуется выбор 2 из 5 или 3 из 5). Такое тестовое суждение состоит из неполного утверждения с одной вакансией и совокупности элементов, один или несколько из которых являются истинными. Тестируемый должен выбирать корректные выводы из предложенного множества. Дистракторы в ПДТЗ закрытой формы должны быть корректно подобраны и не содержать подсказок. Содержание дистракторов необходимо семантически согласовывать с исходными посылками тестового суждения.
Задание на установление соответствия предполагает необходимость определения тестируемым истинных пар из двух приведенных множеств объектов. Соответствие из множества А в множество В – произвольное подмножество G декартова произведения AxB, т. е. некоторое множество упорядоченных пар (a, b), где α
A,b
В. Множество А называют областью отправления, а множество В – областью прибытия данного соответствия G. Соответствие определяется как тройка (G, А, В) и называется графиком. При A=B G соответствие в А. Если ПДТЗ представлено соответствием «А есть В», где А и В термины, смысл и значение которых известен, а термин В выражает свойство или отношение, приписываемое объекту А, то данное утверждение является суждением. Тестируемый должен связать каждый элемент первой группы с соответствующим ему элементом из второй группы.
Задание на установление правильной последовательности (порядка) требует от тестируемого определения порядка следования предложенных объектов (символов, слов, формул, рисунков). Дано множество неупорядоченных элементов, необходимо установить заданный в посылках порядок между ними (например, технология производства хлеба).
ПДТЗ на соответствие и порядок являются разновидностями разделительных суждений. Формальный критерий истинности в таких суждениях имеет вид исключения третьего: каждому субъекту можно приписать только одну разновидность предиката, поскольку в разделительных суждениях признаки координированы – они определяют друг друга взаимно.
Приводимую иногда форму «фасет» мы принципиально не включаем в данный список, так как фасет скорее порождение способа формирования тестового утверждения, нежели сама структура задания. Фасет — одна из форм закрытого или открытого задания. В содержании фасетного ПДТЗ есть один элемент, который меняет свое значение при очередном предъявлении тестового задания каждому испытуемому. Изменение может происходить случайным образом, в заданной последовательности или по определенному закону. Таким образом, можно сформировать несколько однотипных по строению, содержанию и посылкам тестовых утверждений.
При исследовании форм представления тестовых ситуаций в инструментальной среде тестирования ACT авторы разработали другую систему классификации, которая, на наш взгляд, дает возможность дальнейшего развития структур ПДТЗ. С этой целью представим содержание ПДТЗ как совокупность элементов утверждения, выраженных в виде упорядоченного множества частей задания («обязательных» элементов), и необязательного множества «лишних» элементов, которые не входят в истинное суждение (табл.1).
Таблица 1

Примечание: (1) – полностью определено, (2) – частично задано, (3) – не определено, (4) – задано, (5) – не задано; синтез – соединение элементов ПДТЗ в единое целое; анализ – расчленение объекта на элементы, уточнение структуры задания.
При предъявлении ЭФТК тестируемому возможны частичное или полное отсутствие некоторых компонент, отражающих содержание задания. Задача индивида состоит в том, чтобы сформировать истинное утверждение путем определения порядка, выделения множества «обязательных» и отсечения «лишних» элементов. В ЭФТК с излишними данными нарочито введены дополнительные сведения, маскирующие формирование истинного суждения.
В [10] приведены возможные комбинации формирования содержания заданий, соответствующие им формы и целевая направленность ПДТЗ. Многие из форм в настоящее время не используются скорее по техническим причинам: сложность разработки задания, трудоемкость проверки правильности вывода, невозможность или сложность реализации той или иной формы при компьютерном тестировании.
С учетом части II данной книги и этого раздела можем дать эффективное определение ЭФТК.
Элементарный феномен тестовой культуры – стандартизированное краткое тестовое суждение, представленное в свернутой форме и выполненное по правилам логичного или логического мышления. Для примера составим (или сопоставим) тестовые задания каждой указанной комбинации и опишем действия тестируемого при формировании заключений на них (на примере ACT или идеализированной программной среды).
|
Из за большого объема эта статья размещена на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 |


