Почему поведение и состояние элементов эмпирической системы носят нечисловой характер? Ответ на этот вопрос состоит в том, что проверяемые, экзаменаторы и разработчики тестовых материалов не мыслят цифрами. В логичном мышлении позиционера используются слова, образы, но не количественные величины. Это видно из условных атрибутов оценки поведения тестируемых (отличник, почти отличник, хорошист и т. п.) и категории трудности ЭФТК (трудное, средней трудности, легкое). Никто не возьмет на себя ответственность утверждать, во сколько раз или насколько отличник лучше хорошиста.
Заключения тестируемого на требования ПДТЗ различной меры трудности, установленные в порядковой шкале, являются ранжировками, результатами парных сравнений, но не числами. Распространенное заблуждение состоит в том, что отдельные акты поведения респондента изучают как числа – баллы, которые обрабатывают с помощью методов количественной статистики как результаты обычных физических измерений [40].
В случае произвольности оцифровки полученные таким способом результаты обработки данных могут не иметь отношения к реальности. Это утверждение иллюстрируется на примере «неадекватного данным усреднения отношения школьников к профессиям» [26].
Структура СКДО уровня достижений объектов нечисловой природы весьма сложна, но может быть сведена к двум взаимодействующим между собой компонентам. Во-первых, в науку о дидактической оценке УУД входят эмпирические знания, причем не только заимствованные из логичного мышления и представленные в виде методологических правил, инструкций и требований, но и специально обобщаемые результаты научных наблюдений за качеством заключений тестируемых, выраженные определенным языком. Данные научных наблюдений являются тем эмпирическим базисом, из которого формируются значения о моментах переключения меры трудности ПДТЗ или об отнесении поведения целеустремленного объекта к одному из априорно заданных своими образцами классов обученности. Эмпирики лежат, например, в основе создания концептуальной модели поведения объекта и разработки методологических правил проектирования тестовых материалов, выборе стратегии управления процессом КАТ и качественных уровней-интервалов обученности тестируемых. Оценки качества ЭФТК и КФТ, неподдаюшиеся непосредственному измерению, также базируются на субъективных суждениях экспертов.
Во-вторых, тестология и тестометрия – это области эмпирического и теоретического знания, которые призваны вносить не только новые формально-логические методы в описание процессов СКДО УУД, но и открывать в эмпирическом материале действие законов, сводить эти законы в целостную систему. Здесь на первое место выходит обобщение научных наблюдений за поведением тестируемых, когда из данных и фактов образуется система знаний. Это положение особенно важно для тестометрии, когда в качестве эмпирического объекта исследования выступает латентный параметр феномена нечисловой природы. Синтез эмпирических и теоретических знаний определяет структуру процессов управления (алгоритмов адаптации и шкалирования) и составляет основу теории СКДО УУД респондентов.
Здесь мы не согласны с аргументами антииндуктивиста К. Поппера, который противопоставляет дедукцию индукции и, более того, отрицает само существование последней: «Индукция, то есть вывод, опирающийся на множество наблюдений, представляет собой миф. Она не является ни психологическим фактором, ни фактом обыденной жизни, ни фактом научной практики». Это суждение Поппер делает на основании того, что первоначальное предположение «все лебеди белые» было опровергнуто открытием австралийских черных лебедей. Однако Поппер умалчивает о том, что цвет лебедей не является специфическим признаком для данного вида птиц. Отрыв современной теории тестов (тестологии) от мировоззренческого отражения объективной реальности привел к тому, что эта область естествознания ассоциируется с классической теорией измерения. Так, например, на XIV Международном философском конгрессе в Вене (1968) неопозитивист А. Айер и неотомист Й. Мойрерс отстаивали идею, что естествознание может «только измерять величины». Подобный подход обедняет естественные науки и ограничивает область их приложения в теории тестологии и тестометрии.
В России это положение усугублялось тем, что в конце 30-х годов прошлого века призыв «Овладеем культурой» сменился новым лозунгом – «Овладеем большевизмом». Внешние атрибуты культурности подверглись осуждению и порицанию, на первый план вышли «твердые убеждения и партийная сознательность».
Следуя философскому принципу историзма, необходимо помнить, что для создания культурного пространства адаптивного тестирования требуется учет опыта классической и современной теории тестов. Простым комбинированием эмпирических элементов добиться этого невозможно. А это означает, что единственной альтернативой для эволюции теории тестов является «наследственный» путь усложнения структур, когда используется опыт предшествующих, обработанных и проверенных методов тестовых испытаний.
Осуществляя движение в этом направлении, заметим, что процессы, которые изучают классическая и современная теории тестов, составляют основу педагогических измерений. Но каждое измерение дает только количественные закономерности исследуемых признаков, а потому качественные признаки затушевываются. Для этого случая справедливы слова английского физика Э. Розерфорда: «Качество есть плохое количество». Это высказывание в известной степени справедливо в физических исследованиях, но когда объектами математического описания являются сложные развивающиеся системы социологии, психологии, образования и т. п., ценность качественных методов резко возрастает. Лишь после того, когда построена концептуальная (содержательная, качественная) модель описания того или иного объекта эмпирической системы, можно принять во внимание «количественную сторону дела».
При анализе поведения телеологических объектов (тестируемых) фундаментальной проблемой становится правдоподобное описание задач широкого диапазона. Более того, возникает необходимость наличия такой формы представления знаний, которая гарантирует, что обработка их содержимого формальными правилами и методами будет осуществляться правильно. Поэтому особую ценность в процессе оценки функционирования эмпирических систем имеют те концептуальные и математические модели, которые качественно инвариантны, т. е. не изменяют своих свойств при использовании их для описания объектов произвольной природы.
Объектом изучения тестологов и разработчиков системы КАТ являются эмпирические (качественные) и числовые (количественные) множества. Совокупности тестируемых, множество ПДТЗ, методологические правила и т. п. образуют эмпирическую систему, а ее элементы объекты произвольной природы. Другими примерами объектов нечисловой природы в культурном пространстве КАТ являются: а) значения признака меры трудности ПДТЗ; б) упорядоченные экспертами образцы тестовых ситуаций; в) структуризация и спецификации БТЗ; г) качественные уровни-интервалы на шкале оценки.
В некоторых случаях исследователей интересуют не элементы этих множеств, а лишь заданные отношения между группами неоднородных по степени обученности респондентов. Например, если нас интересуют учебные достижения множества индивидов по некоторой учебной дисциплине, то эти оценки бывают нужны лишь для того, чтобы установить, к какому классу (таксону) обученности относятся тестируемые.
В другом случае изучается поведение однородных эмпирических объектов одного класса обученности. Тогда нас интересует УУД каждого конкретного испытуемого из заданного образа. Произвольную совокупность элементов вместе с выделенными на них операциями будем называть системой с отношениями. Ясно, что отношения могут различаться не только по форме их задания, но и по смыслу. Носителем эмпирических систем с отношениями служит некоторая совокупность неоднородных по значениям латентных параметров тестируемых. На этом множестве имеют место следующие отношения:
· респонденты а и в имеют близкие значения степени обученности;
· целеустремленные объекты а имеют более высокую степень обученности, чем тестируемые из различных, но схожих по поведению групп в и с.
Будем называть одномерной числовой системой такой артефакт, носителем которого служит множество наборов длины n, где n – объем ПДТ. Множество-носитель называют пространством компьютерного тестирования, а число n – размерностью этой числовой системы.
Основной целью неметрического – типологического – шкалирования является представление поведения телеологических объектов, однако допускается отказ от гомогенности групп тестируемых, а так же то, что различные респонденты не одинаково воспринимают пространство оценки. Иначе говоря, оценка их поведения происходит по результатом анализа их заключений на набор ПДТЗ различной меры трудности. Формально это означает, что при оценке УУД учитывается взвешенное расстояние, когда величинам параметра трудности ЭФТК придаются различные значения. В итоге мы получаем два типа результатов: а) количество набранных объектом баллов в пространстве оценивания; б) класс, приписываемый их поведению в множестве априорно установленных уровней-интервалов обученности.
Философский подход к анализу поведения однородных и неоднородных эмпирических систем (шкалированию) состоит в синтезе качественных и количественных категорий при отображении значений латентного параметра тестируемых с отношениями в шкалу оценок (классификации и оценивания). Сопоставляя процедуры классификации и оценивания УУД индивидов, можно представить, что в процессе КАТ устанавливаются не только количество баллов, полученных респондентом, но и производится отнесение его поведения к одному из априорно выбранных на этапе шкалирования качественных уровней-интервалов обученности.
Синтез эмпирического и теоретического знания дает возможность приводить косвенные инструментальные наблюдения за качеством заключений тестируемых, что позволяет на основе обобщения фактов добывать новые знания о поведении объектов нечисловой природы. Накопление количественных фактов в области тестометрии – путь к глубоким качественным изменениям как методов дидактического анализа качества тестовых материалов, так и оценки УУД индивидов.
Понятие истинной степени обученности конкретизируется философией до термина истины объективной, под которой подразумевается знание, содержание которого не зависит от проверяющего (квазисубъекта). Существенным в этом определении является то, что в объективной истине выражена диалектика объекта и субъекта. С одной стороны, степень обученности проверяемого объективна, ибо она не зависит от тестирующей программы, а с другой стороны, она субъективна, поскольку поведение тестируемого проявляется в процессе его коммуникации с квазисубъектом. И в этом смысле наше знание о латентном параметре обученности испытуемого в каждом сеансе проверки относительно: оно отражает действительность с заданной степенью верности.
Под верностью дидактической оценки понимают меру приближения результатов косвенных научных наблюдений за поведением эмпирического объекта к действительному значению состояния его обученности. Последнее идеальным образом отражает в качественном и количественном отношениях соответствующий параметр личности. Это значение параметра обученности отображается в УУД испытуемого, выражается качественными понятиями «почти отлично», «отлично», «превосходно», «более чем хорошо», и т. д., а также количественными баллами [10].
С точки зрения категорий философии оценка рассматривается нами как синтез количества (числа) и качества (смысла). Качество в этой области знания порождает количество, а смысл проверяется числом – результатом оценивания. Если бы этого не было, то теория оценивания и классификации поведения объекта нечисловой природы не могла бы быть проверена на опыте, не имела бы предсказательной силы. Логичное мышление определяет структуру установления оценки, и то, что содержит исход тестовой проверки, когда взаимосвязанные соотношения заключений тестируемого находят свое отражение в сочетании числа и смысла.
Максвелловская электродинамика – один из примеров, который подтверждает эту мысль. Она применяется для проектирования генераторов, линий связи, радиоприемных устройств, ускорителей и т. п. И эти приложения вызваны не тем, что мы умеем решать уравнения Максвелла (1831 – 1879), а тем, что мы понимаем основные понятия этой теории и руководящие сущности, лежащие в ее основе. Здесь для понимания смысла электромагнитной теории качество является главным, а количественный математический аппарат Максвелла играет, хоть и важную, но вспомогательную роль. Об этом писал еще Оливер Хевисайд (1850 – 1925).
Процесс СКДО УУД объекта нечисловой природы как основной способ отображения значения латентного параметра обученности тестируемого в уровень его учебных достижений включает в себя, во-первых, создание, модификацию и сертификацию KCT3 по различным областям знаний с установленными априорно показателями качества тестовых материалов. Во-вторых, это разработка концептуальной и математических моделей поведения объекта. В-третьих, это управление процессом компьютерного тестирования с целью адаптации системы к качеству заключений индивида и проектирование механизмов оценивания и классификации его УУД. Развитие этих направлений тестологии и тестометрии требует философского осмысления эмпирических и теоретических положений теории КАТ, постижения ценностей и смыслов знаковых систем и артефактов как информационных носителей культуры тестовых испытаний, их гармоничного включения в контекст современных методов адаптации и оценки поведения целеустремлнных объектов нечисловой природы.
Философия КАТ призвана объяснять закономерности развития теории KT, обосновывать методы управления (адаптации, классификации и оценивания) процессом тестовых испытаний и содержательного представления научной картины дидактической оценки УУД тестируемых, выступать как духовное рационально-теоретическое освоение направления деятельности позиционеров в культурном пространстве СКДО. Объектом ее изучения является культурное пространство компьютерного тестирования как целостная, многомерная и многоуровневая система, для характеристики которой важное значение приобретают проблемы самоорганизации, спецификации тестовых материалов, качества оценки, описания процессов мышления и функционирования системы КАТ, культуры регулирования образовательного процесса и т. п.
Эти категории отражают наиболее общие понятия тестологии и тестометрии, фиксирующие опорные, узловые знания об эмпирической системе СКДО УУД респондентов. Ясно, что, чем больше категорий, чем полнее и шире они охвачены содержательным «окружением», тем «ближе» они расположены друг к другу в системе теоретического и эмпирического знания. Новое содержание философского мышления в области установления латентного (скрытого) параметра обученности индивида определяется также возрастанием объемов рациональной деятельности позиционеров (разработчиков и тестируемых), внесением элементов искусственного интеллекта в программное обеспечение инструментальных средств тестирования, возможностью регулирования процесса обучения на основании мониторинга результатов тестовых проверок. Реализация этих положений связана со становлением культуры тестирования.
В соответствии с информационно-аксиологической концепцией под культурой будем понимать совокупность воплощенных ценностей, которые накапливаются, сохраняются, модифицируются, обрабатываются техническими системами с помощью создаваемых позиционерами знаковых средств. Три лика культуры – ее духовная, социальная и техническая компоненты – составляют целостное культурное пространство КАТ, существование и изменение которого связано с человеком и определено его целенаправленной и осмысленной деятельностью [19].
Отдельные феномены культуры – артефакты – образуют знаки – систему чувственно воспринимаемых предметов непосредственно определяющих те объекты, о которых утверждается, а также те свойства и отношения, которые этим сущностям приписываются. Из знаков формируются слова или словосочетания, используемые для создания абстрактных понятий культурного пространства тестирования. При этом каждое слово служит условным знаком, принятым во всеобщее употребление участниками пространства КАТ для обозначения определенного свойства (рис.2).
Введение знаков избавляет позиционеров от необходимости изучать бесконечное множество явлений или процессов, обобщенных по определенному признаку, позволяет говорить обо всех подобных объектах произвольной природы как об одном и том же. Совокупности слов представляют тексты, включающие в себя социально значимую информацию, используемую для управления процессом КАТ и проектирования профессиональных банков ПДТЗ. Культурные тексты обладают для участников комплекса тестовых испытаний самоценными смыслами. Они символизируют отношения между реальными артефактами и позиционерами с точки зрения их общезначимости и ценности, как для разработчиков компонентов культурного комплекса, так и для тестируемых. Философское осмысление генезиса пространства КАТ требует его герменевтического освоения, постижения ценностей и смыслов текстов как информационных носителей культурных феноменов, их органического включения в контент постсовременной теории тестирования. Отношения между элементами эмпирической системы выражаются в форме суждений, представляющих собой мысленно возможные ситуации, которые «могут иметь место для предъявляемых сущностей или не иметь места». В формальном или естественном языке данной форме мышления соответствуют предложения. Извлекаемая из текстов информация, пройдя ряд преобразований, может рассматриваться как знание. В инструментальных средах адаптивного тестирования различают три модели представления объектов: логические, сетевые и продукционные. Для данных превращенных в знания, характерны внутренняя интерпретируемость, структурированность, связность, семантическая метрика и активность.

Рис.2. Взаимосвязь компонентов культурного пространства тестирования
Языковая (логическая или логичная) конструкция, будучи обобщением реальных ситуаций, оказывается абстрагированным отражением деятельности позиционеров в пространстве КАТ. Однако следует понимать, что основным феноменом этого комплекса являются объекты произвольной природы. Поэтому описание в виде формальной структуры компонентов культурного пространства тестирования является как бы вершиной айсберга, основное качественное содержание оказывается скрытым.
Составляющие культурного комплекса КАТ позволяют извлечь правила приспособления тестирующей программы к поведению каждого конкретного индивида и сформировать траекторию заключений респондентов на требования ЭФТК. Духовная (когнитивная) компонента культуры включает в себя методологические правила конструирования ПДТЗ, структурирования и спецификации учебного материала, проведение экспертизы и сертификации ПДТ. Каждый ЭФТК, хранящийся в банке тестовых заданий (БТЗ), играет свою роль, имеет смысл и значение (категория трудности), служит мерой эффективности проведения тестовых испытаний. В дальнейшем духовную составляющую культуры будем понимать именно в этом (узком) смысле слова.
Социальная компонента устанавливает нормативную систему деятельности участников культурного пространства КАТ. Сюда относятся система стандартов, инструкций и правил, регламентирующих процесс создания и оценки качества не только тестовых материалов, но и технологий компьютерного тестирования. Философия культуры объясняет действия и поступки позиционеров как деятельность по правилам. Выполнение методологических правил конструирования ПДТ, стандартов, требований и норм является обязательным и составляет сущность социальной компоненты культуры КАТ. Разработка новой концепции обработки результатов поведения респондентов и появление в 2001 году стандарта IMS по тестированию послужили основой становления культуры КАТ, когда по результатам научных наблюдений требуется оценить (желательно с минимальным риском) значение латентного параметра обученности индивида.
И, наконец, третья компонента культурного пространства КАТ образует область технической культуры, которая понимается нами как рациональная деятельность по созданию инструментальных средств компьютерного тестирования и их операциональному наполнению. В область технической культуры входят технологические компоненты управления и спецификации KCT3, а также средства коммуникации и связи. Эта составляющая культуры содержит в себе определенные логичные и математические структуры, обеспечивающие формальный и содержательный переход от латентного параметра уровня обученности индивида к описанию дидактической модели его поведения. Для того, чтобы данные, содержащие косвенную информацию о состоянии (точнее, поведении) тестируемого, могли быть использованы системой КАТ, они должны быть обработаны специальной программой и включены в контекст знаний о дидактической оценке УУД этого респондента, определенным образом соотнесены с ними, и только в этом случае эти знания могут эффективно использоваться как фактор культурной деятельности позиционеров.
Три стороны культуры схематически изображены на рис. 3 в виде плоскостей, на которых отображается содержание культурного пространства КАТ [19]. Синтез этих компонентов комплекса позволяет, образно говоря, построить категориальный каркас открытого пространства СКДО. Результат синтеза дедуктивных и содержательных трактовок соответствующих категорий – теоретическая основа КАТ.
С точки зрения философии культуры пространство КАТ не выводится из наблюдений за поведением позиционеров, поскольку процесс тестирования предполагает этот комплекс как форму своего «протекания». Этот феномен состоит из культурных компонентов, организованных в целостную систему. На том основании, что реальные компоненты нельзя представить вне пространства, но можно представить пространство без культурных компонентов, оно есть необходимо априорное представление, делающее возможным внешнее выражение процесса тестовых испытаний. Характер доопытности данному способу выражения культурного комплекса КАТ придает то, что пространство тестирования мыслится как акультная бесконечность состояний возможных наблюдений поведения и деятельности позиционеров. Это пространство адаптивного тестирования обладает, во-первых, эмпирической реальностью, так как им сопровождаются коммуникации позиционеров с культурными компонентами (духовными, социальными, техническими), во-вторых, трансцендентальной идеальностью, поскольку оно не лежит в основе феноменов культуры самих по себе – если отбросить условия возможности рационального взаимодействия феноменов комплекса, то пространство КАТ прекратит свое существование, хотя элементы в «себе» должны будут сохраниться.

Рис.3. Структура компонентов модели культурного пространства КАТ
Основное внимание в системе КАТ уделяется изучению условий логичного равновесия, под которым понимается такое описание ее состояния, для которого характерно удержание близости мсры трудности ПДТЗ к фиксированной степени обученности тестируемого. Это свойство в значительной степени способствует упорядочению и формализации качественных идей и понятий, присущих тестометрии, а также оказывает влияние на развитие методологии СКДО достижений респондентов.
Философия КАТ изучает наиболее общие проблемы сущего и должного в специфической сфере дидактической оценки УУД, рассматривает проблемы удовлетворения естественных и постоянно меняющихся образовательных потребностей личности. Дуальный характер философии адаптивного тестирования с ориентацией и фокусированием системы добытых в этой области знаний как на решение проблем типологической классификации поведения целеустремленных объектов по УУД, так и на индивидуальные, дифференцированные образовательные запросы отдельной личности, сказывается на самом статусе компьютерных проверок, свидетельствует о принципиальной необходимости синтеза знаний о поведении тестируемых. Философия адаптивного тестирования исследует такие «пограничные» сферы как взаимоотношения культуры оценки и культуры регулирования, гармоничное единение духовной, социальной и технической компонентов культуры.
В концептуальном плане ответ на эти вопросы дает аспектный анализ поведения объекта нечисловой природы в единстве его образного и личностного знания. Эти структурные блоки в своей взаимосвязи и целостности формируют объективную сферу философско-оценочного знания в наиболее полном виде. Структурирование и детализация поведения и свойств объектов, приложения этого знания к проблеме шкалирования представляется задачей исключительно важной, поскольку увеличение уровня декомпозиции интервала качества оценки приводит к более четкому и ясному отображению степени обученности испытуемого [14]. Несмотря на достаточно длительную предысторию и активную разработку теоретических и прикладных вопросов оценки УУД как в нашей стране, так и за рубежом, проблема установления значения латентного параметра обученности телеологического объекта является относительно новой. По существу исследования и разработки в классической, да и в современной теориях тестов, ориентированы на экстенсивный путь развития оценки степени обученности индивида. Экстенсивный потому, что результаты обоих подходов не выходят за пределы использования параметрических моделей.
Интенсивный путь развития теории адаптивного тестирования ориентирует исследователей не на механический перенос в нее методов классической теории вероятностей и математической статистики, а на разработку адаптивных алгоритмов тестирования и создание принципиально новых методов изучения эмпирических объектов на основе теоретических положений непараметрической и интервальной статистики. Более того, предлагаемый авторами подход к построению инструментальных систем КАТ на первое место выдвигает проблему анализа качества заключений испытуемого как личности, поведение которой описывается с учетом философских категорий количества и качества.
Исследуя творческую личность тестируемого, можно обозначить ряд положений, которые задает контекст анализа ее реальной деятельности. Во-первых, личность индивида – достаточно ранее психическое образование. Оно не может полностью сформироваться до начала рациональной деятельности испытуемого в культурном пространстве КАТ, поскольку постичь смысл этого интеллектуального комплекса, сформировать и, главное, реализовать ценностные отношения к нему можно только внутри каждого конкретного индивида. Hе владея нормативной системой культуры, отношение объекта нечисловой природы к проверкам собственных достижений не может стать «действительным и стабильным компонентом ценностно-мотивационной системы образования». Таким образом, понятие «личность испытуемого» – некоторая реальность, которая характеризует его рациональную деятельность в пространстве КАТ через ее субъективную ценность и значимость.
Второй момент, характеризующий испытуемого как личность, определяется тем, как упомянутые ценности и смыслы воплощаются в конкретных нормах, мотивах и установках, регулирующих субъективную свободу его учебной деятельности. Внешне мотивированная деятельность респондента направляется преимущественно потребностью в признании, соображениями престижа, классом обученности, занимаемого внутри конкретного социума, по отношению к которому проверка УУД выступает скорее средством, а не целью. Внутренняя мотивация предполагает, что деятельность тестируемого в культурном пространстве проверок побуждается логикой познания и желанием установления объективной оценки собственной степени обученности.
О личностном пути движения однородной эмпирической системы в культурном пространстве КАТ можно говорить только в тех случаях, когда субъект осознает свое участие и ответственность за свои поступки, пытается активно способствовать или противодействовать внешним обстоятельствам, планировать и ставить цель определения собственного УУД, изменять ради этой цели окружающий мир и свое собственное поведение. Именно этот путь и является наиболее продуктивным для творческой личности, действующей в культурном комплексе тестовых проверок.
В рамках философии КАТ должна быть обоснована специфика использования системного подхода к изучению процесса СКДО УУД в целом и его отдельных компонентов, показана необходимость поиска инвариантных подходов к целеполаганию, спецификации БТЗ по конкретным областям знаний, конструированию ПДТЗ, выбору конкретных форм тестовых ситуаций, анализу алгоритмов управления тестирующими воздействиями, разработке методов оценивания и классификации результатов тестовых проверок целеустремленных объектов нечисловой природы.
Философское знание призвано воплотить в себе стратегические идеи повышения эффективности процесса тестирования на основе его гуманизации, технологизации, объективизации, массовости, дифференциализации, адаптации, индивидуализации и т. д. на всех этапах КАТ. Эти категории могут быть осмыслены с достаточной полнотой лишь на междисциплинарном уровне. Именно поэтому и необходимы философский, системный подходы к их анализу и, в конечном счете, к их синтезу. При этом возрастает роль и значение культуры СКДО достижений, отражающей в инвариантной системе знаний сложившуюся для данного конкретно-исторического этапа дидактическую парадигму, выполняющую духовную и нормативную функции по отношению к развивающейся теории и практике КАТ.
Выявление и наполнение специфическим содержанием культурных компонентов пространства КАТ (оснований, теорий, закономерностей, категорий, понятий, правил, гипотез и т. п.) позволяют, с одной стороны, выделить данную область научного знания от других наук, а с другой – установить возможности интегрированного взаимодействия знаний на уровне конкретных взаимоотношений компонентов социальной, духовной и технической культуры в аспекте их взаимодополнения и взаимообогащения. Подобные исследования в таком масштабе проводятся впервые, однако, на взгляд авторов, от развития данной методологии во многом зависит научный уровень политики и стратегии в сфере дидактической оценки поведения объектов нечисловой природы.
Главная функция философии КАТ состоит в решении проблемы гармоничного единения массификации и демассификации культуры оценки, их мировоззренческого синтеза. Первая обеспечивает уровень взаимопонимания и интеракцию позиционеров (разработчиков, администраторов и тестируемых) в культурном пространстве тестовых проверок. Вторая гарантирует возможность каждому испытуемому действительно индивидуальное самовыражение, выделяющее его поведение среди других индивидов данного образа. Таким образом, впервые не только в сфере философских стремлений и целей, но в самой реальности, в ее культурологических основаниях «возникают возможности для образования культурно-самодостаточных и вместе с тем гармонических индивидов» [35].
Для реализации этой гуманистической модели культуры КАТ необходимо ответить на вопрос: существуют ли фундаментальная ценность, инвариантная условиям проведения компьютерных тестовых испытаний латентному параметру обученности для каждого отдельного индивида и для респондентов конкретного социума? Такими ценностями, имеющими существенные значения для испытуемого и коллектива тестируемых, являются объективная и субъективная компоненты свободы как условия самореализации каждой личности в установлении собственной степени обученности.
Что же представляют собой эти компоненты свободы? Первая из них – объективная свобода – означает наличие инструментальных средств тестирования, банков качественных ПДТ3 и нормативных документов, регламентирующих деятельность позиционеров с реальными феноменами ЭФТК, КФТ и KCT3 пространства компьютерных проверок. Объективная свобода охватывает всю совокупность условий, делающих это пространство принципиально реальным и открытым для доступа позиционеров.
Вторая компонента – субъективная свобода – включает знания каждым эмпирическим объектом из данного социума возможностей культурного комплекса тестирования, а также все остальные знания, необходимые для ориентации и принятия в нем адекватных решений. Субъективная свобода – состояние деятельности тестируемого, в которой он формирует и совершенствует свои сущностные силы путем познания компонентов открытого пространства КАТ, реализует потребность установления собственной степени обученности. Свобода и ответственность – залог культурной деятельности позиционеров. Субъективная свобода реализует системообразующий принцип мировоззренческого синтеза инструментальных, духовных и социальных феноменов пространства тестовых проверок. Слова апостола Павла «все мне позволено, но не все полезно» – по-прежнему актуальны для деятельности позиционеров в этом комплексе. Позволительно верить в безусловную ценность свободы установления собственного уровня достижений и пользоваться свободой в соответствии с общезначимой системой культурных норм. Генезис личности – это социокультурный процесс освоения телеологческим объектом системы культуры, содержания и ценностей культурного пространства КАТ, их творческого преобразования в индивидуальных формах. Под личностью мы понимаем любого участника культурного комплекса адаптивного тестирования, который в индивидуальной мере усваивает правила и нормы деятельности, преобразует свою социальную сущность. Социализация личности означает врастание ее в культурное пространство компьютерного тестирования. Здесь формируется и институциализируется специализированная культура, когда исследователи проявляют себя как тестологи или эксперты. Их действия подчинены стандартным технологиям и методологическим правилам, методически обоснованы, экспериментально выверены. Процесс социализации связан с усвоением позиционерами некоторого обязательного культурного минимума тестологии и тестометрии, когда переход от традиционной отметки к культуре оценки связан с приобретением разработчиками KCT3 и тестируемыми нового статуса, изменения привычного образа деятельности. Обучение нормам и правилам деятельности в культурном комплексе адаптивного тестирования называется ресоциализацией [24].
Третьим компонентом структуры свободы является система принимаемых индивидом решений. Выбор возможных решений тестируемым для творческой реализации своих потребностей в установлении исходного и реального УУД становится неотъемлемым элементом свободы принятия решения для реализации собственной траектории заключений на требования ПДТЗ.
И, наконец, четвертый компонент структуры свободы есть процесс реализации принятого решения. Он предполагает наличие системы культурных норм, обеспечивающих выполнение каждым эмпирическим объектом рациональных и нравственных решений, относящихся к поступкам тестируемых и этическим основаниям свободы, внутренне осознанных и принятых ими. Мировоззренческий характер философского знания о процессе КАТ вырабатывает обобщенную систему взглядов позиционеров на пространство тестовых проверок и место в нем каждого конкретного индивида, акцентирует их внимание на познавательном и эстетическом отношениях к феноменам этого комплекса.
Деятельность объекта нечисловой природы в пространстве КАТ можно конкретизировать как динамику предпочтений попадания тестируемого в тот или иной уровень-интервал обученности, который испытуемый выбирает в ситуации принятия решения на одном из этапов КАТ. Такое осознание собственных смыслов, безусловно, связано со свободным выбором респондентом номативно – или личностно-ориентированного для него по смыслу и значению ПДТ [9,10].
Таким образом, если мировоззрение есть понятие, характеризующее меру свободы, которую культурное пространство тестовых проверок в состоянии предоставить испытуемому, то носителем этих систем обобщенных взглядов являются личность и социальная группа, воспринимающие данную реальность сквозь призму собственных ценностей. Маркса о том, что в центре будущего общества будет стоять «свободная индивидуальность, основанная на универсальном развитии индивидов», находит свое воплощение в реализации культурного комплекса адаптивного тестирования.
Вне триединства инструментальных, духовных и социальных феноменов комплекса компьютерного тестирования невозможно обеспечить взаимодействие различных компонентов свободы. Взять на себя функцию мировоззренческого синтезатора этих компонентов культуры и тем самым предоставить тестируемым возможность на новой идеологической основе оценить качественно степень собственной обученности может только культурное пространство КАТ – целостная рациональная система качественных и количественных отношений. В этом комплексе становление личностных смыслов и ценностей связано с мерой свободы, которая предоставлена каждому конкретному телеологическому объекту для реализации его решений о личностных предпочтениях.
В современных педагогических исследованиях в области тестологии проблема ценностей как регуляторов деятельности и диалога сохраняет до сих пор методологический контекст асиологических субъект-объектных отношений. Оценка субъекта направлена при этом на внешнюю по отношению к нему действительность – экзаменуемого. Эта концепция подобных взаимодействий представлена теорией деятельности , в которой понятие личностного не включало ценностные отношения в содержание понятий, описывающих смысловую регуляцию оценки уровня УУД испытуемых. Такой подход был оправдан в силу невозможности сравнения поведения проверяемых с близкими степенями обученности в условиях массовых испытаний и ограниченном времени проведения традиционного контроля знаний.
Активная регулирующая роль самосознания целеустремленного объекта в культурном пространстве КАТ предполагает возможность структурирования поведения индивида. В плоскости эмпирических исследований конструктивная роль личностных решений проявляется на первом этапе тестовых испытаний, когда решается вопрос об установлении близости оценок респондентов в процессе выполнения ими ПДТЗ различной категории трудности. Здесь реализуются только личностные смыслы тестируемых.
Наша вторая гипотеза заключается в том, что на основе реализуемых личностью возможностей (попадания результатов КАТ в тот или иной уровень-интервал обученности) испытуемый приступает к осмыслению полученной на первом этапе КАТ ситуации (класса, образа обученности). Этот процесс предполагает переход от личностных смыслов к личностным ценностям, которые выражаются в решении о приемлемости для него оценки, полученной в результате анализа качества его заключений на нормативно-ориентированный ПДТ и выбора для себя личностно-ориентированного теста [10].
Уточнение личностно значимого для испытуемого действительного уровня обученности может произойти только в том случае, когда на основе личностных предпочтений он принимает решение о готовности выполнения однородного (точнее, близкого к его степени обученности) теста. Эта активность эмпирического объекта находит свое реальное выражение в процессах осмысления и взвешивания разных смысловых содержаний и ценностном для него контексте выбора с учетом тех или иных мыслей и переживаний. Перевод плана индивидуальных предпочтений (в условиях свободного выбора) для себя личностно-ориентированного ПДТ во внешнюю деятельность предполагает подключение к личностным смысловым структурам «культурного резерва» испытуемого, когда он несет моральную ответственность за выбор однородной по мере трудности КФТ на этапе установления его реального (близкого к действительной степени обученности) УУД. В переходе личностных смыслов к собственным ценностям лежат истоки ответственности целеустремленного объекта нечисловой природы за собственные решения [9].
Предлагаемый здесь подход установления степени обученности тестируемого включает как минимум две составляющие – образование личностных смыслов и переход от них к личностным ценностям. Такая позиция согласуется с рассматриваемым взаимопереходам «планов внешней речи как речи для других, внутренней речи как речи для себя и мышления, предполагающего зарождение мысли из мотивирующей сферы сознания» [Выготский и речь. Собр. Соч., T.2,M., 1982]. Внешнюю речь мы здесь можем интерпретировать как личностный смысл исходного УУД образа, а внутреннюю – как личностные ценности, раскрывающие реальный УУД испытуемого.
При таком понимании философии КАТ оказывается, что приобщение к ней тестируемого следует рассматривать как институт формирования личности в качестве объекта и субъекта культурного пространства адаптивного тестирования. И в этом смысле философия культуры высоких технологий тестовых проверок изучается нами как духовно-творческая деятельность участников культурного комплекса тестирования, как мера выражения их самосознания и достоинства, залог и условие личной самореализации. Это новое для сферы образования направление заряжено стремлением противопоставить себя господствующей ныне традиции усреднения достижений проверяемых и поэтому требует определенности, прежде всего в установлении ясных и явных функций философии культуры адаптивного тестирования.
Функции философии КАТ
Философия КАТ как особый вид духовной культуры связана с практической деятельностью участников культурного комплекса, а потому ориентирована на выполнение многообразных функций. Важнейшая из них функция мировоззрения — совокупность принципов, взглядов и убеждений, определяющих направление деятельности и отношение к культурному комплексу тестовых проверок позиционеров различной категории.
Коммуникация объекта нечисловой природы и тестирующей системы в культурном пространстве КАТ – один из важнейших вопросов эпистемологического познания. Необычность ситуации, в которой оказывается респондент, состоит в том, что он должен действовать в этом комплексе с учетом требований и норм культурной системы, методологических правил и социальных ролей. В этом смысле каждый объект нечисловой природы предстает как феномен культурного пространства, где всеобщим признаком, выделяющим конкретного индивида, является его поведение как особый вид мыслительной и психической деятельности.
Классическая и современная теория тестов стандартизируют поведение целеустремленных объектов, индивидуальные качества тестируемых не являются здесь предметом специального изучения. Стандартизация мыслей и поведения объясняется наличием одинаковых по мере трудности тестовых заданий для индивидов с различными значениями латентных параметров обученности. Успехи респондентов также оцениваются стандартно при помощи традиционных методов количественной статистики [27,28,40].
Мировоззренческая функция философии КАТ по своему содержанию направлена на решение проблемы познаваемости степени обученности личности. Личные интересы индивида требуют удовлетворения его потребности в объективном установлении собственного уровня обученности. Поэтому коммуникации тестирующей системы и объекта нечисловой природы – это взаимоотношения их интересов.
Поведение личности в культурном пространстве КАТ исследуется в двух аспектах. Прежде всего тестируемый рассматривается как устойчивая система социально значимых черт, характеризующих индивида как члена из определенного класса (образа) обученности. К одному образу тестирующая система относит поведение объектов в процессе классификации, когда к данному таксону приписываются тестируемые со схожими (близкими) в некотором смысле качествами заключений на требования ПДТЗ нормативно-ориентированного теста.
Но термин «личность» связан и с понятием «индивидуальность». Индивидуальность находит свое выражение в уходе от типичности, когда тестирующая система действует таким образом, что бы УУД испытуемых из одного таксона (например, хорошистов) были различимы между собой. Именно поэтому в культурном пространстве КАТ личность – это целеустремленный объект, рассматриваемый с точки зрения не только его схожего поведения с тестируемыми из заданного класса обученности, а и со стороны неповторимости его собственного УУД.
Так в культурном комплексе СКДО УУД возникает дуальная дифференциация тестируемых: сначала объекты разбиваются на однородные группы – образы, а затем внутри этих классов производится различение поведения каждою конкретного испытуемого. Эти взаимоотношения элементов эмпирической системы и респондентов преломляются через их отношения с тестирующей программой, которая для разбиения индивидов на классы и для различения поведения испытуемых внутри каждого образа генерирует существенно различные композиции ПДТ.
Подобного рода этапность с мировоззренческой точки зрения свидетельствует о неограниченной возможности приближения оценки УУД испытуемых к действительной степени обученности личности путем увеличения числа этапов тестовых проверок с одновременным повышением значимой валидности личностно-ориентированных ПДТ.
Мировоззренческая
Главная, на наш взгляд, мировоззренческая функция философии адаптивного тестирования состоит в трансформации принципа антропоцентризма, согласно которому «человек есть центральная и высшая цель мироздания». Сущность интерпретации антропоцентризма применительно к мировоззренческой функции КАТ можно выразить так: позиционер является эндогенным образованием по отношению к культурному пространству адаптивного тестирования и к самому себе.
Содержание принципа антропоцентризма менялось от Протогора (V в. до н. э.), который провозгласил положение о том, что «человек есть мера всех вещей», до современных взглядов на устойчивое развитие методов СКДО УУД тестируемого, ядром которых является идея использования его коммуникации с квазисубъектом (компьютерной программой) как средства самопознания и самоутверждения. Такой подход в развитии антропоцентризма детализирует и дополняет заложенный в эпоху Возрождения мировоззренческий принцип осмысленно – гуманистического взгляда на индивидуализацию и самореализацию личности.
В процессе самореализации целеустремленного объекта действует философский закон единства и борьбы противоположностей. Во-первых, он ориентирует индивида на поиск своего образа (нормативно-ориентированный тест). Во-вторых, указывает на переходящий характер полученного в процессе КАТ класса обученности, так как изменение образа есть переход в другое качество, характеризуемое иным «полем возможностей и противоречий». В-третьих, этот закон направляет процесс познания сущности степени обученности объекта нечисловой природы на ступени приближения меры трудности ПДТЗ к значению латентного параметра испытуемого (личностно-ориентированный тест).
Мировоззренческая функция философии КАТ исходит из понимания того, что каждый респондент культурного пространства тестирования является не только объектом, но и субъектом, УУД которых должны быть оценены с заданной верностью. Согласно этому подходу качественная трансформация успехов тестируемого происходит тогда, когда изменение количественных характеристик его заключений достигает определенной меры. Такой взгляд на процесс КАТ основан на философском законе взаимного перехода количественных и качественных изменений и раскрывает механизм развития познания об установлении действительной степени обученности испытуемого.
Особенностью современного подхода к рассматриваемому принципу является то, что каждый участник культурного пространства тестирования занимает одно из центральных мест в нем, а потому он является главным сознательно – деятельным фактором этого комплекса. Эта ситуация определяет характеристики частных законов, действующих в тестологии и тестометрии. Специфика мировоззренческих законов при таком подходе заключается в том, что их формулировки носят эвристический и теоретический характер. Спор между сторонниками применения теоретических и эмпирических уровней знания для описания процессов, происходящих в культурном пространстве КАТ, подразумевает наличие двух противоречий между философскими гипотезами.
Первая из них основывается на количественной категории оценивания УУД и подразумевает использование дедуктивных наук. Поскольку при компьютерном тестировании мы вынуждены формировать математическую модель траектории поведения респондента, и, следовательно, прибегать к процедуре идеализации (упрощению действительности), то результаты оценивания можно принимать лишь с определенной степенью верности. Статистический характер законов описания процесса КАТ связан, прежде всего, с массовостью проведения тестовых испытаний в условиях неопределенностей представления как поведения индивидов, так и состояния учебной среды.
С развитием методов тестометрии и экспертных оценок тестовых материалов стало ясно, что существующие в классической и современной теории тестов модели количественного статистического анализа не могут дать этим явлениям удовлетворительное истолкование, что области применения методов параметрической статистики к описанию деятельности и поведения телеологических объектов ограничены, не полны и поэтому нуждаются не только в дополнении, но и в замене новыми, более общими теориями.
Вторая гипотеза, напротив, принимает тезис о принципиальной невозможности корректной оценки УУД тестируемых методами традиционной (количественной) статистики. Новый подход рассматривает индивида как объекта нечисловой природы, успехи которого могут быть установлены только с помощью методов непараметрической статистики, когда в основе построения механизма аттестации заложена философская категория качества. Последняя влечет за собой тождественность (одинаковость) поведения объектов внутри каждого класса обученности и непохожесть этого описания для испытуемых из других образов (классов).
В свое время Гегель установил качество как тождественное с бытием объекта, а количество – как равнодушное к бытию его определение. «Тождественное» в том смысле, что философская категория качества выражает специфичность, присущую феномену и отличающую его от других объектов. «Равнодушное» потому, что категория количества отвлекается от содержательной стороны поведения объекта нечисловой природы.
Проблема соотношения количества и качества с эпистемологической точки зрения может быть истолкована так: сегодня тестологи давно известными методами статистически умеют получать числа о поведении тестируемых опытным путем, абстрагируя их от качественного конкретного смысла параметра обученности индивида. Задачей качества в этих условиях становится – приобретение умения вновь связывать число с той реальной степенью обученности целеустремленного объекта, от которой эта же «самая человеческая мысль» в свое время научилась абстрагировать количество от качества латентного параметра респондента. В этом, собственно говоря, и состоит главная проблема соединения числа с мыслью, которая восстанавливает на философском уровне связь количества с качеством, нарушенную ранее специалистами из классической статистики путем абстрагирования этих категорий друг от друга. Такая гармония может наступить только в результате синтеза количественной и качественной сторон познаваемой степени обученности тестируемого – как сплавление числа и мысли.
Философия категории тестометрии – это наиболее фундаментальные понятия, отражающие существование связей между действительной степенью обученности тестируемого и его поведением. Они являются основой познания культурного пространства КАТ, служат орудиями логического и логичного мышления участников этого комплекса. Здесь проявляется действие диалектического закона отрицания отрицания: сначала дается исходная связь количества с качеством, затем она абстрагируется («отрицается»). После этого вторично отрицается это безразличие к смыслу поведения телеологического объекта, и последнее снова обретает свое содержание.
В классической и современной теории тестов второе отрицание не произошло, и начатая правильно идеализация измерения УУД тестируемых приняла гипертрофические размеры. Так было и в античности, когда Пифагор (6в. до н. э.) приписывал числам сущность вещей. Идеализация количественной стороны описания поведения целеустремленных объектов и процессов породила течение механицизма, рассматривающего прямолинейное развитие процесса познания. Народники также пытались посредством неправильного применения статистических методов (жонглируя со средними числами), т. е. неверно оперируя числами (количествами, значениями), замаскировать процесс глубокого расслоения и поляризации крестьянства. Но «неправильное мышление, если его последовательно проводить до конца, неизбежно приводит по давно известному диалектическому закону к таким результатам, которые прямо пропорциональны его исходному пункту» (Ф. Энгельс).
Чтобы избежать подобного рода ошибок, постсовременная теория КАТ должна содержать в своей основе: классы обученности тестируемых, плотность поведения индивидов внутри этих классов, расстояние между образами и испытуемыми, различных по УУД среди каждого таксона. Следовательно, качественный анализ поведения объектов нечисловой природы должен в нашем случае предшествовать количественному подсчету баллов, причем такой анализ должен быть проведен корректно направленной деятельностью тестолога-статистика. При этом определяющую роль должна играть философская категория качества.
Проблема типологической классификации поведения целеустремленных объектов рассматривается в непараметрической статистике как задача группировки исходных данных о качестве их заключений. При этом совокупность исследуемых объектов, каждый из которых задан научным наблюдением, требуется разбить на однородные по степени обученности таксоны. В данном случае априорная информация о характере распределения значений наблюдаемых признаков внутри образов (если не считать общих предположений, относящихся к диапазону изменений компонент вектора заключений телеологичесчких объектов и предполагаемом числе классов) практически отсутствует.
Нам будет целесообразно интерпретировать характер заключений тестируемых на требования ПДТЗ различной меры трудности в виде кластеров – групп элементов эмпирической системы, характеризуемых близким (сходным) описанием. Тогда основная цель типологической классификации – выделение в исходных многомерных данных таких однородных по значению латентного параметра обученности эмпирических объектов, поведение которых внутри каждой из групп было бы похоже в известном смысле друг на друга. Под «похожестыо» понимается близость характера заключений тестируемых в n-мерном пространстве значений признака, и тогда задача сводится к выделению в этом пространстве естественных скоплений выводов объектов нечисловой природы, которые и считаются однородными по степени обученности группами индивидов.
Разбиение респондентов на классы в соответствии с априорно заданными качественными уровнями-интервалами реализуется в форме комбинационной группировки. Она представляет собой последовательное отнесение системой КАТ поведения объектов нечисловой природы к определенной зоне обученности (отличников, хорошистов и т. п.) в соответствии с длиной и значимостью уровня-интервала. Решение данной задачи зависит от статистических свойств вектора научных наблюдений, полноты априорных сведений о характере вероятностного распределения заключений тестируемых.
Например, для нормального закона распределения предполагается, что величина коэффициента вариации при построении группировок не должна быть меньше 0,33. Однако, как отмечает ряд исследователей, у этого способа кластеризации имеется ряд ограничений: «критические значения коэффициента вариации, как и любой случайной величины, не сводятся к одному числу, а зависят, в частности, от объема выборки; в рамках указанного критерического значения могут находиться самые разные, в том числе полимодальные, распределения; метод неприменим в многомерных ситуациях; коэффициент не имеет смысла в интервальных шкалах». Так что, несмотря на распространенность этого способа кластерного анализа, его использование для разбиения поведения телеологических объектов на класты не может быть оправдано. Следует учитывать и то обстоятельство, что, если даже значения признака трудности ЭФТК и поддается количественной оценке, то эти числа страдают значительными неопределенностями, возникающими из субъективного мнения экспертов при анализе ими качества ПДТЗ и всевозможного рода усреднений. В связи с этим для установления коэффициента сходства поведения объектов нечисловой природы предлагается использовать метрику B. B. Красильникова и предложенную им новую методику решения задач кластерного анализа [25].
Этот подход основывается на методах непараметрической и интервальной статистики, обладает четкой содержательной осмысленностью и возможностью контроля результатов разбиения поведения целеустремленных объектов, придавая уровням-интервалам обученности нормативные значения. Общая эпистемологическая проблема оценки поведения объектов нечисловой природы с вероятностных позиций обретает здесь качественную интерпретацию результатов КАТ.
Непараметрический подход не требует домысливания непроверенных экспериментально продуктов традиционной статистики: например, предположений о независимости отдельных научных наблюдений, что установить принципиально не представляется возможным; постулирования одного из законов распределения; однородности исходной совокупности объектов эмпирической системы и т. д. Безусловно, методы параметрической статистики могут применяться чисто в стохастических областях с миллионами наблюдений (например, в статистической физике), но «при тщательной проверке устойчивости, воспроизодимости результатов от серии к серии».
Поэтому мы будем проводить анализ поведения и свойств объектов нечисловой природы на основе методов непараметрической статистики с применением процедур образцового типа. Для этого необходимо принять три решения: 1) обосновать тип и число значений меры трудности ЭФТК; 2) выбрать способ первичного задания образцовых множеств в KCT3; найти метрику и способ классификации поведения и свойств целеустремленных объектов. Обсуждение этих вопросов тесно связано со шкалированием при анализе дидактической информации и будет частично предпринято в этой книге.
Классы обученности (отличников, хорошистов и т. п.) образуют группы однородных по поведению телеологических объектов, различающиеся по их месту расположения на шкале оценки. Они формируются априорно экспертами и уточняются тестирующей программой в результате анализа качества заключений тестируемых на тестовые ситуации различной категории трудности. Ясно, что от значения латентного параметра обученности объекта из неоднородной эмпирической среды зависит его поведение, а, следовательно, и уровень интервала обученности (класса), к которому он будет отнесен системой КАТ. Совокупность таксонов и система их взаимоотношений образуют социальную структуру культурного пространства тестовых испытаний.
Безусловно, среди индивидов одного класса находятся испытуемые с неодинаковыми количественными оценками. Этот аспект существования субъектов внутри одного образа выражает категория различия исходной степени их обученности (например, более чем отличник, отличник, почти отличник). Из сопоставлений этих противоположных подходов следует вывод, что спор противников и сторонников о возможностях создания механизмов оценки УУД тестируемых, по существу, происходит не в рамках единой парадигмы, а свидетельствует о возникновении двух различных подходов.
Философское мировоззрение определяет возможности позиционеров объединять в обобщенном виде знания о культурном пространстве КАТ в целостную систему и фокусировать их на ценностных компонентах сферы образования (государственных, общественных и личностных). Оно акцентуирует свое внимание на исследовании свойств культурного комплекса тестирования и месте в нем позиционеров, на отношение разработчиков, администраторов и тестируемых к этому феномену и к самим себе, а также изучает обусловленные их взглядами убеждения, идеалы, мотивы и принципы деятельности. Носителями этой системы взглядов является личность испытуемого и социальная группа позиционеров, воспринимающая реальную деятельность сквозь призму собственного мировоззрения.
Содержание мировоззрения определяется практическими результатами деятельности участников культурного пространства КАТ, ориентированными на наполнение KCT3 и свободный доступ к ним респондентов. На рациональном уровне мировоззрение исследует и обосновывает законы развития СКДО УУД тестируемых и правила их поведения в пространстве тестовых испытаний.
Это естественное представление о сущности философии мировоззрения КАТ на протяжении длительного периода существования сферы образования до настоящего времени во многом гипертрофированно, в результате чего философские аспекты теории тестов не рассматриваются как подлинно культурное знание. Поэтому современная тестология отражает не столько объективную истину, сколько односторонне исследует показатели качества тестовых материалов и методы шкалирования, опираясь на теорию IRT, а не на совершенствование интегральных показателей качества КАТ и учет интересов личности.
Современная теория тестов не ставит своей целью обоснование определенной ориентации личности на ее ценностные ориентиры. В отличие от нее постсовременная теория тестов проявляет свою сущность через философию КАТ, объектом которой является культурное пространство СКДО достижений тестируемых и его категорий: ценностей, самоорганизации, инкультуриализации и др. Новое содержание философского мышления при изучении культурного комплекса тестовых проверок определяется рациональной деятельностью участников этого пространства, применением в процессе создания инструментальных средств тестирования методов искусственного интеллекта и высоких технологий обмена сигналами данных. При этом на первый план философия КАТ выдвигает проблемы духовного мира личности, ее сознания и нравственности.
Как сложное духовное явление мировоззрение необходимо рассматривать в единстве и взаимодействии чувственного и рационального уровней. Чувственная деятельность лежит в основе наших знаний о том, можно ли на основании априорных сведений о содержании и качественных показателях БТЗ, опираясь только на результаты КАТ, так приписать сравниваемым значениям поведения целеустремленных объектам качественные и количественные величины, чтобы тестируемому с большей степенью обученности соответствовала более высокая оценка.
Предлагаемая авторами концепция КАТ базируется на современном философском представлении о фундаментальных ценностях для индивида. К ним относятся свободный доступ респондента к KCT3 и возможность самореализации. Именно свобода самореализации есть та ценность, которая составляет подлинное содержание и меру прогресса образования, по отношению к которой инструментальная среда, БТЗ и нормативная система культуры тестирования составляют лишь условия и предпосылки (объективную компоненту свободы) для оценки значения латентного параметра обученности индивида.
В соответствии с уровнем получаемых знаний процесс КАТ разделяется на два этапа. На начальном этапе разработки знания о степени обученности объекта у тестирующей системы полностью отсутствую, следовательно, проектирование траектории его заключений необходимо осуществлять с учетом эмпирических результатов, накапливаемых в процессе испытаний. На этой стадии тестовых проверок не следует полагаться на факторы случайности, а необходимо использовать возможности автоматического подбора меры трудности тестовых ситуаций к качеству заключений объекта и формировать образ тестируемого с учетом его поведения (рис. 4).
На втором этапе подтверждаются первоначально выявленные причинно – следственные отношения, для чего используются методы систематизации научных наблюдений, регулярно приобретаются новые данные о качестве заключений испытуемого на однородные по категории трудности ПДТЗ. Это позволяет избежать влияния на оценку ПДТЗ, не соответствующих исходному УУД тестируемого. На этой стадии можно выявить регулярности, присущие поведению каждого конкретного испытуемого из данного класса обученности. Кроме того, при анализе полученных данных строятся эмпирические зависимости для коррекции категории трудности ЭФТК, хранящихся в БТЗ. Важным обстоятельством является также то, что на этом этапе более верно оценивается реальная степень обученности испытуемого, что предоставляет дополнительный материал для правильного построения теоретической модели элементов однородной эмпирической системы КАТ (рис.4).

Рис. 4. Этапы тестирования
С этих позиций процесс СКДО учебных достижений респондентов выделяет две дидактические цели – разделение объектов на классы обученности (нормативно-ориентированный ПДТ) и различения индивидуальных достижений конкретных испытуемых внутри каждого образа (личностно-ориентированный ПДТ). Здесь философия КАТ формирует мировоззрение не только отдельных личностей, но и социума в целом, отражая в нормах деятельности позиционеров их устремления сознательного воздействия на культурное пространство тестирования. Овладение мировоззренческими аспектами КАТ повышает уровень профессиональных знаний специалистов в области проектирования качественных методов оценки степени обученности тестируемых, дает ориентир в применении новых способов анализа поведения и свойств объектов произвольной природы в условиях неопределенности.
Основным критерием установления УУД эмпирических объектов является практика – целенаправленная деятельность тестируемых, направленная на определение собственной степени обученности. Ее содержанием в нашем случае является процесс КАТ, выраженный в форме обработки научных наблюдений. Достаточно простого размышления, чтобы увидеть, что, осуществляя научные наблюдения за качеством заключений индивида на тестирующие воздействия различной меры трудности, можно составить первоначальное представление о его исходной степени обученности. Это представление является идеальным образом поведения объекта нечисловой природы, поскольку отражает отношение индивида к реально существующей образцовой KCT3.
Философия адаптивного тестирования изучает общие закономерности построения эмпирических систем оценки УВД респондентов. Синтезируя для достижения своих целей совокупный опыт разработчиков, мировоззренческая функция философии наиболее полно выражает каждый исторический период развития теории тестов, духовно-практические и социальные устремления, а также методологию культурного мышления участников пространства тестовых проверок.
Постсовременная теория адаптивного тестирования концентрирует свое внимание на личностных атрибутах латентного параметра обученности респондента. Безусловно, состояние обученности индивида, как дидактического феномена эмпирической системы тестовых проверок, может быть рассмотрено или сконструировано, исходя из различных предпосылок. Философия культуры КАТ исследует личностные свойства и их различия на основе научных наблюдений за поведением целеустремленных объектов, базирующихся на косвенной оценке качества их заключений.
Хотя большинство тестологов не рассматривают структуру личности тестируемого, наша задача состоит в том, чтобы представить адекватный инструментарий, необходимый для плодотворной дискуссии. Будем исходить из того, что личность есть синтез сходных (близких, похожих) и индивидуальных степеней обученности объекта нечисловой природы. Под «сходством» понимается толерантность поведения тестируемых, когда они образуют в пространстве решений однородные классы. Традиционно проблема выделения однородных групп рассматривается в статистике как задача типологической классификации поведения объектов нечисловой природы.
Типологической классификацией будем называть разбиение поведения телеологических объектов нечисловой природы на качественно однородные по свойству обученности группы. Действительно, если группы в пространстве оценки удалены в некотором смысле друг от друга, то можно предположить, что в основе такого разбиения лежит качественный, но скрытый признак, обуславливающий четкое расслоение характера заключений тестируемых. В этой ситуации типологическая классификация представляет собой последовательный анализ выводов респондентов и отнесение их обобщенного поведения к определенным таксонам (образам, классам) в соответствии с длинами уровней-интервалов обученности. Таким образом, на первом этапе адаптивного тестирования каждая личность обретает свой содержательно осмысленный образ (отличника, хорошиста и т. п.).
Представления дают нам элементарную форму образного отражения значения латентного параметра респондента в его косвенно наблюдаемой целостной форме. Именно поэтому процесс представления о состоянии обученности эмпирических объектов изучается как активный и творческий, когда в ходе многократных исходов респонденты относятся системой КАТ к тому или иному классу (образу). Фундаментальное значение чувственно – образной формы деятельности состоит в том, что она позволяет системе КАТ разделить объекты неоднородной эмпирической среды (точнее их поведение) на образы, когда к одному таксону обученности относятся тестируемые с близкими, в определенном смысле, качествами заключений на требования ЭФТК различной категории трудности.
Так, например, в дисплейном классе, где одновременно происходит проверка уровня знаний, умений и навыков 15 – 20 респондентов, тестирующая программа выбирает случайным образом из KCT3 персональные нормативно-ориентированные выборки (КФТ) для каждого индивида, оценивает качество их заключений, приспосабливает свои действия к поведению каждого телеологического объекта и формирует протоколы результатов тестирования. В этом случае индивид с априорно не установленной для системы КАТ степенью обученности дает заключения на требования ПДТЗ различной категории трудности. Анализируя качество его выводов, тестирующая программа приспосабливает категорию трудности заданий к уровню обученности этого респондента и формирует в памяти системы КАТ траекторию проверки (дидактическую модель) его достижений. Одновременно с самоорганизацией в эмпирической системе вычисляется исходный балл тестируемого, который и относит респондента к одному из заранее установленных классов.
Деятельность целеустремленного объекта на первом этапе тестирования сопряжена с возможностью не только самостоятельного регулирования им темпа КАТ, но и лежит в основе выбора числа сеансов тестирования по конкретной учебной дисциплине с целью «попадания» в возможный для него уровень – интервал (образ) обученности. В этой ситуации философское мировоззрение не просто провозглашает свои принципы, а выступает как система воспитания у каждого индивида чувства причастности к развитию культурного пространства тестирования, понимания им сущности этого комплекса, идей и норм, веры в возможность установления объективной оценки его собственной степени обученности. На этом этапе КАТ устанавливается исходный УУД каждого конкретного образа, под которым мы понимаем приближенную оценку степени обученности образа за счет анализа качества его заключений на ПДТЗ различной меры трудности.
Несмотря на то, что ситуации одного образа описываются различными совокупностями заключений респондентов, представление каждого факта в тестирующей системе сохраняет регулярность, которая и используется для представления знаний об УУД индивида. Другими словами, при формализации процесса тестирования в концепциях вычисления степени обученности респондента сначала устанавливается пространство состояний заключений, а затем в этом классе фиксируется поведение каждого объекта. Отдельное состояние обученности в тестирующей системе является комбинацией одних и тех же значений признака, следовательно, все факты описываются в одинаковой форме представления (структуре данных). Это и означает сохранение регулярности для представления УУД для каждого тестируемого.
По своей сущности типологическая группировка представляет собой специфическую методологию классификации поведения неоднородных по значениям латентного параметра обученности объектов нечисловой природы. Однако каждой личности наряду с близкими степенями обученности свойственны и индивидуальные черты. Индивидуальность находит свое выражение в процессе различения поведения каждого конкретного испытуемого из каждого однородного образа. Эта позиция дуального подхода к оценке УУД тестируемых совпадает с работами Г. Олпорта, который высказал идею когнетивного стиля, когда оценка несет в себе «отпечаток уникальности индивида». Уникальность и неповторимость поведения личности может быть достигнута только в том случае, когда индивидуальная окраска ее обобщенных заключений устанавливается в результате предъявления однородных по содержательности и логичности ПДТЗ [9].
По своему содержанию философское мировоззрение КАТ на втором (рациональном) уровне деятельности концентрирует свои исследование на установлении реальной (сколь угодно близкой к действительной степени) обученности каждого конкретного испытуемого. В современной философии под рациональностью понимают логическое и логичное (правдоподобное) обоснование процесса компьютерного тестирования. Мировоззрение в этом смысле основывается на обосновании законов развития объективных процессов КАТ, которые необходимо рассматривать в единстве и взаимодействии с образным представлением поведения телеологического объекта.
Здесь философия ставит своей целью обоснование определенной ориентации выбора научных основ установления более верного значения, чем на первом этапе КАТ, латентного параметра испытуемого. Как бы тщательно не проводилось тестирование, мы никогда не можем узнать истинное значения искомой величины. Производя тестирования, мы получим результат, который с заданной степенью верности отражает действительное значение степени обученности испытуемого, поскольку из-за наличия неопределенностей при повторной проверке через некоторое время в тех же (точнее в близких) условиях и с той же тщательностью мы получаем несколько иной (но близкий к первому) результат.
Так как действительное значение степени обученности тестируемого остается неизвестным вследствие отсутствия «идеальных» методов и средств оценки, в практической деятельности данный параметр определяют приближенно. Это более качественное значение результата КАТ, применяемое вместо действительного латентного параметра, будем называть реальным. Реальный УУД – это оценка степени обученности испытуемого за счет анализа качества его заключений на ПДТЗ, мера трудности которых соответствует фиксированному (исходному) уровню достижений каждого субъекта. Напомним, что еще в начале восемнадцатого века утверждал единство объективного и субъективного сознания. Очевидно, что при установлении реального УУД применяется личностно-ориентированный тест.
Строго говоря, возможность дальнейшего увеличения этапов тестирования и уточнения однородности обученности испытуемых на наш взгляд нецелесообразна. Это связано с тем, что на втором этапе о параметре обученности объекта почти все становится известным. В этом смысле о решении проблемы установления действительной степени обученности испытуемого можно говорить, что ее полное формализованное описание возможно осуществлять до бесконечности путем непрерывного улучшения однородности значений параметров объектов нечисловой природы.
Наличие двух этапов КАТ соответствует убеждениям , который говорил, что «личность имеет право на независимость от любых социальных групп и от общества в целом». Этот мировоззренческий принцип автономии личности соответствует новой парадигме СКДО УУД и предполагает не только возможность каждому испытуемому установить реальный, свойственный только ему УУД, но и учитывает наличие у эмпирического объекта желания войти в соответствующий со степенью собственной обученности класс достижений.
Имеются способы оценить качество наблюдаемого поведения испытуемых, определяя границы, за пределы которых не выходит полученная в результате проверки оценка уровня УУД конкретного образа. Все это дает возможность выбирать те средства и методы, которые обеспечивают получение результата с верностью, не превышающей рациональных для данного уровня границ. Показателем верности мы будем называть качественные характеристики неопределенности в оценке исходного (или реального) значения УУД тестируемого. Этот показатель должен выносить суждение о том, насколько близки полученные оценки УУД к значениям их латентных параметров или же какой ущерб может понести позиционер (испытуемый, администратор, преподаватель) при замене этих параметров их оценками[12].
Термин «верность» в некотором смысле является синонимом понятия «точность». Однако последний обычно используется лишь применительно к оцениванию результатов измерений физических величин, которые представляются лишь одним числом. В качестве показателей верности в классической и современной теории тестов также используются точечные или векторные оценки. Применительно к анализу результатов тестирования авторами данной книги развиваются непараметрические методы оценки поведения и свойств (например, категории трудности ПДТЗ) телеологических объектов, когда оценка рассматривается как синтез философских категории качества и количества.
Относительность оценки степени обученности тестируемых связана с тем, что мозг человека обладает бесконечной сложностью, в то время как на каждом уровне развития постсовременной теории адаптивного тестирования мы имеем дело с приближенными моделями поведения респондентов. Выражение бесконечного в конечной модели поведения объектов нечисловой природы возможно только благодаря упрощению действительного состояния обученности индивида путем преобразования этого состояния в заключения тестируемого и оценки качества выводов, что и ведет к приблизительности, а, следовательно, к относительности наших знаний о действительной степени обученности эмпирического объекта. Модель поведения тестируемого, которая еще недавно была адекватной, через некоторое время перестает быть таковой. Если в точных и естественных науках главная трудность создания адекватных моделей сопряжена со сложностью и многообразием материальных компонентов культуры, то в социальных и духовных науках к этому прибавляется неопределенность изменения самих законов и правил эмпирической деятельности позиционеров.
Не менее важным в становлении философии адаптивного тестирования является определение направленности и преемственности дальнейшего совершенствования процесса СКДО УУД респондентов. Здесь на помощь приходит философский закон отрицания отрицания. Применительно к тестометрии этот закон указывает, что процедура повышения верности оценки связана, во-первых, с увеличением объема БТЗ и его качественных показателей (валидности, различающей способности и т. п.); во-вторых, с ростом количества этапов тестирования, когда последующая фаза проверки отрицает предыдущую таким образом, что сохраняются необходимые существенные моменты некоторых свойств и отношений предыдущей стадии проверки. Эта характеристика закона отрицания выражается категорией снятия неопределенности, которая есть разрешение противоречия между действительным и реальным состоянием эмпирической системы, образуемого единством и борьбой исходного УУД и его отрицанием путем перехода к следующему этапу КАТ, синтезирующего в себе необходимые и существенные стороны предыдущей стадии оценки, но уже с однородными значениями меры трудности ПДТЗ, предъявляемых на втором этапе тестирования испытуемому из каждого образа.
Использование рационального подхода при выборе методов оценивания и классификации является очень важным, так как распространено мнение – чем вернее полученная оценка достижений, тем лучше. В действительности, это не всегда так и, прежде всего потому, что чем выше верность, тем труднее ее достигнуть. Важным факторами в этом отношении являются, например, валидность ПДТ и неопределенность условий при проведении сеанса КАТ. Однако в любом случае, когда мы подходим к границам наших знаний об эмпирическом объекте и методах оценки, верность последней оказывается фактором, ограничивающим их дальнейшее углубление. С мировоззренческой точки зрения действительная степень обученности испытуемого познаваема и возможности этого познания безграничны; также, в принципе, безграничны требования к верности, необходимой для расширения наших знаний о состоянии обученности каждого испытуемого.
Исследуя рациональную деятельность в области установления реальной степени обученности элементов однородной эмпирической системы, мы должны понимать, что это возможно сделать только в том случае, когда тестирующая система анализирует поведение образа с априорно установленной исходной степенью обученности. Последнее связано с тем, что только в этом случае, действие системы КАТ будут для испытуемого содержательными и логичными.
Философия адаптивного тестирования рассматривает два подхода к описанию личности – типологический и индивидуальный. Первый подход акцентирует внимание исследователей на типологической классификации неоднородных по степени обученности целеустремленных объектов; второй – на различении поведения однородных по значениям латентного параметра обученности испытуемых, входящих в данный образ. Предлагая данный подход к оценке УУД тестируемых, напомним слова социологов Х. Мюррея и К. Клукхона (1948): «каждый человек чем-то похож на всех, чем-то на некоторых и чем-то не похож ни на кого». Безусловно, рассмотренные свойства личности могут проявляться на разных уровнях обученности, и их нужно различать.
С философско-мировоззренческой точки зрения предлагаемый авторами подход гарантирует индивидуализацию тестовых проверок для каждого конкретного испытуемого с фиксированной степенью обученности. Эта личностная ориентация тестирующей программы организуется в виде коммуникации между испытуемым из данного образа и однородной по мере трудности КФТ. Рациональные партнерские отношения обмена сообщениями основываются на том, что из конечной совокупности ЭФТК испытуемому предъявляются только те задания, категория трудности которых соответствует (точнее близка) установленному на этапе первоначального тестирования исходному УУД данного образа. На основе этой рациональной деятельности каждый испытуемый становится не только объектом, но и субъектом проверки.
Таким образом, нерасторжимость и взаимодополняемость двух этапов КАТ позволяет корректно подойти к изучению рациональной организации дидактического оценивания и классификации одного из латентных параметров личности. Здесь мы можем утверждать то, что изучение поведения элемента эмпирической системы в культурном пространстве КАТ действительно приводит к изменению содержания и организации процесса СКДО УУД объекта нечисловой природы.
Изучая целенаправленную деятельность на уровне личности, мы замечаем, что принимаемые ею решения могут не соответствовать предусмотренным механизмам нормативной системы культуры. Например, тестируемый, находясь в классе отличников, может на этапе рациональной аттестации (идентификации) во избежание риска принять решение о том, чтобы получать ПДТЗ, мера трудности которых соответствует образу хорошиста. Такая нерациональная деятельность личности не является враждебна социуму. Со временем она может явиться причиной возникновения новой рациональности или с соответствующей самокоррекцией постепенно трансформироваться в уже существующую рациональность.
Коммуникация целеустремленных объектов с КСТЗ формирует у них качественно новую культуру мышления. Это явление связано с тем, что в культурном пространстве КАТ дисциплинарность мышления регулируется не только нормативной системой правил, но и необходимостью однозначного формирования заключений на требование каждого ПДТЗ. В любом случае, здесь мы сталкиваемся с необходимостью построения статистических моделей полученных результатов. Используемые нами модели включают наблюдаемое значение УУД индивида, которое складывается из параметра, описывающего искомую степень обученности этого респондента и неконтролируемых величин, характеризующих неопределенные (остаточные) эффекты условия проведения тестовых испытаний. Разумеется, в зависимости от результатов КАТ (классификация, отбор, отсев и т. п.) методы оценок достижений и случайные эффекты должны изучаться в соответствии с особенностями рассматриваемой ситуации.
Простейшей формой плана научных наблюдений является сравнение нескольких уровней одного и того же фактора, когда определяется один и тот же параметр объекта. Очень легко привести примеры данных наблюдений такого рода, но для определенности обратимся к исследованию, когда должны сравниваться эффекты трех различных значений признака трудности ПДТЗ для установления степени обученности индивидов из трех классов.
Допустим, что из нескольких (m) индивидов m1 являются отличниками, m2 – хорошистами, m3 – троечниками. Сейчас нас интересует только структура данных наблюдений. В этом случае ее можно представить схематически, как показано на рис.5. Здесь цифрами обозначены заключения тестируемых с фиксированной степенью обученности на ЭФТК различной меры трудности.
Из этой таблицы следует, что данный тест хорошо разбивает объекты на классы. Рациональность здесь фиксирует отличие качества заключений конкретной личности от всех остальных испытуемых из данного образа.
Применительно к дидактической оценке УУД тестируемых высказывания, сделанные в привычных построениях вероятностного языка, оказываются неудачными из-за того, что на этом языке пытаются описать явления, действительно связанные с «замаскированной» причинно-следственной упорядоченностью. Иллюстрируем это с помощью следующего мысленного эксперимента.

Рис.5. Гипотетическая таблица заключений тестируемых
Пусть имеется КСТЗ, включающая в себя тестовые ситуации различной меры трудности. Оценка достижений производится следующим образом: тестируемым с различной степенью обученности предъявляются КФТ (выборки из КСТЗ) заданного объема n и подсчитывается доля правильных заключений на ПДТЗ с учетом их веса. Результаты подобных исследований, конечно, можно представить функциями распределения. Однако их параметрическое описание требует вычисления моментов высокого порядка, что влечет за собой проведение большого числа наблюдений. К тому же, описание в терминах функций распределения оказывается слишком громоздким. Объясняется это тем, что заключения тестируемых располагаются преимущественно не случайно, образуя облака сгущений вблизи среднего значения, соответствующего латентному параметру их обученности. Эти сгущения очень хорошо могут проранжировать индивидов по уровням их учебных достижений, связывая полученные оценки с действительными уровнями обученности тестируемых.
Отсюда следует, что задача дидактической оценки латентного параметра целеустремленных объектов эмпирической системы КАТ в данной постановке носит не метрический, а топологический характер. В построенном no данному принципу механизме оценивания и классификации, систему КАТ «интересует» не расстояние между точками n-мерного пространства, а вхождение этих точек в определенные уровни-интервалы обученности. Если это так, то следует перейти к методике синтеза философских категорий количества и качества оценки достижений, когда нужно установить, как часто алгоритмы оценки в разное время относят одну и ту же степень обученности тестируемого к одному и тому же классу. В этом примере обнаруживается некая, хотя и не четко выраженная, причинно-следственная связь между уровнем достижений тестируемого и качеством его обученности, и ее следует описывать содержательным статистическим представлением наблюдений. И здесь можно говорить о прогрессе в культурном мышлении, когда важна не смена идей выбора того или иного метода параметрической статистики, а эволюция мышления – переход к непараметрической и интервальной статистике оценки поведения телеологических объектов нечисловой природы.
Создание инструментальных сред КАТ – яркий образец инженеризации «интеллектуальной технологии» СКДО УУД тестируемых. Среда считается интеллектуальной, если она обладает дружественным интерфейсом с пользователями, способна приспосабливать тестирующие воздействия к качеству заключений тестируемых, принимать рациональные решения о необходимости изменения меры трудности ПДТЗ, обрабатывать данные, касающиеся поведения респондентов, и обладает качественным механизмом оценки достижений.
Разработка инструментальных систем (ИС) в сочетании с концепцией БТЗ – трудоемкий и дорогостоящий процесс. Существенным здесь является то, что в ИС можно выделить систему логических оболочек (каркасов), связанных различными механизмами формального вывода. Эти логические оболочки составляют сущность инструментальных средств и могут быть использованы как базисные модели для конструирования эмпирических систем КАТ, реализующих указанные мировоззренческие функции [38].
Иерархические, модульные строения оболочек составляют семантические сети и сложные фреймы с разветвленными структурами. Их верхние слои представляют собой структурированные БТЗ, через которые осуществляется приспособление интеллектуальной системы КАТ к пользователям и учебной среде. Эти артефакты, взятые в обособленном виде, называет «динамическими функционирующими моделями реального экспертного знания» [35].
Культурное пространство КАТ с философско-мировоззренческой точки зрения рассматривается нами как качественно специфическая часть реальной действительности. В этом комплексе действуют законы синергетики, к числу которых относятся информационная открытость, удаленность от состояния равновесия, бифуркация, непредсказуемость результатов тестовых испытаний и др.
Самоорганизация является необходимым условием существования пространства КАТ, поскольку она изначально связана с необходимостью целенаправленного изменения характера тестирующих воздействий с учетом качества заключений каждого конкретного индивида. Регулятивы, законы и правила выступают в пространстве КАТ как результат имманентного развития системы интеллектуального тестирования, следствие ее адаптации, в то время как целенаправленное приспособление меры трудности ЭФТК, связанное с поведением объекта нечисловой природы, является содержанием феномена управления.
Таким образом, рассматриваемая в данной книге философия мировоззрения адаптивного тестироввания раскрывает закономерности и пути развития методов, средств и форм отражения степени обученности тестируемых в моделях качественной оценки их достижений. Она формирует общие принципы и теоретические положения, описывающие и объективизирующие этот процесс. В связи с этим приобретают первостепенное значение вопросы методологии научного познания, совершенствования строений и способов КАТ.
Методологическая
Данная функция философии состоит в логичном и логико-теоретическом анализе научно – практической деятельности разработчиков культурного пространства КАТ. Философия методологии определяет направление научных исследований, позволяет ориентироваться в многообразии культурных феноменов, фактов и процессов, происходящих в культурном комплексе тестовых проверок.
Методология акцентирует внимание на философском учении о методах и гипотезах, используемых в процессе научного познания и преобразования компонентов культурного пространства КАТ. Она изучает процесс разбора ситуаций, осуществление выбора и целеустремленное продвижение к целям. Метод научного познания – способ восприятия действительной степени обученности эмпирического объекта в нашем сознании, т. е. система принципов практической и теоретической деятельности. Выработанные субъектом методы научного познания составляют последовательность операций в деятельности, которая позволяет найти общие закономерности в культурном пространстве тестовых испытаний. Общенаучными способами, используемыми в теории КАТ являются, например, такие как: научные наблюдения за поведением тестируемого, моделирование процесса тестовых проверок и т. д. Частно научные методы применяются в тестометрии и тестологии. Сюда следует отнести метод оценки УУД тестируемых, способ анализа качества тестовых материалов и т. п. На основе частно научных методов разрабатываются методики для решения специфических задач теории КАТ. Методы всех уровней познания характеризуются свойствами ясности и общепонятности, общепринятостью, подчиненностью конкретной цели и т. д.
Попытка с помощью исследований разобраться на первый взгляд кажется почти неосуществимой затеей. Однако для науки проблемы такого рода вовсе но новы, так как ее прогресс проявляется в том, что проблемы, казавшиеся по началу непомерно сложными, оказывались относительно простыми.
Основным научным методом изучения неизвестного является эксперимент. Однако экспериментировать с дидактическими системами нельзя. Можно выделить три подхода к решению этой проблеммы. Первый из них применяется в классической теории тесттов, когда для измерения степени обученности объекта применяются методы теории вероятностей и математической статистики. Работы в этом направлеинии позволяют получить первые представления об установлении значения скрытого параметра обученности тестируемого. Это достижение нельзя недооценивать, но пока мы не научимся делать выводы о реальном поведении объектов нечисловой природы, мы не сможем разработать научную теорию, которая непосредственно описывала бы динамику целеустремленных эмпирических систем КАТ.
Второй подход к изучению крупномасштабных дидактических систем тестовых испытаний связан с использованием относительно сложных экспериментальных манипуляций с моделями Раша и Бернбаума. Хотя эти модели кажутся и, возможно, являются более близкими аналогами реальных ситуаций, проблема исследования поведения телеологических объектов произвольной природы все же остается, и на это есть две причины. Во-первых, хотя модели напоминают действительность, потому что они воспроизводят многие их свойства, но нет никакой уверенности, что эти свойства в моделях связаны между собой также, как в реальных условиях тестовых испытаний. Во-вторых, из-за сложности поведения живых объектов и неопределенности учебной среды количественное описание того, что в большинстве из них происходит, оказывается невозможным. Сказанное не в коей мере не ставит под сомнение ценность вклада, вносимой современной теорией тестов в наши представления об описании процессов компьютерного тестирования.
Традиционный статистический анализ дает в лучшем случае описание, а не объяснение результатов КАТ. Большинство заключений, получаемых на основе анализа реального материала, оказались невоспроизводимыми никаким объективным путем. Авторами сделана попытка объединить сильные стороны всех трех подходов и избежать, или хотя бы минимизировать, сопряженные с ними трудности.
По функциональному назначению и способам применения научные методы познания подразделяются на теоретические и эмпирические. Теоретический уровень знания (содержательного или формального) базируется на аксиоматическом методе абстрагировании и идеализации. Основу этого метода составляют повторяемость и получение истинных результатов при наличии корректных посылок.
Эмпирический уровень знания – это знание, полученное непосредственно из научных наблюдений за деятельностью экспертов тестовых материалов или за поведением тестируемых, с некоторой «рациональной обработкой свойств и отношений изучаемых мнений или заключений». Этот уровень представляет собой исходную базу для теоретического знания. Основу эмпирического подхода составляют регулярность и получение наиболее вероятных результатов при наличии конкретных посылок. В учении о логичных основах эмпирического познания анализируются и оцениваются те философские представления и концепции, которые базируются на правдоподобных рассуждениях. Эта часть методологии непосредственно связана с анализом данных, полученных в результате наблюдений, и со взглядами разработчиков на проблему анализа качественных показателей целеустремленных объектов нечисловой природы.
В методологическом плане тестометрия ставит своей целью разработку такого набора спецификаций моделей, методов оценки их параметров и адекватности действительным ситуациям, который позволил бы для каждой из гипотез либо придти к выводу о достаточной реалистичности получаемой с ее помощью картины объективной оценки степени обученности эмпирического объекта, либо признать необходимость установления иной спецификации модели.
Нам предстоит выяснить, как реализована эта установка в практической деятельности, иначе говоря, каковы основания и принципы методологии теоретической тестометрии, что представляет собой ее объект и согласованы ли свойства различных моделей с оценкой реального состояния обученности испытуемого. В конечном счете, необходимо установить насколько существующая методология современной теории тестов отвечает потребностям количественных и качественных исследований поведения телеологических объектов эмпирических систем КАТ.
Обсуждая свойства эмпирических объектов и отражающих их состояние обученности научных наблюдений, классическая и современная теория тестов исходят из посылок о их вероятностной и статистической природе. Это позволяет сразу же аппелировать к аппарату теории вероятностей и математической статистики, и прежде всего к методам регрессивного и корреляционного анализа, основанным на теореме Гаусса-Маркова и подобных ей. Эти посылки лежат в основании теории тестов, и степень ее обоснованности в существенной мере определяет корректность самой методологии. Она принята всеми авторами трудов по тестологии и поэтому получила статус научной истины. Но как обстоят дела в действительности?
В работах [27,40] начальная спецификация математической модели поведения объекта нечисловой природы дается в форме априорного постулирования о том, что закон распределения ошибок измерений является нормальным. Ставится задача – разработать такой метод измерения УУД тестируемых, который бы обеспечивал соответствующим оценкам свойства несмещенности и эффективности. Из анализа приведенных в [27,40] материалов по спецификации моделей измерения следует, что в качестве поведения телеологического объекта тестологии выступает некоторая математико-статистический модель, показатели которой описываются либо случайными величинами, либо векторами. Фактически в этих работах постулирована начальная спецификация модели и указан согласованный с ней метод измерения. Но почему теоретическая тестология не говорит ничего (no крайней мере, явным образом) про объект своего исследования? Можно ли с заданной верностью (и с какой) описать его поведение? Почему для вычисления ошибок измерений необходимо использовать методы параметрической статистики?
Сразу же возникает множество вопросов, но будем последовательны в стремлении понять теоретическую тестологию и ее методологию. Начнем со следующего вопроса – что представляет собой состояние целеустремленного объекта и как приступить к построению его модели?
Во-первых, действительная степень обученности объекта нечисловой природы относится к нефизическим величинам, для которых единица измерения в принципе не может быть введена. Поэтому значение латентного параметра обученности тестируемого может быть только оценено, когда данному состоянию обученности индивида по установленным правилам приписывается определенное число в заданном уровне-интервале качества обученности.
Во-вторых, постулируемый в указанных работах нормальный закон распределения вероятностей в отношении оцениваемых параметров является существенным ограничением на возможности исследования поведения тестируемых в реальных условиях. Особенно на ограниченной практической ценности применения методов классической теории вероятностей и математической статистики настаивают математики, работающие с непараметрическими моделями [9,25,29,30].
Их опасения основываются на следующих утверждениях:
· тестируемые в отличие от объектов природы и техники наблюдаются исключительно косвенным и неполным образом;
· в отличие от физических, биологических и технических процессов с их возможностями планирования эксперимента, тестологические (в нашей интерпретации тестометрические) процессы принципиально неповторимы, а соответствующие им научные наблюдения представляют собой единственные реализации качества заключений тестируемых;
|
Из за большого объема эта статья размещена на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 |


