Существенным признаком попадания отображения состояния обученности респондента в тот или иной уровень-интервал оценки является качество его заключений, которое в свою очередь определяется значением его латентного параметра и категорией трудности предъявляемых ему тестовых суждений.
Из этого правила следует, что основным носителем информации о качестве заключений тестируемых является значение признака трудности ЭФТК. Эти значения образуют некоторый алфавит и характеризуются качественными показателями: легкое, средней трудности и трудное ПДТЗ. Интенсивность проявления меры трудности тестовых суждений, исходя из содержательной гипотезы и мнения экспертов, определяется числами 1,2,3.
Качественная тождественность учебных достижений телеологических объектов означает близость (сходство) в некотором смысле их поведения. Поэтому цель первого этапа КАТ, когда полностью отсутствуют априорные сведения о степени обученности тестируемого, состоит в том, чтобы выделить в полученных данных однородные подмножества – классы, когда отдельные образы внутри каждого таксона похожи (по своему поведению) друг на друга. Здесь понятие «конкретной оценки» ассоциируется с исходной оценкой УУД конкретного респондента. Безусловно, внутри каждого класса обученности описания заключений тестируемых отличаются друг от друга, хотя качественно поведение этих объектов нечисловой природы считается тождественным. Будучи толерантными по качеству обученности, они различаются друг от друга лишь количественно. Эта связь качества (смысла) и количества (значения) устанавливается категорией меры и образует оценку – содержательную интерпретацию степени обученности тестируемого.
Мера – интервал количественных изменений качества заключений тестируемого, в пределах которого сохраняется принадлежность его поведения к данному образу. Такое изменение может произойти, когда эмпирический объект из заданного образа (например, хорошо обученного) повышает исходную степень обученности до тех пор, пока уровень его учебных достижений не претерпевает качественных изменений, что переводит этого индивида, например, в класс отличников.
Выше изложенное позволяет переформулировать философский закон перехода количественных изменений в качественные. Этот закон есть такая взаимосвязь количественных и качественных сторон установления УУД телеологического объекта, в силу которой изменения корректности его заключений могут привести к изменению оценки достижений этого индивида в такой степени, что происходят коренные качественные изменения, протекающие в виде скачков, когда респондент переводится тестирующей системой из одного таксона (уровня — интервала) в другой.
Когда мы говорим о близости степеней обученности тестируемых, образующих данный образ, то понимаем, что сама эта толерантность предполагает некоторое различие их учебных достижений. А это значит, что даже простое сопоставление УУД двух индивидов из одного уровня – интервала вскрывает единство тождества и различия. Сущность этого диалектического закона можно установить на втором этапе тестовых испытаний, когда тестирующая система различает степень обученности каждого однородного элемента эмпирической системы из конкретного класса. Если на первом этапе КАТ были установлены взаимосвязи противоположностей схожих по поведению респондентов, то на втором этапе тестовых испытаний происходит разрешение противоречия, которое означает снятие данного единства и установление реальной степени обученности каждого из однородных по степени обученности испытуемых, входящих в один образ. Здесь работает философский закон единства и борьбы противоположностей, в силу которого испытуемым из конкретного образа свойственны внутренние противоречия, находящиеся в состоянии взаимосвязи и взаимоотрицания, поскольку каждый конкретный субъект тестирования является индивидуальностью и имеет свойственную только ему степень обученности. Система конкурентного тестирования осуществляет здесь различие между уровнями достижений каждого испытуемого из данного таксона. Например, в классе отличника будут различимы испытуемые с почти отличными, отличными и превосходными достижениями. Это и будет реальная – сколь угодно близкая к действительной степени обученности – оценка УУД каждого конкретного испытуемого.
На основании философского закона отрицания можно и далее развивать процесс уточнения качества определения системой КАТ реального уровня обученности испытуемого. Для этого следует осуществить дальнейшее разбиение подуровней – интервалов на части и проводить тестирование (различение) испытуемых внутри каждой части. Это уже второе отрицание УУД объекта нечисловой природы, отрицание первого отрицания, когда тестирующая система различала степень обученности испытуемого из заданного класса. Отсюда следует общая закономерная тенденция поэтапного движения к установлению реальной оценки достижений каждого конкретного испытуемого, когда система КАТ удерживает и сохраняет в памяти все положительное содержание предшествующих этапов тестовых проверок. Верность оценки достижений испытуемого – субъекта тестовых проверок – возрастает с увеличением числа этапов КАТ и все больше приближается к действительной степени его обученности.
И здесь на первый план ИЭ выдвигает категорию качества оценки, выражающую существенную определенность УУД индивида, благодаря которой он является именно почти отличником, а не среднестатистическим хорошистом. Это касается и качества ПДТЗ, когда изучается содержание, форма представления и оценивается мера трудности конкретной тестовой ситуации, обуславливающие ее способность различать поведение однородных эмпирических объектов с различными, но близкими степенями обученности.
С помощью качественно формулируемых законов выражается основная тенденция процесса КАТ и общий характер между явлениями, связанными с установлением исходного или реального УУД объектов нечисловой природы. Эти законы формируются на основе методов непараметрической статистики и отражают в своих формулировках реальное поведение телеологических объектов.
ИЭ ориентирует разработчиков на создание интеллектуальной системы КАТ, которая способна вести коммуникационный обмен сообщениями с пользователями, обрабатывать данные о качестве заключений тестируемых, принимать рациональные решения и т. п. Она концентрируется главным образом на процессе «прочитывания» знаний, который представляет собой систему процедур, ориентированных на рациональную деятельность. Этот процесс регуляризации знаний воспринимается социумом как стандарты и образцы общественно значимой деятельности. Здесь с логической точки зрения ИЭ сосредотачивает свое внимание на культурных нормах поведения участников процесса КАТ, а с методологической – на применении знаний для «производства» правил.
Регуляризация знаний подводит нас к вопросу о построении инструментальных средств КАТ с применением высоких технологий, реализующих деятельность, сопоставимую с рациональным поведением человека. Поскольку сама рациональность представляет собой деятельность по правилам (по Платону) и ценностным установкам, общезначимых для данного социума, то принятие в системе СКДО УУД тестируемых именно логичных решений становится главным фактором управления (адаптации и оценки).
К качественным показателям инструментальной среды КАТ добавляют еще требование, чтобы система предъявляла ПДТЗ тестируемым в режиме реального времени, сопоставимого с временным режимом человеческой деятельности при формировании выводов. Обычно к интеллектуальным технологиям относят наличие в системе КАТ дружественного пользователю интерфейса, способность инструментария к принятию решения о необходимости изменения категории трудности ПДТЗ, а также (в случае параметрической адаптации) возможность модификации категории трудности ЭФТК на основе новых знаний, полученных в процессе промежуточной аттестации испытуемых.
По существу, центральная проблема создания интеллектуальных технологий СКДО УУД тестируемых заключается в следующем. Если мы обладаем четкими, поддающимися содержательному объяснению и качественной оценке знаниями, то на основе регуляризации последних могут быть получены алгоритмы или эвристические правила классификации и ранжирования поведения объектов нечисловой природы. И здесь ИЭ приводит нас к мысли, что для интеллектуальной деятельности важно, не какими артефактами она осуществляется, а какова операциональная структура когнитивной деятельности, обеспечивающей требуемый результат тестовых испытаний.
Специфической особенностью функционирования систем КАТ является их способность корректировать свои действия для выполнения заданных целей. Чтобы достичь требуемой цели, тестирующая система должна заранее формировать план своей деятельности, что, в свою очередь, предполагает необходимость оценки не только существующей в данный момент ситуации, но и знание последующих состояний действительности, т. е. предполагает умение предвидеть ее будущие действия.
Возможность научного предсказания действий системы КАТ следует из самой сущности ситуационного управления, вскрывающего определенную инвариантность (упорядоченность, регулярность) между качеством выводов тестируемого и мерой трудности, предъявленных ему ПДТЗ. В плане культуры мышления научное предсказание сходно с объяснением. Однако эти понятия служат разным целям. Если объяснение относится к известному событию, которое необходимо истолковать с помощью существующего закона, то предсказание всегда относится к событию (или явлению) неизвестному, которое еще не наблюдалось. В силу этого для предсказания всегда характерна некоторая неопределенность, причем эта хаотичность тем больше, чем значительнее интервал времени, отделяющий предсказания от предсказываемого события. Приближенный характер научных предсказаний является следствием неполноты знания соответствующих законов, что связано со сложностью описания объектов произвольной природы, которая не может быть до конца учтена и зафиксирована на этапе создания их концептуальных и математических моделей.
Эта неопределенность предвидения обусловлена также и тем, что объекты находятся в процессе постоянного развития, ибо в учебной среде происходит непрерывное возникновение нового и, следовательно, преобразование как состояния обученности самих индивидов, так и условий проведения тестовых испытаний.
В силу указанных причин научное предсказание неизбежно заключает в себе элемент некоторой неопределенности и, следовательно, носит вероятностный характер. И, тем не менее, эта неконтролируемость научных прогнозов не мешает им быть достаточно верными в пределах того приближения, которое необходимо для практических целей.
Научное предвидение может строиться и на основе гипотез. Примером этого является, в частности, подтверждение предлагаемой концептуальной модели тестируемого в процессе проведения массовых тестовых испытаний. Научные предсказания (прогнозы) принято делить на два типа: аналитические и синтетические.
Аналитические прогнозы представляют собой требуемый вывод из существующей теории. Синтетические предсказания являются результатом не только учета содержания установленных научных законов, но и опоры на интуицию. Важную роль в этом процессе играет математическая гипотеза, когда высказанные на начальном этапе предположения проверяются по следующей цепочке:
![]()
Обобщения, получаемые в рамках такого представления о строении знания, вариативы, учитывают семантическую изменчивость смыслов и значений суждений в зависимости от изменений контекста и ситуации. Логичное знание раскрывает значение наиболее существенных для рассматриваемого факта явлений, когда налицо совпадение содержания этого знания с атрибутом исследуемого элемента эмпирической системы.
Безусловно, что в системах КАТ дескриптивные и индуктивные знания тесно связаны. С точки зрения ИЭ первые дают осмысленное отображение объективных ситуаций и процессов и представляют собой способ регистрации количественных данных. Вторые несут информацию о последовательности рациональных целенаправленных действий и качестве полученных при этом результатов. Здесь вырабатываются основные теоретические и эвристические концепции и схемы, образующие методологические основания актуализации культурного пространства КАТ. Все это позволяет считать отношения процесса моделирования поведения тестируемого качественными, когда область применения термина «неопределенность» касается анализа ситуаций, в которых не вполне очевидно, как следует поступать в том или ином случае. На основе описанных функций мировоззрения может быть обоснована социально-коммуникативная функция философии КАТ.
Социально-коммуникативная
Эта функция философии КАТ концентрируется на управлении процедурами тестовых проверок. Феномен управления имеет всеобщий характер и применим к широкому кругу процессов целенаправленной деятельности человека. Поэтому коммуникационное взаимодействие эмпирических объектов и тестирующей программы естественно интерпретировать как отношение объекта управления и управляющего устройства, реализующего заданные алгоритмы тестовых испытаний.
В качестве стратегического вопроса, начинающего синтезирующий подход к исследованию культурологических аспектов тестологии и тестометрии, мы выбрали изучение об объективности оснований научного знания, смысл которого заключается «в том, чтобы выявить объективную сферу приложимости данной системы знания, отделить то, что действительно является знанием, от того что напрасно претендует на этот статус» (. Самосознание и рефлексия в научном познании. «Общественные науки»; 1980, №2).
В рамках различных направлений развития теории тестов высказываются суждения, не вполне согласуемые друг с другом и вместе с тем свидетельствующие о наличии методологических противоречий, которые вовсе не являются источником и движущей силой научного познания, а в основном сами порождены разнонаправленностью интересов исследователей и отчасти различиями в понимании используемой терминологии. Возможный путь устранения отмеченных несоответствий лежит в совместных поисках ответов на вопросы, являющиеся кардинальными для всех направлений генезиса теории КАТ и определяющие стратегорию их развертывания.
В классической и современной концепции теории тестов респондент рассматривался односторонне, как объект исследования. Подобный подход – и исторически и логически – в определенных границах был оправдан, поскольку он опирался на традиционную систему контроля знаний (отметку). Известно, что традиционная теория тестовых испытаний, исследуя способы измерения латентного параметра обученности, оставляет в стороне методологические установки, культурологические основания тех или иных познавательных действий, эмпирических рассуждений, содержательных процедур и правил.
Здесь внимание тестологов фиксируется на идеальном описании поведения объекта методами теории вероятностей и количественной статистики. Важным пунктом концепции современной теории тестов является положение, что основание данной области знания лежит в построении математических моделей тестируемого (точнее, его поведения). Эти подходы, разумеется, не отрицают объективности оснований, но в то же время, фиксируя лишь логико-методологические аспекты процесса тестовых испытаний, не учитывают информационно-эпистемологическую функцию философии, ориентирующую исследователей на регуляризацию знаний о свойствах эмпирических объектов и систем. Конечно, можно дефиницией ограничить обоснование подхода к проблеме установления степени обученности тестируемого сферой только сознания, а основания знания – только изучением идеальных объектов. Но тогда вне поля зрения останутся реальные эмпирические системы КАТ, элементами которых являются объекты произвольной природы, которые в принципе не могут быть представлены только количественными моделями прикладной статистики. Имея это в виду, можно согласиться с тем, что «математическая симметрия не является и не может явиться «основой» законов природы, не может определять «рациональный порядок в природе». (B. C. Готт, Диалектика развития понятийной формы мышления. M., 1981 ).
Изучением поведения и свойств целеустремленных объектов произвольной природы занимается качественная статистика — аппарат анализа и моделирования гуманистических (эмпирических систем), т. е. систем, в которых одним из главных звеньев является человек. для этих случаев разработал теорию нечетких множеств, которая «опирается на предпосылку о том, что элементами мышления человека являются не числа, а элементы некоторых размытых множеств или классов объектов, для которых переход от «принадлежности» к «непринадлежности» не скачкообразен, а непрерывен».
В связи с изложенным у исследователей растет сознание того, что качественные методы оценки – аппарат адекватный природе задач, решаемых в процессе установления УУД эмпирических объектов нечисловой природы. Необходимость применения качественной статистики при анализе процесса функционирования системы КАТ обусловлена «разнотипностью атрибутов» элементов системы, размытостью их свойств и поведения, слабой структурированностью исходных объектов. Это связано с тем, что в системе адаптивного тестирования:
· роль субъектов при выборе содержания и качество экспертиз ПДТЗ исключительно велик;
· спецификации KCT3 никогда не бывают полными;
· не существует определенных законов, при помощи которых можно было бы полностью найти решение проблемы описания функционирования эмпирических систем КАТ, включающих в себя объекты произвольной природы.
Отношение между поведением объекта и действием тестирующей программы представляет собой развертывание содержания процесса адаптивного тестирования из своего основания. При этом, то, что составляет начало, будучи ещё лишь концептуальным обобщением, по-настоящему ещё не познается и лишь по мере развития логических и логичных оснований теории КАТ становится все более завершённым, содержательным, приобретающим статус истинного обоснованного знания. Иными словами, развёртывание эмпирической системы КАТ – это обоснование её начала, которое в контексте становления постсовременной теории адаптивного тестирования и общественной практики само методологически обосновывается содержанием исследуемого феномена.
Процесс разработки систем КАТ связан с применением формального (логического) и содержательного (логичного) мышления. Логическое мышление подразумевает применение теоретических правил, которые предполагают известным только форму того, что преобразуется по ним, вне зависимости от наличия содержания исходных знаний. Формально-логичные правила применяются к формулам, выражающим изучаемые понятия и суждения без учета содержания (смысла и значения последних). Действительно, система КАТ включает в себя тестируемых и тестирующую программу и образует систематическую форму. А форма по Гегелю имеет двойственное отношение к содержанию. Признание этой двойственности (субстанциональной и формальной рациональностей) требует четкого различения эмпирического и теоретического методов исследования. Совершенно очевидно, что из принципа содержания следует принцип формы, а из содержательной системы отношений объектов произвольной природы – формальная структура инструментальной среды адаптивного тестирования. И, как следствие, любая аппаратно-программная система КАТ, реализующая формальные правила, не может реализовать полностью логику эмпирических объектов. Это связано, прежде всего, с тем, что чисто теоретическое изучение поведения или состояния объектов нечисловой природы ограничено не «бедностью» формальной системы, а её принципом, в силу того, что она количественная, т. е. не может в себе отразить всё содержание эмпирического научного знания.
Интенсивное развитие теории КАТ показывает сколь сложна и диалектически противоречива в ней проблематика, связанная с изучением соотношения объективного и субъективного. При исследовании степени обученности тестируемых и анализа сходимости мнений экспертов о качестве тестовых материалов (ПДТЗ, ПДТ, БТЗ) в определенных контекстах мы не вправе абстрагироваться от факторов, составляющих суть субъективности.
Система КАТ является феноменом реального мира, требует соотнесения с ним не только тех или иных теоретических (логико-методологических) концептов, но и условно-методологических (логичных) обоснований представления свойств и поведения объектов произвольной природы. Одно из значений понятия «объективность» закреплено по отношению к содержанию знания. В этом случае процедура обоснования процесса адаптивного тестирования или качества тестовых материалов будет означать поиски такого же зависящего от воли и сознания исследователя содержания идеальных объектов, которое послужило бы «объективным основанием» этих компонентов. В другом значении понятие «объективное обоснование» употребляется нами для характеристики процесса опредмечивания абстрактной модели, когда происходит конструирование объективного основания поведения или свойств идеальных объектов.
Таким образом, понятие «объективное обоснование» является важным концептом научной методологии культуры КАТ. Ответ на вопрос о единстве эмпирического и теоретического знания, о субординации этих оснований в теории КАТ следуег из рационального учета различных функций философии при установлении объективных методологических принципов тестологии и тестометрии.
Продвижение в деле сохранения объективности оценки и рациональности процесса КАТ требует радикального пересмотра основ и толкования феномена управления. Необходимость учитывать в полной мере вклад, который вносит тестируемый в результаты проверок, невозможность полностью элиминировать человеческий фактор при наблюдении за поведением индивида привели к необходимости расщепления знания на его «форму» и «содержание». Уже беглый взгляд на структуры формализованной теории показывает, что некоторые её компоненты, например, правила принятия решения и выводы, должны быть не только фиксированы, но некоторым образом входить в сферу субъективного. Но для того, чтобы эти правила действовали, необходимо качественно управлять процессом компьютерного тестирования в условиях неопределённости, недостатке или отсутствии априорных сведений о степени обученности каждого конкретного объекта нечисловой природы.
При таком положении дел управление процессом компьютерного тестирования следует решать для произвольного поведения объекта. Здесь стратегия управления должна «приспосабливаться», «подстраиваться» к поведению каждого респондента и после «обучения» компьютерной программы обеспечить достижение заданной цели, когда требуется подобрать управление тестирующими воздействиями так, чтобы мера трудности ПДТЗ была как можно ближе к степени обученности индивида. И здесь на первое место стали выдвигаться адаптивные методы управления, не требующие подробного исходного описания степени обученности телеологического объекта.
На первом этапе КАТ, когда о значении латентного параметра обученности респондента в тестирующей системе нет сведений, приходится изменять категорию трудности ПДТЗ с учётом качества его заключений. Добавим к сказанному, что момент времени, начиная с которого приспособление меры трудности тестовых ситуаций оказывается близким к назначенной цели, является «немарковским моментом» и его наступление не может быть установлено априори. В другом случае, когда исходная степень обученности образа известна заранее, появляется возможность индивидуализации поведения испытуемого, т. е. установление его реального (субъективного) УУД.
Таким образом, метод формализации двухэтапного процесса КАТ начинается с чёткого разграничения формального и содержательного основания научного знания, а заканчивается тем, что вовлекает оба этапа тестовых проверок в построения дидактических моделей исходной и реальной оценок достижений. Формальная теория здесь дополняется некоторым содержательным знанием – метатеорией. Благодаря принципу научной рациональности формализация процесса компьютерных тестовых испытаний позволяет установить чёткую границу, в рамках которой гарантируется возможность отделения количественных методов анализа функционирования системы КАТ от качественной (субъективной, содержательной) сферы.
Однако качественный подход не только ограничен рамками метатеории, но и в значительной степени зависит от содержательности исходного (неформального) знания. Отсюда следует тот факт, что средствами метатеории можно изучать объективную реальность как на синтаксическом, так и на семантическом уровнях. Семантика вводится в метотеорию лишь на этапе исследования теоретическими методами исходной содержательной информации.
В познании степени обученности респондента как объекта нечисловой природы обнаруживается универсальный по своему историко-культурному значению эпистемологический парадокс. Его можно сформулировать в следующем виде: установить степень обученности индивида – значит отнестись к нему как к объекту исследования; но если предметом познания становятся значения латентных параметров конкретных испытуемых, то превратить их в объект – значит лишить их существенных качеств субъективности, а именно: принадлежности субъективному качеству заключений каждого индивида, выраженному в актах его самосознания и самопознания.
Перед нами особая информационно-эпистимологическая ситуация, фиксирующая тот очевидный факт, что субъективные состояния обученности испытуемых являются эмпирическими атрибутами особого рода, и их познание должно отличаться от познания значения латентного параметра объектов хотя бы потому, что каждый конкретный субъект имеет особый «доступ» к знанию о степени собственной обученности. Отсюда следует необходимость изучения, как объекта, так и субъекта, поведение которых взаимно предполагают и опосредуют друг друга. Выделение из объектов образов – первый, элементарный акт самосознания; различение испытуемых внутри каждого образа – акт установления реального УУД каждого испытуемого (субъекта) из данного класса обученности. Поэтому переход объективного в субъективное должен стать предметом рационального анализа поведения индивида как главного феномена эмпирической системы КАТ. И в этом смысле необходимо рассмотреть понятие рефлексии.
По своей сути, рефлексия как форма теоретической деятельности исследователя, конституирует такую сферу его познавательной деятельности, в которой эпистимологические феномены (абстракции, математические модели, теории и т. п.) подвергаются критическому анализу и декомпозиции. Поле рефлексивной деятельности – само знание.
Особый интерес представляет переход рефлексии от концепции современной теории тестов к постсовременной. Когда специалист-методолог задумывается над корректностью, адекватностью концептуальных средств, с помощью которых он фиксирует результаты собственных исследований, когда он занимает критическую позицию по отношению к имеющимся данным, когда он переключает свое внимание с предметной области на структуру теоретического знания, то можно говорить о методологической саморефлексии проектанта. Рефлексия как форма самопознания и культуры мышления всегда есть результат концентрирования внимания с предмета деятельности на методы и средства деятельности, а это бывает возможно лишь при наличии новых, и при том существенно иных, методов и инструментов управления процессом КАТ.
Касаясь предельно общих оснований постсовременной теории тестов, необходимо анализировать следующие аналитические проблемы.
Имеет ли семантика теоретических терминов контекстуальную природу, или она определяется только системой формальных референций?
Какая онтология (принципы реальной действительности, ее структуры и закономерности) лежит в основе суждений об элементах эмпирических систем тестовых проверок? Кроется ли за теоретическими положениями содержательная реальность или они представляют собой лишь абстракции, применяемые в целях сокращений при описании научных наблюдений за поведением объектов нечисловой природы?
Такая саморефлексия является существенным элементом методологического знания, возникающего при изучении культуры постсовременной теории КАТ. Рассмотрим в связи с этим гносеологические функции философии и рефлексии, причем в качестве примера возьмем такую форму познания, как понимание. Понятие «понимание» – есть универсальная категория, связанная с работой сознания в целом; актуализация методологического подхода, когда четко осознается проблемность смыслового содержания элементов эмпирической системы КАТ, усматривается «непрозрачность» исходных научных понятий и смыслов. Каждый акт понимания предполагает наличие некоторого ядра смысловых связей, причем в самом акте понимания рефлексия выступает в качестве его предпосылок, то есть неявного знания. Чтобы осуществить критико-рефлексивный анализ указанного ядра, необходимо перейти на более высокий уровень рассмотрения и использовать специальные категориальные средства.
Простейший тип понимания основывается на здравом смысле, предпосылками которого являются аксиомы практического опыта людей как с его объективно верными обобщениями, так и со всеми исторически неизбежными иллюзиями. К таким не всегда корректным обобщениям относятся построения доверительного интервала оценки при малом числе наблюдений, а также априорное предсказание закона распределения появления некоторого события. Именно поэтому выбору оценки поведения эмпирического объекта должно предшествовать её критическое рассмотрение.
Так, например, для практических задач, связанных с применением методов традиционной (количественной) статистики для оценки результата тестирования при ограниченном числе наблюдений, или когда группа тестируемых является неоднородной no степени обученности и не образует бесконечного множества, введение гипотетической «генеральной» совокупности не вызвано необходимостью и вносит в рассмотрение вопроса излишний элемент идеализации, не вытекающий из непосредственной реальной ситуации.
В данном случае исследователь должен критически отнестись к выбору метода прикладной статистики и выйти за рамки исходного контекста, преодолев реальную гносеологическую границу, разделяющую объективное и субъективное. Понимание перестает быть чем-то общепризнанным, а связывается с принимаемой данным научным сообществом новой «парадигмы», противостоящей существующему подходу к педагогическим измерениям УУД индивидов.
В рамках такого подхода система КАТ рассматривается как эмпирическая, что и задает «познавательную позицию», вне которой вопрос о понимании, о значении тех или иных терминов, методов и средств не имеет смысла. Феномены эмпирической системы адаптивного тестирования наполняются подлинно «человеческим содержанием», смыслами и ценностями. И в этом смысле на первое место выходит личность тестируемого с ее внутренним миром и внутренними проблемами. Деятельность индивида в эмпирической системе становится специально ориентированной на самопознание и саморазвитие.
Сказанное требует разъяснений. В традиционной теории тестов предъявляемые респонденту тестовые ситуации не имеют индивидуального значения и не становятся событием внутренней жизни тестируемого. Только в адаптивной системе тестирования испытуемый работает с содержательно и логично значимыми для него ПДТЗ. Отбор меры трудности ЭФТК тестирующей программой осуществляется с учетом качества его заключений, что, в свою очередь, приводит к возникновению рациональной коммуникации каждого конкретного индивида с тестирующей системой. Возникает целостная понятийно-образная онтологическая система, в которой респондент от «скромной» творческой причастности переходит к многообразию осмысления собственного поведения, своих возможностей и интересов [9]. А мыслить в пространстве КАТ, это значит свободно сравнивать, свободно выбирать, свободно принимать решение и нести за это ответственность.
В этой системе реальной сущности важное место занимают корректные описания программ функционирования системы КАТ. Именно в ней реальное поведение тестируемых и свойства элементов эмпирической системы превращаются в виртуальные. Требуются немалые умственные усилия, чтобы в этом слабоструктурированном описании добиться целостности. Вот примерный перечень требований к инструментальной среде КАТ:
· удобное представление действий, совершаемых пользователями;
· классификация поведения объектов по степени обученности и дальнейшее различение испытуемых внутри каждого образа;
· композиции ПДТ, а также их интерпретации, облегчающие «схватывание» содержания;
· наглядные представления скрытых в словесно-понятийных конструкциях закономерностей и связей;
· приспособление меры трудности ЭФТК к поведению каждого индивида;
· выбор способа оценки УУД тестируемых и алгоритма шкалирования.
В инструментальной среде реализуются логико-символический и эвристический языки науки, универсальные средства мысленного экспериментирования и агрегирования, синтеза целостной эмпирической системы КАТ. Становится понятной идея композиции философских категорий количества и качества при описании поведения и свойств элементов эмпирической системы адаптивного тестирования, которые позволят оперировать с любым описанием объектов и соответственно расширить возможности выбора рациональных действий.
Действия тестирующей программы в системе КАТ направлены на автоматическое распознавание всевозможных регулярностей в поведении тестируемых. Установление этих регулярностей рассматривается двояко:
· классификация включает в себя процессы, заканчивающиеся указанием некоторого образа для каждого рассматриваемого объекта;
· рациональная аттестация связана с присвоением конкретному испытуемому из заданного класса надлежащего ему реального балла.
Основная проблема распознавания поведения эмпирических объектов или образов связана с изменчивостью их поведения. Так например, входные данные, которые должны быть классифицированы как представители одного и того же образа (таксона, класса), могут отличаться довольно сильно. Для изучения специфической изменчивости образов, принадлежащих отдельным классам некоторого репрезентативного обучающего множества, может потребоваться анализ этой совокупности, причем с учетом изменчивости заключений эмпирических объектов нечисловой природы на ПДТЗ различной меры трудности. При автоматическом распознавании поведения тестируемых необходимо стандартизировать, насколько это возможно, подготовку и обработку данных с тем, чтобы свести дополнительную изменчивость к минимуму.
Обращение к методам и приемам распознавания – характерная черта исследований, связанных с компьютерной обработкой данных, когда математические модели поведения эмпирических объектов невозможно реализовать с помощью существующих вычислительных средств, а решение отыскивается на базе правдоподобных эвристических процедур.
Классификация включает процессы тестовых проверок, заканчивающиеся указанием некоторого образа обученности, полученного в условиях применения нормативно-ориентированного ПДТ. Эта процедура является приемлемой для случаев, в основе которых лежит использование критериально-ориентированного теста, когда сравнение некоторого оцениваемого и порогового значений предполагает установление факта отнесения поведения тестируемого к заданным пределам его обученности. Существенным в типологической классификации поведения объектов нечисловой природы является то обстоятельство, что множество близких (сходных) заключений тестируемых может быть отображено в один и тот же образ.
Результатом КАТ является рациональная аттестация (идентификация) образов, когда на основе их заключений на требования ПДТЗ личностно-ориентированного ПДТ устанавливается реальный УУД каждого конкретного испытуемого из заданного класса обученности.
Основу процессов классификации и идентификации образует феномен управления.
Актуализация и развитие этого феномена в процессе компьютерного тестирования связаны с разработкой (рис.9):
· алгоритмов адаптации меры трудности тестовых заданий к модели объекта;
· механизма оценки (оценивания и классификации) параметра модели, поведения индивида.

Рис. 9. Декомпозиция процесса управления
Такой взгляд (он будет обоснован далее) позволяет, во-первых, использовать методы теории и практики ситуативного управления в процессе тестирования, а также это дает возможность утверждать об оптимальном процессе КАТ, лучше которого в рамках выбранной структуры не существует. Во-вторых, удается по-новому подойти к разработке процедуры оценки латентного параметра объекта нечисловой природы. Эти изменения, с одной стороны, уникальны для тестометрии и являются особой формой универсальных трансформаций, в которых пребывает теория СКДО УУД целеустремленных объектов.
Проблема становления теории КАТ предстает перед нами как приложение культурологического подхода к развитию СДКО УУД тестируемых с применением высоких технологий, методов самоорганизации, способов оценивания и классификации поведения индивидов. Решение этих задач очень важно, поскольку неопределенность в описании дидактических законов оценки УУД привела к искусственному представлению обобщений поведения объектов нечисловой природы количественными методами параметрической статистики, создающей во многих приложениях к тестологии и тестометрии лишь иллюзию научной состоятельности вскрываемых с их помощью дидактических смыслов и сущностей.

Рис.10. Этапы проектирования моделей управления
На рис.10 выделены четыре основных этапа при создании модели нечеткого управления поведением эмпирического объекта:
· выбор совокупности лингвистических правил управления (база правил);
· установление нечетких подмножеств, описываемых лингвистическими характеристиками в правилах (база данных);
· описание алгоритма преобразования выходных данных процесса адаптивного тестирования в нечеткие подмножества (интерфейс условий);
· представление механизма формирования управляющих воздействий, направленных на достижение цели.
Рассматриваемая нами задача управления имеет нежелательные, с точки зрения построения модели поведения тестируемого, характеристики – нелинейность, асимметрию в окрестности приближения β κ θ и т. п. Одним из возможных направлений научных исследований при создании эмпирических систем КАТ является организация процедуры управления поведением объекта на основе теории нечетких множеств. В такой модели управления каждая лингвистическая характеристика «отличное», «грудное», «менее трудное» и т. п. должна быть представлена нечетким подмножеством, заданным на соответствующей шкале. Функции принадлежности всем нечетким подмножествам также следует описать некоторым параметрическим семейством. Поскольку априорно мы не обладаем совокупностью этих размытых отношений, создание адекватной модели поведения объекта нечисловой природы на основе теории нечетких множеств затруднительно. Читатель, желающий ознакомиться с теоретическими аспектами создания адаптивных систем управления с моделью объекта, может обратиться к книге , . Адаптивное управление с нечеткими стратегиями. Изд. Ростовского университета, 1993].
Под управлением понимается процесс организации такого целенаправленного воздействия на тестируемого, в результате которого устанавливается близкое соответствие между степенью обученности эмпирического объекта и мерой трудности предъявляемых ему тестовых ситуаций. Объектом управления будем называть тот латентный параметр индивида, состояние которого нас интересует. Систему управления образуют совокупности алгоритмов обработки результатов научных наблюдений за поведением тестируемого и средств их реализации, объединенных для достижения заданных целей управления в поведении эмпирического объекта нечисловой природы. Последовательность этапов при создании системы КАТ приведена на рис. 11.

Рис. 11. Последовательность действий при создании системы КАТ
Для системы КАТ характерна ситуация, когда априорно отсутствует модель оптимального управления поведением эмпирического объекта, и задачей артефакта является построение такой дидактической модели. Решение этой проблемы связано с разработкой концептуальной и математических моделей, отражающих поведение респондента, процессы адаптации, оценивания и классификации, а также процедуры поддержки качества поведения объекта нечисловой природы. Состояние (ситуация) управляемой системы тестовых испытаний формируется на основе анализа предыстории поведения (заключений тестируемого на требования ПДТЗ различной категории трудности) и построения гипотез о возможных законах функционирования системы на заданном временном интервале. Управление системой КАТ определяется как установление оптимальных отношений между мерой трудности тестовых ситуаций и качеством выводов каждого индивида. Траектория поведения тестируемого отображается в обобщенной модели его поведения.
Если дана некоторая ситуация, то определяется класс, которому она принадлежит и выбираются соответствующие этому таксону стратегии управления, с помощью которых осуществляется преобразование состояние обученности телеологического объекта в значения косвенного признака. Этот процесс повторяется для каждого значения латентного параметра. Если независимо от состояния обученности респондента процесс тестирования, в конечном счете, приводит к целевой ситуации (θi ≈ βi), то стратегия называется оптимальной. Ее отыскание завершается созданием ситуационной дидактической модели поведения тестируемого.
Проблема поиска наилучшей обобщенной стратегии управления является центральной социально-коммуникативной функцией философии КАТ. Она формулируется как поиск такого разбиения множества ситуаций на классы обученности, при котором каждому образу сопоставляется однозначно оптимальное обобщенное управление из совокупности допустимых. Роль ситуаций выполняют последовательности заключений управляемого объекта. При этом класс эмпирических систем КАТ, рассматриваемых в книге, xaрактеризуется тем, что множество ситуаций значительно превышает совокупность обобщенных управлений. Основные трудности, которые возникают при практической реализации построения обобщенной дидактической модели тестируемого, связаны с поиском эффективных процедур создания системы конкретных отношений, возникающих между поведением элементов эмпирической системы в процессе формирования и функционирования моделей управления.
Установления соответствия между множеством макроситуаций и обобщенными командами управления тестирующими воздействиями осуществляются специальной программой, в которой заданы цель управления и соответствующий этой цели функционал оценки качества поведения каждого конкретного индивида. Построение траектории заключений объекта нечисловой природы происходит в процессе реального сеанса тестовых испытаний. Текущая ситуация поступает в память дидактической модели тестируемого. На основе анализа предыстории поведения управляемого объекта и построения гипотез о законе его действий тестирующая система устанавливает оптимальные отношения между элементами ситуации и записывает последнюю в классификатор модели. Одновременно осуществляется реализация построенных отношений на реальном объекте, в результате чего изменяется его поведение. Далее процесс повторяется для новой ситуации. В классификаторе производится обобщение ситуаций, в результате которых множество фактов разбивается на классы толерантности. На множестве ситуаций вводится экспертами некоторая метрика, которая учитывается как при обобщении, так и при последующей оценке поведения тестируемых.
Ситуационное управление позволяет принудительно решить проблему выхода на любой уровень обобщения ситуаций. Результат тестирования определяет множество целей, которые связаны с определением критериев и ограничений для рассматриваемой задачи. Цели ограничения Z должны быть унифицированы и сведены к выполнению требований «ограничить», «приравнять», «минимизировать»:

Здесь φi, ψj , υe – критерии функционалы, определяемые на S – состояниях обученности тестируемого и его среды; S = <X, θ >;X – состояние учебной среды (БТЗ и объекта управления), взаимодействующей с объектом; θ – значение латентного параметра обученности целеустремленного объекта.
Цель КАТ – расширение объема знаний о строении УУД обученности конкретного респондента. Ограничения-неравенства определяют тот минимум обученности тестируемого, нарушение которого недопустимо. Функция φi выражается в виде балльной оценки достижений по i-й учебной дисциплине. Ограничения-равенства определяют уровень знаний и умений индивида, отсутствие которого недопустимо.
Понятие «цель» используется здесь в смысле модели потребности квазисубъекта (тестирующей программы) заданного состояния среды, которое желательно для потребителя и которое не реализуется естественным образом без целенаправленного воздействия на поведение тестируемого. Главная проблема, которая стоит перед разработчиком целей, состоит в том, чтобы с помощью эмпирической системы КАТ обеспечить эффективную процедуру проверки при заданной верности полученной оценки.
Тестирующая система в процессе коммуникации с учебной средой фиксирует свое внимание на значении латентного параметра обученности объекта нечисловой природы. Эта система располагает БТЗ различной категории трудности и способна подстраивать тестирующие воздействия таким образом, чтобы их мера трудности (β) находилась в близком соответствии со степенью обученности (θ) каждого конкретного индивида (β = θ). Квазисубъект, выполняя цели Z, реагирует только на качество заключений тестируемого.
Такие действия тестирующая программа выполняет на основе дедуктивно-индуктивного накопления и обобщения эмпирических научных наблюдений. Этот материал, накопленный в виде фактов, по мере обобщения служит базой для установления закономерных связей и отношений между поведением эмпирического объекта и характером тестирующих воздействий. Существенным для анализа поведения тестируемого, как объекта нечисловой природы, является умение системы компьютерного тестирования «извлекать из факта смысл» (по ).
Тестирующая программа воспринимает учебную среду как некоторый набор значений ее параметров

каждый из которых может быть изменен, т. е. воспринимаемая квазисубъектом ситуация всегда управляема

где V – управляющее тестирующее воздействие.
Свою цель тестирующая система формулирует в виде вектора-цели

Здесь Zi – i-e требование к состоянию среды S, выраженное с помощью некоторой функции ψi (S), отражающей свойство среды

Точка или область S, удовлетворяющая требованиям (4), и является тем состоянием учебной среды, которого добивается квазисубъект с учетом (5) и ресурса R (например, времени сеанса тестирования), выделенного на управление V
R.
Ситуация S характеризуется некоторой степенью неопределенности, которую следует рассматривать как совокупность некачественного установления экспертами меры трудности ПДТЗ, хранящихся в БТЗ и предъявляемых тестируемому, а также непредсказуемостью заключений индивида на требования ЭФТК. Если полагать, что состояние учебной среды во время проведения сеанса тестовых проверок не изменяется, то процесс управления следует сосредоточить только на установлении класса обученности тестируемого. Это можно сделать в том случае, когда границы описания поведения телеологического объекта четко очерчены.
Структурная модель является основой для синтеза управления тестирующими воздействиями, переводящими их меру трудности близко к значению латентного параметра эмпирического объекта нечисловой природы. По существу модель тестируемого представляет собой способ оценки уровня его учебных достижений при заданных условиях X и V. Если алгоритм управления обозначить F, то оценка
состояния обученности θ телеобогического объекта F0 примет вид
(6)
Зависимость (6) определяется некоторым алгоритмом тестирования, который указывает, как можно установить с заданной верностью значения латентного параметр обученности объекта θ.
Структурный синтез модели состоит в определении структуры Q объекта управления. Такими категориями для рассматриваемого нами случая являются дискретность и неопределенность процесса тестирования. В соответствии с (3) структурная модель включает:
· содержательное описание ПДТЗ

· содержательное описание тестирующих воздействий

· описание состояния эмпирического объекта в процессе тестовых испытаний

· функциональное описание алгоритма тестирования с точностью до значений параметра
![]()
Тогда оператор модели F поведения целеустремленного объекта
![]()
Этап параметрического синтеза связан с коррекцией значений меры трудности ПДТЗ. Исходная идентификация этих значений заключается в определении их при помощи экспертных оценок или (и) путем предъявления БТЗ репрезентативной группе испытуемых. Протоколы экспертов или (и) тестовых испытаний являются источниками необходимой информации для установления категории трудности каждой тестовой ситуации. Заметим, что в реальных условиях адаптивного тестирования значения меры трудности тестовых утверждений автоматически корректируются на основании обобщения качества заключений испытуемых (объектов с фиксированной степенью обученности). На этом этапе определяются знания параметра в модели θ =(X, V,B).
Синтез управления связан с построением алгоритма V, когда в сложившийся на данный момент времени ситуации S и имеющемся ресурсе R удается достигнуть заданной цели Z. Реализация цели управления состоит в том, чтобы при конкретных ограничениях добиться максимальной эффективности функционирования системы КАТ. Цель тестирующей системы связана с подстройкой БТЗ таким образом, чтобы тестируемому с заданной степенью обученности предъявлялись ПДТЗ с близкой к этому параметру мерой трудности. Более того, экстремальная цель будет достигнута только в том случае, если эта операция выполняется за минимальное время тестирования.
Основная цель процесса КАТ – вскрыть регулярное, необходимое. Философская категория необходимости выражает устойчивые, существенные связи и отношения объектов пространства тестирования, обусловленные предшествующим ходом их поведение. Она вытекает их сущности компонентов (процессов, явлений, артефактов) пространства и при определенных условиях обязательно должна произойти.
Необходимые процессы осуществляются во множестве неопределенных событий. Так, например, тестируемые, имея разные траектории поведения, но близкие степени обученности, относятся тестирующей системой к одному образу. Неопределенность заключений индивидов выступает здесь как форма проявления необходимости, когда отдельные неопределённости накапливаются, обобщаются и на этом основании складываются необходимые качества описания процесса тестовых проверок.
Необходимое и неопределенное различается тем, что возникновение необходимого обусловливается существенными факторами, а неопределенного – чаще всего, несущественными для исследуемого случая отклонениями. Так, через обобщение случайных заключений телеологических объектов система КАТ может при необходимости изменять характер тестирующих воздействий, а также выделять регулярную компоненту в поведении объекта нечисловой природы.
При управлении есть такие моменты, которые отражают необходимое и неопределенное в единстве. Предвидение ситуаций предполагает гармонию этого единства. На учете влияния неопределенности построена статистическая закономерность событий, представляющая собой диалектическое единство необходимых и случайных значений признаков. В этом случае из определенного состояния системы ее последующее состояние следует не однозначно, а с определенной вероятностью. Неопределенность возникает тогда, когда из нескольких состояний эмпирической системы необходимо осуществлять выбор. Характерной особенностью статистических законов является и то, что они основываются на неопределенности, обладающей устойчивостью. Это значит, что они применяются только к большим совокупностям явлений, каждое из которых носит неопределённый характер. Так из значений качества заключений тестируемых складывается необходимость изменения меры трудности ПДТЗ, а также процесс вычисления оценки.
Например, в системе ACT процесс управления строится следующим образом. Тестируемому на первом этапе проверки предъявляются ЭФТК средней меры трудности. После того, как респондент выполнил заключения по нескольким заданиям с указанной степенью трудности, тестирующая система обобщает результаты этих заключений и в зависимости от их качества изменяет категорию трудности ЭФТК в ту или иную сторону. Таким образом, достигается установление в системе КАТ исходной оценки латентного параметра объекта (θi ≈ βj) – регулярное (устойчивое) поведение объекта нечисловой природы.
Очевидно, что специфика поведения тестируемого определяет время проведения проверки и качество оценки его состояния. Индивидуализация процесса КАТ ориентирована именно на выполнение каждым конкретным респондентом экстремальных целей.
На этапе реализации управления убеждаются в корректности описания предыдущих этапов. Даже в том случае, когда цель достигнута и модель поведения тестируемого построена удачно, система адаптивного тестирования обращается к предыдущему этапу синтеза. Эта ситуация отображает появление на входе данного артефакта нового эмпирического объекта и необходимость перестройки управления под его поведение.
На рис.12 приведен характер изменения качества оценки индивида после каждого из 10-ти испытательных заданий. Пунктирные линии указывают степень доверия к результатам КАТ. Видно, что увеличением числа ПДТЗ соответственно уменьшается интервал принятия неверного решения, т. е. верность оценки УУД телеологического объекта при достаточно большом n увеличивается и принимает довольно устойчивое значение. Это обстоятельство отражает общую закономерность, состоящую в том, что при n → ∞ и β → θ величина правильности установления УУД тестируемого стремится к некоторому пределу, зависящему от условий учебной среды. Существенным является и то, что достижение этого предела в случае адаптивного тестирования, достигается за меньшее число шагов (ПДТЗ), чем при традиционной организации тестовых испытаний.

Рис.12. Пример работы системы КАТ
Отсутствие априорных сведений о степени обученности объекта требует привлечения методов адаптации с тем, чтобы в процессе тестовых испытаний выбрать наилучший с точки зрения минимального времени сеанса тестирования алгоритм проверки. Структурная адаптация рассматривается здесь как процесс приспособления тестирующей системы к специфическому поведению каждого конкретного эмпирического объекта. Адаптация структуры модели обеспечивает переключение меры трудности ЭФТК в соответствии с поведением респондентов на первом этапе тестирования, когда исходный уровень их обученности не установлен. Параметрическая адаптация связана с коррекцией значений категорий трудности ПДТЗ, осуществляемой автоматически программой на основе обобщения качества заключений испытуемых с фиксированной исходной степенью обученности.
К адаптации объекта управления следует прибегнуть в том случае, если параметрическая и структурная адаптации не позволяют достигнуть ожидаемого результата. И, наконец, если и эта мера неэффективна, следует осуществить изменение цели управления или ограничений. Можно утверждать, что адаптивность характеризует способность систем тестирования модифицировать свое окружение, когда происходит неприятное для него изменение с целью восполнения потери эффективности управления.
Главное преимущество системы КАТ перед традиционным компьютерным тестированием является то, что приспособление качества тестирующих воздействий к поведению каждого респондента позволяет при той же верности оценки сократить время проведения сеанса проверки на 60% и более. Как сказано выше, это достигается благодаря предъявлению каждому конкретному тестируемому содержательных (по смыслу) и логичных (по мере трудности) для его степени обученности тестовых ситуаций.
Сила предсказательности законов тестометрии возрастает, если они адекватно отражают причинные связи и отношения между явлениями, когда эмпирические научные факты получают формальную трактовку и возводятся на уровень теоретических зависимостей. Причинность обуславливает количественный УУД тестируемого, а основание отнесения его поведения к тому или иному классу обученности определяется качественными различиями между обобщенными заключениями индивидов на ПДТЗ различной категории трудности.
Эти неоспоримые положения надо учитывать при изучении дидактических законов и закономерностей. При этом следует понимать, что методы СКДО УУД применяются к объектам нечисловой природы, описание поведения которых имеет специфические особенности.
Первая особенность эмпирических систем состоит в том, что они в качестве необходимого условия своего познания и использования предполагает рациональную сознательную деятельность участников пространства КАТ. Из целенаправленных, необходимых и самоценных норм поведения объектов нечисловой природы образуется дидактическая закономерность теории СКДО УУД тестируемых.
Вторая особенность дидактических законов адаптивного тестирования состоит в том, что их сущность проявляется при массовом проведении тестовых проверок, и в этом смысле законы тестометрии носят статистический характер. Последние проявляются в результате анализа большого числа научных наблюдений, осуществляемых в условиях неопределенности поведения индивидов и непредсказуемых изменений состояния учебной среды. Специфической особенностью законов, описывающих дидактические наблюдения, является то, что аналогичные оценки, происходящие в различных условиях, могут дать разные результаты. Как отмечает [Философия образования. M. «Флинта», 1998, стр.382], «повторяемость как существенный признак педагогического закона не может быть абсолютной, скорее, речь должна идти о некоторой регулярности, которая лишь в своей статистически достоверной устойчивости может претендовать на статус закона». Поэтому авторы данной книги, обосновывая такие регулярности, критически относятся к применению методов классической (количественной) статистики для описания моделей поведения и состояния объектов произвольной природы.
Третьей существенной особенностью дидактических законов управления эмпирическими системами является их динамичность, историческая недолговечность и содержательная интерпретация. Это накладывает дополнительные ограничения на использование методов параметрической статистики и требует системной доказательности статуса представления той или иной регулярности при описании процессов КАТ.
Постсовременную тестометрию можно определить как научную дисциплину, занимающуюся разработкой непараметрических методов анализа и синтеза систем адаптивного тестирования. Как феномен культуры тестометрия выражает субъективно-личностную сторону деятельности участников пространства КАТ, способы и нормы социальной организации и регулирования учебной деятельности, выполняет важную функцию накопления и модификации ЭФТК, а также трансляции KCT3.
Для логичного мышления характерны иные тенденции. Оно не стремятся к длинным цепочкам логически неопровержимых рассуждений, а предпочитают им множественность точек зрения на один и тот же предмет, процесс или явление, пытаясь выявить многообразие его качеств. Вводимые ими понятия являются более или менее расплывчатыми, а наличие оттенков восприятия объектов нечисловой природы различными участниками культурного пространства тестирования считается естественным и допустимым. Это связано с тем, что категории качества, с которыми имеют дело разработчики инструментальных средств адаптивного тестирования, проектанты и эксперты программно-дидактических тестовых материалов, не очерчены только жесткими границами и не могут быть измерены численно.
В культурном пространстве КАТ эпистемологические и ИЭ категории познания тесно связаны. С философской точки зрения первые дают осмысленное отображение объективных ситуаций и процессов и представляют собой способ регистрации информации. Вторые несут информацию о последовательности эффективных целенаправленных действий.
Характеристика предмета и задач постсовременной теории адаптивного тестирования предполагает выяснение соответствия между педагогическими измерениями и такими операциями как контроль и проверка УУД тестируемых, поскольку та или иная операция входит в состав процесса управления. Процедуры измерения, контроля и проверки имеют немало общего. Во всех трех случаях речь идет о состоянии обученности респондента с обязательным выполнением операции сравнения. Измерительный анализ в соответствии с документом ИСО/ТО 10017 представляет собой набор процедур для оценки погрешности измерений. Если при его применении отсутствует тщательность и обоснованность выбора методов и средств измерений, то результаты могут оказаться ошибочными. Применяемые при измерениях средства должны быть обязательно аттестованы и проверены, т. е. калибрированы.
Если в случае измерения производится сравнение искомой величины с величиной, принятой за единицу, то при контроле осуществляется сравнение значения латентного параметра обученности эмпирического объекта с некоторым образцом его состояния. Последнее может быть задано в виде некоторого описания, которое отражает поведение индивида. Специфика дидактического контроля УУД тестируемого, в отличие от измерения, в том, что последний является объектом нечисловой природы, и его состояния обученности рассматриваются как качественно разные. Безусловно, эти состояния имеют не только качественную, но и количественную характеристику (например, баллы), однако в целом множество выделенных состояний никогда не рассматривается как упорядоченная совокупность знаний некоторой величины, что имеет место в случае измерения. Иначе говоря, в какой бы форме не были бы заданы значения латентных параметров тестируемого, они всегда изучаются в случае контроля как некоторые качественно различные его состояния, между которыми не установлены отношения «больше» или «меньше» и не определены арифметические операции. Нельзя, например, утверждать, что состояние «хорошист» в два раза больше, чем состояние «двоечник».
Процесс КАТ предполагает использование математического аппарата для описания эмпирических закономерностей, обнаруживаемых в поведении тестируемого. Здесь следует остановиться на культуре мыслительной деятельности позиционеров при использовании понятий тестометрии. Для логического мышления характерна приверженность к количественным законам формальной логики, они мыслят цепочками взаимосвязанных ходов, для них естественно двигаться по ступенькам силлогизмов от некоторых исходных понятий до конкретного утверждения. Это становится возможным, если удается дать строгие определения всем понятиям, используемым в процессе рассуждения, четко договориться о правилах оперирования с этими терминами и т. п.
Результаты, полученные на основе параметрической статистики, поддаются довольно четкой дедуктивной переработке. Однако они обладают рядом существенных недостатков. Во-первых, они не содержат в себе правил для формирования самих исходных данных и не включают в себя критериев для определения исходных этапов распределения. Обобщения, получаемые в рамках такого представления о строении знаний, жестко однозначны и не допускают вариантов, тогда как в реальном процессе оценки УУД позиционер в состоянии строить множество различных обобщений на основе ограниченной совокупности данных. Знания, получаемые в результате дедуктивного вывода из исходных данных о показателях БТЗ и предполагаемой степени обученности тестируемых, могут и чаще всего оказываются неадекватными реальной ситуации, так как не учитывают семантической изменчивости смыслов и значений тестовых материалов в зависимости от изменений ситуаций. Наконец, язык теории вероятностей, лежащий в основе вычисления показателей KCT3 и измерении достижений объектов нечисловой природы, является сугубо дескриптивным, неспособным моделировать процессы принятия решений при анализе теологического состояния индивида.
Осознание отмеченных недостатков применения методов традиционной статистики привело уже в 90-х г. г. к пониманию того, что перспектива создания механизма управления и оценки в гораздо большей степени зависит не от объема дескрипций, т. е. исходных данных БТЗ, а от эволюции, развития, накопления и усложнения программ, содержащих правила, имитирующих, стимулирующих или, наконец, функционально моделирующих интеллектуальную деятельность позиционеров. Такая оценка осуществляется сверху вниз, от более общих понятий к менее общим, от объектов – к испытуемым.
Термин «измерение» не следует применять и потому, что эта операция проводится при наличии эталона – меры, служащей для воспроизведения, хранения и передачи единиц какой-либо величины. В системе КАТ хранятся образцы ПДТЗ, а не эталоны. Поэтому телеологическое состояние тестируемого можно оценить, не нельзя измерить.
Оценка – синтез процессов оценивания и классификации поведения тестируемого, способ и результат установления факта соответствия или несоответствия латентного параметра обученности индивида целям и задачам КАТ. Она предполагает не просто качественную фиксацию конкретной ситуации, но и служит основой для выявления причин неуспешности усвоения учебного материала, способствует совершенствованию организации дидактической деятельности, направленной на устранение «неудобств» в педагогической системе. Количественным аналогом оценки является отметка. В отличие от оценки, которая определяется уровнем – интервалом на оси, отметка имеет множество ранговых значений внутри интервала оценки. Отметка дает возможность дать целостное представление о результатах тестирования и может служить удобным ориентиром при контроле УУД целеустремленных объектов.
Проверку УУД объекта нечисловой природы можно рассматривать как операцию, близкую к контролю. Основное отличие названных процедур состоит в том, что при контроле можно ограничиться рассмотрением отметки, а при дидактической проверке достижений этого делать нельзя. Проверка с необходимостью предусматривает изучение содержательной компоненты оценки УУД тестируемых, когда исследованию подлежат заключения индивида на требования каждого ПДТЗ, и задача проверки – установить причину того или иного состояния обученности респондента в целом, сведя его к отдельным ситуациям. И только в этом случае можно говорить о культуре оценки и о культуре регулирования на ее основе дидактического процесса обучения. Развитие анализа в области СКДО УУД объектов эмпирических систем приводит к необходимости выполнения большого объема вычисления. Здесь возникают трудности технического характера и проблемы ограниченности материала наблюдения. В преодолении первого препятствия существенную роль играет появление персонального компьютера. Второе имеет место при ограничении затрат на тестирование. Однако в обоих случаях важна роль качественного анализа, поскольку в процессе оценки достижений объектов нечисловой природы мы должны понять, что сам переход от действительных значений латентных параметров объектов эмпирической системы к обобщенным атрибутам есть реализация принципа «экономии мышления». Так возникает задача сведения множества состояний обученности индивида к небольшому ряду обобщенных итогов, выражающему действительно существенное, закономерное для поведения респондента. Развитие этого подхода и составляет новую ступень в истории статистики научных наблюдений.
Наиболее ярко отражает черты качественного анализа в процессе классификации образов по уровням обученности кластерный анализ. Здесь мы отмечаем основополагающий эпистемологический принцип статистической науки о СКДО УУД респондента: его основу составляет примат качества степени обученности тестируемого над количеством. Усовершенствование количественных методов эмпирического исследования не может поколебать этот принцип. Не случайно содержательный анализ возник именно в психологии, где для него почва особенно благоприятна, поскольку раскрытие внутренней логики эмпирических объектов в ней исключительно затруднено. Отсюда следует целесообразность идеи синтеза философских категорий количества и качества в такой социокультурной общности, которая обобщает методы установления опенки УУД телеологических объектов с учётом их содержательной интерпретации.
Наиболее существенные методологические черты кластерного анализа сводятся к образованию единой меры, охватывающей категории трудности ЭФТК, качественное установление уровней – интервалов оценивания и количественное решение вопроса об УУД конкретного индивида. Идея классификации по сочетанию ряда признаков появилась в I920r., когда исследовал 34 характеристики уездов, анализируя «Связь между элементами крестьянского хозяйства в 1917 и 1919 годах» («Вестник статистики», 1920). В кластерном анализе заключения тестируемых объединяются в один показатель сходства (близости, толерантности) поведения группируемых объектов. И здесь без предварительного анализа качества принципиально нельзя приступать к опенке УУД тестируемых. Коль скоро значения признаков установлены, становится оправданным и подход кластерного анализа, но не как чисто эмпирического, а основанного на конкретных методологических принципах.
В кластерном анализе группировочные значения признака подвергаются объединению с помощью некоторой метрики. Вопрос о выборе метрики и масштабов (числа качественных интервалов) имеет различное содержание в зависимости от целей. Удобной и понятной является качественная шкала из двенадцати уровней: «превосходно обученный», «отличник», «почти отличник» и т. д. При таком подходе тестируемые одного кластера (класса) образуют совокупность схожих по поведению эмпирических объектов, объединенных по набору общих для них значений признака. Так, например, все респонденты с отличным уровнем обученности попадают в интервал качества отличника, хорошисты занимают свой интервал, троечники – свой, а плохо обученные – свой. Количественные баллы индивидов легко сводимы к соответствующим им качественным аналогам.
Изложенный подход подразумевает разработку программы, которая обеспечивает расщепление отметки на равноценные части. В этом случае сравнительно небольшие отклонения от образцовых интервалов оценки вносят изменения величины оценки в обе стороны от отметки. Оценка подразумевает переход от точки на шкале отметок в определенной зоне, в которую попадают действия испытуемых с близкими, но не равными достижениями. Этим обеспечивается переход от отметки к оценке, которая представляется тетраэдром триад [ 11].
В тестометрии рассматриваются вопросы, связанные с задачей опенки значения параметра обученности тестируемого по результатам наблюдений за качеством его заключений на ПДТЗ различной степени трудности. Результат испытаний зависит oт случая, т. e. исходом научных наблюдений является реализация некоторого значения неопределенной величины. Поэтому результат КАТ представим в виде вектора, компонентами которого являются исходы отдельных научных наблюдений. Как правило, испытания считаются независимыми, в том смысле, что вероятностные категории непредсказуемой величины, наблюдаемой в каком либо сеансе тестирования, не зависят от исходов остальных наблюдений.
Оценивание рассматривается нами как процесс вычисления значения оценки, в то время как последняя является результатом этой процедуры и включает в себя еще и смысловую составляющую. Ясно, что система принципов СКДО УУД тестируемых, должна соответствовать объективно действующим научным законам дидактики, когда удается отразить сущее, существенное в изучаемых нами процессах КАТ.
Наблюдаемые атрибуты могут быть как количественными, так и качественными. Например, балл 81,3 является числом, выражающим характер заключений тестируемого, а понятие «более чем хорошо», отражает качество поведения. Основная часть нашего рассмотрения будет связана с качественными показателями оценки. Результат установления значения латентного параметра вывода i-гo объекта нечисловой природы на j-e ПДТЗ будем обозначать символом
, а вектор

где Y΄j = [y'ij]; i
; 1![]()
будет отвечать каждому ряду оценивания (для j-го индивида). В этой матрице n – число ПДТЗ, m – количество тестируемых.
В задачах кластерного анализа неотрицательная функция d(Yi, Yj) называется метрикой, если

Величина d(Xi, Xj) – расстояние между Xi и Xj. Ниже приведены примеры некоторых наиболее употребительных функций расстояния [Б. Дюран, П. Одел Кластреный анализ. М. Статистика. 1977.c.17]
|
Название |
Формула |
|
l1 – норма Евклидово расстояние Сюпремум – норма |
|
Расстояния между парами векторов d(Yi, Yj) могут быть представлены в виде матрицы

Неотрицательная вещественная функция ω(Yi, Yj) = ωij называется мерой сходства, если

Пары значений мер сходства объединяются в матрицу сходства

Величину ωij называют коэффициентом сходства (например, мнения экспертов о качестве ПДТЗ или поведения тестируемых). Если каждый вектор заключений Y ΄i состоит из нулей и единиц, значение ω ij называют коэффициентом ассоциации.
Статистики часто пользуются мерой линейного сходства, называемой коэффициентом корреляции,

Этот коэффициент зачастую используется ошибочно. Так, например, две точки Y΄l и Y΄2 могут сравнительно далеко находиться друг от друга и в то время сходство поведения телеологических объектов может оказаться равным 1.
Пусть X1 = (1,1), Х2 = (10,10). Пользуясь метриками приведенной ранее таблицы и уравнением для rij, найдем:

Заметим, что d∞(Y1, Y2) < d2(Y1, Y2) < d1(Y1, Y2) . Более того, хотя Yl ≠ Y2, rij =1, т. e, Поведение тестируемых с точки зрения коэффициента корреляции будут считаться сходными. В связи с этим количественные метрики и коэффициент корреляции для оценки сходства поведения целеустремленных объектов следует применять критически.
По-видимому, первоначальное определение предмета кластерного анализа было сделано Р. Трионом (Tryon R. C. Cluster analisis, Ann Arbor: Edvaards Bros, 1939). Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся в множестве заключений индивидов на требования ПДТЗ различной меры трудности, разбить эту совокупность тестируемых на фиксированное число кластеров так, что бы каждый респондент принадлежал одному и только одному классу обученности и чтобы эмпирические объекты, принадлежащие одному и тому же образу, были сходными no поведению, в то время как поведение объектов разных классов было разнородным.
При решении задач кластерного анализа принимается два предположения:
· выбранные характеристики в принципе допускают желательное разбиение поведения объектов нечисловой природы на классы;
· единицы оценивания (масштаб) выбраны произвольно.
Первое допущение вносит некоторый произвол и при разделении объектов нечисловой природы требует содержательных рассуждений. Во втором случае желательно найти такой метод классификации, который был бы инвариантен к изменению масштаба оценивания.
Поскольку мы рассматриваем процесс оценки УУД как категорию качества, то ни метрики, ни масштабы не могут быть выбраны без учета содержательной интерпретации свойств и поведения элементов эмпирической системы КАТ. Так, для привязки поведения тестируемого к определенному классу в большей степени следует учитывать характер его заключений на ПДТЗ, мера трудности которых близка к исходной степени обученности этого испытуемого. Критерием могла бы стать величина полученного им балла. Установив для этого числа некоторые границы уровня-интервала качества, отвечающие возможности отнесения к ним заданного количества баллов, мы получим объективный критерий для масштаба, да и для метрики.
Решением задачи кластерного анализа является разбиение, удовлетворяющее заданному критерию оптимальности. В качестве такого критерия мы будем пользоваться коэффициентом сходства B. B. Красильникова [25]

Здесь n – количество ПДТЗ в тестовой последовательности;
k – число качественных уровней обученности тестируемых;
S(v) – сумма вариаций качественных оценок;
m – число тестируемых (включается при вычислении S(v)).
Параметр m участвует при вычислении S(v). Значение коэффициента близости поведения эмпирических объектов
![]()
W=0 – полное отсутствие сходства;
W=1 – абсолютная похожесть поведения объектов нечисловой природы.
Так как приложением шкалирования являлось представление о том, что суждение о близости поведения объектов является некоторой оценкой расстояния между ними в пространстве наблюдений, то свойства сходства должны быть в четком смысле аналогичны свойствам расстояния
При оценке поведения тестируемых полученные статистические данные – не числа, а интервалы, порожденные неопределенностями заключений респондентов и учебной среды. В этом случае количественные значения признака являются неопределенными. Поэтому для оценки качества выводов индивидов мы вынуждены обратиться к статистике интервальных данных. Интервальный Метод перевода, основанный на философской категории перехода количественных изменений в новые качественные различия, является подходящим способом для оценки УУД объектов нечисловой природы. В нем вычисленные ранги являются аналогами количественных баллов, полученных тестируемыми. Применение интервального метода перевода количественных значений в их качественные аналоги в сочетании с формулой Красильникова обеспечивает построение новых алгоритмов оценки результатов КАТ с учетом различных показателей качества (рис. 13).

Рис.13. Показатели качества оценки достижений
Опыт исследования алгоритмов шкалирования показал, что, во-первых, полная элиминация субъективного фактора при установлении границ степени обученности тестируемых как с точки зрения процесса КАТ, так и понимания результата познания невозможна, во-вторых, можно указать такие качественные уровни-интервалы обученности, внутри которых отвлечение от субъективного фактора рационально обосновано.
Целесообразность принятия рациональных дидактических решений участниками пространства КАТ должна базироваться на культуре оценки, которая обозначает процесс сбора и обработки верной информации, позволяющей участникам образовательного процесса принимать решения, необходимые для совершенствования содержания и формы ПДТЗ, а также для изменения технологии КАТ. Культура оценки подразумевает, прежде всего, способы реализации рациональной процедуры компьютерного тестирования и результаты его применения для управления компонентами образовательного процесса. Оценка поведения испытуемых при осуществлении компьютерной проверки их учебных достижений, рассматриваемая как вспомогательный инструмент для принятия рациональных решений, носит динамичный, объективный и более открытый характер, чем традиционная отметка.
Концепция культуры оценки понимается не только как контроль состояния испытуемого, а скорее касается действий позиционеров различной категории и тестируемых. Именно на уровне культуры оценка в наиболее полном объеме выражает индивидуальность каждого испытуемого. В материалах Всемирной конференции по высшему образованию, состоявшейся в Париже 5-9 октября 1998r., подчеркивается необходимость обеспечения становления культуры оценки и принятия ее всеми учебными заведениями.
Культура оценки реализуется только при наличии БТЗ и механизмов, обеспечивающих анализ эволюции поведения и телеологических свойств объектов, верность обработки заключений индивидов на требования ПДТЗ. При этом особую актуальность приобретают проблемы индивидуальности и объективности оценки УУД тестируемых, систематичности и всесторонности проверок, обеспечения заданной верности оценки и возможности применения результатов КАТ для оперативного регулирования содержания обучения.
Более того, важен не только достигнутый результат КАТ и его качественная оценка, но и влияние последней на процесс коррекции учебной деятельности. Именно поэтому существенно установить взаимосвязь между оценкой и культурой регулирования дидактической системы обучения, которая подразумевает использование принципа обратной связи в последовательности: результат – цель – содержание – технология – оценка – коррекция.
Культура регулирования включает деятельность целеустремленных участников образовательного процесса, направленную на пересмотр и совершенствование целей, содержания, норм, правил и технологий тестовых проверок. На первом уровне цели действий заданы, и активность системы состоит в приспособлении тестирующих воздействий к поведению индивидов, а также в изменении категории трудности ПДТЗ в соответствии с заключениями на их требования объектов нечисловой природы. Задача выработки макрополитики связана с перестройкой оснований системы КАТ, предполагает способность преподавателей и администраторов строить собственные программы действий, которые позволили бы выйти за рамки предписываемых имеющейся ситуацией фактов, наметить новые цели деятельности. Для преподавателя это могут быть внесения изменений в содержание обучения, модификация смысла и меры трудности неконкретных тестовых заданий. Администрация может вносить корректировку в правила организации тестовых проверок, изменения целей субъектов или требований образовательных стандартов. Безусловно, такие преобразования могут осуществляться только на основе объективной информации результатов КАТ, представляемых для каждой категории участников пространства КАТ.
В процессе развития уровня культуры регулирования формируется сложная иерархическая структура с вертикальными и горизонтальными связями. Вертикальные связи определяют совокупность норм и ценностей (ценностно-целевые структуры), общение позиционеров и по поводу совершенствования системы КАТ (субъект-субъектные отношения), а горизонтальные связи – реальные изменения тестирующих воздействий и параметров БТЗ (объект-квазисубъектные отношения при классификации и субъект-квазисубъектные отношения в процессе аттестации).
Исследуя культуру регулирования процесса КАТ, мы видим, что категории причины и следствия взаимосвязаны: не только причина порождает результат, но и следствия по принципу обратной связи действуют на причины и изменяют их. Это взаимодействие выступает внутренней причиной совершенствования компонентов культурного пространства КАТ, включая в себя не только модификацию меры трудности ЭФТК, но и совершенствования нормативной системы культуры тестирования. Культура регулирования рассматривается здесь как синтез причины и следствия, когда взаимодействие последних является основой совершенствования условий проведения тестовых испытаний. Здесь отчетливо видно, что теория КАТ не может ограничиться изучением только причинных взаимодействий, представленных математической моделью Раша, она призвана изучать процессы СКДО УУД тестируемых во всем многообразии их статистических связей. Поскольку причинная связь носит объективный характер, то познавая причины отображения поведения телеологических объектов в тот или иной класс обученности, позиционеры получают возможность рационально воздействовать на них.
II. КУЛЬТУРОЛОГИЧЕСКИЕ АСПЕКТЫ АДАПТИВНОГО ТЕСТИРОВАНИЯ
Культурология как философия культуры оценки значения одного из параметров личности и адаптивного управления процессом КАТ раскрывает историю, сущность и единство ценностно-ориентированной деятельности участников процесса КАТ; роль тестовых испытаний с точки зрения становления и развития рациональных потребностей каждого индивида в установлении объективной оценки уровня его учебных достижений; самоорганизации эмпирической системы тестовых проверок; культуру регулирования процесса обучения; возможности коммуникации, диалога и взаимоотношения позиционеров различной категории в культурном комплексе тестирования.
Базовым понятием культурологии КАТ считается философия культуры, предметом изучения которой являются общие закономерности ценностно-ориентированной деятельности позиционеров, процессы духовного, социального и технического наполнения компонентов культурного пространства тестовых испытаний с целью установления исходного и реального УУД объектов нечисловой природы. Это определение подчеркивает необходимость исследования таких блоков культуроведческого цикла, как: культура оценки и культура регулирования; методы самоорганизации и шкалирования; правила проектирования тестовых материалов и разработки нормативной системы культуры; создание условий для реализации принципа автономии личности и открытого пространства компьютерного тестирования. Относительно этого комплекса знаний философия культуры КАТ является их непосредственным методологическим фундаментом.
Говоря о спецификации познания культуры СКДО УУД телеологических объектов нечисловой природы, необходимо учитывать то, что она представляет собой сверхсложное системно-целевое единство, являясь в принципе суперсистемой. Культурологический процесс в этом смысле отмечен нарастанием многообразия, обусловленного им усложнения моделей и структур, а также коммуникациями и взаимодействиями между феноменами культуры. Все процессы в культурном пространстве тестовых испытаний обусловлены общечеловеческим содержанием, единством экстенсивных и интенсивных изменений, направленных на совершенствование механизмов оценки УУД целеустремленных (телеологических) объектов. Постичь и описать культуру КАТ в реальной целостности и полноте конкретных форм ее существования, в ее структуре, функционировании и эволюционном развитии можно только с позиции методологии системного мышления как особой сферы бытия и понимания сущности культурологического подхода к представлению механизма деятельности позиционеров. На философском языке это означает превращение каждого участника пространства КАТ в субъекта деятельности и появление ядра культуры, на которое направлен процесс их воздействия.
В наиболее общем виде объект тестирования – это та сфера деятельности, на которую направлено управление, а предмет – это то, что оценивается и классифицируется в телеологическом объекте. Тестируемый в процессе КАТ не просто тождествен объективной реальности, а выступает как такая ее часть, которая находится в процессе коммуникации с квазисубъектом (тестирующей программой), причем само выделение уровней-интервалов обученности респондентов осуществляется априорно с помощью рациональной деятельности проектанта. Предмет нашего изучения – категория, обозначающая степень обученности индивида, выделенная из целостного эмпирического объекта в процессе СКДО уровня его учебных достижений. В гносеологическом плане различие объекта и предмета исследования является относительным и заключается в том, что в предмет входит лишь один, наиболее существенный с точки зрения КАТ, латентный параметр обученности индивида.
Фундаментальные вопросы о сущности, способах и формах оценки знаний, интеллектуальных умений и практических навыков культурология изучает в следующем контексте: каков смысл компьютерного тестирования, зачем понадобился переход к адаптивному управлению процессом тестовых испытаний?
Объектами культурологии СКДО достижений являются участники создания моделей КАТ; элементы произвольной природы; разработчики методологических правил и стандартов; проектанты ЭФТК, КФТ, культурных систем ГТДТЗ и артефактов, объединяющие различные феномены культурного пространства в целостную систему адаптивного тестирования. В качестве собственных приложений культурология выделяет:
· историю становления культуры СКДО УУД объектов нечисловой природы;
· философию культуры КАТ;
· методологическую и прикладную культуру управления поведением респондентов (объектов нечисловой природы). Феномен управления изучается в культурном комплексе тестовых проверок с двух точек зрения: адаптации и оценки.
Среди многообразных взглядов на сущность и роль философии культуры КАТ наиболее плодотворна ее деятельная интерпретация. Этим подчеркивается необходимость установления предмета культурологии адаптивных тестовых проверок, создания методологических правил проектирования тестовых материалов, разработки основ теорий адаптации и алгоритмов шкалирования, проектирования концептуальной и математической моделей поведения целеустремленного объекта.
Определение предмета исследования важно с двух точек зрения. Во-первых, наличие этого знания необходимо для трансформации основ теории КАТ в самостоятельную науку. Во-вторых, это помогает выделить круг рассматриваемых нами проблем и определить границы этой области знания. В процессе установления предмета исследования необходимо ответить, по крайней мере, на следующие вопросы:
· Какие исторические предпосылки предшествовали появлению культуры КАТ?
· Какие закономерности рассматривает и вскрывает культура СКДО УУД телеологических объектов?
· В чем состоит сущность отношений между элементами числовых и эмпирических систем?
· Почему возникла необходимость изучения этих закономерностей и какова готовность науки к их исследованию?
· Какие объекты произвольной природы включает в себя философия культуры КАТ и каковы связи между ними?
· Насколько специфичны эти закономерности?
История становления КАТ свидетельствует о том, что дефицит культурных оснований в традиционных системах контроля учебных достижений связан со скудным учетом рефлексии личности – формы деятельности экзаменуемых, направленной на осмысление своих собственных поступков. Этому представлению о контроле успеваемости обучаемых противостоит культурологический подход, связывающий меру и критерий прогресса в сфере образования с качественной и количественной оценкой поведения тестируемого как объекта, так и субъекта познания. Здесь генезис философии культуры адаптивного тестирования направлен на переход от жестких рамок количественной статистики к композиции методов количественной и качественной оценке УУД. Этот подход акцентирует внимание на эмпирическом описании научных наблюдений респондентов методами непараметрической и интервальной статистики [29,30].
Чтобы теория КАТ имела практическую ценность, она должна давать нам возможность концептуально представить состояние и поведение целеустремленных объектов. Такие системы будем относить к культурным. Существенной характеристикой культурной системы адаптивного тестирования является целеустремленное ее поведение, которое сопряжено с выбором. Целеустремленная система получает поддержку от тестирующей системы, если вторая сотрудничает с первой.
Исторически сложилось так, что классическая и современная теория тестов базируются на методах параметрической статистики. Их различие состоит в том, что в первом случае оценка достижении осуществляется традиционными методами теории вероятностей и математической статистики, а во втором – правильность оценки устанавливается с помощью математических моделей Раша или Бернбаума. Оба подхода основываются на априорно заданном нормальном законе распределения ошибок измерений. Ранее мы показали, что в случае оценки УУД тестируемого приходится иметь дело с объектами нечисловой природы, которые в принципе не могут быть корректно описаны только количественными методами традиционной статистики. Поэтому на данном этапе становления и развития теории адаптивного тестирования необходимо опираться на методы непараметрической и интервальной статистики.
Постсовременная теория КАТ изучает закономерности описания элементов эмпирических систем, преломляя их через призму философии культуры. В этом контексте процесс адаптивных тестовых испытаний представляет собой новую систему методологических знаний, основным содержанием которой являются закономерности установления исходного и реального состояния обученности объектов нечисловой природы; разработка правил и стандартов для продуцирования культурных систем программно-дидактических тестовых материалов; создание механизмов адаптации параметров системы и оценки УУД респондента. В этом процессе на первый план культурология выдвигает проблемы духовного и социального смысла деятельности всех участников пространства КАТ.
Объектами содержательного (методологического) подхода являются концептуальная модель поведения телеологического объекта, кодекс правил конструирования феноменов культуры и спецификации KCT3, конкретные формы представления тестовых утверждений, стратегия оценивания и классификация достижений объектов нечисловой природы, установление границ интервалов правильной типологической классификации и рациональной аттестации индивидов.
Рассматривая труд «в простых и абстрактных его моментах» и изучая механизм классификации объектов, К. Маркс выделял объект и субъект исследования с его целями, мотивами и интересами. Распространяя эту схему на концептуальную модель поведения объекта нечисловой природы, можно трактовать процедуру СКДО достижений личности как единство двух этапов компьютерного тестирования: разделение поведения респондентов на однородные классы обученности (образы) и различения УУД конкретного испытуемого внутри каждого образа (класса, таксона). Установление границ для представления поведения объекта нечисловой природы определяет процедуру и этапность КАТ, обеспечивает заданное качество отображения значения латентного параметра индивида.
Определяя культуру проведения адаптивных тестовых испытаний как совокупность результатов целеустремленной деятельности участников проверок, было бы ошибкой не учитывать новаторские потенции разработчиков культурных артефактов пространства тестирования. В своем воздействии на инструментальное и операциональное наполнение системы КАТ, в поисках адекватных методов реализации творческих возможностей участников культурного комплекса тестирования, прежде всего, преподавателей и испытуемых, проектанты создают особый мир предметов культуры тестовых проверок, расширяя тем самым информационные ресурсы сферы образования и способствуя развитию единого культурного пространства адаптивных испытаний.
Эмпирический и теоретический подходы к проектированию интеллектуальных систем СКДО различаются и по методам исследования. В первом случае разработчик системы оперирует с содержательными понятиями образов идеальных объектов, обладающих фиксированным набором значений признаков. Так, например, в процессе КАТ подвергаются установлению только учебные достижения объектов нечисловой природы, в то время как другие признаки человека остаются вне нашего поля зрения; при построении классификации ПДТ рассматриваются только результаты проверок, а двенадцатибалльная шкала оценки строится только с учетом триад [11]. Субъективные оценки мы получаем при определении качественных показателей ПДТЗ и при разработке спецификаций KCT3. На теоретическом уровне в качестве основного средства исследования применяется описание поведения объекта в виде модели Бернбаума, а установление степени сходства заключений тестируемых производится на основе коэффициента конкордации , когда работа с символами заменяет реальное наблюдение за качеством выводов тестируемых [25]. Однако не стоит идеализировать математические модели современной теории тестирования и «растворять причинность в функциональной зависимости». «Усилия на ложном пути множат заблуждения» (Ф. Бэкон).
Для оценки отношений между элементами в культурном пространстве КАТ важное значение имеет не только вопрос о качестве оценки УУД элементов нечисловой природы, но и учет неопределенностей, вносимых условиями проведения тестовых испытаний. Гармоничное единство причин и следствий позволяют позиционерам ориентироваться в культурном комплексе, предвидеть процесс функционирования эмпирической системы КАТ и проектировать рациональные алгоритмы управления этим процессом. В зависимости от условий (качества ПДТ и спецификации KCT3, наличия развитой нормативной системы культуры и т. п.) один и тот же результат проверки может порождаться различными причинами, и, наоборот, одна и та же причина может привести к различным следствиям. В культурном пространстве КАТ, где установление УУД реализуется через рациональную деятельность всех участников этого комплекса и эффективное управление процессом испытаний, причинность имеет более сложный характер, чем математическая зависимость в моделях Раша и Бернбаума.
Безусловно, выделение категорий слоев знаний при создании теории КАТ определяется развитием на данном этапе: тестологии; методов ситуационного управления; и алгоритмов шкалирования; наличием адекватного математического аппарата для описания поведения и состояния объектов произвольной природы. С точки зрения культурологического подхода эмпирические и теоретические знания взаимодействуют и по мере развития науки переходят друг в друга.
|
Из за большого объема эта статья размещена на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 |



