Психологическое тестирование (psychological testing) — термин зарубежной психологии, обозначающий процедуру установления и измерения индивидуально-психологических отличий. В отечественной психологии чаще употребляется термин «психодиагностическое обследование».
Психологическое тестирование используется в различных сферах: профориентации, профотборе, психологическом консультировании, планировании коррекционной работы и т. д.
Правила организации и проведения психологического тестирования описываются в рамках соответствующей области психологии — психологической диагностики.
Психологический тест
Психологический тест — стандартизированное задание, по результатам выполнения которого судят о психофизиологических и личностных характеристиках, знаниях, умениях и навыках испытуемого.
На создание эффективного психологического теста уходит от 10 лет работы авторских коллективов. Качество теста обеспечивается многоступенчатой процедурой проверки и стандартизации его шкал. Тестов, прошедших адаптацию к российской действительности 1990-х годов мало, поэтому выбор хороших психологических тестов для оценки персонала затруднен. Конечно, кроме тестов известны разные методы изучения личности, и каждые решают свои задачи.
Понятие «Психологическое тестирование»
С появлением первых тестов наиболее употребляемым термином, с помощью которого обозначается измерение индивидуально-психологических особенностей, стал термин «психологическое тестирование». Первоначально термин «психологическое тестирование» использовался широко, включая в себя любое измерение в психологической науке. По мере развития тестов, сфера психологического тестирования сузилась до измерения личностных и когнитивных особенностей. Термин «психодиагностика» впервые озвучил в 1921 году Г. Роршах, назвав так процесс обследования с помощью созданного им «теста чернильных пятен», названного позже тестом Роршаха. Далее термин «психодиагностика» использовался как синоним термина «психологическое тестирование», постепенно заменяя его употребление. Появление понятия «психодиагностика» связано со становлением проективного подхода, открывающего целостную картину личности, и кризисом психометрических тестов, «раскладывающих» личность испытуемого на отдельные функции. В этот период начинают использоваться достаточно обширные теории проективного подхода, разрабатываемые психоаналитическими авторами. Длительное время понятие «психодиагностика» отождествляется с проективными тестами, и используется в работах немецких и швейцарских психологов.
В научной литературе США продолжает развиваться понятие «психологическое тестирование» вплоть до 1970-х годов, и обозначает все то, что связано с разработкой и применением любых психологических тестов. За этот период публикуется большое количество исследований по истории психологического тестирования, постепенно термин «психодиагностика» вытесняется из употребления.
Вышеописанные обстоятельства свидетельствуют о любопытном в науке феномене, связанном с развитием области исследований по измерению индивидуально-психологических различий, и отсутствия должного названия этой области, так как термин «психологическое тестирование» пригодный скорее для обозначения процесса применения тестов, но не области науки.
В 70-х годах 20 столетия в области индивидуальных различий на территории стран Западной Европы и США вместо термина «психологическое тестирование» все чаще применяется понятие — психологическая оценка (psychological assessment).
На территории России благодаря усилиям , возглавляющего в 1960-х годах Ленинградскую психологическую школу, описанное направление исследований получило название«психологическая диагностика».
В первом советском учебном пособии по психодиагностике (под редакцией и в 1987 году) описанная отрасль психологических знаний — «это наука и практика постановки психологического диагноза».
Характеристики психологических тестов
- Стандартность — тестовая методика проходит стандартизацию, по итогам которой получаемые данные должны соответствовать закону нормального распределения или же норме социокультурного характера. В соответствии с нормами формируются диапазоны значений, говорящие нам о силе выраженности исследуемого признака. Надёжность — свойство теста давать при повторном измерении близкие результаты. Надежная методика дает сходные результаты независимо от времени года или пола экспериментатора, влияния подобных фоновых факторов, должно сводиться к минимуму самой методикой, что и определяет ее надежность. Валидность — соответствие результатов теста той характеристике, для измерения которой он предназначен. Различают внутреннюю и внешнюю валидность. В случае с внешней это соответствие может быть проверенно положительной корреляцией, с объективными достижениями, результаты по тесту интеллекта, могут сопоставляться с академической успеваемостью. В случае с внутренней все сложнее, здесь речь идет о теоретической связи, о том, насколько выстроенная модель реально моделирует заявленный аспект. Но все может быть проще, если аналогичные «проверенные» методики уже существуют, тогда возможно обойтись корреляцией с уже известным методом. В случае если вам повезло быть новатором, внутренняя валидность находится путем долгой экспериментальной и интеллектуальной работы и в каком-то роде остается на совести «создателя».
Конструирование теста
Прежде всего, необходимо четко представлять себе то психологическое свойство, которое будет измерять будущий тест. Ни один тест не создается "с нуля", обычно за его созданием стоит длительная научная работа по изучению тематического материала.
Перед конструктором психологического теста стоит сложная задача — наиболее полно отразить все стороны измеряемого психологического свойства через минимальное количество заданий. Последнее условие — один из критериев эффективности теста. Это не означает, что личностный опросник Кеттела, содержащий полтысячи вопросов, можно считать неэффективным. При таком большом количестве измеряемых личностных факторов (16) такое количество вопросов является оптимальным. То же касается тестов на интеллект, мотивацию и другие обширные психические сферы. Остерегаться следует опросника, скажем, на стремление к риску, содержащего 250 вопросов.
Кроме этих требований, тест должен соответствовать целевой группе, на которую он направлен. Разрабатываются задания соответствующей сложности и доступности для разных возрастных групп, для людей с различными психическими нарушениями, для представителей разных национальных и языковых групп. Если тест предлагается к проведению в другой языковой группе или стране, его необходимо адаптировать.
К адаптации относятся не только перевод заданий, но и перестройка фраз, понятий, замена фразеологизмов, пословиц и поговорок на аналогичные им в данном языке. Смысл вопросов должен передаваться с учетом религиозных взглядов данной группы.
Также необходимо учитывать и некоторые эффекты, наблюдаемые при заполнении людьми тестовых заданий. Так называемый эффект социальной желательности срабатывает тогда, когда человек в своих ответах хочет представить себя в лучшем свете. Многие тесты вооружены до зубов "шкалами лжи", вопросами-ловушками и пр. Но и это не всегда помогает — человек находит одинаковые вопросы, держит в памяти свои ответы.
Есть еще один прием — подмена цели теста в инструкции, если эта цель вообще открывается испытуемому. Тогда человек, отвечая на вопросы, показывает себя хорошо с одной стороны (ложная цель) и дает более или менее достоверные сведения о другой стороне (истинная цель), которая на самом деле измеряется данным тестом.
Существуют и требования к формулировке вопросов, к порядку их расстановки в тесте. Они опять же зависят от целевой группы, на которую тест рассчитан.
Правильно составленный тест еще нельзя назвать разработанным. Для этого он должен быть стандартизован.
Стандартизация
Стандартизация теста обеспечивает возможность сравнения полученных с его помощью данных от разных людей. Для этого необходимо, чтобы все эти люди находились в равных условиях. На психологическом языке это называется "контроль всех зависимых переменных". В идеале единственной независимой переменной в тесте будет личность испытуемого. Для обеспечения равных условий разработчик теста дает специальные указания по его проведению. Они включают:
- Специфику стимульного материала Временные ограничения (time limits) Инструкцию испытуемым Пробные образцы заданий Допустимые ответы на вопросы (если таковые ограничения необходимы)
Кроме этих указаний, в приложение к тесту включаются специально установленные нормы ответов (в "сырых баллах") и их интерпретации.
Помимо стандартизации тест должен быть проверен на предмет своей эффективности по критериям надежности и валидности. Очень часто эти понятия делают взаимозаменяемыми, поэтому рассмотрим, какое значение имеет каждое из них.
Надежность
Под надежностью понимают согласованность результатов, полученных при каждом повторном выполнении теста одним и тем же испытуемым, с результатами его первого тестирования. Абсолютной тестовой надежности не существует, погрешности допускаются, однако чем они выше, тем ниже тестовая эффективность. Надежность можно проверить следующими методами:
- тест-ретестовая надежность подразумевает многократное выполнение одного теста и корреляционное сравнение полученных результатов. разделенная надежность определяется при делении теста на две части и сравнение результатов выполнения двух частей по отдельности. эквивалентная надежность выявляется путем предъявления испытуемому теста и его альтернативного варианта. Полученные результаты также сравниваются между собой.
Валидность
Психологические словари раскрывают понятие валидности как степени соответствия теста своему назначению измерять то, для чего он создан; действительной способности теста измерять ту психологическую характеристику, для диагностики которой он заявлен. Количественно валидность теста может выражаться через корреляции результатов, полученных с его помощью, с другими показателями, например, с успешностью выполнения соответствующей деятельности.
Кроме того, валидность теста можно установить, сравнивая его результаты с результатами по аналогичным методикам. К примеру, разработанный тест на вербальный интеллект можно провести вместе с известным тестом Амтхауэра, сравнив затем их результаты. Высокая корреляция результатов будет означать высокую валидность — значит, новый тест действительно измеряет вербальный интеллект, а не речевые способности, память, внимание и т. д.
Выше было сказано про ошибки на этапе использования теста. Нарушение условий его проведения, рекомендуемых в приложениях, может привести к снижению валидности. Допустим, мы проводим тест на запоминание слов и, видя, что испытуемый достаточно способный, увеличиваем скорость прочтения списка слов. В этом случае увеличение скорости будет дополнительной независимой переменной, проще говоря, помехой. В результате вместо скорости запоминания мы будем измерять стрессоустойчивость личности.
Оценка валидности теста включает следующие этапы:
- определение очевидной валидности (face validity). Такую валидность видно, что говорится, "невооруженным глазом" — оценивается общее соответствие теста его назначению. определение концептуальной валидности (construct validity). Степень соответствия теста, измеряющего какое-либо свойство, общепринятым теоретическим представлениям об этом свойстве. Как правило, эта валидность оценивается экспертами. определение эмпирической валидности (empirical validity). Выбирается критерий (независимая переменная), с которой связываются результаты теста. К примеру, критерием для теста готовности к школе может стать общая оценка успеваемости первоклассника. определение содержательной валидности (content validity). Разработанный тест должен включать вопросы для оценки максимально возможного числа параметров того свойства, которое этот тест измеряет (выше упоминалось первое правило составления теста — максимальное количество параметров свойства через минимальное количество заданий). Эта валидность также оценивается с помощью экспертных оценок.
Кстати, не только новые тесты проходят такой экзамен. В настоящее время многие исследователи заняты анализом эффективности уже известных тестов. Недавняя полемика на страницах психологического журнала "Psychological Science in the Public Interest" поставила под сомнение эффективность таких "мэтров" психодиагностических инструментов, как тест чернильных пятен Роршаха, ТАТ (тест тематической апперцепции) и проективный тест-рисунок фигуры человека. Оказалось, что эти психодиагностические методики имеет низкую эмпирическую валидность, низкую тест-ретестовую надежность и некорректно составленные нормативные показатели.
Вышеприведенные методы оценки эффективности теста помогают психологу не только самому конструировать инструменты для измерения определенных свойств личности, но и выбирать из уже разработанных тестов наиболее качественные и надежные.


