О классической модели погрешностей измерения сказано уже до-
статочно. Надеюсь, что содержательные обоснования и статистиче-
ские основания психометрических формул, используемых при раз-
работкетестов, теперьмогутбыть понятыми. Онинеявляютсятолько
лишь изобретениями разработчиков тестов, а вытекают логически из
предположений о погрешностях измерения, которые допускаются в
классической психометрии. Поэтому, давайте завершим рассмотре-
ние этого вопроса и перейдем к следующей теме, гораздо более про-
стой, но, несмотря на это, очень полезной в области приложений
психологического тестирования.
Стандартизация и нормы
Дальнейшая характеристика эффективных тестов, не являющая-
ся, однако, внутренней особенностью, присущей самому тесту, - это
наличие нормативных данных. Нормы - это множество показателей
из четко определенных выборок, а разработка и процедуры получе-
ния этих показателей составляют процесс стандартизации теста.
Нормы позволяют использующему тест адекватно интерпретиро-
вать показатели, которые он получает от индивидуумов. Они, следо-
вательно, имеют большее значение для практического применения
тестов, чем для исследовательских целей, где используются исход-
ные, не подвергнутые обработке показатели теста и где нормы добав-
ляют лишь немного полезной информации.
В главе 8 будет описано, как должны определяться нормы для
различных видов тестов. Здесь же достаточно сказать, что комплек-
тование групп испытуемых должно быть адекватным, а их количест-
41
во - большим. В противном случае нормирование теста может ока-
заться скорее вредным, чем просто бесполезным, то есть, на самом
деле вводящим в заблуждение. Несмотря на это, если стандартизация
выполнена соответствующим образом, показатели психологических
тестов дают нам основу для сравнения, которого не может предоста-
вить ни одна нестандартизированная процедура.
Следует также понимать, что большинство методов испытаний,
отличных от тестов, не могут быть стандартизированы, так что эта
возможность является важной характеристикой психометрических
тестов.
Некоторые другие модели ответов
на задания тестов
Теперь я хотел бы обсудить некоторые другие подходы к психоло-
гическому тестированию, в которых делаются иные предположения
об особенностях ответов на задания тестов. Некоторые из них явля-
ются особенно важными, поскольку они позволяют использовать
шкалы отношений а также потому, что они дают возможность разра-
батывать тесты с подмножествами действительно эквивалентных за-
даний - свойство, которое было использовано в последних разработ-
ках по психологическому тестированию : индивидуально-ориенти-
рованному тестированию и компьютерному тестированию. Оба эти
метода описаны в главе 10. В данной главе я намереваюсь обсудить,
хотя и кратко, теоретические обоснования этих методов.
Кривые зависимости "задание-ответ"
Методы, основанные на кривых зависимости "задание-ответ",
описывают вероятность ответов "Да" или "Нет" на дихотомические
задания, относящиеся к гипотетическим свойствам или латентным
чертам, которые они измеряют. Их статистическая основа полностью
описана у Lord и Novick (1968).
Существует много различных моделей ответов на задания теста,
базирующихся на методе кривых зависимости "задание-ответ", ко-
торые Levy (1973) отмечает как получившие широкое признание.
Birnbaum (1968) описал общую модель латентных черт, согласно
которой вероятность правильного ответа - это функция от трудности
задания, способностей тестировщика и параметра угадывания. Мо-
дель Раша (Rasch, 1966) является, по существу, особым случаем
модели Бирнбаума и связана с процедурой шкалирования по Гутмену
(Guttman, 1950), в которой задания отбираются в порядке их трудно-
сти, так что любой испытуемый, который не смог выполнить задание
X, не может также выполнить все задания, более трудные, чем X, но
42
успешно разрешает все более легкие задания. Как указывает Levy
(1973), если по шкале Раша задания различимы в терминах трудно-
сти, то в результате получаем шкалу Гутмена, если же это невозмож-
но, что бывает редко, то строится вероятностная версия шкалы Гут-
мена. Аналогично, Lord и Novick показали, что модель Lazarsfelda
(1950) является частным случаем модели Бирнбаума.
Вероятность
ответа
Атрибут или свойство
Ъ
Рисунок 1.1.
На рис. 1.1 показаны некоторые гипотетические кривые зависимо-
сти "задание-ответ" для двух заданий, что помогает прояснить роль,
которую играют эти кривые при конструировании-психологических
тестов. Прежде всего, следует заметить, как подчеркивает Nunnally
(1978), что латентные черты или свойства являются гипотетически-
ми и зависят от заданий. В этом отношении, данные модели не отли-
чаются от тестов других видов, обсуждавшихся нами ранее. Гене-
ральный фактор, присутствующий во всем наборе заданий, является,
как мы видели, понятием для объяснения вариации (дисперсии) за-
даний.
Давайте предположим, для иллюстрации, что латентной чертой
двух заданий рисунка 1.1 является интеллект. Испытуемые распре-
деляются по непрерывной (континуальной) шкале - от низкого до
высокого уровня интеллекта. Пусть "а", "Ь" и "с" - три точки на
этой шкале. Испытуемые в точке "а" имеют вероятность 0,015 пра-
вильного ответа на задание 2 и вероятность 0,15 правильного ответа
на задание 1. Те же испытуемые в точке "с" имеют вероятность 1
правильного ответа на задание 2 и вероятность 0,95-на задание 1.
Крутизна кривых на рис. 1.1 не совпадает. В моделях, основанных
на кривых зависимости "задание-ответ", предполагается, что они
являются кривыми нормального распределения.
Кривые зависимости "задание-ответ" в применении
к тестированию
Не следует ожидать или стремиться к тому, чтобы кривые зависи-
мости "задание-ответ" для всего объема заданий были идентичными.
Если это так, то каждое задание будет иметь идентичные характери-
стики. Наоборот, выдвигается предположение, что каждое задание
имеет тенденцию соответствовать конкретной кривой. Характери-
стики заданий отражаются в кривых зависимости "задание-ответ" и
частично показаны на рис. 1.1. Такими характеристиками являются:
( 1 ) Трудность ( (1 )- difficulty
Эта характеристика отражается тем, насколько далеко вправо или
влево смещена кривая, и определяется как точка на оси свойства, в
которой кривая пересекает значение вероятности 0,5. Так, задания
на рис. 1.1 имеют практически одинаковую трудность.
(2) Дискриминативность ( r )- discriminability
Это отражается в крутизне кривой. Чем выше значение r , тем
более точно задание выделяет среди испытуемых по латентной черте
тех, которые попадают в интервал, соответствующий значению ве-
роятности 0,5.
Подмножества заданий
На рис. 1.1 показано, что при помощи кривых зависимости "зада-
ние-ответ" можно приблизительно оценить показатели испытуемых
для заданий, которые они не выполняли, считая, что положение этих
заданий на континууме латентных черт известно. Это означает, что
показатели испытуемых на подмножествах заданий позволяют де-
лать приблизительные оценки для всего теста, и могут быть выделены
эквивалентные подмножества заданий. Такие индексы трудности за-
даний имеют тенденцию быть более стабильными, будучи независи-
мыми от выборки, чем простые уровни трудности, оцененные пропор-
ционально количеству испытуемых, давших правильный ответ, ко-
торые являются сильно зависимыми от выборки испытуемых.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88