ИНКРЕМЕНТНАЯ ВАЛИДНОСТЬ: ШАГИ ПРОЦЕДУРЫ
( 1 ) Вычислите корреляцию теста с критерием и с другими тестами
батареи.
(2) Если он имеет положительную корреляцию с критерием, но
незначимо коррелирует с другими тестами, то продемонстрирована
инкрементная валидность. Такой тест будет вносить свой вклад в
множественную корреляцию Данной батареи с критерием.
(3) При факторном анализе этот тест должен нагружать тот же
фактор, что и критерий, но не фактор, нагружаемый другими теста-
ми.
ДИФФЕРЕНЦИАЛЬНАЯ ВАЛИДНОСТЬ
Для доказательства дифференциальной валидности нет общих
процедур, но если бы мы взяли пример об академической успеваемо-
сти (из главы 1, стр. 28), то дифференциальную валидность можно
было бы показать сравнением ее корреляции с различными академи-
ческими дисциплинами: значения корреляции должны значительно
различаться. Таким образом, в общем для демонстрации дифферен-
циальной валидности предполагается различие корреляций с различ-
ными аспектами данного критерия.
Конструктная валидность
Как уже говорилось, для доказательства конструктной валиднос-
ти привлекается демонстрация психологических характеристик пе-
ременных, измеряемых данным тестом. При этом могут затрагивать-
ся и другие, уже обсуждавшиеся, типы валидности. Общее описание
приведено ниже.
ПРОЦЕДУРЫ ОПРЕДЕЛЕНИЯ КОНСТРУКТНОЙ ВАЛИД-
НОСТИ
(1) Перечислите точно гипотезы, касающиеся переменных, с ко-
торыми данный тест должен коррелировать (конкурентная валид-
ность) .
(2) Перечислите точно гипотезы, касающиеся переменных, с ко-
торыми данный тест не должен коррелировать.
(3) Укажите группы, которые должны давать низкие и высокие
показатели по данному тесту.
(4) Сформулируйте гипотезу о месте данного теста в факторном
пространстве. Эта гипотеза подобна гипотезам из выше приведенных
пунктов (1) и (2).
Эти четыре гипотезы должны затем быть проверены на больших
выборках, соответствующим образом сформированных, как указано
в процедурах для установления конкурентной валидности. Специфи-
ческие группы должны быть достаточно большими, не только для
выявления статистически значимых различий, но также такими,
чтобы с уверенностью могли быть сделаны обобщения. В терминах
нашей психометрической модели доказательство конструктной ва-
лидности предполагает демонстрирование того, что генеральная со-
вокупность заданий, из которой отобраны задания для данного теста,
является фактически такой, как мы и надеялись.
Выводы
Очевидно, что, в отличие от надежности и дискриминативности,
валидность теста не может быть представлена просто в виде одного
коэффициента. Вместо этого валидность теста устанавливается сери-
ями результатов, вид которых обсуждался выше в различных проце-
дурах. Если следовать процедурам, описанным в предыдущих разде-
лах, то результаты исследований не могут быть опровергнуты с точки
зрения методологии. Однако, в исследованиях валидности все зави-
сит от психологических знаний и проницательности разработчика
212
тестов. Так, тесты, подвергнутые исследованию конкурентной ва-
лидности, могут как пройти, так и не пройти эту проверку, если даже
она будет выполнена в соответствии с хорошо обоснованной методи-
кой. Аналогично, для локализации в факторном пространстве требу-
ется, чтобы в исследование были включены соответствующие пара-
метры этого пространства. Если это не так, то несмотря на тщатель-
ное выполнение процедуры, конструктная валидность показана не
будет.
Хотя доказательство валидности является в некоторой степени
субъективным, серьезные разногласия возникают редко. Это проис-
ходит потому, что если переменная понимается соответствующим
образом, то в большинстве случаев не возникает сомнений, с какими
другими переменными она будет или не будет коррелировать, какое
место она займет в факторном пространстве и какие группы проде-
монстрируют по ней хорошие показатели, а какие нет. Когда же
переменная не понятна, вопрос о валидности не поднимается. В про-
тивном случае, изучение валидности превращается в эксперимен-
тально-описательные исследования, которыми и определяется пере-
менная.
Глава 8. Стандартизация тестов
В главе 1 было показано, что одно из преимуществ, которыми
обладают психологические тесты по сравнению с другими видами
измерений, - это то, что они стандартизованы. Следовательно, воз-
можно сравнение показателя некоторого испытуемого с таковыми в
генеральной совокупности или других релевантных группах, что в
конечном счете дает возможность адекватной интерпретации пол-
ученного показателя.
Из сказанного следует, что стандартизация тестов наиболее важ-
на в тех случаях, когда осуществляется явное или неявное сравнение
показателей испытуемых, как, например, при профориентации или
отборе в целях обучения. Нормы также могут быть полезны и в
крупномасштабных скрининговых исследованиях. При использова-
нии психологических тестов в научном исследовании свойств чело-
века - в психометрии индивидуальных различий - нормы не столь
важны. В этом случае удовлетворительными являются и непосредст-
венные, не подвергнутые обработке ("сырые") показатели теста. По-
скольку указание норм обычно обязательно для тестов способностей,
наше обсуждение того, как следует проводить стандартизацию теста,
будет касаться, в основном, этой категории тестов.
Стандартизация выборки
Это определяющий аспект стандартизации: все зависит от выбор-
ки. При формировании выборки следует учитывать две важные пере-
менные: объем и репрезентативность выборки. Выборка должна точ-
но отражать категорию лиц, для которых предназначен тест (конеч-
но, может быть несколько таких категорий и, следовательно, и не-
сколько выборок), а также быть достаточной большой для обеспече-
ния столь малой стандартной погрешности нормативных данных,
чтобы ею можно было пренебречь.
Объем выборки
Для простого уменьшения значения стандартной погрешности
вполне адекватной будет выборка из 500 испытуемых. Однако, ре-
презентативность выборки не зависит от ее объема. При получении
нормы для общей популяции, например, детей школьного возраста,
необходима выборка объемом около 10 000 испытуемых. Выборка из
столь ограниченной популяции, как укротители львов или факиры,
конечно, не должна быть столь большой. Таким образом, нельзя
сделать никакого утверждения относительно объема выборки безот-
носительно той популяции (категории лиц), из которой она подбира-
214
ется. И здесь проясняется тот момент, что репрезентативность выбор-
ки является более важной, чем ее размер. Маленькая, но репрезен-
тативная нормативная выборка будет предпочтительнее, чем боль-
шая, но неравномерно представленная. Некоторые примеры, взятые
из реальных тестов, позволят показать очевидность этого замечания,
и также помогут указать разработчикам тестов наилучшие методы
получения стандартизационных выборок.
Получение репрезентативной нормативной выборки
Ясно, что наиболее неоднородной популяцией является генераль-
ная популяция (все население), а все остальные являются ее подмно-
жествами.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88