Разумеется, контрастные группы могут комплектоваться по любому
критерию-по успеваемости, субъективному мнению о качествах лично-
сти, выполнению деятельности или просто по признаку предельных слу-
чаев в каком-либо распределении критериальных мер. Эти группы стано-
вятся различными постепенно под действием многочисленных требова-
ний повседневной жизни. В этих условиях критерий оказывается
сложнее ранее рассмотренных и не поддается четкому определению.
Метод контрастных групп весьма часто применяется при валидации
личностных тестов. Так, определяя валидность теста социальных качеств,
можно сопоставить результаты тестирования торговых и администра-
тивных работников с данными конторских служащих и инженеров. При
этом предполагается, что работающие в торговле или управленческом
аппарате превосходят по своим социальным качествам инженеров
и клерков. Точно так же можно сравнить самых активных и наименее ак-
тивных студентов колледжа. При валидации тестов интересов, таких, как
анкета основных профессиональных интересов (SVIB), и при подготовке
шкал социальных установок часто используются данные разных профес-
сиональных групп. Для определения валидности шкал социальных уста-
новок иногда используются также группы, сформированные по полити-
ческому, религиозному, географическому и иным признакам, поскольку
эти группы представляют явно различные точки зрения.
При разработке некоторых личностных тестов, как отбор заданий,
так и валидация, основываются на врачебном диагнозе. Такой диагноз
допустимо использовать как достаточный критерий, если он ставится по-
сле длительного наблюдения и детального изучения истории болезни,
а не после поверхностного собеседования или осмотра. В последнем слу-
чае на врачебный диагноз можно положиться не больше чем на резуль-
тат самого теста, и такой диагноз следует рассматривать не как крите-
риальную меру, а как результат, валидность которого еще должна быть
установлена.
В связи с другими категориями критериев уже упоминались субъек-
тивные оценки, даваемые школьными учителями, инструкторами специа-
лизированных курсов, мастерами на производстве. Сюда же относятся
отзывы офицеров о подчиненных им военнослужащих, оценки, даваемые
ученикам школьной администрацией, оценки товарищей по работе, по
классу, по клубу и т.д. До сих пор речь шла о субъективных оценках,
играющих лишь вспомогательную роль в получении информации о та-
ком критерии, как академическая успеваемость, обучение на специализи-
рованных курсах, успехи в работе. Теперь же рассмотрим применение
субъективных оценок в качестве основной критериальной меры, особенно
когда такие оценки не ограничиваются описанием конкретных достиже-
ний, а являются мнением наблюдателя по целому ряду свойств, на изме-
рение которых ориентирован тест. Например, испытуемые из выборки
--_".."" " -хапактеоистики по таким признакам, как стремле-
- Т,ТТТ1 чстнпсть.
13о ПРИНЦИПЫ 11ихо..к)гич1-(к()го ТЕСТИГПЛНИЯ
Подобные оценки используются при валидации почти всех типов те-
стов. Они особенно важны в качестве критерия личностных тестов, по-
скольку в этой области трудно установить более объективные критерии.
Это особенно справедливо в отношении социальных качеств, оценка ко-
торых основывается на личных контактах и составляет наиболее ло-
гичный их критерий. Хотя эти оценки подвержены ошибкам, свой-
ственным всем субъективным суждениям, они представляют значитель-
ную ценность, если условия, в которых производится регистрация
мнений, тщательно контролируются. Способы повышения точности
субъективных оценок будут рассмотрены в гл. 20.
Наконец, часто упоминается такой метод валидации, как определе-
ние корреляции между новым и уже использующимся тестами. Если
новый тест представляет собой сфащснный или упрощенный вариант
уже существующего теста, то последний может рассматриваться как кри-
териальная мера. Так, валидация теста <бумага - карандаш> может быть
осуществлена относительно более разработанного и давно употребляю-
щегося теста действия, чья валидность уже известна. Валидность группо-
вого теста может быть проверена относительно индивидуального теста.
Тесты Станфорд-Бине, например, не раз служили критерием при вали-
дации групповых тестов. Следует отметить, что если новый тест не
является более простым или более коротким вариантом уже существую-
щего теста, то использование последнею в качестве критерия недопусти-
мо.
Специфичное ib критерия. Валндпость по критерию наиболее
уместна при изучении локальпоН налпданнн, при которой оценивается
эффективность теста для конкретной пр01раммы тестирования, напри-
мер, когда какая-либо фирма намерена оценить тест для отбора посту-
пающих к ним на работу или когда какой-либо колледж хочет устано-
вить, насколько пригоден тест способности к обучению для предсказания
успешного освоения студентом ма-
icpi.n,! ..:и!
зывать практической валидностью
теста при локальном применении.
Определение валидности такого
типа является прикладным иссле-
дованием, и результаты его в мень-
шей степени подлежат обобщению,
нежели результаты иных процедур.
Выло нс раз показано, что ва-
лидносгь данного типа зависит от
конкретных условий. На рис. 15
приводятся примеры разброса
значений корреляции между ре-
зультатами однотипных тестов
я профессиональным умением.
Верхняя диаграмма показывает
распределение 72 коэффициентов
корреляции между данными теста
инэсллскта конторских служащих
и их llnofl)i(lиl>ll-"l-"-"" -""
Рис. IS. Разброс значений коэффициептоп
валидности тестов для конкретных p<.iboi
(Е. Е. Ghiselli, 1966, р. 29)
20
72 коэффициента корреляции
теста длп служащих и их
профессионального
умении П
? \
0L
X ct s с. 1 оj-U -J i i п i П i!П ,
-100 -0,50 000 +0,50 +\0
s
я-
Jl. on
-131 коэффициент корреляции
0 ?теста пальцейой моторики
для слесарей и их
x 1 10профессиональных j 1 умений lj 1 1 1 И 1 1
01 , Т1 , \п
137
ПАЛИ, IHOlTli. ОСНОВПЫГ; 11(1ЦЯ1ИЯ
представлены аналогичные данные но гесту пальцевой моторики и про-
фессиональным умениям слесарей. Хотя в обоих примерах значения
коэффициентов корреляции сосредоточены более или менее в одной
области, между ними заметны существенные расхождения. Некоторые
коэффициенты валвдности приближаются к 1, тогда как другие близки
к нулю или явно отрицательны.
Подобная же неоднозначность применительно к прогнозированию
учебных оценок видна из рис. 16. На нем приведено распределение коэф-
фициентов корреляции между оценками по математике и результатами
каждого из субтестов теста различных способностей {DAT). Например,
для теста числовых способностей {NA) самое большое значение коэффи-
циента валидности для мальчиков с результатом от 0,50 до 0,59, в то
время как коэффициент корреляции для разных курсов математики и
в разных школах колеблется от 0,22 до 0,75. Столь же велики различия
и по другим субтестам, и надо добавить, это справедливо и в отношении
других предметов, не представленных на рис. 16.
Разброс значений коэффициентов валидности по критерию выполне-
ния деятельности, показанный на рис.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132