Как и при анализе заданий для личностных опросников, каждый
вопрос должен коррелировать с общим показателем по тесту. Чтобы
добиться этого, для отрицательных утверждений оценка показателей
должна быть подвергнута так называемому обращению. Покажем это
на примере.
( 1 ) Евреи склонны держаться вместе замкнутым кланом (отрица-
тельный аттитюд)
(2) Евреи - высококультурная группа в европейском сообществе
(положительный аттитюд)
Для задания 1 показатель равен 8 (количество градаций шкалы
плюс 1) минус реальное значение, отмеченное испытуемым; а для
задания 2 показатель равен реальному значению, отмеченному на
шкале. Общий показатель для каждого испытуемого, отражающий
его позицию по переменной "положительный аттитюд к евреям",
состоит из суммы показателей, полученных по заданиям.
Шаги по обработке результатов следующие:
(1) Подсчитайте показатели для каждого задания, принимая во
внимание обращение для негативных заданий, как описано для зада-
ний 1 и 2 выше.
(2) На основе показателей по заданиям вычислите общий показа-
тель для каждого испытуемого.
(3) Вычислите коэффициента (см. гл.5, стр. 173).
(4) Вычислите корреляцию каждого задания с общим показате-
лем, используя формулу произведения моментов Пирсона.
(5) Отберите задания, для которых выполняется критерий корре-
ляции (в обоих случаях, если используются две формулы).
(6) Если возможно, используйте равное количество положитель-
ных и отрицательных заданий.
(7) Вычислите коэффициент а. для нового теста из отобранных
заданий.
(8) Следует стремиться к шкалам из 20 заданий, как указано в
главе 6 (см. стр. 197), со значением коэффициента а 0.60 или выше.
(9) Если необходимо, переформулируйте некоторые задания и
подвергните их вновь анализу.
4-196
(10) Апробируйте и подвергните анализу заданий окончательно
отобранную шкалу.
(II) Заданиям следует приписать весовые коэффициенты в соот-
ветствии с их корреляцией с общим показателем. Однако, как указы-
вает Nunnally, корреляция шкал, в которых используются весовые
коэффициенты, и шкал без них так велика, что, как оказывается, не
стоит утруждать себя вычислением этих весовых коэффициентов.
(12) Валидизируйте переменную теста при помощи соответству-
ющих экспериментальных приемов.
Вероятно, нет никаких сомнений в том, что в результате этих
процедур будет получено однородное и с признаками очевидной ва-
лидности средство измерения аттитюда к евреям, для которого про-
цедурами шага 12 будет продемонстрировано, валидно оно или нет.
Заслуживает внимания еще один момент. Когда используются
многобалльные шкалы, разброс заданий всегда больше, чем в случае
с дихотомическими заданиями. Следовательно, факторный анализ
заданий шкалы Лайкерта с гораздо большей вероятностью может
привести к четкой факторной структуре чем для личностных опрос-
ников, в которых используется дихотомический подсчет показате-
лей. Следовательно, имеет смысл подвергать корреляции между за-
даниями факторному анализу и выбирать те задания, которые насы-
щают факторы. Процедуры и логические основания для факторного
анализа заданий при конструировании тестов уже полностью обсуж-
далось, поэтому здесь будут только кратко указаны необходимые
шаги.
(1) Как для анализа заданий.
(2) Как для анализа заданий.
(3) Как для анализа заданий.
(4) Вычислите корреляционную матрицу для всех заданий (по
формуле произведения моментов Пирсона).
(5) Подвергните корреляционную матрицу факторному анализу
с вращением.
(б) Отберите задания, нагруженные генеральным фактором или
другими факторами (см. пункт "Замечания" ниже).
(7) Проведите тестирование с отобранными заданиями и проверь-
те результаты.
(8) Валидизируйтетесттакже, каквшаге 12анализазаданий (см.
выше).
ЗАМЕЧАНИЯ
Для факторного анализа желательна настолько большая выборка,
насколько возможно. Если размер выборки не больше утроенного
162
числа заданий теста, то обязательно необходимы повторные испыта-
ния.
В шкалах аттитюдов может присутствовать генеральный фактор:
в нашем примере это аттитюд к евреям. Однако, можно возразить,
что этот аттитюд сам зависит от таких факторов, как догматизм
(Rokeach, 1960), авторитарные черты личности (АсЗогпоидр., 1950),
или от личностных факторов, таких как фактор Кэттелла L - подо-
зрительность. Если это так, тогда факторная структура шкалы атти-
тюдов не будет явно выраженной, и любой генеральный фактор мог
бы проявляться только в факторах второго или даже более высокого
порядка. По этой причине факторный анализ как метод конструиро-
вания тестов должен использоваться только тогда, когда есть веские
основания a priori предположить наличие явно выраженного гене-
рального фактора или другой подобной структуры.
Краткий обзор и заключение
(1) Определены объективные тесты и указаны их преимущества.
(2) Предложена таксономия тестов, основывающаяся на двух па-
раметрах: стимульно-инструктивной ситуации и особенностях оце-
нивания ответов. Это позволяет разработчику тестов конструировать
разнообразные формы заданий.
(3) Проведено различие между объективными тестами способно-
стей, темперамента и динамики.
(4) Сформулированы некоторые практические советы по констру-
ированию объективных тестов, прежде всего тестов личности и моти-
вов.
(5) Обсуждены пути преодоления трудностей при разработке тес-
тов.
(6) Обсуждены специфические проблемы объективных тестов ди-
намики.
(7) Приведен список основных принципов конструирования тес-
тов мотивов, основывающийся на психологических публикациях.
(8) Обсуждены различия между тестированием силы мотивов и
целей.
(9) Описано конструирование проективных тестов, после доказа-
тельства значимости разработки таких тестов.
(10) Кратко обсуждено конструирование других тестов мотивов.
(II) Описано конструирование шкал настроений.
(12) Обсуждено конструирование тестов Лайкерта.
Глава 5. Вычисление надежности тестов
В первой главе были кратко обсуждены два основных для психо-
метрических тестов понятия - надежность и валидность. В этой
главе будут описаны методы и процедуры установления надежности
теста. Как уже отмечалось, в смысле практического применения по-
нятие надежности имеет два значения: одно связано с внутренней
согласованностью теста, а другое - с воспроизводимостью результа-
тов. Оба они важны, хотя на практике второе существенно для раз-
работки эффективных тестов, тогда как первое, связанное с внутрен-
ней согласованностью, является значением надежности, учитывае-
мым в классической теории погрешностей тестов.
Однако, с точки зрения разработчика психологических тестов,
существуют различные практические вопросы, касающиеся надеж-
ности тестов, которые следовало бы обсудить: о преимуществах и
недостатках различных способов вычисления надежности, о важно-
сти надежности по внутренней согласованности на практике, в отли-
чие от теории, а также об источниках неудовлетворительной надеж-
ности. Эти вопросы и будут рассмотрены в данной главе.
Важность надежности по внутренней согласованности
при конструировании тестов
Понятие надежности по внутренней согласованности является
центральным для теории погрешностей измерения:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88