Следует отметить, что описанный метод
конструирования теста при помощи методики критериальных клю-
154
чевых признаков является также демонстрацией валидности, так как
валидный тест должен быть дискриминативным по отношению к
созданным экспериментальным ситуациям. Эта процедура требует,
конечно, повторной проверки на других группах.
ВАЛИДИЗАЦИЯ ТЕСТА
Если мы конструировали тест усталости с помощью бисериальной
корреляции и методики критериальных ключевых признаков, то тог-
да для его валидизации необходимо, чтобы мы продемонстрировали,
помимо очевидной валидности заданий и факта измерения ими опре-
деленной переменной, что этим тестом определяется чувство или
состояние усталости. Лучшей проверкой этого был бы специальным
образом спланированный эксперимент, что говорит в пользу отбора
заданий по методике критериальных ключевых признаков. Так,
можно было бы предположить, что значение показателей после экс-
периментальных процедур возрастет. Аналогично, мы могли бы пол-
учить показатели индивидуумов, которых мы считаем уставшими
после экзаменов или экспедиций, а затем сравнить их с показателями
не уставших (контрольных) испытуемых или с их собственными по-
казателями, но полученными несколько позже.
И наконец, следовало бы обратить внимание на один аргумент,
приводимый Cattell (1973) и Cattell и Kline (1977). В их работах
указывалось, что даже если факторный анализ уже разработанного
теста настроения показывает, что некоторый фактор присутствует,
то это еще не означает, что с его помощью обязательно будет изме-
ряться настроение или состояние. Такой Л-анализ может обнаружить
как черты, так и состояния. Целесообразно применение либо Р-ана-
лиза, в котором выявляются колебания значений некоторого фактора
у одного человека с течением времени, либо -анализа, позволяю-
щего факторизировать ретестовые изменения показателей индиви-
дуумов. В то же время справедливо и то, что если тест показал себя
валидным в процессе экспериментальной валидизации, описанном
выше, при обсуждении методики критериальных ключевых призна-
ков, то тогда не имеет смысла подвергать его Р- или -анализу.
Однако это не означает, что не стоит использовать Р- и -анализ в
исследовании настроений.
Для многих состояний (таких как депрессия или злость) экспери-
ментальные манипуляции не так просты, как в случае с усталостью,
по практическим, а иногда и по этическим соображениям. В таких
случаях -анализ больших выборок, протестированных в двух си-
туациях без экспериментального манипулирования, должен позво-
лить продемонстрировать валидность теста.
155
Краткий обзор
Шкалы состояний могут конструироваться точно так же, как шка-
лы темперамента, за исключением содержания заданий и точных
инструкций к тесту, в которых всегда подчеркивается то, что ответы
испытуемых должны касаться их состояния на момент обследования.
Валидизация лучше всего достигается путем экспериментального
создания настроения или состояния, если это возможно, в противном
случае необходим факторный Р- или -анализ, -анализ сам по
себе, без дальнейших свидетельств валидности, не эффективен.
Измерение аттитюдов
Существует три обычно используемых типа шкалы аттитюдов:
шкалы Терстоуна, шкалы Гутмена и шкалы Лайкерта. Однако я
намереваюсь обсудить полностью только конструирование шкал
Лайкерта, поскольку для двух других существуют серьезные пробле-
мы, из-за которых возможность их использования подвергается со-
мнению. Мы кратко упомянем об этих трудностях.
Шкалы Терстоуна
Основной метод конструирования шкалы аттитюдов Терстоуна
состоит из трех шагов: (1) собирается большое количество утвержде-
ний, относящихся к данному аттитюду (полезным источником могут
быть газеты); (2) эти утверждения оцениваются экспертами по 11-
балльной шкале, от "очень расположен" до "очень не расположен";
(3) отбираются те задания, относительно которых мнения экспертов
не разошлись. Кроме того, отобранные задания должны располагать-
ся по всей 11-балльной шкале. Показателем испытуемого будет ме-
дианная шкальная цена высказываний, с которыми он согласился,
или наибольшая оценка на шкале для заданий, которые он подтвер-
дил. ,
Поскольку, как утверждает Edwards (1957), необходимо около
100 экспертов, если мы хотим получить надежное шкалирование, то
существуют очевидные трудности с подбором этих экспертов. Поми-
мо этого, если эксперты не отражают в точности ту выборочную
совокупность (популяцию, группу лиц), для которых предназнача-
ется средство измерения, то, конечно же, вся процедура будет некор-
ректной.
Nunnally (1978) весьма обоснованно подвел итог тем возражени-
ям, которые выдвигались против использования шкал Терстоуна. По
его мнению, основной трудностью в данной модели является то, что
задания очень редко к ней подходят. Сутью этой модели является то,
156
что на каждое задание имеется ключевой ответ только в одной облас-
ти значений измеряемого свойства. Так, если имеется утверждение:
"Я ненавижу войну,"- то его должны подтвердить только, те, кто
получат средний балл на шкале аттитюда к войне. Однако испытуе-
мые с сильными антивоенными настроениями также, вероятно, отве-
тят на это задание утвердительно. Таким образом, данная модель не
отражает правильно структуру аттитюдов. Другими словами, эти
задания монотонны , и это существенно для большинства заданий
для измерения аттитюдов. Однако данная модель шкалирования не
является монотонной. В ней предполагается континуальность изме-
ряемого свойства и нормальное распределение ответов на задания.
Практические проблемы, связанные с подбором экспертов, вместе с
тем фактом, что трудно подобрать задания так, чтобы они соответст-
вовали предположениям данной модели, являются вескими противо-
показаниями для использования шкал Терстоуна при измерении ат-
титюдов.
Шкалы Гутмена
Шкалы Гутмена уже упоминались в главе 1, когда было указано,
что модель Раша (в случае, если задания не различимы по трудности)
порождает вероятностную версию шкалы Гутмена. Это, однако, не-
обычный взгляд на шкалы Гутмена, который заслуживает здесь не-
сколько более подробного описания.
Шкалы Гутмена попадают в класс моделей, известных как детер-
минированные, в которых предполагается, что кривые, описываю-
щие зависимость "задание-ответ" лишены погрешностей. По шкале
Гутмена предполагается, что в случае, когда задания упорядочены по
трудности, скажем, от 1 до 20, если испытуемый выполнил задание
8, он в состоянии выполнить и задания от 1 до 7. Если же он не смог
выполнить задание 9, то он также не сможет выполнить и задания от
10 до 20.
На основе кривых, описывающих зависимости "задание-ответ", в
данной модели предполагается, что для всех значений, превышаю-
щих некоторую точку на оси измеряемого свойства, вероятность от-
вета О. равна 0, а для всех меньших значений вероятность равна +1.
Это означает, что каждое задание имеет высокую бисериальную кор-
реляцию с общим показателем, и является весьма дискриминатив-
ным в некоторой точке на континуальной оси измеряемого свойства.
Под монотонностью понимается, во-первых, то, что задание допускает как поло-
жительный, так и отрицательный ответ, во-вторых, вероятность утвердительного
ответа возрастает по мере роста значимости данной черты (свойства) и наоборот
(Прим.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88
конструирования теста при помощи методики критериальных клю-
154
чевых признаков является также демонстрацией валидности, так как
валидный тест должен быть дискриминативным по отношению к
созданным экспериментальным ситуациям. Эта процедура требует,
конечно, повторной проверки на других группах.
ВАЛИДИЗАЦИЯ ТЕСТА
Если мы конструировали тест усталости с помощью бисериальной
корреляции и методики критериальных ключевых признаков, то тог-
да для его валидизации необходимо, чтобы мы продемонстрировали,
помимо очевидной валидности заданий и факта измерения ими опре-
деленной переменной, что этим тестом определяется чувство или
состояние усталости. Лучшей проверкой этого был бы специальным
образом спланированный эксперимент, что говорит в пользу отбора
заданий по методике критериальных ключевых признаков. Так,
можно было бы предположить, что значение показателей после экс-
периментальных процедур возрастет. Аналогично, мы могли бы пол-
учить показатели индивидуумов, которых мы считаем уставшими
после экзаменов или экспедиций, а затем сравнить их с показателями
не уставших (контрольных) испытуемых или с их собственными по-
казателями, но полученными несколько позже.
И наконец, следовало бы обратить внимание на один аргумент,
приводимый Cattell (1973) и Cattell и Kline (1977). В их работах
указывалось, что даже если факторный анализ уже разработанного
теста настроения показывает, что некоторый фактор присутствует,
то это еще не означает, что с его помощью обязательно будет изме-
ряться настроение или состояние. Такой Л-анализ может обнаружить
как черты, так и состояния. Целесообразно применение либо Р-ана-
лиза, в котором выявляются колебания значений некоторого фактора
у одного человека с течением времени, либо -анализа, позволяю-
щего факторизировать ретестовые изменения показателей индиви-
дуумов. В то же время справедливо и то, что если тест показал себя
валидным в процессе экспериментальной валидизации, описанном
выше, при обсуждении методики критериальных ключевых призна-
ков, то тогда не имеет смысла подвергать его Р- или -анализу.
Однако это не означает, что не стоит использовать Р- и -анализ в
исследовании настроений.
Для многих состояний (таких как депрессия или злость) экспери-
ментальные манипуляции не так просты, как в случае с усталостью,
по практическим, а иногда и по этическим соображениям. В таких
случаях -анализ больших выборок, протестированных в двух си-
туациях без экспериментального манипулирования, должен позво-
лить продемонстрировать валидность теста.
155
Краткий обзор
Шкалы состояний могут конструироваться точно так же, как шка-
лы темперамента, за исключением содержания заданий и точных
инструкций к тесту, в которых всегда подчеркивается то, что ответы
испытуемых должны касаться их состояния на момент обследования.
Валидизация лучше всего достигается путем экспериментального
создания настроения или состояния, если это возможно, в противном
случае необходим факторный Р- или -анализ, -анализ сам по
себе, без дальнейших свидетельств валидности, не эффективен.
Измерение аттитюдов
Существует три обычно используемых типа шкалы аттитюдов:
шкалы Терстоуна, шкалы Гутмена и шкалы Лайкерта. Однако я
намереваюсь обсудить полностью только конструирование шкал
Лайкерта, поскольку для двух других существуют серьезные пробле-
мы, из-за которых возможность их использования подвергается со-
мнению. Мы кратко упомянем об этих трудностях.
Шкалы Терстоуна
Основной метод конструирования шкалы аттитюдов Терстоуна
состоит из трех шагов: (1) собирается большое количество утвержде-
ний, относящихся к данному аттитюду (полезным источником могут
быть газеты); (2) эти утверждения оцениваются экспертами по 11-
балльной шкале, от "очень расположен" до "очень не расположен";
(3) отбираются те задания, относительно которых мнения экспертов
не разошлись. Кроме того, отобранные задания должны располагать-
ся по всей 11-балльной шкале. Показателем испытуемого будет ме-
дианная шкальная цена высказываний, с которыми он согласился,
или наибольшая оценка на шкале для заданий, которые он подтвер-
дил. ,
Поскольку, как утверждает Edwards (1957), необходимо около
100 экспертов, если мы хотим получить надежное шкалирование, то
существуют очевидные трудности с подбором этих экспертов. Поми-
мо этого, если эксперты не отражают в точности ту выборочную
совокупность (популяцию, группу лиц), для которых предназнача-
ется средство измерения, то, конечно же, вся процедура будет некор-
ректной.
Nunnally (1978) весьма обоснованно подвел итог тем возражени-
ям, которые выдвигались против использования шкал Терстоуна. По
его мнению, основной трудностью в данной модели является то, что
задания очень редко к ней подходят. Сутью этой модели является то,
156
что на каждое задание имеется ключевой ответ только в одной облас-
ти значений измеряемого свойства. Так, если имеется утверждение:
"Я ненавижу войну,"- то его должны подтвердить только, те, кто
получат средний балл на шкале аттитюда к войне. Однако испытуе-
мые с сильными антивоенными настроениями также, вероятно, отве-
тят на это задание утвердительно. Таким образом, данная модель не
отражает правильно структуру аттитюдов. Другими словами, эти
задания монотонны , и это существенно для большинства заданий
для измерения аттитюдов. Однако данная модель шкалирования не
является монотонной. В ней предполагается континуальность изме-
ряемого свойства и нормальное распределение ответов на задания.
Практические проблемы, связанные с подбором экспертов, вместе с
тем фактом, что трудно подобрать задания так, чтобы они соответст-
вовали предположениям данной модели, являются вескими противо-
показаниями для использования шкал Терстоуна при измерении ат-
титюдов.
Шкалы Гутмена
Шкалы Гутмена уже упоминались в главе 1, когда было указано,
что модель Раша (в случае, если задания не различимы по трудности)
порождает вероятностную версию шкалы Гутмена. Это, однако, не-
обычный взгляд на шкалы Гутмена, который заслуживает здесь не-
сколько более подробного описания.
Шкалы Гутмена попадают в класс моделей, известных как детер-
минированные, в которых предполагается, что кривые, описываю-
щие зависимость "задание-ответ" лишены погрешностей. По шкале
Гутмена предполагается, что в случае, когда задания упорядочены по
трудности, скажем, от 1 до 20, если испытуемый выполнил задание
8, он в состоянии выполнить и задания от 1 до 7. Если же он не смог
выполнить задание 9, то он также не сможет выполнить и задания от
10 до 20.
На основе кривых, описывающих зависимости "задание-ответ", в
данной модели предполагается, что для всех значений, превышаю-
щих некоторую точку на оси измеряемого свойства, вероятность от-
вета О. равна 0, а для всех меньших значений вероятность равна +1.
Это означает, что каждое задание имеет высокую бисериальную кор-
реляцию с общим показателем, и является весьма дискриминатив-
ным в некоторой точке на континуальной оси измеряемого свойства.
Под монотонностью понимается, во-первых, то, что задание допускает как поло-
жительный, так и отрицательный ответ, во-вторых, вероятность утвердительного
ответа возрастает по мере роста значимости данной черты (свойства) и наоборот
(Прим.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88