С помощью соответствующих та-
блиц, приводимых в руководстве к тесту, эти три показателя могут быть
выражены как стандартный IQ со средним значением, равным 100, и <7,
равным 15. Однако такие IQ находят соотнесением с собственной воз-
растной группой индивида. Поэтому они показывают положение индиви-
да в сравнении с людьми того же возрастного уровня.
При интерпретации показателей IQ WAIS должны приниматься во
внимание относительные значения IQ, полученные в шкалах Векслера
и других тестах интеллекта. Неоднократно отмечалось, что яркие лично-
сти часто показывают более высокие результаты по тесту Станфорд-
Бине, нежели по методике Векслера, в то время как менее развитые ин-
дивиды показывают по сравнению со шкалой Станфорд-Бине более
высокие результаты по тесту Векслера. Например, изучение первокурсни-
ков колледжа показало, что их средний показатель IQ, полученный по
методике Станфорд - Бине, более высок, нежели тот же показатель по те-
стам Векслера; обратную картину дало исследование группы умственно
отсталых. В какой-то степени различия между стандартным отклонением
IQ, полученного по шкалам Векслера и Станфорд - Бине, объясняют раз-
ницу в IQ, получаемом в этих двух шкалах. Напомним, что стандартное
отклонение IQ для тестов Станфорд-Бине равно 16, а для шкал Вексле-
ра 15. Все же расхождения в значениях IQ у испытуемых, тестированных
по этим методикам, несколько больше, чем можно было ожидать, исхо-
дя из различий в стандартных отклонениях. Еще одно отличие между
двумя шкалами в том, что в тесте Векслера нижний и верхний пороги
меньше, чем в тесте Станфорд - Бине и, следовательно, в нем хуже разли-
чаются предельные значения из диапазона значений IQ.
Взаимосвязь значений IQ по обеим шкалам зависит не только от
уровня IQ, но и от возраста испытуемых. При прочих равных условиях
более старшие испытуемые обычно получают более высокие показатели
IQ по шкале Векслера, в то время как для испытуемых молодых более
характерна обратная связь. Одним из объяснений этого, очевидно, может
служить применение пониженного стандарта при вычислении IQ для лиц
старшего возраста в шкалах Векслера. Вместе с тем в тесте Станфорд-
Бине все взрослые оцениваются в терминах среднего возрастного макси-
мума по этой шкале, т.е. 18 лет. Возможно также, что, поскольку стан-
дартизация шкал Станфорд-Бине первоначально проводилась на детях,
а тестов Векслера на взрослых, содержание первых более соответствует
детям, а последних-взрослым.
Надежность. Для каждого из одиннадцати субтестов, так же как
и для показателей IQ полной шкалы, вербальной шкалы и шкалы дей-
ствия, были подсчитаны коэффициенты надежности в возрастных выбор-
ках от 18 до 19, от 24 до 34 и от 45 до 54 лет. Эти три группы были вы-
браны как наиболее репрезентативные всему возрастному диапазону
224 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
цифр> и <цифровые символы>, коэффициенты надежности вычислялись
по методу расщепления теста на четные и нечетные задания (с поправкой
на полный тест по формуле Спирмана-Брауна). Надежность субтеста
<запоминание цифр> оценивалась на основе корреляций между показате-
лями называния цифр в прямом и обратном порядке. Методика расще-
пления не могла быть применена к тесту <цифровые символы>, так как
этот субтест является высокоскоростным. Поэтому надежность теста бы-
ла определена с помощью метода взаимозаменяемых форм в группе,
протестированной тестом <цифровые символы> по шкале WAIS и по
шкале Векслера-Белльвью.
Коэффициенты надежности IQ по полной шкале оказались для всех
трех возрастных выборок равными 0,97. Показатели IQ по вербальной
шкале во всех трех группах имели идентичные коэффициенты надежно-
сти, равные 0,96, а по шкале действия-0,93 и 0,94. Таким образом, все
три показателя IQ высоконадежны с точки зрения внутренней согласо-
ванности теста. Как можно было ожидать, индивидуальные субтесты да-
ли более низкие коэффициенты надежности, колеблющиеся от 0,60 для
заданий <запоминание цифр>, <расположение картинок> и <сборка
объекта> до таких высоких, как 0,96 для субтеста <словарный запас>.
Особенно важно учитывать надежность субтестов при оценке значимо-
сти различий между показателями субтестов, полученными одним и тем
же испытуемым, например при профильном анализе.
В руководстве к WAIS приводятся стандартные ошибки измерения
для всех трех показателей IQ и для всех показателей субтестов. Для IQ,
полученного в вербальной шкале, такая ошибка составляет 3 единицы
в каждой группе, для IQ, полученного в шкале действия,-чуть ниже 4,
а для полной шкалы-2,6. Опираясь на эти данные, мы можем заключить
с вероятностью около 1/2, что истинное значение IQ испытуемого нахо-
дится в диапазоне 3 единиц по обе стороны от полученного им по вер-
бальной шкале показателя IQ. Такая величина ошибки предпочтительней
ошибки измерения в 5 единиц, полученной для шкалы Станфорд-Бине.
Напомним, однако, что коэффициенты надежности в тестах Станфорд-
Бине определялись методом взаимозаменяемых форм, предъявлявшихся
с интервалами в одну неделю и менее, а такие условия уже сами по себе
предполагают более низкие коэффициенты надежности и большую ва-
риативность показателей.
Валидность. Любые обсуждения проблемы валидности WAIS
обязательно должны начинаться с исследования, проведенного по более
раннему варианту по тесту Векслера-Белльвью. Поскольку все измене-
ния, введенные в WAIS, являются улучшениями первого варианта теста
Векслера-Белльвью (надежности, верхнего порога, нормативной выбор-
ки и т.д.) и поскольку природа теста по существу остается той же, впол-
не оправдано допущение, что валидность данных, полученных по тесту
Векслера-Белльвью, будет скорее недооценивать, а не переоценивать ва-
лидность WAIS.
Само руководство к WAIS не содержит данных по валидности, но
некоторые аспекты валидности рассматриваются в книгах Д. Векслера
(D.Wechsler, 1958) и Дж.Д.Матараццо (J.D.Matarazzo, 1972). В своей
книге Д. Векслер доказывает, что психологические функции, измеряемые
каждым из II выбранных субтестов, соответствуют определению интел-
лекта, что подобные тесты успешно применялись в ранее разработанных
-. " .."" """а T-ffTT,T показали свою ценность в клиниче-
225 ИНДИВИДУАЛЬНЫЕ ТЕСТЫ
ской практике. Сам автор теста делает основной акцент именно на таком
подходе к валидности. Подобная трактовка существенна для валидности
по содержанию, хотя ее можно отнести и к конструктной валидности без
подтверждающих данных. Многие из рассуждений в книге Дж.Д. Мата-
раццо напоминают приведенную аргументацию, особенно когда речь
идет о структуре общего интеллекта, но они почти не затрагивают оцен-
ки WAIS как измерительного инструмента.
Некоторые из эмпирических данных по критериальной текущей яа-
лидности обобщены в обеих книгах (J.D.Matarazzo, 1972, р. 284;
D. Wechsler, 1958, гл. 14). Такие данные включают разницу средних зна-
чений IQ среди испытуемых, отличающихся по уровню образования
и профессиональной принадлежности, и некоторые корреляции с оценка-
ми выполнения работы на предприятии и учебными отметками. Самые
большие групповые различия хотя и невелики, но того же порядка, что
и предполагался. Служащие разных типов и уровней в среднем получили
высокие показатели IQ по вербальной шкале, а представители профес-
сий, требующих владения физическими умениями и навыками, получили
более высокие показатели IQ по тестам действия.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132
блиц, приводимых в руководстве к тесту, эти три показателя могут быть
выражены как стандартный IQ со средним значением, равным 100, и <7,
равным 15. Однако такие IQ находят соотнесением с собственной воз-
растной группой индивида. Поэтому они показывают положение индиви-
да в сравнении с людьми того же возрастного уровня.
При интерпретации показателей IQ WAIS должны приниматься во
внимание относительные значения IQ, полученные в шкалах Векслера
и других тестах интеллекта. Неоднократно отмечалось, что яркие лично-
сти часто показывают более высокие результаты по тесту Станфорд-
Бине, нежели по методике Векслера, в то время как менее развитые ин-
дивиды показывают по сравнению со шкалой Станфорд-Бине более
высокие результаты по тесту Векслера. Например, изучение первокурсни-
ков колледжа показало, что их средний показатель IQ, полученный по
методике Станфорд - Бине, более высок, нежели тот же показатель по те-
стам Векслера; обратную картину дало исследование группы умственно
отсталых. В какой-то степени различия между стандартным отклонением
IQ, полученного по шкалам Векслера и Станфорд - Бине, объясняют раз-
ницу в IQ, получаемом в этих двух шкалах. Напомним, что стандартное
отклонение IQ для тестов Станфорд-Бине равно 16, а для шкал Вексле-
ра 15. Все же расхождения в значениях IQ у испытуемых, тестированных
по этим методикам, несколько больше, чем можно было ожидать, исхо-
дя из различий в стандартных отклонениях. Еще одно отличие между
двумя шкалами в том, что в тесте Векслера нижний и верхний пороги
меньше, чем в тесте Станфорд - Бине и, следовательно, в нем хуже разли-
чаются предельные значения из диапазона значений IQ.
Взаимосвязь значений IQ по обеим шкалам зависит не только от
уровня IQ, но и от возраста испытуемых. При прочих равных условиях
более старшие испытуемые обычно получают более высокие показатели
IQ по шкале Векслера, в то время как для испытуемых молодых более
характерна обратная связь. Одним из объяснений этого, очевидно, может
служить применение пониженного стандарта при вычислении IQ для лиц
старшего возраста в шкалах Векслера. Вместе с тем в тесте Станфорд-
Бине все взрослые оцениваются в терминах среднего возрастного макси-
мума по этой шкале, т.е. 18 лет. Возможно также, что, поскольку стан-
дартизация шкал Станфорд-Бине первоначально проводилась на детях,
а тестов Векслера на взрослых, содержание первых более соответствует
детям, а последних-взрослым.
Надежность. Для каждого из одиннадцати субтестов, так же как
и для показателей IQ полной шкалы, вербальной шкалы и шкалы дей-
ствия, были подсчитаны коэффициенты надежности в возрастных выбор-
ках от 18 до 19, от 24 до 34 и от 45 до 54 лет. Эти три группы были вы-
браны как наиболее репрезентативные всему возрастному диапазону
224 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
цифр> и <цифровые символы>, коэффициенты надежности вычислялись
по методу расщепления теста на четные и нечетные задания (с поправкой
на полный тест по формуле Спирмана-Брауна). Надежность субтеста
<запоминание цифр> оценивалась на основе корреляций между показате-
лями называния цифр в прямом и обратном порядке. Методика расще-
пления не могла быть применена к тесту <цифровые символы>, так как
этот субтест является высокоскоростным. Поэтому надежность теста бы-
ла определена с помощью метода взаимозаменяемых форм в группе,
протестированной тестом <цифровые символы> по шкале WAIS и по
шкале Векслера-Белльвью.
Коэффициенты надежности IQ по полной шкале оказались для всех
трех возрастных выборок равными 0,97. Показатели IQ по вербальной
шкале во всех трех группах имели идентичные коэффициенты надежно-
сти, равные 0,96, а по шкале действия-0,93 и 0,94. Таким образом, все
три показателя IQ высоконадежны с точки зрения внутренней согласо-
ванности теста. Как можно было ожидать, индивидуальные субтесты да-
ли более низкие коэффициенты надежности, колеблющиеся от 0,60 для
заданий <запоминание цифр>, <расположение картинок> и <сборка
объекта> до таких высоких, как 0,96 для субтеста <словарный запас>.
Особенно важно учитывать надежность субтестов при оценке значимо-
сти различий между показателями субтестов, полученными одним и тем
же испытуемым, например при профильном анализе.
В руководстве к WAIS приводятся стандартные ошибки измерения
для всех трех показателей IQ и для всех показателей субтестов. Для IQ,
полученного в вербальной шкале, такая ошибка составляет 3 единицы
в каждой группе, для IQ, полученного в шкале действия,-чуть ниже 4,
а для полной шкалы-2,6. Опираясь на эти данные, мы можем заключить
с вероятностью около 1/2, что истинное значение IQ испытуемого нахо-
дится в диапазоне 3 единиц по обе стороны от полученного им по вер-
бальной шкале показателя IQ. Такая величина ошибки предпочтительней
ошибки измерения в 5 единиц, полученной для шкалы Станфорд-Бине.
Напомним, однако, что коэффициенты надежности в тестах Станфорд-
Бине определялись методом взаимозаменяемых форм, предъявлявшихся
с интервалами в одну неделю и менее, а такие условия уже сами по себе
предполагают более низкие коэффициенты надежности и большую ва-
риативность показателей.
Валидность. Любые обсуждения проблемы валидности WAIS
обязательно должны начинаться с исследования, проведенного по более
раннему варианту по тесту Векслера-Белльвью. Поскольку все измене-
ния, введенные в WAIS, являются улучшениями первого варианта теста
Векслера-Белльвью (надежности, верхнего порога, нормативной выбор-
ки и т.д.) и поскольку природа теста по существу остается той же, впол-
не оправдано допущение, что валидность данных, полученных по тесту
Векслера-Белльвью, будет скорее недооценивать, а не переоценивать ва-
лидность WAIS.
Само руководство к WAIS не содержит данных по валидности, но
некоторые аспекты валидности рассматриваются в книгах Д. Векслера
(D.Wechsler, 1958) и Дж.Д.Матараццо (J.D.Matarazzo, 1972). В своей
книге Д. Векслер доказывает, что психологические функции, измеряемые
каждым из II выбранных субтестов, соответствуют определению интел-
лекта, что подобные тесты успешно применялись в ранее разработанных
-. " .."" """а T-ffTT,T показали свою ценность в клиниче-
225 ИНДИВИДУАЛЬНЫЕ ТЕСТЫ
ской практике. Сам автор теста делает основной акцент именно на таком
подходе к валидности. Подобная трактовка существенна для валидности
по содержанию, хотя ее можно отнести и к конструктной валидности без
подтверждающих данных. Многие из рассуждений в книге Дж.Д. Мата-
раццо напоминают приведенную аргументацию, особенно когда речь
идет о структуре общего интеллекта, но они почти не затрагивают оцен-
ки WAIS как измерительного инструмента.
Некоторые из эмпирических данных по критериальной текущей яа-
лидности обобщены в обеих книгах (J.D.Matarazzo, 1972, р. 284;
D. Wechsler, 1958, гл. 14). Такие данные включают разницу средних зна-
чений IQ среди испытуемых, отличающихся по уровню образования
и профессиональной принадлежности, и некоторые корреляции с оценка-
ми выполнения работы на предприятии и учебными отметками. Самые
большие групповые различия хотя и невелики, но того же порядка, что
и предполагался. Служащие разных типов и уровней в среднем получили
высокие показатели IQ по вербальной шкале, а представители профес-
сий, требующих владения физическими умениями и навыками, получили
более высокие показатели IQ по тестам действия.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132