При-мовым (Е. S. Primoff, 1975). /-Коэффициент является одним из
методов характеристики синтетической валидности (см. Валидность критериальная).
Процедура его определения предусматривает наличие перечня элементов сложной
деятельности или способности, выраженных языком профессиональных или других
специальных действий, и экспертной оценки относительной значимости этих элементов
для осуществления данной сложной деятельности. Окончательный анализ проводится на
базе корреляции оценок теста и отдельных элементов реальной деятельности с учетом их
удельных весов. Статистическая обработка основана на применении уравнения множе-
ственной регрессии. Для каждого элемента деятельности его корреляция с деятельностью
в целом умножается на <вес> в тесте, и полученные произведения суммируются по всем
элементам деятельности.
В. к. являются важными, но далеко не определяющими и не исчерпывающими ха-
рактеристиками валидности методики. В. к. являются лишь элементом в сложном процессе
характеристики валидности теста.
Приблизительность отдельно вычисленного В. к. обусловлена многими факторами. Во-
первых, условия валидности теста не представляется возможным определить полностью.
Всегда остается множество неучтенных факторов, ситуаций, условий и т. д. Во-вторых,
логика критериальной валидизации предполагает ва-лидность самого критерия. Проверка
такой валидности представляет собой весьма трудную проблему. К тому же очень часто
тесты валидизируются относительно доступного, а не наиболее соответствующего
критерия. Так, тесты интеллекта сопоставляются с показателями академической
успеваемости, которая несомненно связана с интеллектом, но его далеко не исчерпывает.
В-третьих, условия валидизации по критерию предполагают, что выборка полностью
репрезентативна в популяции, для которой позже будут делаться заключения. В реальной
ситуации это требование осуществить трудно, и репрезентативность выборки валидизации
все-
------------------- ВАЛ
гда требует дополнительной проверки статистическими и качественными методами. На
практике обычно весьма сложно охватить адекватно большое количество случаев,
особенно при определении валидности прогностической.
Наибольшая сложность интерпретации В. к. с т. з. определяемой реальной валидности
теста заключается в следующем. Критериальная валидизация опирается, как правило, на
круг внешних для психологии социально-прагматических критериев. Это оправдывается
тем, что важнейшая цель валидизации - определение практической ценности разрабаты-
ваемой методики. Критерии в этом случае выступают как показатели, обладающие
непосредственной ценностью для определенных областей практической деятельности,
напр.: <успеваемость>, <производительность>, <преступность>, <состояние здоровья> и т.
д. При ориентации на эти категории в ходе валидизации решаются сразу две задачи:
собственно задача измерения валидности и оценка прагматической эффективности
психодиагностической методики. Если получен значимый коэффициент корреляции, то
можно считать, что с той или иной степенью достоверности решены с позитивным
результатом сразу две эти задачи. Но если корреляция не обнаружена, то остается
неопределенность: либо не валидна сама процедура (тестовый балл не отражает, напр.,
стрессоустойчивость оператора), либо не верна гипотеза о наличии причинно-след-
ственной связи между психическим свойством и социально ценным показателем
(стрессоустойчивость не влияет на процент аварийных ситуаций).
Наряду с перечисленными теоретическими и методическими сложностями применения и
интерпретации В.к.необходимо помнить и об обеспечении статистической значимости
рассчитываемых коэффициентов. Делая вывод о валидности теста
ВАЛ ___________________
с привлечением В. к., нужно быть уверенным в том, что данный коэффициент не появился
в результате случайных откло-.нений в выборке. Установив значимость корреляции между
тестовыми показателями и критерием, необходимо оценить величину стандартной ошибки
тестовых оценок. Применяемый при этом статистический показатель ошибки измерения
указывает на допустимые пределы ошибки в индивидуальных показателях вследствие ог-
раниченной надежности теста. Аналогично ошибка в оценке указывает на допустимые
пределы возможной ошибки в прогнозируемой величине индивидуального критериального
показателя, возникающей в результате ограниченной валидности теста.
Ошибка оценки находится по формуле
где гу - коэффициент валидности, Оу - стандартное отклонение критериальных
показателей. Величина ,/1-г2 указывает на величину ошибки относительно ошибки простого
угадывания, т. е. при нулевой валидности. Если ,/1-г2 = 1, то ошибка столь же велика, как и
при угадывании. Если коэффициент валидности ра-
1-y-Jy указыва-
вен 0,80, то ,/1-г == 0,60, т. е. доля ошибок составляет 60% таковой при случайном
распределении.
Особенности интерпретации В. к. как статистических мер аналогичны другим мерам связи.
ВАЛИДНОСТЬ (англ. valid - действительный, пригодный, имеющий силу) - комплексная
характеристика методики (теста), включающая сведения об области исследуемых явлений
и репрезентативности диагностической процедуры по отношению к ним.
34
В наиболее простой и общей формулировке В. теста это <...понятие, указывающее нам,
что тест измеряет и насколько хорошо он это делает> (А. Анастази, 1982). В стандартных
требованиях к психологическим и образовательным тестам (Standarts..., 1974) В.
определяется как комплекс сведений о том, относительно каких групп психологических
свойств личности могут быть сделаны выводы с помощью методики, а также о степени
обоснованности выводов при использовании конкретных тестовых оценок или других форм
оценивания. В психологической диагностике В. - обязательная и наиболее важная часть
сведений о методике, включающая (наряду с указанными выше) данные о степени
согласованности результатов теста с другими сведениями об исследуемой личности,
полученными из различных источников (теоретические ожидания, наблюдение, экспертные
оценки, результаты других методик, достоверность которых установлена и т. д.), суждение
об обоснованности прогноза развития исследуемого качества, связь изучаемой области
поведения или особенности личности с определенными психологическими конструктами. В.
описывает также конкретную направленность методики (контингент испытуемых по
возрасту, уровню образования, социально-культурной принадлежности и т. д.) и степень
обоснованности выводов в конкретных условиях использования теста. В совокупности
сведений, характеризующих В. теста, содержится информация об адекватности
применяемой модели деятельности с т. з. отражения в ней изучаемой психологической
особенности, о степени однородности заданий (субтестов), включенных в тест, их
сопоставимости при количественной оценке результатов теста в целом.
Важнейшая составляющая В. - определение области изучаемых свойств -
имеет принципиальное теоретическое и практическое значение при выборе методики
исследования и интерпретации ее данных. Содержащаяся в названии теста информация,
как правило, недостаточна для суждения о сфере его применения.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147
методов характеристики синтетической валидности (см. Валидность критериальная).
Процедура его определения предусматривает наличие перечня элементов сложной
деятельности или способности, выраженных языком профессиональных или других
специальных действий, и экспертной оценки относительной значимости этих элементов
для осуществления данной сложной деятельности. Окончательный анализ проводится на
базе корреляции оценок теста и отдельных элементов реальной деятельности с учетом их
удельных весов. Статистическая обработка основана на применении уравнения множе-
ственной регрессии. Для каждого элемента деятельности его корреляция с деятельностью
в целом умножается на <вес> в тесте, и полученные произведения суммируются по всем
элементам деятельности.
В. к. являются важными, но далеко не определяющими и не исчерпывающими ха-
рактеристиками валидности методики. В. к. являются лишь элементом в сложном процессе
характеристики валидности теста.
Приблизительность отдельно вычисленного В. к. обусловлена многими факторами. Во-
первых, условия валидности теста не представляется возможным определить полностью.
Всегда остается множество неучтенных факторов, ситуаций, условий и т. д. Во-вторых,
логика критериальной валидизации предполагает ва-лидность самого критерия. Проверка
такой валидности представляет собой весьма трудную проблему. К тому же очень часто
тесты валидизируются относительно доступного, а не наиболее соответствующего
критерия. Так, тесты интеллекта сопоставляются с показателями академической
успеваемости, которая несомненно связана с интеллектом, но его далеко не исчерпывает.
В-третьих, условия валидизации по критерию предполагают, что выборка полностью
репрезентативна в популяции, для которой позже будут делаться заключения. В реальной
ситуации это требование осуществить трудно, и репрезентативность выборки валидизации
все-
------------------- ВАЛ
гда требует дополнительной проверки статистическими и качественными методами. На
практике обычно весьма сложно охватить адекватно большое количество случаев,
особенно при определении валидности прогностической.
Наибольшая сложность интерпретации В. к. с т. з. определяемой реальной валидности
теста заключается в следующем. Критериальная валидизация опирается, как правило, на
круг внешних для психологии социально-прагматических критериев. Это оправдывается
тем, что важнейшая цель валидизации - определение практической ценности разрабаты-
ваемой методики. Критерии в этом случае выступают как показатели, обладающие
непосредственной ценностью для определенных областей практической деятельности,
напр.: <успеваемость>, <производительность>, <преступность>, <состояние здоровья> и т.
д. При ориентации на эти категории в ходе валидизации решаются сразу две задачи:
собственно задача измерения валидности и оценка прагматической эффективности
психодиагностической методики. Если получен значимый коэффициент корреляции, то
можно считать, что с той или иной степенью достоверности решены с позитивным
результатом сразу две эти задачи. Но если корреляция не обнаружена, то остается
неопределенность: либо не валидна сама процедура (тестовый балл не отражает, напр.,
стрессоустойчивость оператора), либо не верна гипотеза о наличии причинно-след-
ственной связи между психическим свойством и социально ценным показателем
(стрессоустойчивость не влияет на процент аварийных ситуаций).
Наряду с перечисленными теоретическими и методическими сложностями применения и
интерпретации В.к.необходимо помнить и об обеспечении статистической значимости
рассчитываемых коэффициентов. Делая вывод о валидности теста
ВАЛ ___________________
с привлечением В. к., нужно быть уверенным в том, что данный коэффициент не появился
в результате случайных откло-.нений в выборке. Установив значимость корреляции между
тестовыми показателями и критерием, необходимо оценить величину стандартной ошибки
тестовых оценок. Применяемый при этом статистический показатель ошибки измерения
указывает на допустимые пределы ошибки в индивидуальных показателях вследствие ог-
раниченной надежности теста. Аналогично ошибка в оценке указывает на допустимые
пределы возможной ошибки в прогнозируемой величине индивидуального критериального
показателя, возникающей в результате ограниченной валидности теста.
Ошибка оценки находится по формуле
где гу - коэффициент валидности, Оу - стандартное отклонение критериальных
показателей. Величина ,/1-г2 указывает на величину ошибки относительно ошибки простого
угадывания, т. е. при нулевой валидности. Если ,/1-г2 = 1, то ошибка столь же велика, как и
при угадывании. Если коэффициент валидности ра-
1-y-Jy указыва-
вен 0,80, то ,/1-г == 0,60, т. е. доля ошибок составляет 60% таковой при случайном
распределении.
Особенности интерпретации В. к. как статистических мер аналогичны другим мерам связи.
ВАЛИДНОСТЬ (англ. valid - действительный, пригодный, имеющий силу) - комплексная
характеристика методики (теста), включающая сведения об области исследуемых явлений
и репрезентативности диагностической процедуры по отношению к ним.
34
В наиболее простой и общей формулировке В. теста это <...понятие, указывающее нам,
что тест измеряет и насколько хорошо он это делает> (А. Анастази, 1982). В стандартных
требованиях к психологическим и образовательным тестам (Standarts..., 1974) В.
определяется как комплекс сведений о том, относительно каких групп психологических
свойств личности могут быть сделаны выводы с помощью методики, а также о степени
обоснованности выводов при использовании конкретных тестовых оценок или других форм
оценивания. В психологической диагностике В. - обязательная и наиболее важная часть
сведений о методике, включающая (наряду с указанными выше) данные о степени
согласованности результатов теста с другими сведениями об исследуемой личности,
полученными из различных источников (теоретические ожидания, наблюдение, экспертные
оценки, результаты других методик, достоверность которых установлена и т. д.), суждение
об обоснованности прогноза развития исследуемого качества, связь изучаемой области
поведения или особенности личности с определенными психологическими конструктами. В.
описывает также конкретную направленность методики (контингент испытуемых по
возрасту, уровню образования, социально-культурной принадлежности и т. д.) и степень
обоснованности выводов в конкретных условиях использования теста. В совокупности
сведений, характеризующих В. теста, содержится информация об адекватности
применяемой модели деятельности с т. з. отражения в ней изучаемой психологической
особенности, о степени однородности заданий (субтестов), включенных в тест, их
сопоставимости при количественной оценке результатов теста в целом.
Важнейшая составляющая В. - определение области изучаемых свойств -
имеет принципиальное теоретическое и практическое значение при выборе методики
исследования и интерпретации ее данных. Содержащаяся в названии теста информация,
как правило, недостаточна для суждения о сфере его применения.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147