Стассен, 1986). При этом с помощью Н. и.
диагностируются в первую очередь когнитивные аспекты надежды (см. Ожидаемого
баланса шкала). Теоретической основой методики является концепция триады <я-
другие-мир> А. Бека (1967), описывающая взаимодействие человека с окружающим
миром.
Надежность ретестовая Н. и. при обследовании 112 испытуемых-студентов с интервалом 9
недель составила = 0,62-0,74; внутренняя согласованность (при обследовании 130
испытуемых студентов) - 0,72-0,85. Н. и. обладает достаточно высокой валидностью.
Сведений об использовании в СНГ не имеется.
НАДЕЖНОСТИ КОЭФФИЦИЕНТЫ - статистические показатели надежности
психологического теста.
При оценке надежности наиболее часто применяются различные виды корреляционного
анализа. В качестве Н. к. при характеристике надежности ретес-товой используются
коэффициенты корреляции результатов первичного и повторного обследования, при
оценке надежности параллельных форм - коэффициент корреляции результатов, полу-
ченных с помощью разных форм теста (см. Параллельные формы теста).
При оценке надежности частей теста находят применение специальные коэффициенты,
полученные на основе уравнений Кьюдера-Ричардсона, Спирме-на-Брауна.
Распространенным методом анализа надежности является расчет коэффициента
<альфа>. При характеристике надежности факторно-дисперсионной используются
специальные методы дисперсионного анализа.
Н. к., определенные на основе разных подходов, нередко существенно отличаются по
своим эмпирическим значениям. Между разными моделями определения надежности
могут отмечаться противоречия (см. Надежность по внутренней согласованности). Имеется
ряд сложностей количественной характеристики надежности, аналогично проблемам, воз-
никающим при анализе содержания ва-лидности коэффициентов.
Несмотря на то что количественные характеристики надежности в виде традиционного Н. к.
более распространены в практике психодиагностики, нежели количественные
коэффициенты при оценке валидности, о надежности теста следует (как и в случае
валидности) судить на основании изучения разных аспектов. При интерпретации Н. к.
обязателен учет закономерностей разных подходов к определению надежности и
психологический анализ показателей проверяемого на надежность теста.
НАДЕЖНОСТЬ - характеристика методики, отражающая точность психодиагностических
измерений, а также устойчивость результатов теста к действию ""сторонних случайных
факторов. Н. и вaлuднocmь являются важнейшими ха-
------------------ НАД
рактеристиками методики как инструмента психодиагностического исследования.
Результат психологического исследования обычно подвержен влиянию большого
количества неучитываемых факторов (напр., эмоциональное состояние или утомление,
если они не входят в круг исследуемых характеристик, освещенность температура и другие
особенности помещения, в котором проводится исследование, уровень мотивированности
испытуемых на обследование и др.). Любое изменение ситуации исследования усиливает
влияние одних и ослабляет воздействие других факторов на результат теста.
Общий разброс (дисперсию) результатов тестового обследования можно, таким образом,
представить как результат влияния двух групп причин: изменчивости, присущей самому
измеряемому свойству, и факторов нестабильности измерительной процедуры.
В самом широком смысле Н. теста - это характеристика того, в какой степени выявленные
у испытуемых различия по тестовым результатам являются отражением действительных
различий в измеряемых свойствах и в какой мере они могут быть приписаны случайным
ошибкам.
В более узком, методическом, смысле под Н. понимают степень согласованности
результатов теста, получаемых при первичном и вторичном его применении, у одних и тех
же испытуемых в различные моменты времени, с использованием разных (но
сопоставимых по характеру) наборов тестовых заданий или при других изменениях
условий обследования.
Распределение оценок испытуемых при выполнении теста, измеряющего одно качество, в
идеальном случае совпадает с нормальным распределением, и дисперсия при этом будет
<истинной> (т. е. отражающей вариативность только измеряемого признака). Каждый
испытуемый занимает определенное место по оценкам
193
НАД
НАД
теста, и теоретически это место для каждого члена выборки постоянно. В рассмат-
риваемом случае повторное выполнение теста теми же лицами должно давать рас-
пределение мест на шкале оценок, идентичное первому. Тогда методика точна и
максимально надежна. Реальные оценки и ранговые места испытуемых при повторном
обследовании изменяются, и их распределение в той или иной степени отличается от
исходного. При этом дисперсия нового распределения выше исходного на величину
дисперсии ошибки измерения. Сказанное можно выразить формулой, описывающей Н.
теста как отношение <истинной> и реальной (эмпирической) дисперсии:
0,=
ИЛИ
S2 <-1-t
Оу
где а - надежность теста, S- <истинная> дисперсия, Sj - дисперсия ошибки;
S - эмпирическая дисперсия оценок теста. Как видно, Н. теста тесно связана с ошибкой
измерения, которая указывает на вероятные пределы колебаний измеряемой величины
под воздействием случай-
S2 ных посторонних факторов. Величина -
"х служит основным показателем точности и
устойчивости измерений и называется коэффициентом Н. теста (F():
S2
г ---г- с2
Величина ошибки измерения обратно пропорциональна показателям точности измерения
(чем шире доверительный интервал, внутри которого возможно появление истинного
результата у данного испытуемого, тем меньше точность измерения). Относительную долю
дисперсии ошибки (5)легко установить, исходя из уравнения
S2
С2 --1_,-
S2
На практике в большинстве применяемых методик редко удается получить значения
коэффициентов Н., превышающие 0,7-0,8. При т-; порядка 0,8 относительная доля
стандартной ошибки (см. Ошибка измерения} составляет Jl - 0,8 = 0,45, а эмпирическое
значение отклонения тестового балла от среднего оказывается завышенным. Для
коррекции эмпирического значения в практических исследованиях применяется формула:
Х1=г+х(1-Г{),
где Xf - истинное значение тестового балла, х, - эмпирический балл испытуемого, г; -
коэффициент надежности, х - среднее значение оценок по тесту.
Напр., у испытуемого при обследовании по шкале Векслера (см. Векслера интеллекта
измерения шкалы.) оценка вербального интеллектуального показателя составила 107
баллов. Среднее значение х для шкалы составляет 100, а надежность г, - 0,89. При этом
истинное значение х, = 0,89 107 +0,11 100 = 106,2.
Разновидностей характеристик Н. теста так же много, как условий, влияющих на его
результаты. Наиболее широкое практическое применение находят несколько типов
характеристик Н.: надежность ре-тестовая, надежность параллельных форм, надежность
частей теста.
Подчеркивается, что ни одна из существующих процедур не является идеальной с т. з. Н.
Свойства Н. могут существенно изменяться при незначительных, на первый взгляд,
изменениях условии проведения обследования, изменении характера заданий, они
значительно варьируют в зависимости от степени сложности или трудности конкретных
заданий для испытуемого.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147
диагностируются в первую очередь когнитивные аспекты надежды (см. Ожидаемого
баланса шкала). Теоретической основой методики является концепция триады <я-
другие-мир> А. Бека (1967), описывающая взаимодействие человека с окружающим
миром.
Надежность ретестовая Н. и. при обследовании 112 испытуемых-студентов с интервалом 9
недель составила = 0,62-0,74; внутренняя согласованность (при обследовании 130
испытуемых студентов) - 0,72-0,85. Н. и. обладает достаточно высокой валидностью.
Сведений об использовании в СНГ не имеется.
НАДЕЖНОСТИ КОЭФФИЦИЕНТЫ - статистические показатели надежности
психологического теста.
При оценке надежности наиболее часто применяются различные виды корреляционного
анализа. В качестве Н. к. при характеристике надежности ретес-товой используются
коэффициенты корреляции результатов первичного и повторного обследования, при
оценке надежности параллельных форм - коэффициент корреляции результатов, полу-
ченных с помощью разных форм теста (см. Параллельные формы теста).
При оценке надежности частей теста находят применение специальные коэффициенты,
полученные на основе уравнений Кьюдера-Ричардсона, Спирме-на-Брауна.
Распространенным методом анализа надежности является расчет коэффициента
<альфа>. При характеристике надежности факторно-дисперсионной используются
специальные методы дисперсионного анализа.
Н. к., определенные на основе разных подходов, нередко существенно отличаются по
своим эмпирическим значениям. Между разными моделями определения надежности
могут отмечаться противоречия (см. Надежность по внутренней согласованности). Имеется
ряд сложностей количественной характеристики надежности, аналогично проблемам, воз-
никающим при анализе содержания ва-лидности коэффициентов.
Несмотря на то что количественные характеристики надежности в виде традиционного Н. к.
более распространены в практике психодиагностики, нежели количественные
коэффициенты при оценке валидности, о надежности теста следует (как и в случае
валидности) судить на основании изучения разных аспектов. При интерпретации Н. к.
обязателен учет закономерностей разных подходов к определению надежности и
психологический анализ показателей проверяемого на надежность теста.
НАДЕЖНОСТЬ - характеристика методики, отражающая точность психодиагностических
измерений, а также устойчивость результатов теста к действию ""сторонних случайных
факторов. Н. и вaлuднocmь являются важнейшими ха-
------------------ НАД
рактеристиками методики как инструмента психодиагностического исследования.
Результат психологического исследования обычно подвержен влиянию большого
количества неучитываемых факторов (напр., эмоциональное состояние или утомление,
если они не входят в круг исследуемых характеристик, освещенность температура и другие
особенности помещения, в котором проводится исследование, уровень мотивированности
испытуемых на обследование и др.). Любое изменение ситуации исследования усиливает
влияние одних и ослабляет воздействие других факторов на результат теста.
Общий разброс (дисперсию) результатов тестового обследования можно, таким образом,
представить как результат влияния двух групп причин: изменчивости, присущей самому
измеряемому свойству, и факторов нестабильности измерительной процедуры.
В самом широком смысле Н. теста - это характеристика того, в какой степени выявленные
у испытуемых различия по тестовым результатам являются отражением действительных
различий в измеряемых свойствах и в какой мере они могут быть приписаны случайным
ошибкам.
В более узком, методическом, смысле под Н. понимают степень согласованности
результатов теста, получаемых при первичном и вторичном его применении, у одних и тех
же испытуемых в различные моменты времени, с использованием разных (но
сопоставимых по характеру) наборов тестовых заданий или при других изменениях
условий обследования.
Распределение оценок испытуемых при выполнении теста, измеряющего одно качество, в
идеальном случае совпадает с нормальным распределением, и дисперсия при этом будет
<истинной> (т. е. отражающей вариативность только измеряемого признака). Каждый
испытуемый занимает определенное место по оценкам
193
НАД
НАД
теста, и теоретически это место для каждого члена выборки постоянно. В рассмат-
риваемом случае повторное выполнение теста теми же лицами должно давать рас-
пределение мест на шкале оценок, идентичное первому. Тогда методика точна и
максимально надежна. Реальные оценки и ранговые места испытуемых при повторном
обследовании изменяются, и их распределение в той или иной степени отличается от
исходного. При этом дисперсия нового распределения выше исходного на величину
дисперсии ошибки измерения. Сказанное можно выразить формулой, описывающей Н.
теста как отношение <истинной> и реальной (эмпирической) дисперсии:
0,=
ИЛИ
S2 <-1-t
Оу
где а - надежность теста, S- <истинная> дисперсия, Sj - дисперсия ошибки;
S - эмпирическая дисперсия оценок теста. Как видно, Н. теста тесно связана с ошибкой
измерения, которая указывает на вероятные пределы колебаний измеряемой величины
под воздействием случай-
S2 ных посторонних факторов. Величина -
"х служит основным показателем точности и
устойчивости измерений и называется коэффициентом Н. теста (F():
S2
г ---г- с2
Величина ошибки измерения обратно пропорциональна показателям точности измерения
(чем шире доверительный интервал, внутри которого возможно появление истинного
результата у данного испытуемого, тем меньше точность измерения). Относительную долю
дисперсии ошибки (5)легко установить, исходя из уравнения
S2
С2 --1_,-
S2
На практике в большинстве применяемых методик редко удается получить значения
коэффициентов Н., превышающие 0,7-0,8. При т-; порядка 0,8 относительная доля
стандартной ошибки (см. Ошибка измерения} составляет Jl - 0,8 = 0,45, а эмпирическое
значение отклонения тестового балла от среднего оказывается завышенным. Для
коррекции эмпирического значения в практических исследованиях применяется формула:
Х1=г+х(1-Г{),
где Xf - истинное значение тестового балла, х, - эмпирический балл испытуемого, г; -
коэффициент надежности, х - среднее значение оценок по тесту.
Напр., у испытуемого при обследовании по шкале Векслера (см. Векслера интеллекта
измерения шкалы.) оценка вербального интеллектуального показателя составила 107
баллов. Среднее значение х для шкалы составляет 100, а надежность г, - 0,89. При этом
истинное значение х, = 0,89 107 +0,11 100 = 106,2.
Разновидностей характеристик Н. теста так же много, как условий, влияющих на его
результаты. Наиболее широкое практическое применение находят несколько типов
характеристик Н.: надежность ре-тестовая, надежность параллельных форм, надежность
частей теста.
Подчеркивается, что ни одна из существующих процедур не является идеальной с т. з. Н.
Свойства Н. могут существенно изменяться при незначительных, на первый взгляд,
изменениях условии проведения обследования, изменении характера заданий, они
значительно варьируют в зависимости от степени сложности или трудности конкретных
заданий для испытуемого.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147