При использовании интервальных шкал (см. Шкалы
измерительные} применяется коэффициент корреляции произведения моментов Пирсона
(см. Корреляционный анализ). Для шкал порядка в качестве меры устойчивости к
перетестированию может быть использован коэффи-
------------------- НАД
циент ранговой корреляции Спирмена или Кэндалла (см. Корреляция ранговая).
При характеристике Н. р. особое значение имеет временной интервал между первым и
вторым обследованиями. С его увеличением показатели корреляции имеют тенденцию к
снижению, существенно повышается вероятность воздействия посторонних факторов -
могут наступить закономерные возрастные изменения измеряемых тестом свойств,
произойти различные события, влияющие на состояние и особенности развития
исследуемых качеств. По этой причине при определении Н. р. стараются выбирать
непродолжительные временные интервалы (до нескольких месяцев), а при обследовании
детей младшего возраста эти интервалы должны быть еще меньше, поскольку возрастные
изменения и развитие в этом случае происходят еще быстрее.
Несмотря на указанную тенденцию, при получении характеристик теста проводятся
повторные испытания и с длительным временным промежутком. Иногда они
осуществляются в целях оценки валидности прогностической, элементов валидности
конструктной, связанных с дифференциацией по возрастному критерию и др. Определение
же Н. р. главным образом ограничивается анализом краткосрочных случайных изменений,
характеризующих тест как измерительную процедуру, а не его отношение к исследуемой
области поведения.
Наряду с очевидной простотой Н. р. как метод определения надежности обладает
существенными недостатками. Так, при повторном применении одних и тех же заданий,
особенно при относительно непродолжительном временном интервале между
обследованиями, у испытуемых может сформироваться навык работы с данной
психодиагностической методикой, что приводит к улучшению индивидуальных результатов,
хотя и не одинаково вы-
НАД
раженному у разных лиц. Это неизбежно ведет к заметной перестановке ранговых мест
отдельных испытуемых в данной выборке и, соответственно, ухудшению коэффициента
надежности. Еще более заметное воздействие на результаты анализа надежности
оказывает запоминание испытуемыми отдельных решений, воспроизведение в повторном
обследовании предыдущей картины правильных и неправильных решений. В этом случае
результаты двух предъявлений теста не будут независимыми и корреляция между ними
окажется завышенной.
Один из путей устранения влияния тренировки на результаты оценки Н. р. -
формирование устойчивого навыка в работе с соответствующей методикой перед
проведением тест-ретеста. Однако количество повторений теста при этом неизбежно
возрастает, что приводит к увеличению числа запомнившихся решений. Такой прием
может быть рекомендован для методик типа тестов скорости, содержащих большое
количество элементов тестового материала.
Для других методик, очевидно, единственным приемлемым путем снижения влияния
тренировки остается увеличение интервала ретеста, что, однако, как уже говорилось выше,
вступает в противоречие с определением надежности как характеристики теста.
Для большинства тестов общих способностей характерно улучшение показателей Н. р. с
возрастом испытуемых за счет лучшего контроля условий их выполнения. Другим
фактором увеличения расчетных показателей Н. р. является относительное замедление с
возрастом темпа психического развития в области тех характеристик, которые могут стать
объектом измерения или влиять на результат теста. Благодаря этому, спустя время, со-
ставляющее интервал ретеста, случайные колебания результатов обследования ста-
новятся менее выраженными. Это искусственно завышает показатели Н. р. Эта
закономерность требует отдельных измерений Н. р. в разных возрастных контин-гентах
испытуемых, что особенно существенно для методик, предназначенных для обследования
в широком возрастном диапазоне (см. Станфорд-Бине умственного развития шкала,
Векслера интеллекта измерения шкалы.}.
Указанные особенности и недостатки метода определения надежности путем ретеста
делают его пригодным лишь для ограниченного числа методик, допускающих многократное
повторное обследование. К их числу относятся сенсомоторные пробы, тесты скорости и
ряд других методик, отличающихся большим количеством пунктов (см. Миннесотский
многоаспектный личностный опросник).
НАДЕЖНОСТЬ ФАКТОРНО-ДИСПЕРСИОННАЯ - способ определения надежности,
основанный на дисперсионном анализе результатов теста. Надежность теста
соответствует отношению истинной дисперсии (т. е. дисперсии самого исследуемого
фактора) к реально полученной эмпирической дисперсии. Последняя складывается из
истинной дисперсии и дисперсии погрешности измерения (см. Ошибка измерения). Фак-
торно-аналитический подход к определению надежности дополнительно расчленяет и
дисперсию истинного показателя (Дж. Гилфорд,1956).
Дисперсия истинного показателя, в свою очередь, может состоять из дисперсии общего
фактора для групп аналогичных тестов (см. Фактор G), особых факторов. обеспечивающих
тесты специфической направленности (см. Факторы групповые) и дисперсии факторов,
присущих конкретной тестовой методике. Следовательно, полная дисперсия теста равна
сумме дисперсий для общих, специфи-
НАД
ческих и единичных факторов плюс дисперсия погрешности:
о, - а-
О +...G-+0:
где ст7 - дисперсия теста, Од - сг,, - дисперсия общих, групповых и единичных факторов,
ст - дисперсия погрешности. Разделив уравнение на ет2;, получим:
ЇL ст;
t ~ i v t i чго может быть записано в виде:
1 = а2 + Ь\ +
2 2
+ п,. + т,
где а~у - доля дисперсии, выраженная общим фактором а, и т. д.
Таким образом, коэффициент надежности теста равен:
/-,=1 -=+++4
Факторно-дисперсионный способ определения надежности подходит для оценки уже
факторизованного теста (см. Факторно-аналитический принцип), но не для тестов,
измеряющих широкий набор разнообразных параметров.так как некоторые из них могут не
входить в установленную область валидности методики.
НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА-
характеристика надежности психодиагностической методики,получаемая путем анализа
устойчивости результатов отдельных совокупностей тестовых задач или единичных
пунктов (заданий) теста.
Наиболее простым и распространенным способом определения Н.ч.т. является метод
расщепления, суть которого заключается в выполнении испытуемым заданий двух
равноценных частей теста. "основанием метода является вывод о м, что при
нормальном или близком к ""рмальному распределении оценок по полному тесту (см.
Нормальное распре-вление) выполнение любого случайного
набора из частей теста даст аналогичное распределение (при условии, что части
однородны по характеру заданий по отношению к тесту в целом).
Для оценки надежности методом расщепления выбирают две эквивалентные по характеру
и степени трудности группы задач (см. Внутренняя согласованность, Трудность заданий
теста). Разделение объема заданий теста на сопоставимые части достигается:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147
измерительные} применяется коэффициент корреляции произведения моментов Пирсона
(см. Корреляционный анализ). Для шкал порядка в качестве меры устойчивости к
перетестированию может быть использован коэффи-
------------------- НАД
циент ранговой корреляции Спирмена или Кэндалла (см. Корреляция ранговая).
При характеристике Н. р. особое значение имеет временной интервал между первым и
вторым обследованиями. С его увеличением показатели корреляции имеют тенденцию к
снижению, существенно повышается вероятность воздействия посторонних факторов -
могут наступить закономерные возрастные изменения измеряемых тестом свойств,
произойти различные события, влияющие на состояние и особенности развития
исследуемых качеств. По этой причине при определении Н. р. стараются выбирать
непродолжительные временные интервалы (до нескольких месяцев), а при обследовании
детей младшего возраста эти интервалы должны быть еще меньше, поскольку возрастные
изменения и развитие в этом случае происходят еще быстрее.
Несмотря на указанную тенденцию, при получении характеристик теста проводятся
повторные испытания и с длительным временным промежутком. Иногда они
осуществляются в целях оценки валидности прогностической, элементов валидности
конструктной, связанных с дифференциацией по возрастному критерию и др. Определение
же Н. р. главным образом ограничивается анализом краткосрочных случайных изменений,
характеризующих тест как измерительную процедуру, а не его отношение к исследуемой
области поведения.
Наряду с очевидной простотой Н. р. как метод определения надежности обладает
существенными недостатками. Так, при повторном применении одних и тех же заданий,
особенно при относительно непродолжительном временном интервале между
обследованиями, у испытуемых может сформироваться навык работы с данной
психодиагностической методикой, что приводит к улучшению индивидуальных результатов,
хотя и не одинаково вы-
НАД
раженному у разных лиц. Это неизбежно ведет к заметной перестановке ранговых мест
отдельных испытуемых в данной выборке и, соответственно, ухудшению коэффициента
надежности. Еще более заметное воздействие на результаты анализа надежности
оказывает запоминание испытуемыми отдельных решений, воспроизведение в повторном
обследовании предыдущей картины правильных и неправильных решений. В этом случае
результаты двух предъявлений теста не будут независимыми и корреляция между ними
окажется завышенной.
Один из путей устранения влияния тренировки на результаты оценки Н. р. -
формирование устойчивого навыка в работе с соответствующей методикой перед
проведением тест-ретеста. Однако количество повторений теста при этом неизбежно
возрастает, что приводит к увеличению числа запомнившихся решений. Такой прием
может быть рекомендован для методик типа тестов скорости, содержащих большое
количество элементов тестового материала.
Для других методик, очевидно, единственным приемлемым путем снижения влияния
тренировки остается увеличение интервала ретеста, что, однако, как уже говорилось выше,
вступает в противоречие с определением надежности как характеристики теста.
Для большинства тестов общих способностей характерно улучшение показателей Н. р. с
возрастом испытуемых за счет лучшего контроля условий их выполнения. Другим
фактором увеличения расчетных показателей Н. р. является относительное замедление с
возрастом темпа психического развития в области тех характеристик, которые могут стать
объектом измерения или влиять на результат теста. Благодаря этому, спустя время, со-
ставляющее интервал ретеста, случайные колебания результатов обследования ста-
новятся менее выраженными. Это искусственно завышает показатели Н. р. Эта
закономерность требует отдельных измерений Н. р. в разных возрастных контин-гентах
испытуемых, что особенно существенно для методик, предназначенных для обследования
в широком возрастном диапазоне (см. Станфорд-Бине умственного развития шкала,
Векслера интеллекта измерения шкалы.}.
Указанные особенности и недостатки метода определения надежности путем ретеста
делают его пригодным лишь для ограниченного числа методик, допускающих многократное
повторное обследование. К их числу относятся сенсомоторные пробы, тесты скорости и
ряд других методик, отличающихся большим количеством пунктов (см. Миннесотский
многоаспектный личностный опросник).
НАДЕЖНОСТЬ ФАКТОРНО-ДИСПЕРСИОННАЯ - способ определения надежности,
основанный на дисперсионном анализе результатов теста. Надежность теста
соответствует отношению истинной дисперсии (т. е. дисперсии самого исследуемого
фактора) к реально полученной эмпирической дисперсии. Последняя складывается из
истинной дисперсии и дисперсии погрешности измерения (см. Ошибка измерения). Фак-
торно-аналитический подход к определению надежности дополнительно расчленяет и
дисперсию истинного показателя (Дж. Гилфорд,1956).
Дисперсия истинного показателя, в свою очередь, может состоять из дисперсии общего
фактора для групп аналогичных тестов (см. Фактор G), особых факторов. обеспечивающих
тесты специфической направленности (см. Факторы групповые) и дисперсии факторов,
присущих конкретной тестовой методике. Следовательно, полная дисперсия теста равна
сумме дисперсий для общих, специфи-
НАД
ческих и единичных факторов плюс дисперсия погрешности:
о, - а-
О +...G-+0:
где ст7 - дисперсия теста, Од - сг,, - дисперсия общих, групповых и единичных факторов,
ст - дисперсия погрешности. Разделив уравнение на ет2;, получим:
ЇL ст;
t ~ i v t i чго может быть записано в виде:
1 = а2 + Ь\ +
2 2
+ п,. + т,
где а~у - доля дисперсии, выраженная общим фактором а, и т. д.
Таким образом, коэффициент надежности теста равен:
/-,=1 -=+++4
Факторно-дисперсионный способ определения надежности подходит для оценки уже
факторизованного теста (см. Факторно-аналитический принцип), но не для тестов,
измеряющих широкий набор разнообразных параметров.так как некоторые из них могут не
входить в установленную область валидности методики.
НАДЕЖНОСТЬ ЧАСТЕЙ ТЕСТА-
характеристика надежности психодиагностической методики,получаемая путем анализа
устойчивости результатов отдельных совокупностей тестовых задач или единичных
пунктов (заданий) теста.
Наиболее простым и распространенным способом определения Н.ч.т. является метод
расщепления, суть которого заключается в выполнении испытуемым заданий двух
равноценных частей теста. "основанием метода является вывод о м, что при
нормальном или близком к ""рмальному распределении оценок по полному тесту (см.
Нормальное распре-вление) выполнение любого случайного
набора из частей теста даст аналогичное распределение (при условии, что части
однородны по характеру заданий по отношению к тесту в целом).
Для оценки надежности методом расщепления выбирают две эквивалентные по характеру
и степени трудности группы задач (см. Внутренняя согласованность, Трудность заданий
теста). Разделение объема заданий теста на сопоставимые части достигается:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147