3)
( 1 ) Для каждого испытуемого вычислите его показатель по первой
половине теста: Х.
(2) Для каждого испытуемого вычислите его показатель по второй
половине теста: Y.
(3) Вычислите корреляцию между Х и Y .
ПРИМЕЧАНИЕ. Корреляция между Х и Y вычисляется по формуле:
2ху-(2х)(2г)
" Nx-xf V/2y"-(Sy)
где N - количество испытуемых, Х - показатели по тесту 1, Y - показатели по
тесту 2.
(4) Пересчитайте результирующую корреляцию, значение на-
дежности, в зависимости от величины частей теста по формуле Спир-
мена-Брауна (1.6):
2 ry
"J , - __________________У
kk - ] _i_ -
I i Гху
Это дает нам значение надежности при расщеплении теста попо-
лам (скорректированное по величине полученных частей теста).
ПРОЦЕДУРЫ ВЫЧИСЛЕНИЯ НАДЕЖНОСТИ ПРИ РАСЩЕ-
ПЛЕНИИ ТЕСТА ПОПОЛАМ. НАДЕЖНОСТЬ ДЛЯ ЧЕТНЫХ-
НЕЧЕТНЫХ ЗАДАНИЙ (ВЫЧИСЛЕНИЕ 5.4)
( 1 ) Для каждого испытуемого вычислите его показатель по зада-
ниям теста с четными номерами: Х .
(2) Для каждого испытуемого вычислите его показатель по зада-
ниям теста с нечетными номерами: Y.
(3) Вычислите корреляцию между Х и Y .
(4) Пересчитайте результирующую корреляцию, значение на-
дежности в зависимости от величины частей теста по формуле Спир-
мена-Брауна (1.6):
2rxy
Это дает нам значение надежности при расщеплении теста попо-
лам (скорректированное по величине полученных частей теста).
174
Метод дисперсионного анализа по Хойту
Hoyt (1941) использовал для оценки надежности дисперсионный
анализ. Как указывает Guilford (1956), Хойт рассматривает ответы
на задания как двухфакторный анализ дисперсии без репликации.
Гилфорд утверждает, что алгебраически это идентично формуле
K-R20. Следовательно, это означает, что такой метод идентичен
также применению коэффициента о. (частным случаем которого яв-
ляется формула K-R20). Метод дисперсионного анализа Хойта заслу-
живает рассмотрения как альтернативный для коэффициента О., если
важна простота вычислений.
ФОРМУЛА ХОЙТА
rft = 1
Ve-Vr
Ve
где Vr - это дисперсия остатка от суммы квадратов, а Ve - это
дисперсия для испытуемых.
ФОРМУЛА ДЛЯ СУММЫ КВАДРАТОВ
( 1 ) Сумма квадратов для испытуемых равна:
Su=
Xt
Xt)
nN
где Xt - общий показатель для каждого испытуемого, п - коли-
чество заданий теста, N - количество испытуемых.
(2) Сумма квадратов для заданий равна:
S )2
di
nN
где R{ - количество правильных ответов для задания i.
(3) Общая сумма квадратов:
у2 _ (Ri) (s Wi)
- )+\i)
где Wi - количество неправильных ответов на задание / .
(4) Остаток суммы квадратов S Хг равен (3) - (1) - (2).
СТЕПЕНИ СВОБОДЫ
Количество испытуемых N - 1 , количество заданий п - 1 ,
остаток Nn -N- п+1. Дисперсии равны суммам квадратов,
деленным на степени свободы.
ПРОЦЕДУРЫ ВЫЧИСЛЕНИЯ ПО ФОРМУЛЕ ХОЙТА ( ВЫ-
ЧИСЛЕНИЕ 5.5)
( 1 ) Возведитв квадрат и просуммируйте показатели для каждого
испытуемого: S Xi .
(2) Разделите полученное значение на количество заданий:
S
(3) Просуммируйте эти показатели для всех испытуемых и возве-
дите общую сумму в квадрат: (S Х() .
(4) Перемножьте количество испытуемых и количество заданий и
разделите на это число результат п. (3):
ГУ У
nN
(5) Вычтите (4) из (2):
S
S)
nN
(6) Разделите (5) на N-1 (степени свободы для испытуемых), то
есть на количество испытуемых минус 1. Это дает нам дисперсию для
испытуемых: Vg.
Дисперсия для заданий:
(7) Вычислите количество правильных ответов для каждого зада-
ния, возведите в квадрат и просуммируйте: S Ri .
(8) Разделите полученное значение на количество испытуемых:
iRi
(9) Из (8) вычтите (4):
Z
)
nN
(10) Разделите (9) на (п-1), то есть на количество заданий
минус 1. Это дает нам дисперсию для заданий (items): Vi .
Общая сумма квадратов:
(II) Просуммируйте количество правильных ответов для всех
заданий: (S Ri).
(12) Просуммируйте количество неправильных ответов для всех
заданий: (S Щ). W: N - R,
(13) Перемножьте (11)и(12).
(14) Сложите (II) и (12).
(15) Деление (13) на (14) дает общую сумму квадратов.
Сумма квадратов для остатка:
(16) Вычтите (5) плюс (9) из (15).
Остаток дисперсии:
(17) Разделите (16) на Nn-N-п + / (степени свободы):
Ретестовая надежность
Как уже говорилось, если нам нужно удостовериться в значении
некоторого показателя, то оно должно оставаться неизменным при
измерении переменной в двух случаях (предполагая, что сама пере-
менная со временем не изменилась).
Существует два метода измерения ретестовой надежности. Пер-
вый состоит в предъявлении двух взаимозаменяемых форм данного
теста одним и тем же испытуемым. Для этого метода существует
проблема в том, что чрезвычайно трудно подобрать два набора зада-
ний, которые были бы действительно эквивалентны. В идеале, каж-
дое задание одной формы должно было бы иметь некоторый эквива-
лент в другой форме, с идентичными характеристиками задания, а
следовательно, такой же должна быть доля испытуемых из популя-
ции, дающих ключевые ответы на это задание, и аналогичными дол-
жны быть корреляция с общим показателем и содержание заданий.
Это трудно достижимо, и корреляция между параллельными форма-
ми, предъявляемыми одновременно, редко превышает 0.9, а часто
она значительно меньше, так что правомочность использования тер-
мина "параллельный" вызываетсомнения. Темне менее, чембольше
известно о том, что же измеряется, тем проще сконструировать па-
раллельные формы теста.
Обычно ретестовая надежность отделяется от надежности параллельных форм (см.
А.Анастази, 1982; Л.Ф.Бурлачук, С.М.Морозов, 1989) (Прим.ред.)
177
Второй подход заключается в том, что испытуемым предъявляется
один и тот же тест при двух тестированиях. Nunnally (1978) утверж-
дает, что недостатком этого приема является то, что испытуемые
помнят свои ответы, а в случае тестов способностей это может значи-
тельно повлиять на результаты повторного выполнения теста. Одна-
ко, если между повторными тестированиями прошло много времени,
то это влияние незначительно, а когда после первого тестирования
прошел год, то им можно смело пренебречь. Nunnally также утверж-
дает, что ретестовая корреляция в случае с одной формой теста не
удовлетворяет требованиям классической модели погрешностей из-
мерения, поскольку если бы даже между заданиями была нулевая
корреляция, ретестовая надежность может быть высокой. Это, конеч-
но же, верно, но это не означает, что не стоит вычислять ретестовую
надежность. Напротив, она дает ответ на другой вопрос. При помощи
коэффициента а. и ему подобных оценивается согласованность теста.
А ретестовая надежность связана с другой характеристикой теста: с
надежностью его работы по истечении времени. Это является в рав-
ной степени, а в некоторых случаях и более важным, чем согласован-
ность. Идеально согласованное, но дающее необъяснимые колебания
во времени средство измерения не будет полезным. С нашей точки
зрения, для каждого теста существенно, чтобы его ретестовая надеж-
ность была высокой. Если это не так, то он не будет валидным.
ВЫЧИСЛИТЕЛЬНЫЕ ПРОЦЕДУРЫ ДЛЯ РЕТЕСТОВОЙ НА-
ДЕЖНОСТИ (ВЫЧИСЛЕНИЕ 5.6)
Параллельные формы данного теста, А и Б:
(1) Вычислите корреляцию между показателями по тесту А и по
тесту Б, где тесты предъявляются в отдельных процедурах тестиро-
вания.
Ретестовая надежность:
(2) Вычислите корреляцию между показателями теста при тести-
ровании А и при тестировании Б.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88
( 1 ) Для каждого испытуемого вычислите его показатель по первой
половине теста: Х.
(2) Для каждого испытуемого вычислите его показатель по второй
половине теста: Y.
(3) Вычислите корреляцию между Х и Y .
ПРИМЕЧАНИЕ. Корреляция между Х и Y вычисляется по формуле:
2ху-(2х)(2г)
" Nx-xf V/2y"-(Sy)
где N - количество испытуемых, Х - показатели по тесту 1, Y - показатели по
тесту 2.
(4) Пересчитайте результирующую корреляцию, значение на-
дежности, в зависимости от величины частей теста по формуле Спир-
мена-Брауна (1.6):
2 ry
"J , - __________________У
kk - ] _i_ -
I i Гху
Это дает нам значение надежности при расщеплении теста попо-
лам (скорректированное по величине полученных частей теста).
ПРОЦЕДУРЫ ВЫЧИСЛЕНИЯ НАДЕЖНОСТИ ПРИ РАСЩЕ-
ПЛЕНИИ ТЕСТА ПОПОЛАМ. НАДЕЖНОСТЬ ДЛЯ ЧЕТНЫХ-
НЕЧЕТНЫХ ЗАДАНИЙ (ВЫЧИСЛЕНИЕ 5.4)
( 1 ) Для каждого испытуемого вычислите его показатель по зада-
ниям теста с четными номерами: Х .
(2) Для каждого испытуемого вычислите его показатель по зада-
ниям теста с нечетными номерами: Y.
(3) Вычислите корреляцию между Х и Y .
(4) Пересчитайте результирующую корреляцию, значение на-
дежности в зависимости от величины частей теста по формуле Спир-
мена-Брауна (1.6):
2rxy
Это дает нам значение надежности при расщеплении теста попо-
лам (скорректированное по величине полученных частей теста).
174
Метод дисперсионного анализа по Хойту
Hoyt (1941) использовал для оценки надежности дисперсионный
анализ. Как указывает Guilford (1956), Хойт рассматривает ответы
на задания как двухфакторный анализ дисперсии без репликации.
Гилфорд утверждает, что алгебраически это идентично формуле
K-R20. Следовательно, это означает, что такой метод идентичен
также применению коэффициента о. (частным случаем которого яв-
ляется формула K-R20). Метод дисперсионного анализа Хойта заслу-
живает рассмотрения как альтернативный для коэффициента О., если
важна простота вычислений.
ФОРМУЛА ХОЙТА
rft = 1
Ve-Vr
Ve
где Vr - это дисперсия остатка от суммы квадратов, а Ve - это
дисперсия для испытуемых.
ФОРМУЛА ДЛЯ СУММЫ КВАДРАТОВ
( 1 ) Сумма квадратов для испытуемых равна:
Su=
Xt
Xt)
nN
где Xt - общий показатель для каждого испытуемого, п - коли-
чество заданий теста, N - количество испытуемых.
(2) Сумма квадратов для заданий равна:
S )2
di
nN
где R{ - количество правильных ответов для задания i.
(3) Общая сумма квадратов:
у2 _ (Ri) (s Wi)
- )+\i)
где Wi - количество неправильных ответов на задание / .
(4) Остаток суммы квадратов S Хг равен (3) - (1) - (2).
СТЕПЕНИ СВОБОДЫ
Количество испытуемых N - 1 , количество заданий п - 1 ,
остаток Nn -N- п+1. Дисперсии равны суммам квадратов,
деленным на степени свободы.
ПРОЦЕДУРЫ ВЫЧИСЛЕНИЯ ПО ФОРМУЛЕ ХОЙТА ( ВЫ-
ЧИСЛЕНИЕ 5.5)
( 1 ) Возведитв квадрат и просуммируйте показатели для каждого
испытуемого: S Xi .
(2) Разделите полученное значение на количество заданий:
S
(3) Просуммируйте эти показатели для всех испытуемых и возве-
дите общую сумму в квадрат: (S Х() .
(4) Перемножьте количество испытуемых и количество заданий и
разделите на это число результат п. (3):
ГУ У
nN
(5) Вычтите (4) из (2):
S
S)
nN
(6) Разделите (5) на N-1 (степени свободы для испытуемых), то
есть на количество испытуемых минус 1. Это дает нам дисперсию для
испытуемых: Vg.
Дисперсия для заданий:
(7) Вычислите количество правильных ответов для каждого зада-
ния, возведите в квадрат и просуммируйте: S Ri .
(8) Разделите полученное значение на количество испытуемых:
iRi
(9) Из (8) вычтите (4):
Z
)
nN
(10) Разделите (9) на (п-1), то есть на количество заданий
минус 1. Это дает нам дисперсию для заданий (items): Vi .
Общая сумма квадратов:
(II) Просуммируйте количество правильных ответов для всех
заданий: (S Ri).
(12) Просуммируйте количество неправильных ответов для всех
заданий: (S Щ). W: N - R,
(13) Перемножьте (11)и(12).
(14) Сложите (II) и (12).
(15) Деление (13) на (14) дает общую сумму квадратов.
Сумма квадратов для остатка:
(16) Вычтите (5) плюс (9) из (15).
Остаток дисперсии:
(17) Разделите (16) на Nn-N-п + / (степени свободы):
Ретестовая надежность
Как уже говорилось, если нам нужно удостовериться в значении
некоторого показателя, то оно должно оставаться неизменным при
измерении переменной в двух случаях (предполагая, что сама пере-
менная со временем не изменилась).
Существует два метода измерения ретестовой надежности. Пер-
вый состоит в предъявлении двух взаимозаменяемых форм данного
теста одним и тем же испытуемым. Для этого метода существует
проблема в том, что чрезвычайно трудно подобрать два набора зада-
ний, которые были бы действительно эквивалентны. В идеале, каж-
дое задание одной формы должно было бы иметь некоторый эквива-
лент в другой форме, с идентичными характеристиками задания, а
следовательно, такой же должна быть доля испытуемых из популя-
ции, дающих ключевые ответы на это задание, и аналогичными дол-
жны быть корреляция с общим показателем и содержание заданий.
Это трудно достижимо, и корреляция между параллельными форма-
ми, предъявляемыми одновременно, редко превышает 0.9, а часто
она значительно меньше, так что правомочность использования тер-
мина "параллельный" вызываетсомнения. Темне менее, чембольше
известно о том, что же измеряется, тем проще сконструировать па-
раллельные формы теста.
Обычно ретестовая надежность отделяется от надежности параллельных форм (см.
А.Анастази, 1982; Л.Ф.Бурлачук, С.М.Морозов, 1989) (Прим.ред.)
177
Второй подход заключается в том, что испытуемым предъявляется
один и тот же тест при двух тестированиях. Nunnally (1978) утверж-
дает, что недостатком этого приема является то, что испытуемые
помнят свои ответы, а в случае тестов способностей это может значи-
тельно повлиять на результаты повторного выполнения теста. Одна-
ко, если между повторными тестированиями прошло много времени,
то это влияние незначительно, а когда после первого тестирования
прошел год, то им можно смело пренебречь. Nunnally также утверж-
дает, что ретестовая корреляция в случае с одной формой теста не
удовлетворяет требованиям классической модели погрешностей из-
мерения, поскольку если бы даже между заданиями была нулевая
корреляция, ретестовая надежность может быть высокой. Это, конеч-
но же, верно, но это не означает, что не стоит вычислять ретестовую
надежность. Напротив, она дает ответ на другой вопрос. При помощи
коэффициента а. и ему подобных оценивается согласованность теста.
А ретестовая надежность связана с другой характеристикой теста: с
надежностью его работы по истечении времени. Это является в рав-
ной степени, а в некоторых случаях и более важным, чем согласован-
ность. Идеально согласованное, но дающее необъяснимые колебания
во времени средство измерения не будет полезным. С нашей точки
зрения, для каждого теста существенно, чтобы его ретестовая надеж-
ность была высокой. Если это не так, то он не будет валидным.
ВЫЧИСЛИТЕЛЬНЫЕ ПРОЦЕДУРЫ ДЛЯ РЕТЕСТОВОЙ НА-
ДЕЖНОСТИ (ВЫЧИСЛЕНИЕ 5.6)
Параллельные формы данного теста, А и Б:
(1) Вычислите корреляцию между показателями по тесту А и по
тесту Б, где тесты предъявляются в отдельных процедурах тестиро-
вания.
Ретестовая надежность:
(2) Вычислите корреляцию между показателями теста при тести-
ровании А и при тестировании Б.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88