ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ
скорость. Чем больше индивидуальные
различия в тестовых результатах зависят от скорости выполнения, тем
более завышенными оказываются коэффициенты надежности, опреде-
ленные этими методами. Это видно из следующего контрастного приме-
ра. Пусть некий тест, состоящий из 50 заданий, является чисто ско-
ростным тестом, т.е. индивидуальные различия в результатах опреде-
ляются лишь числом выполненных заданий, а не числом ошибок. Тогда
испытуемый А, набравший 44 очка, очевидно, получит по 22 очка за
четные и за нечетные задания. Точно так же испытуемый В, показавший
результат 34, справится с 17 четными и 17 нечетными заданиями. Следо-
вательно, если не считать нескольких случайных ошибок, допущенных по
небрежности, корреляция между четными и нечетными заданиями будет
полной, т.е. равна 1. Но такая корреляция, однако, явно завышена и не
дает никакой информации о надежности теста.
Проверка процедур, используемых при определении надежности ме-
тодом расщепления и по формуле Кьюдера-Ричардсона, показала, что
обе они основаны на согласованности числа ошибок. Если же различия
индивидуальных тестовых результатов определяются не ошибками,
а скоростью, то и мера их надежности должна, очевидно, основываться
на согласованности заданий на скорость. Когда же выполнение теста за-
nwru-г пгтнпнпомйннп пт скоппсти и возможностей выполнения, то коэ(Ь-
116 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
вления теста, окажутся ниже 1,00, но все еще будут завышенными. Такие
коэффициенты надежности не поддаются адекватной интерпретации, по-
скольку на индивидуальные различия в тестовых результатах заметное
влияние оказывает скорость выполнения заданий.
Какие же процедуры определения надежности пригодны для тестов
с выраженным скоростным компонентом? Такими процедурами могли
бы быть метод ретеста (если его удается применить) и метод взаимоза-
меняемых форм. Можно воспользоваться и методом расщепления при
условии, что задания теста расчленяются по временным характеристи-
кам, а не по порядковым номерам. Иными словами, сравниваемые ре-
зультаты должны быть получены временным разделением частей теста.
Одним из способов такого разделения является применение двух эквива-
лентных частей теста с разделенным временным ограничением. Напри-
мер, четные и нечетные задания распечатываются на разных листах, и по
каждому набору заданий устанавливается временной лимит, равный по-
ловине лимита для всего теста. Такая процедура равносильна проведе-
нию следующих друг за другом двух эквивалентных форм теста. Каждая
форма, однако, вдвое короче целого теста, тогда как результаты испы-
туемого определяются по всему тесту. Поэтому необходимо воспользо-
ваться формулой Спирмана-Брауна или какой-либо другой формулой
этого типа для определения надежности всего теста.
Если раздельное применение двух половин теста недопустимо, то
вместо него можно воспользоваться разделением полного времени теста
на четыре части с регистрацией результатов отдельно для каждой че-
тверти. Это легко осуществить, прося испытуемого по сигналу экспери-
ментатора отметить крестиком выполняемое в этот момент задание.
Число заданий, выполненных за первую и четвертую части полного вре-
менного лимита, составит результат по одной из сравниваемых половин
теста. Показатель другой половины теста будет равен числу заданий,
с которыми испытуемый справился за вторую и третью четверти. Такая
комбинация четвертей способствует нейтрализации кумулятивных эффек-
тов тренировки, утомления и других факторов. Этот метод лучше всего
подходит для тестов, задания которых не особенно отличаются друг от
друга по степени трудности.
В каких случаях временной компонент следует считать суще-
ственным? При каких условиях нужно соблюдать рассмотренные выше
меры предосторожности? Очевидно, само по себе использование лими-
тов времени еще не означает, что мы имеем дело с тестом на скорость.
Если все испытуемые укладываются в отведенное время, то скорость ра-
боты не сказывается на показателях. В качестве приблизительной меры
существенности скоростного компонента, казалось бы, можно взять про-
цент испытуемых, не успевающих закончить тест. Однако даже если ник-
то не укладывается в отведенные временные рамки, скорость выполне-
ния может оказаться тут ни при чем. Например, если все испытуемые
выполнят 40 заданий из 50, то индивидуальные различия в скорости от-
сутствуют, хотя никто не успевает выполнить весь тест.
Существенным здесь оказывается следующий вопрос: <В какой сте-
пени индивидуальные различия в тестовых результатах определяются
скоростью?> Или более специальным языком: <Какую долю в суммар-
ной дисперсии тестовых показателей составляет дисперсия скорости?>
Эту долю можно приблизительно оценить, определяя диспеосию числа
117
НАДЕЖНОСТЬ
Таблица II
Коэффициенты надежности четырех тестов элемен-
тарных умственных способностей для детей 11-17
лет (1-е издание) (A. Anastasi, J. Drake, 1954)
дисперсию тестовых результатов (ст/ст). Для только что приводившего-
ся примера, когда все испытуемые выполнили 40 заданий, числитель
этой дроби равен нулю, поскольку отсутствуют индивидуальные разли-
чия в числе выполненных заданий (с = 0). Таким образом, в тесте воз-
можностей данный индекс будет равен нулю. Напротив, если суммарная
дисперсия теста (of) определяется индивидуальными различиями в ско-
рости, то обе дисперсии будут равны и их отношение обратится в 1. Для
определения этого отношения разработано несколько более совер-
шенных процедур, но их детальное обсуждение выходит за рамки на-
стоящей книги (L.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171
различия в тестовых результатах зависят от скорости выполнения, тем
более завышенными оказываются коэффициенты надежности, опреде-
ленные этими методами. Это видно из следующего контрастного приме-
ра. Пусть некий тест, состоящий из 50 заданий, является чисто ско-
ростным тестом, т.е. индивидуальные различия в результатах опреде-
ляются лишь числом выполненных заданий, а не числом ошибок. Тогда
испытуемый А, набравший 44 очка, очевидно, получит по 22 очка за
четные и за нечетные задания. Точно так же испытуемый В, показавший
результат 34, справится с 17 четными и 17 нечетными заданиями. Следо-
вательно, если не считать нескольких случайных ошибок, допущенных по
небрежности, корреляция между четными и нечетными заданиями будет
полной, т.е. равна 1. Но такая корреляция, однако, явно завышена и не
дает никакой информации о надежности теста.
Проверка процедур, используемых при определении надежности ме-
тодом расщепления и по формуле Кьюдера-Ричардсона, показала, что
обе они основаны на согласованности числа ошибок. Если же различия
индивидуальных тестовых результатов определяются не ошибками,
а скоростью, то и мера их надежности должна, очевидно, основываться
на согласованности заданий на скорость. Когда же выполнение теста за-
nwru-г пгтнпнпомйннп пт скоппсти и возможностей выполнения, то коэ(Ь-
116 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
вления теста, окажутся ниже 1,00, но все еще будут завышенными. Такие
коэффициенты надежности не поддаются адекватной интерпретации, по-
скольку на индивидуальные различия в тестовых результатах заметное
влияние оказывает скорость выполнения заданий.
Какие же процедуры определения надежности пригодны для тестов
с выраженным скоростным компонентом? Такими процедурами могли
бы быть метод ретеста (если его удается применить) и метод взаимоза-
меняемых форм. Можно воспользоваться и методом расщепления при
условии, что задания теста расчленяются по временным характеристи-
кам, а не по порядковым номерам. Иными словами, сравниваемые ре-
зультаты должны быть получены временным разделением частей теста.
Одним из способов такого разделения является применение двух эквива-
лентных частей теста с разделенным временным ограничением. Напри-
мер, четные и нечетные задания распечатываются на разных листах, и по
каждому набору заданий устанавливается временной лимит, равный по-
ловине лимита для всего теста. Такая процедура равносильна проведе-
нию следующих друг за другом двух эквивалентных форм теста. Каждая
форма, однако, вдвое короче целого теста, тогда как результаты испы-
туемого определяются по всему тесту. Поэтому необходимо воспользо-
ваться формулой Спирмана-Брауна или какой-либо другой формулой
этого типа для определения надежности всего теста.
Если раздельное применение двух половин теста недопустимо, то
вместо него можно воспользоваться разделением полного времени теста
на четыре части с регистрацией результатов отдельно для каждой че-
тверти. Это легко осуществить, прося испытуемого по сигналу экспери-
ментатора отметить крестиком выполняемое в этот момент задание.
Число заданий, выполненных за первую и четвертую части полного вре-
менного лимита, составит результат по одной из сравниваемых половин
теста. Показатель другой половины теста будет равен числу заданий,
с которыми испытуемый справился за вторую и третью четверти. Такая
комбинация четвертей способствует нейтрализации кумулятивных эффек-
тов тренировки, утомления и других факторов. Этот метод лучше всего
подходит для тестов, задания которых не особенно отличаются друг от
друга по степени трудности.
В каких случаях временной компонент следует считать суще-
ственным? При каких условиях нужно соблюдать рассмотренные выше
меры предосторожности? Очевидно, само по себе использование лими-
тов времени еще не означает, что мы имеем дело с тестом на скорость.
Если все испытуемые укладываются в отведенное время, то скорость ра-
боты не сказывается на показателях. В качестве приблизительной меры
существенности скоростного компонента, казалось бы, можно взять про-
цент испытуемых, не успевающих закончить тест. Однако даже если ник-
то не укладывается в отведенные временные рамки, скорость выполне-
ния может оказаться тут ни при чем. Например, если все испытуемые
выполнят 40 заданий из 50, то индивидуальные различия в скорости от-
сутствуют, хотя никто не успевает выполнить весь тест.
Существенным здесь оказывается следующий вопрос: <В какой сте-
пени индивидуальные различия в тестовых результатах определяются
скоростью?> Или более специальным языком: <Какую долю в суммар-
ной дисперсии тестовых показателей составляет дисперсия скорости?>
Эту долю можно приблизительно оценить, определяя диспеосию числа
117
НАДЕЖНОСТЬ
Таблица II
Коэффициенты надежности четырех тестов элемен-
тарных умственных способностей для детей 11-17
лет (1-е издание) (A. Anastasi, J. Drake, 1954)
дисперсию тестовых результатов (ст/ст). Для только что приводившего-
ся примера, когда все испытуемые выполнили 40 заданий, числитель
этой дроби равен нулю, поскольку отсутствуют индивидуальные разли-
чия в числе выполненных заданий (с = 0). Таким образом, в тесте воз-
можностей данный индекс будет равен нулю. Напротив, если суммарная
дисперсия теста (of) определяется индивидуальными различиями в ско-
рости, то обе дисперсии будут равны и их отношение обратится в 1. Для
определения этого отношения разработано несколько более совер-
шенных процедур, но их детальное обсуждение выходит за рамки на-
стоящей книги (L.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171