ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ
Следуя этой логике, X. Галликсен (Н. Gulliksen, 1950b, р. 17-20)
предложил использовать стандартную ошибку измерения для того,
чтобы по результату теста определять <разумные пределы> истинного
показателя. Подобные <разумные пределы> принято называть в психоло-
гическом тестировании и в данной книге тоже интерпретацией ошибки
измерения.
Очевидно, что стандартная ошибка измерения и коэффициент надеж-
ности-это взаимозаменяемые способы выражения надежности теста.
В отличие от коэффициента надежности ошибка измерения не зависит от
разнородности группы, на которой она была определена. Будучи выра-
жена в индивидуальных результатах, она остается неизменной, независи-
мо от того, определена ли она на однородной или гетерогенной группе.
Вместе с тем приводимая в единицах показателя ошибка измерения бу-
дет несравнимой для различных тестов. Проблема сравнимости для
ошибки измерения возникает, когда она выражена в таких единицах, как
число арифметических задач, количество слов словарного теста и т.п.
Следовательно, если хотят сравнить надежность различных тестов, луч-
ше пользоваться коэффициентом надежности. Интерпретации же индиви-
дуальных результатов более соответствует стандартная ошибка измере-
ния.
Интерпретация различий между индивидуальными ре-
зультатами. Особенно важно рассмотреть надежность теста и ошибку
измерения применительно к оценке различий между двумя результатами.
Представление результатов теста в виде интервалов значений предотвра-
щает акцентирование внимания на незначительной разнице в результа-
тах, что нежелательно как при сравнении показателей теста у различных
испытуемых, так и при сравнении показателей различных способностей
одного испытуемого. Изменения результатов вследствие обучения или
других причин экспериментального воздействия также необходимо ин-
терпретировать с учетом ошибки измерения.
Часто возникает вопрос об относительном положении показателей
индивида в различных сферах деятельности. Действительно ли у Джейн
вербальные способности более выражены, чем математические? Есть ли
основания считать, что Том обладает большими данными в сфере техни-
ки, нежели в работе со словом? Если в батарее тестов различных способ-
ностей Джейн получила более высокий показатель по вербальному, чем
OT>TJTTr.CT ЛЛUtяa\ЛЛ Tf>Y-
122 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
утверждать, что они могли бы иметь те же показатели при повторном
тестировании с другой формой батареи? Иными словами, были ли полу-
ченные различия в показателях просто результатом случайного отбора
конкретных заданий в данных субтестах-вербальном, математическом
и механическом?
В связи с растущим интересом к интерпретации профилей показате-
лей издатели тестов разработали формы представления данных, позво-
ляющие оценивать показатели в соответствии с ошибками измерения.
На рис. 13 в качестве примера воспроизведена форма регистрации инди-
видуальных показателей, используемая в тестах различных способностей.
На приведенной форме процентильные показатели по каждому субтесту
батареи изображаются в виде полос длиной в один дюйм, центры ко-
торых находятся против соответствующих процентилей испытуемого.
Каждая такая процентильная полоса соответствует расстоянию приблизи-
тельно 1,5-2 стандартные ошибки по обе стороны от полученного пока-
зателя. Следовательно, предположение, что истинный показатель инди-
вида лежит внутри такой полосы, верно приблизительно в 90Їо случаев.
При интерпретации профилей пользователю теста рекомендуется не при-
давать значения различиям между показателями, чьи процентильные по-
лосы перекрывают друг друга, особенно если перекрытие превышает по-
ловину их длины. В профиле, приведенном на рис. 13, например,
различие между показателями словесного рассуждения и способности
к действию с числами, по-видимому, отражает подлинную разницу
в уровне способности, чего нельзя сказать о различии между технически-
ми рассуждениями и пространственными представлениями. Различие же
между абстрактными и техническими рассуждениями остается неясным.
Следует помнить, что стандартная ошибка различий двух показате-
лей больше, чем ошибка измерения каждого из них в отдельности. Это
вытекает из того, что на это различие влияют случайные ошибки измере-
ния обоих показателей. Зная величины стандартных ошибок для каждого
из двух результатов теста, стандартную ошибку разности различий мож-
но вычислить по следующей формуле:
= 1/1 + 2.
где стд-стандартная ошибка различий двух результатов, а с и
ст"2 -стандартные ошибки измерения каждого результата. Подставляя
<71/1- rii на место (71 и ст]/1-Гц на место (72, можно выразить о а
через коэффициенты надежности:
= ст/2- ri, - г" .
Здеську предполагается, что их показатели при сравнении были переведены
в одну и ту же шкалу.
Проиллюстрируем приведенную выше процедуру на примере вер-
бального IQ и IQ шкалы действия интеллекта взрослых Векслера. Най-
" Поскольку коэффициент надежности (и, следовательно, ет") несколько меняется
в зависимости от субтеста, класса и пола, действительные диапазоны дюймовых полос на
123
НАДЕЖНОСТЬ
денные методом расщепления коэффициенты надежности этих показате-
лей равны соответственно 0,96 и 0,93. Для этой шкалы стандартный IQ
имеет М -- 100 и о = 15. Таким образом, стандартная ошибка различия
двух результатов может быть найдена следующим образом:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171
предложил использовать стандартную ошибку измерения для того,
чтобы по результату теста определять <разумные пределы> истинного
показателя. Подобные <разумные пределы> принято называть в психоло-
гическом тестировании и в данной книге тоже интерпретацией ошибки
измерения.
Очевидно, что стандартная ошибка измерения и коэффициент надеж-
ности-это взаимозаменяемые способы выражения надежности теста.
В отличие от коэффициента надежности ошибка измерения не зависит от
разнородности группы, на которой она была определена. Будучи выра-
жена в индивидуальных результатах, она остается неизменной, независи-
мо от того, определена ли она на однородной или гетерогенной группе.
Вместе с тем приводимая в единицах показателя ошибка измерения бу-
дет несравнимой для различных тестов. Проблема сравнимости для
ошибки измерения возникает, когда она выражена в таких единицах, как
число арифметических задач, количество слов словарного теста и т.п.
Следовательно, если хотят сравнить надежность различных тестов, луч-
ше пользоваться коэффициентом надежности. Интерпретации же индиви-
дуальных результатов более соответствует стандартная ошибка измере-
ния.
Интерпретация различий между индивидуальными ре-
зультатами. Особенно важно рассмотреть надежность теста и ошибку
измерения применительно к оценке различий между двумя результатами.
Представление результатов теста в виде интервалов значений предотвра-
щает акцентирование внимания на незначительной разнице в результа-
тах, что нежелательно как при сравнении показателей теста у различных
испытуемых, так и при сравнении показателей различных способностей
одного испытуемого. Изменения результатов вследствие обучения или
других причин экспериментального воздействия также необходимо ин-
терпретировать с учетом ошибки измерения.
Часто возникает вопрос об относительном положении показателей
индивида в различных сферах деятельности. Действительно ли у Джейн
вербальные способности более выражены, чем математические? Есть ли
основания считать, что Том обладает большими данными в сфере техни-
ки, нежели в работе со словом? Если в батарее тестов различных способ-
ностей Джейн получила более высокий показатель по вербальному, чем
OT>TJTTr.CT ЛЛUtяa\ЛЛ Tf>Y-
122 ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
утверждать, что они могли бы иметь те же показатели при повторном
тестировании с другой формой батареи? Иными словами, были ли полу-
ченные различия в показателях просто результатом случайного отбора
конкретных заданий в данных субтестах-вербальном, математическом
и механическом?
В связи с растущим интересом к интерпретации профилей показате-
лей издатели тестов разработали формы представления данных, позво-
ляющие оценивать показатели в соответствии с ошибками измерения.
На рис. 13 в качестве примера воспроизведена форма регистрации инди-
видуальных показателей, используемая в тестах различных способностей.
На приведенной форме процентильные показатели по каждому субтесту
батареи изображаются в виде полос длиной в один дюйм, центры ко-
торых находятся против соответствующих процентилей испытуемого.
Каждая такая процентильная полоса соответствует расстоянию приблизи-
тельно 1,5-2 стандартные ошибки по обе стороны от полученного пока-
зателя. Следовательно, предположение, что истинный показатель инди-
вида лежит внутри такой полосы, верно приблизительно в 90Їо случаев.
При интерпретации профилей пользователю теста рекомендуется не при-
давать значения различиям между показателями, чьи процентильные по-
лосы перекрывают друг друга, особенно если перекрытие превышает по-
ловину их длины. В профиле, приведенном на рис. 13, например,
различие между показателями словесного рассуждения и способности
к действию с числами, по-видимому, отражает подлинную разницу
в уровне способности, чего нельзя сказать о различии между технически-
ми рассуждениями и пространственными представлениями. Различие же
между абстрактными и техническими рассуждениями остается неясным.
Следует помнить, что стандартная ошибка различий двух показате-
лей больше, чем ошибка измерения каждого из них в отдельности. Это
вытекает из того, что на это различие влияют случайные ошибки измере-
ния обоих показателей. Зная величины стандартных ошибок для каждого
из двух результатов теста, стандартную ошибку разности различий мож-
но вычислить по следующей формуле:
= 1/1 + 2.
где стд-стандартная ошибка различий двух результатов, а с и
ст"2 -стандартные ошибки измерения каждого результата. Подставляя
<71/1- rii на место (71 и ст]/1-Гц на место (72, можно выразить о а
через коэффициенты надежности:
= ст/2- ri, - г" .
Здесь
в одну и ту же шкалу.
Проиллюстрируем приведенную выше процедуру на примере вер-
бального IQ и IQ шкалы действия интеллекта взрослых Векслера. Най-
" Поскольку коэффициент надежности (и, следовательно, ет") несколько меняется
в зависимости от субтеста, класса и пола, действительные диапазоны дюймовых полос на
123
НАДЕЖНОСТЬ
денные методом расщепления коэффициенты надежности этих показате-
лей равны соответственно 0,96 и 0,93. Для этой шкалы стандартный IQ
имеет М -- 100 и о = 15. Таким образом, стандартная ошибка различия
двух результатов может быть найдена следующим образом:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171