ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ
1). В главе 5 уже объяснялось, что ошибка измерения предусматривает
при интерпретации индивидуального результата конкретный способ уче-
та надежности теста.
Если две процентильные полосы частично совпадают, различия ме-
жду показателями могут игнорироваться, если не совпадают, то разли-
чия можно рассматривать как значимые. Таким образом, если два уча-
щихся получили в SCAT суммарные показатели, попадающие
в процентильные полосы 55-68 и 74-84, то можно с полной уверен-
ностью заключить, что второй действительно превосходит первого, и по-
вторное тестирование дает тот же результат. Процентильные полосы по-
могают также сравнивать относительное положение результатов одного
испытуемого по вербальной и количественной части теста. Если показа-
тели по вербальному и количественным тестам у испытуемого соответ-
ствуют процентильным полосам 66-86 и 58-78 соответственно, то можно
сказать, что значимого различия в развитии вербальных и количе-
ственных способностей у этого индивида нет, поскольку процентильные
полосы этих показателей перекрывают друг друга (рис. 43).
Выборка стандартизации-SCAT состояла из более 100000 испы-
туемых. Выборка была репрезентативной относительно среза популяции
учащихся нормальных школ от IV до XII класса и первых двух лет обу-
чения в колледже. При отборе использовалась трехступенчатая процеду-
ра, в которой критериями отбора были школьные системы (государ-
ственная и частная), школы и классы. Похожие процедуры отбора были
использованы и при выборе испытуемых из числа учащихся колледжа.
Формирование выборки стандартизации, как и другие методические при-
емы, свидетельствует о необычно высоких методических стандартах раз-
280
ТЕСТЫ ОВЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
Коэффициенты надежности для вербального, количественного и сум-
марного показателя были подсчитаны по формуле Кьюдера-Ричардсо-
на отдельно для каждой группы, представляющей определенные классы.
Полученные коэффициенты надежности оказались одинаково высокими.
По отдельным группам от IV до XIV уровня коэффициенты надежности
суммарных показателей были равны 0,90 и выше, а для вербального
и количественного показателя колебались от 0,83 до 0,91. Высокие коэф-
фициенты надежности можно объяснить тем, что в какой-то мере тест
был скоростным. Процент учащихся, выполнивших все задания, для раз-
ных классов колеблется от 65 до 96Їц в вербальных тестах и от 55 до
85Їо в количественных. При этих условиях более пригодна надежность,
определенная методом эквивалентных форм. Если коэффициенты надеж-
ности фактически завышены, то ошибки измерения недооцениваются, и,
Рис. 43. Профиль SCAT-11, представленный в виде процентильных полос.
С разрешения Службы тестирования в образовании
Вербальный Математический Суммарный
: =: =E =пчрнь высокие
Очень высокие1- -1i ~
-----90---90--90-------
Высокие111-80-B"BВысокие
BBS5E5""B
-60-55-60-
Средние1-50-11-50-11-50-Средние
1-40--40-1-40-
1-30--50-1-30-
Низкие1-20-1-20--20-Низкие
Очень низкиеr-1U-Иiu --10-Очень низкие
281 ГРУППОВОЕ ТЕСТИРОВАНИЕ
следовательно, процентильные полосы могут оказаться слишком широ-
кими.
Однако следует иметь в виду, что многие учащиеся, не ответившие
на все задания, могли отказаться от решения более трудных заданий, да-
же если у них было достаточно времени. Более того, в количественном
тесте испытуемый в поиске ответа может затратить очень много време-
ни на вычисления, тогда как простое осознание числовых отношений мо-
гло бы привести к ответу моментально. Если это так, то скорость вы-
полнения заданий должна высоко коррелировать со способностями
к количественному мышлению, которые предназначен измерить тест.
Цели, с которыми разрабатывался SCAT, предполагают, что прогно-
стическая валидность этого теста определяется прежде всего достиже-
ниями в учебе. Коэффициенты валидности, полученные для V, VIII, XI,
XII классов из школ-участниц выборки стандартизации (коэффициенты
определялись для каждой школы в отдельности и затем усреднялись,
число школ в зависимости от класса менялось от 3 до 26), колебались от
0,59 до 0,68; корреляция вербального показателя SCATc отметками по
английскому языку равнялась от 0,41 до 0,69 и количественного показа-
теля с оценками по математике составляла от 0,43 до 0,65. Поскольку
частные корреляции значительно менялись от школы к школе, в руко-
водстве к тесту дается рекомендация проводить локальную валидацию
теста.
Корреляция с тестами достижений (Последовательные тесты успехов
в образовании) обычно колеблются от 0,60 до 0,80. Количественные по-
казатели лучше коррелируют с успехами по математике, а вербальные
лучше со всеми другими предметами. Однако коэффициенты валидности
для суммарных показателей SCAT обычно столь же высоки, как и для
показателей обеих частей теста. Таким образом, эффективность вер-
бальных и количественных показателей как различных предсказателей
успеваемости в учебе остается неопределенной. В этой связи следует ска-
зать, что сами по себе показатели вербальной и количественной частей
теста коррелируют на уровне 0,70, за исключением показателей самых
младших и самых старших классов, где корреляция составляет только
0,60. Такое тесное сходство может быть следствием однотипности ис-
пользуемых в тестах заданий, требующих в основном умения выявлять
и использовать установленные отношения в абстрактном или символиче-
ском содержании. Подобно другим обсуждаемым в этой главе тестам,
SCAT предназначен прежде всего для измерения общего интеллектуаль-
ного развития и лишь во вторую очередь он может служить указателем
различий в способностях индивида.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171
при интерпретации индивидуального результата конкретный способ уче-
та надежности теста.
Если две процентильные полосы частично совпадают, различия ме-
жду показателями могут игнорироваться, если не совпадают, то разли-
чия можно рассматривать как значимые. Таким образом, если два уча-
щихся получили в SCAT суммарные показатели, попадающие
в процентильные полосы 55-68 и 74-84, то можно с полной уверен-
ностью заключить, что второй действительно превосходит первого, и по-
вторное тестирование дает тот же результат. Процентильные полосы по-
могают также сравнивать относительное положение результатов одного
испытуемого по вербальной и количественной части теста. Если показа-
тели по вербальному и количественным тестам у испытуемого соответ-
ствуют процентильным полосам 66-86 и 58-78 соответственно, то можно
сказать, что значимого различия в развитии вербальных и количе-
ственных способностей у этого индивида нет, поскольку процентильные
полосы этих показателей перекрывают друг друга (рис. 43).
Выборка стандартизации-SCAT состояла из более 100000 испы-
туемых. Выборка была репрезентативной относительно среза популяции
учащихся нормальных школ от IV до XII класса и первых двух лет обу-
чения в колледже. При отборе использовалась трехступенчатая процеду-
ра, в которой критериями отбора были школьные системы (государ-
ственная и частная), школы и классы. Похожие процедуры отбора были
использованы и при выборе испытуемых из числа учащихся колледжа.
Формирование выборки стандартизации, как и другие методические при-
емы, свидетельствует о необычно высоких методических стандартах раз-
280
ТЕСТЫ ОВЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
Коэффициенты надежности для вербального, количественного и сум-
марного показателя были подсчитаны по формуле Кьюдера-Ричардсо-
на отдельно для каждой группы, представляющей определенные классы.
Полученные коэффициенты надежности оказались одинаково высокими.
По отдельным группам от IV до XIV уровня коэффициенты надежности
суммарных показателей были равны 0,90 и выше, а для вербального
и количественного показателя колебались от 0,83 до 0,91. Высокие коэф-
фициенты надежности можно объяснить тем, что в какой-то мере тест
был скоростным. Процент учащихся, выполнивших все задания, для раз-
ных классов колеблется от 65 до 96Їц в вербальных тестах и от 55 до
85Їо в количественных. При этих условиях более пригодна надежность,
определенная методом эквивалентных форм. Если коэффициенты надеж-
ности фактически завышены, то ошибки измерения недооцениваются, и,
Рис. 43. Профиль SCAT-11, представленный в виде процентильных полос.
С разрешения Службы тестирования в образовании
Вербальный Математический Суммарный
: =: =E =пчрнь высокие
Очень высокие1- -1i ~
-----90---90--90-------
Высокие111-80-B"BВысокие
BBS5E5""B
-60-55-60-
Средние1-50-11-50-11-50-Средние
1-40--40-1-40-
1-30--50-1-30-
Низкие1-20-1-20--20-Низкие
Очень низкиеr-1U-Иiu --10-Очень низкие
281 ГРУППОВОЕ ТЕСТИРОВАНИЕ
следовательно, процентильные полосы могут оказаться слишком широ-
кими.
Однако следует иметь в виду, что многие учащиеся, не ответившие
на все задания, могли отказаться от решения более трудных заданий, да-
же если у них было достаточно времени. Более того, в количественном
тесте испытуемый в поиске ответа может затратить очень много време-
ни на вычисления, тогда как простое осознание числовых отношений мо-
гло бы привести к ответу моментально. Если это так, то скорость вы-
полнения заданий должна высоко коррелировать со способностями
к количественному мышлению, которые предназначен измерить тест.
Цели, с которыми разрабатывался SCAT, предполагают, что прогно-
стическая валидность этого теста определяется прежде всего достиже-
ниями в учебе. Коэффициенты валидности, полученные для V, VIII, XI,
XII классов из школ-участниц выборки стандартизации (коэффициенты
определялись для каждой школы в отдельности и затем усреднялись,
число школ в зависимости от класса менялось от 3 до 26), колебались от
0,59 до 0,68; корреляция вербального показателя SCATc отметками по
английскому языку равнялась от 0,41 до 0,69 и количественного показа-
теля с оценками по математике составляла от 0,43 до 0,65. Поскольку
частные корреляции значительно менялись от школы к школе, в руко-
водстве к тесту дается рекомендация проводить локальную валидацию
теста.
Корреляция с тестами достижений (Последовательные тесты успехов
в образовании) обычно колеблются от 0,60 до 0,80. Количественные по-
казатели лучше коррелируют с успехами по математике, а вербальные
лучше со всеми другими предметами. Однако коэффициенты валидности
для суммарных показателей SCAT обычно столь же высоки, как и для
показателей обеих частей теста. Таким образом, эффективность вер-
бальных и количественных показателей как различных предсказателей
успеваемости в учебе остается неопределенной. В этой связи следует ска-
зать, что сами по себе показатели вербальной и количественной частей
теста коррелируют на уровне 0,70, за исключением показателей самых
младших и самых старших классов, где корреляция составляет только
0,60. Такое тесное сходство может быть следствием однотипности ис-
пользуемых в тестах заданий, требующих в основном умения выявлять
и использовать установленные отношения в абстрактном или символиче-
ском содержании. Подобно другим обсуждаемым в этой главе тестам,
SCAT предназначен прежде всего для измерения общего интеллектуаль-
ного развития и лишь во вторую очередь он может служить указателем
различий в способностях индивида.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171