ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ
В противном случае необходимо было бы согласиться с тем, что в двух тестах,
связанных общим фактором и имеющих одинаковое количество заданий, но совершенно
разных по характеру выполнения и трудности, надежность будет одинаковой, что
невозможно.
Следует обратить внимание на невозможность определения таким способом надежности
тестов скорости, так как связь каждого из заданий исследуемой генеральной совокупности
не определена из-за большого количества заданий, интеркорреляции заданий могут терять
смысл (см., напр., Корректурная проба).
Важным аспектом оценки применимости Н. п. в. с. является парадокс, возникающий в этом
случае при сочетании показателей надежности и валидности теста. Кажется, что высокая
внутренняя согласованность должна быть основной целью разработчиков теста (Л.
Кронбах, 1920). Такая точка зрения является довольно распространенной. Однако Р. Кэт-
телл (1977) обоснованно утверждает, что высокая внутренняя согласованность (особенно
при изучении сложных психологических конструктов, личностных показателей) в известном
смысле противостоит высокой валидности.
Возникающее противоречие можно иллюстрировать следующим примером. Тест
вербальных способностей может включать задания (и соответственно, субтесты) на
подбор антонимов, синонимов, понимание слов, словарный запас. Предположим, что
каждый из субтестов имеет высокие показатели Н. п.в.с. Однако если бы мы
воспользовались только одним субтестом (например, подбором антонимов), то показатель
Н. п. в. с. теста несомненно возрос бы по сравнению с полным набором субтестов, так как
используется
только один тип высокосогласованных заданий. Высокая надежность субтеста антонимов
будет отражать тот факт, что эта выборка заданий в высокой степени коррелирует с
гипотетической генеральной совокупностью заданий на антонимы. Однако этот истинный
показатель отражает не вербальные способности, а только способность подбирать
антонимы (т. е.валид-ность теста станет низкой по отношению к измерению вербальных
способностей).
Приведенные данные свидетельствуют о специфичности применения каждого из
имеющихся подходов к характеристике надежности теста. Н. п. в. с. имеет, очевидно, в
основном теоретическое значение. Как и надежность частей теста в предельном случае
разбивания материала на отдельные задания, рассматриваемый способ имеет
практическое значение для оценки точности коэффициента надежности, а также при
характеристике некоторых тестов, состоящих из специально подобранных
факторизованных заданий (см. Факторно-аналитический принцип).
НАДЕЖНОСТЬ РЕТЕСТОВАЯ - характеристика надежности психодиагностической
методики, получаемая путем повторного обследования испытуемых с помощью одного и
того же теста. Надежность в этом случае вычисляется по соответствию результатов
первого и второго обследований или по сохранению ранговых мест испытуемых в выборке
при ретесте. Коэффициент надежности (г) соответствует коэффициенту корреляции между
результатами таких обследований. При использовании интервальных шкал (см. Шкалы
измерительные} применяется коэффициент корреляции произведения моментов Пирсона
(см. Корреляционный анализ). Для шкал порядка в качестве меры устойчивости к
перетестированию может быть использован коэффи-
------------------- НАД
циент ранговой корреляции Спирмена или Кэндалла (см. Корреляция ранговая).
При характеристике Н. р. особое значение имеет временной интервал между первым и
вторым обследованиями. С его увеличением показатели корреляции имеют тенденцию к
снижению, существенно повышается вероятность воздействия посторонних факторов -
могут наступить закономерные возрастные изменения измеряемых тестом свойств,
произойти различные события, влияющие на состояние и особенности развития
исследуемых качеств. По этой причине при определении Н. р. стараются выбирать
непродолжительные временные интервалы (до нескольких месяцев), а при обследовании
детей младшего возраста эти интервалы должны быть еще меньше, поскольку возрастные
изменения и развитие в этом случае происходят еще быстрее.
Несмотря на указанную тенденцию, при получении характеристик теста проводятся
повторные испытания и с длительным временным промежутком. Иногда они
осуществляются в целях оценки валидности прогностической, элементов валидности
конструктной, связанных с дифференциацией по возрастному критерию и др. Определение
же Н. р. главным образом ограничивается анализом краткосрочных случайных изменений,
характеризующих тест как измерительную процедуру, а не его отношение к исследуемой
области поведения.
Наряду с очевидной простотой Н. р. как метод определения надежности обладает
существенными недостатками. Так, при повторном применении одних и тех же заданий,
особенно при относительно непродолжительном временном интервале между
обследованиями, у испытуемых может сформироваться навык работы с данной
психодиагностической методикой, что приводит к улучшению индивидуальных результатов,
хотя и не одинаково вы-
НАД
раженному у разных лиц. Это неизбежно ведет к заметной перестановке ранговых мест
отдельных испытуемых в данной выборке и, соответственно, ухудшению коэффициента
надежности. Еще более заметное воздействие на результаты анализа надежности
оказывает запоминание испытуемыми отдельных решений, воспроизведение в повторном
обследовании предыдущей картины правильных и неправильных решений.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190
связанных общим фактором и имеющих одинаковое количество заданий, но совершенно
разных по характеру выполнения и трудности, надежность будет одинаковой, что
невозможно.
Следует обратить внимание на невозможность определения таким способом надежности
тестов скорости, так как связь каждого из заданий исследуемой генеральной совокупности
не определена из-за большого количества заданий, интеркорреляции заданий могут терять
смысл (см., напр., Корректурная проба).
Важным аспектом оценки применимости Н. п. в. с. является парадокс, возникающий в этом
случае при сочетании показателей надежности и валидности теста. Кажется, что высокая
внутренняя согласованность должна быть основной целью разработчиков теста (Л.
Кронбах, 1920). Такая точка зрения является довольно распространенной. Однако Р. Кэт-
телл (1977) обоснованно утверждает, что высокая внутренняя согласованность (особенно
при изучении сложных психологических конструктов, личностных показателей) в известном
смысле противостоит высокой валидности.
Возникающее противоречие можно иллюстрировать следующим примером. Тест
вербальных способностей может включать задания (и соответственно, субтесты) на
подбор антонимов, синонимов, понимание слов, словарный запас. Предположим, что
каждый из субтестов имеет высокие показатели Н. п.в.с. Однако если бы мы
воспользовались только одним субтестом (например, подбором антонимов), то показатель
Н. п. в. с. теста несомненно возрос бы по сравнению с полным набором субтестов, так как
используется
только один тип высокосогласованных заданий. Высокая надежность субтеста антонимов
будет отражать тот факт, что эта выборка заданий в высокой степени коррелирует с
гипотетической генеральной совокупностью заданий на антонимы. Однако этот истинный
показатель отражает не вербальные способности, а только способность подбирать
антонимы (т. е.валид-ность теста станет низкой по отношению к измерению вербальных
способностей).
Приведенные данные свидетельствуют о специфичности применения каждого из
имеющихся подходов к характеристике надежности теста. Н. п. в. с. имеет, очевидно, в
основном теоретическое значение. Как и надежность частей теста в предельном случае
разбивания материала на отдельные задания, рассматриваемый способ имеет
практическое значение для оценки точности коэффициента надежности, а также при
характеристике некоторых тестов, состоящих из специально подобранных
факторизованных заданий (см. Факторно-аналитический принцип).
НАДЕЖНОСТЬ РЕТЕСТОВАЯ - характеристика надежности психодиагностической
методики, получаемая путем повторного обследования испытуемых с помощью одного и
того же теста. Надежность в этом случае вычисляется по соответствию результатов
первого и второго обследований или по сохранению ранговых мест испытуемых в выборке
при ретесте. Коэффициент надежности (г) соответствует коэффициенту корреляции между
результатами таких обследований. При использовании интервальных шкал (см. Шкалы
измерительные} применяется коэффициент корреляции произведения моментов Пирсона
(см. Корреляционный анализ). Для шкал порядка в качестве меры устойчивости к
перетестированию может быть использован коэффи-
------------------- НАД
циент ранговой корреляции Спирмена или Кэндалла (см. Корреляция ранговая).
При характеристике Н. р. особое значение имеет временной интервал между первым и
вторым обследованиями. С его увеличением показатели корреляции имеют тенденцию к
снижению, существенно повышается вероятность воздействия посторонних факторов -
могут наступить закономерные возрастные изменения измеряемых тестом свойств,
произойти различные события, влияющие на состояние и особенности развития
исследуемых качеств. По этой причине при определении Н. р. стараются выбирать
непродолжительные временные интервалы (до нескольких месяцев), а при обследовании
детей младшего возраста эти интервалы должны быть еще меньше, поскольку возрастные
изменения и развитие в этом случае происходят еще быстрее.
Несмотря на указанную тенденцию, при получении характеристик теста проводятся
повторные испытания и с длительным временным промежутком. Иногда они
осуществляются в целях оценки валидности прогностической, элементов валидности
конструктной, связанных с дифференциацией по возрастному критерию и др. Определение
же Н. р. главным образом ограничивается анализом краткосрочных случайных изменений,
характеризующих тест как измерительную процедуру, а не его отношение к исследуемой
области поведения.
Наряду с очевидной простотой Н. р. как метод определения надежности обладает
существенными недостатками. Так, при повторном применении одних и тех же заданий,
особенно при относительно непродолжительном временном интервале между
обследованиями, у испытуемых может сформироваться навык работы с данной
психодиагностической методикой, что приводит к улучшению индивидуальных результатов,
хотя и не одинаково вы-
НАД
раженному у разных лиц. Это неизбежно ведет к заметной перестановке ранговых мест
отдельных испытуемых в данной выборке и, соответственно, ухудшению коэффициента
надежности. Еще более заметное воздействие на результаты анализа надежности
оказывает запоминание испытуемыми отдельных решений, воспроизведение в повторном
обследовании предыдущей картины правильных и неправильных решений.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190