ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ
Разумеется, при негативной корреляции между предиктором
и критерием будет действовать обратный принцип. Однако в этом слу-
чае не существует прямого способа получить максимум для промежуточ-
ного значения показателя теста. Хотя во многих случаях оба метода да-
дут одинаковые результаты, существуют ситуации, когда один и тот же
индивид будет отнесен этими методами к разным категориям. Для ос-
новных целей тестирования применение уравнения регрессии более эф-
фективно, однако при некоторых обстоятельствах для получения необхо-
димой информации лучше подходит дискриминантная функция.
СТАТИСТИЧЕСКИЙ АНАЛИЗ СИСТЕМАТИЧЕСКОЙ ОШИБКИ ТЕСТА
Проблема. Если хотят использовать тест, чтобы предсказать результат
в каких-то будущих обстоятельствах, скажем будущую успеваемость или
уровень выполнения какой-то деятельности, то такой тест должен иметь
высокую прогностическую валидность относительно конкретного крите-
рия. Это требование обычно упускают из вида при разработке так назы-
ваемых культурно безразличных тестов (см. гл. 12). Стремясь включить
в такие тесты только функции, общие для разных культур или субкуль-
тур, нередко прибегают к содержанию, не имеющему особого отношения
к какому-либо из прогнозируемых критериев. Лучшим решением было
бы использовать содержание, непосредственно связанное с критерием,
а затем исследовать возможное нттияние мппрчпатпппп чч попёрт,, -т-п-тт
175 ВАЛИДНОСТЬ. ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ
тивные результаты могут меняться в зависимости от прошлого опыта
обследуемого. Эти значения, следовательно, необходимо проверить на
подгруппах, для которых следует ожидать подобного эффекта.
Заметим, однако, что прогностические характеристики тестовых ре-
зультатов меньше зависят от различий в культурах, если тест внутренне
связан с критериальной деятельностью. Если вербальный тест исполь-
зуется для прогноза невербальной деятельности, то в группе, принадле-
жащей к одной культуре, валидность может оказаться высокой в силу
характерных для этой культуры традиционных ассоциаций. Между тем
для группы с иными культурными традициями тест не будет иметь ника-
кой прогностической силы. Напротив, тест, который непосредственно
строится на элементах критериального поведения или измеряет тре-
буемые навыки, вероятно, сохранит свою валидность в различных
группах.
Начиная с середины 60-х гг. происходит быстрое накопление данных,
касающихся влияния этнического фактора на валидность теста. В этой
связи в <Руководстве>, изданном Комиссией использования равных про-
фессиональных возможностей, прямо говорится: <Всегда, когда это тех-
нически осуществимо, данные и результаты должны приводиться отдель-
но для групп, относящихся к меньшинствам и неменьшинствам>.
Функции применения раздельной валидации обсуждались также в докла-
дах Американской психологической ассоциации о тестировании мень-
шинств в образовании и при найме на работу (American Psycho-
logical Association.., 1969; T.A.Cleary, L.G.Humphreys, S.A.Kendrick,
A. Wesman, 1975). Большинство исследований, проведенных на сегодняш-
ний день, касалось американских негров, и лишь в некоторых из них за-
трагивались другие этнические меньшинства. Изучавшиеся проблемы но-
сят общее название <систематическая ошибка теста>. В данном
контексте термин <систематическая ошибка> употребляется в статистиче-
ском смысле, т. е. как нечто противоположное случайной ошибке. В этом
смысле говорят о смещенной и случайной выборке. Главные вопросы,
возникающие в связи с систематической ошибкой теста, относятся
к коэффициенту валидности (ошибка наклона) и к соотношению между
групповыми значениями по тесту и критерию (ошибка интерцепта).
Систематическая ошибка наклона. Чтобы уяснить себе спе-
циальные аспекты систематической ошибки теста, рассмотрим сначала
диаграмму рассеяния, или двумерное распределение (см. рис. 8,9, 10
в гл. 5). Правда, в данном случае по горизонтальной оси (X) отклады-
ваются результаты теста, а по вертикальной (У)-критериальные показа-
тели: средняя успеваемость в колледже или уровень выполнения деятель-
ности. Напомним, что <палочки>, изображающие положение индивида
относительно Х и Y, в своей совокупности показывают направление
и общую величину корреляции между двумя переменными. Линия, ап-
проксимирующая положение <палочек>, есть линия регрессии, а ее урав-
нение есть уравнение регрессии. В данном случае оно содержит только
один предиктор. Множественные уравнения регрессии, о которых гово-
рилось выше, содержат несколько предикторов, но принцип тот же
самый.
Когда тестовые и критериальные показатели выражены в стан-
дартных единицах с о = 1,00, наклон линии регрессии равен коэффициен-
ту коппелянии. Поэтому если коэффициенты валидности теста для двух
176
ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ошибкой наклона. На рис. 21 дается схематическое изображение линий
регрессии для нескольких двумерных распределений. Эллипсы предста-
вляют области расположения <палочек> для каждой выборки. Случай
1 соответствует двумерным распределениям двух групп с различными
средними значениями предиктора, но с общей линией регрессии между
предиктором и критерием. В данном случае систематическая ошибка на-
клона отсутствует, поскольку любому тестовому показателю в обеих
группах соответствует один и тот же показатель критериальный. Случай
Рис. 21. Системотические ошибки наклона и интерсепта в прогнозируемых критериаль-
ных показателях.
Эллипсами отмечены области, в которых располагаются тестовые показатели членов
каждой группы соответственно критериальному выполнению этих же индивидов.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171
и критерием будет действовать обратный принцип. Однако в этом слу-
чае не существует прямого способа получить максимум для промежуточ-
ного значения показателя теста. Хотя во многих случаях оба метода да-
дут одинаковые результаты, существуют ситуации, когда один и тот же
индивид будет отнесен этими методами к разным категориям. Для ос-
новных целей тестирования применение уравнения регрессии более эф-
фективно, однако при некоторых обстоятельствах для получения необхо-
димой информации лучше подходит дискриминантная функция.
СТАТИСТИЧЕСКИЙ АНАЛИЗ СИСТЕМАТИЧЕСКОЙ ОШИБКИ ТЕСТА
Проблема. Если хотят использовать тест, чтобы предсказать результат
в каких-то будущих обстоятельствах, скажем будущую успеваемость или
уровень выполнения какой-то деятельности, то такой тест должен иметь
высокую прогностическую валидность относительно конкретного крите-
рия. Это требование обычно упускают из вида при разработке так назы-
ваемых культурно безразличных тестов (см. гл. 12). Стремясь включить
в такие тесты только функции, общие для разных культур или субкуль-
тур, нередко прибегают к содержанию, не имеющему особого отношения
к какому-либо из прогнозируемых критериев. Лучшим решением было
бы использовать содержание, непосредственно связанное с критерием,
а затем исследовать возможное нттияние мппрчпатпппп чч попёрт,, -т-п-тт
175 ВАЛИДНОСТЬ. ИЗМЕРЕНИЕ И ИНТЕРПРЕТАЦИЯ
тивные результаты могут меняться в зависимости от прошлого опыта
обследуемого. Эти значения, следовательно, необходимо проверить на
подгруппах, для которых следует ожидать подобного эффекта.
Заметим, однако, что прогностические характеристики тестовых ре-
зультатов меньше зависят от различий в культурах, если тест внутренне
связан с критериальной деятельностью. Если вербальный тест исполь-
зуется для прогноза невербальной деятельности, то в группе, принадле-
жащей к одной культуре, валидность может оказаться высокой в силу
характерных для этой культуры традиционных ассоциаций. Между тем
для группы с иными культурными традициями тест не будет иметь ника-
кой прогностической силы. Напротив, тест, который непосредственно
строится на элементах критериального поведения или измеряет тре-
буемые навыки, вероятно, сохранит свою валидность в различных
группах.
Начиная с середины 60-х гг. происходит быстрое накопление данных,
касающихся влияния этнического фактора на валидность теста. В этой
связи в <Руководстве>, изданном Комиссией использования равных про-
фессиональных возможностей, прямо говорится: <Всегда, когда это тех-
нически осуществимо, данные и результаты должны приводиться отдель-
но для групп, относящихся к меньшинствам и неменьшинствам>.
Функции применения раздельной валидации обсуждались также в докла-
дах Американской психологической ассоциации о тестировании мень-
шинств в образовании и при найме на работу (American Psycho-
logical Association.., 1969; T.A.Cleary, L.G.Humphreys, S.A.Kendrick,
A. Wesman, 1975). Большинство исследований, проведенных на сегодняш-
ний день, касалось американских негров, и лишь в некоторых из них за-
трагивались другие этнические меньшинства. Изучавшиеся проблемы но-
сят общее название <систематическая ошибка теста>. В данном
контексте термин <систематическая ошибка> употребляется в статистиче-
ском смысле, т. е. как нечто противоположное случайной ошибке. В этом
смысле говорят о смещенной и случайной выборке. Главные вопросы,
возникающие в связи с систематической ошибкой теста, относятся
к коэффициенту валидности (ошибка наклона) и к соотношению между
групповыми значениями по тесту и критерию (ошибка интерцепта).
Систематическая ошибка наклона. Чтобы уяснить себе спе-
циальные аспекты систематической ошибки теста, рассмотрим сначала
диаграмму рассеяния, или двумерное распределение (см. рис. 8,9, 10
в гл. 5). Правда, в данном случае по горизонтальной оси (X) отклады-
ваются результаты теста, а по вертикальной (У)-критериальные показа-
тели: средняя успеваемость в колледже или уровень выполнения деятель-
ности. Напомним, что <палочки>, изображающие положение индивида
относительно Х и Y, в своей совокупности показывают направление
и общую величину корреляции между двумя переменными. Линия, ап-
проксимирующая положение <палочек>, есть линия регрессии, а ее урав-
нение есть уравнение регрессии. В данном случае оно содержит только
один предиктор. Множественные уравнения регрессии, о которых гово-
рилось выше, содержат несколько предикторов, но принцип тот же
самый.
Когда тестовые и критериальные показатели выражены в стан-
дартных единицах с о = 1,00, наклон линии регрессии равен коэффициен-
ту коппелянии. Поэтому если коэффициенты валидности теста для двух
176
ПРИНЦИПЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ошибкой наклона. На рис. 21 дается схематическое изображение линий
регрессии для нескольких двумерных распределений. Эллипсы предста-
вляют области расположения <палочек> для каждой выборки. Случай
1 соответствует двумерным распределениям двух групп с различными
средними значениями предиктора, но с общей линией регрессии между
предиктором и критерием. В данном случае систематическая ошибка на-
клона отсутствует, поскольку любому тестовому показателю в обеих
группах соответствует один и тот же показатель критериальный. Случай
Рис. 21. Системотические ошибки наклона и интерсепта в прогнозируемых критериаль-
ных показателях.
Эллипсами отмечены области, в которых располагаются тестовые показатели членов
каждой группы соответственно критериальному выполнению этих же индивидов.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171