ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ
(4) Поскольку OPQ является личностным тестом, не должно быть
значимых корреляций с переменными способностей или мотивов.
Отметим, что последняя гипотеза иллюстрирует необходимость
показывать, при исследовании конструктной валидности, чего тест
не измеряет, наряду с тем, что он измеряет.
Если все эти гипотезы получат подтверждение их истинности,
тогда все же может показаться спорным, что продемонстрирована
конструктная валидность теста OPQ как средства измерения сово-
купности личностных черт, определяемых как "оральный песси-
мизм" . Дальнейший, более непосредственный способ продемонстри-
ровать валидность теста может состоять в формулировании пятой
гипотезы, а именно, что испытуемые, имеющие высокую выражен-
ность измеряемых черт личности, покажут по OPQ более высокие
показатели, чем те, у которых она низкая.
29
Таким образом, конструктная валидность - это мощный метод
демонстрации валидности тестов, для которых установление единст-
венного критерия их обоснованности является затруднительным.
Вместо одного результата мы должны учитывать одновременно мно-
жество результатов.
С конструктной валидностью связана одна проблема, которую
следует упомянуть. Речь идет об элементах субъективности, вовле-
каемых в интерпретацию результатов по изучению конструктной
валидности. В этом случае (как это обычно и случается на практике),
когда эти результаты недостаточно однозначны, многое зависит от
мастерства, уровня развития интерпретативных навыков разработ-
чика тестов.
Заключение
Были описаны разнообразные способы установления валидности
тестов; некоторые из них коренным образом отличаются друг от
друга. Так, конструктная валидность тесно связана с нашим опреде-
лением валидного теста как теста, измеряющего то, для измерения
чего он предназначен. Это, вероятно, наиболее важный аспект валид-
ности, особенно, если тесты должны использоваться для расширения
области психологических знаний. С помощью дифференциальной
валидности устанавливается обоснованность теста для некоторых ча-
стных случаев. Это иное использование термина "валидность", кото-
рое отражает особенности его использования. Однако, в практиче-
ских приложениях тестов этот аспект валидности чрезвычайно ва-
жен.
Из обсуждения должно быть также понятно, что не может быть
какого-либо единственного показателя, демонстрирующего валид-
ность теста. Для полной ее проверки следует учитывать множество
получаемых показателей. Несмотря на это, для многих тестов (хотя
это лишь небольшая часть из общего их количества) была показана
высокая валидность и концептуальная, как в случае конструктной
валидности, и для практических целей. Более того, как это станет
ясно из дальнейшего изложения, валидность теста может фактически
гарантироваться логически обоснованными методами конструирова-
ния тестов.
Дискриминативность
Еще одной особенностью эффективных тестов является дискри-
минативность. Действительно, достижение удовлетворительного рас
пределения показателей является одной из целей разработчика тес-
та. Нет необходимости подчеркивать то, что является очевидным:
30
какова ценность психологического теста, по которому все испытуе-
мые показали одинаковые результаты? При помощи тщательного
конструирования теста можно обеспечить соответствующий уровень
дискриминативности, а это именно то, в чем тесты значительно вы-
игрывают по сравнению с другими формами испытаний. В общем,
было обнаружено, что в оценке может быть использовано около де-
вяти градаций (см. Vernon, 1950), а в опросах, вероятно, наиболее
эффективно использовать три градации: нижесреднего, средний уро-
вень и выше среднего. Подобно этому, шкалы ранжирования редко
содержат более девяти градаций. Это означает, что испытуемые раз-
биваются в лучшем случае на девять групп. Это проявляется как
недостаток по сравнению с психометрическим тестом, в котором по-
казатели могут иметь крайне широкий разброс и могут давать эффек-
тивно обрабатываемые значения стандартных показателей от 20 до
80, с крайними показателями некоторых испытуемых, выходящими
за эти пределы. Дискриминативность измеряется показателем дельта
Фергюсона и принимает максимальное значение при равномерном
(прямоугольном) распределении показателей (=1).
Прежде, чем завершить обсуждение надежности, валидности и
дискриминативности, я кратко опишу модель измерения, в неявном
виде подразумевавшуюся во всей предыдущей дискуссии. Даже бег-
лое знакомство с этой моделью прольет свет на внутреннюю природу
конструирования тестов. Она также обеспечивает обоснованную ста-
тистическую базу для вычислений и процедур конструирования тес-
тов, рассматриваемых в данной книге.
Классическая теория погрешностей измерения
Замечание: Этот раздел о классической теории погрешностей из-
мерения - единственный в данной книге, который содержит матема-
тические формулы, а приведенные математические сведения содер-
жат лишь минимальный объем понятий, необходимый для изучения
предмета. Как я указывал, они приведены здесь, чтобы обеспечить
разумное объяснение статистических процедур конструирования те-
стов. Если они покажутся вам слишком утомительными, можно опу-
стить этот раздел или использовать его как справочный, когда воз-
никнет необходимость иметь дело с этими процедурами на практике.
Не очень настойчивые читатели могут перейти прямо к чтению главы
2.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114