ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ
Будучи переформулированными, новые зада-
ния вместе с отобранными ранее должны быть предъявлены вновь
соответствующим выборкам испытуемых и подвергнуты процедуре
анализа так, как описано выше. Это должно дать достаточное коли-
чество репрезентативных заданий для формирования приемлемого
теста.
Если тест сформировать не удалось
Однако, иногда, даже после переформулирования заданий, коли-
чества заданий все еще недостаточно для формирования теста или
даже для получения среднего значения надежности. Существует не-
198
сколько причин, по которым это могло произойти, и будут обсуждены
меры, которые могут быть приняты в каждом случае.
Такой переменной не существует
Возможна, особенно в сфере личности и мотивов, где даже среди
специалистов по психометрии мало согласия по поводу того, что
представляют собой конкретные переменные, (не говоря уже о почти
полном отсутствии согласия между психометрией и клинической тео-
рией) , ситуация, когда мы пытаемся измерить переменную или син-
дром, которые попросту не существуют.
Так, если мы попытаемся измерить фаллический характер
(Freud, 1905), гипотетический синдром личностных черт, появляю-
щийся, согласно теории Фрейда, в результате фиксации на фалличе-
ской фазе онтогенеза, впаяне может произойти такая неудача. Ни
одному исследователю не удалось сконструировать валидное средст-
во измерения этой переменной (см. Kline, 1972; Fisher и Greeaberg,
1977). Представляется, что в этом случае нет корреляции между
составляющими ее чертами. Следовательно, тест не может быть
сконструирован. Как я уже утверждал при обсуждении внутренней
согласованности, при измерении синдромов, включающих широкий
набор черт, допустимо, чтобы значение коэффициента надежности
было ниже, чем для других более однородных переменных, если же
нет корреляции, то даже это становится невозможным. Если это
имеет место, от данного теста лучше отказаться.
КАК ПОКАЗАТЬ, ЧТО ПЕРЕМЕННАЯ НЕ СУЩЕСТВУЕТ
Единственный обоснованный метод для проверки этой гипотезы,
отличный от выводов из природы той переменной, которую мы пыта-
емся измерить, - вычислить корреляцию между заданиями и, воз-
можно, подвергнуть их факторному анализу, хотя это и не всегда
необходимо.
Эта процедура не описывается подробно, так как она идентична
приводимой ниже процедуре конструирования факторизованных те-
стов. Приведем краткое описание. Вычисляются значения коэффи-
циента корреляции (р между заданиями. Если большинство из этих
значений низкие, меньше, чем 0,2 , или незначимые, то тогда ясно,
что черты, измеряемые данным тестом не образуют синдром. Если же
некоторые задания образуют кластеры, то должно быть изучено их
содержание. Если они все подобны - являются перефразированиями
друг друга или затрагивают явно одинаковые особенности поведения
- то это удовлетворительное объяснение их коррелированности. Ес-
ли же они охватывают по крайней мере часть синдрома, может ока-
199
заться, что они действительно формируют реально существующую
переменную, то есть синдром более узок, чем это описано в клиниче-
ской теории. В этом случае может оказаться полезным формулирова-
ние новых заданий такого же вида; эти новые задания будут затем
подвергнуты, вместе с исходными, процедуре анализа так, как было
описано.
При этом существует опасность, что при помощи этой процедуры
мы можем сконструировать специфический фактор - дутую, лож-
ную особенность (Cattell и Kline, 1977). Однако, это должно быть
выявлено при выполнении исследований валидности - этот фактор
не будет коррелировать ни с чем. Такой корреляционный анализ,
конечно, имеет смысл осуществлять в том случае, когда не удалось
сформировать тест и если мы пытаемся измерить переменную, суще-
ствование которой вызывает теоретические сомнения. Если бы мы
пытались измерить хорошо определенную переменную, такую как
вербальные способности, корреляционный анализ был бы бессмыс-
ленным, так как неудачу нельзя было бы приписать тому факту, что
такой переменной не существует.
Неудовлетворительные задания
Логично было бы в каждом случае неудачи при конструировании
теста предположить, что причиной этого является то, что подготов-
ленные задания просто не измеряют того, для измерения чего они
предназначались. Опять-таки, это более вероятно в случае личност-
ных и мотивационных тестов, чем для тестов способностей. Однако,
даже в последних противоречивые высказывания или плохо сформу-
лированные инструкции могут свести на нет их эффективность.
В том случае, когда мы следовали правилам формулирования
заданий (которые были описаны в главах 2 - 4, посвященных конст-
руированию тестов различных типов) и, что более важно, если мы
исправили слабые задания, исходя из требований процедуры их ана-
лиза для повторного испытания, как предлагалось выше, это малове-
роятно (за исключением обычно нескольких заданий, которые просто
отбрасываются).
Это объяснение может быть принято только тогда, когда мы убеж-
дены, что никакие другие причины не могут объяснить полученные
факты. В самом деле, единственный способ продемонстрировать это
- написать эффективные задания для последующих испытаний.
Задания нагружают (насыщают) несколько факторов
Одним из критических замечаний по процедуре анализа заданий
является то, что можно получить задания, нагружающие два корре-
200
пирующих фактора, для которых значение корреляции с общим по-
казателем все же будет высоким.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114
ния вместе с отобранными ранее должны быть предъявлены вновь
соответствующим выборкам испытуемых и подвергнуты процедуре
анализа так, как описано выше. Это должно дать достаточное коли-
чество репрезентативных заданий для формирования приемлемого
теста.
Если тест сформировать не удалось
Однако, иногда, даже после переформулирования заданий, коли-
чества заданий все еще недостаточно для формирования теста или
даже для получения среднего значения надежности. Существует не-
198
сколько причин, по которым это могло произойти, и будут обсуждены
меры, которые могут быть приняты в каждом случае.
Такой переменной не существует
Возможна, особенно в сфере личности и мотивов, где даже среди
специалистов по психометрии мало согласия по поводу того, что
представляют собой конкретные переменные, (не говоря уже о почти
полном отсутствии согласия между психометрией и клинической тео-
рией) , ситуация, когда мы пытаемся измерить переменную или син-
дром, которые попросту не существуют.
Так, если мы попытаемся измерить фаллический характер
(Freud, 1905), гипотетический синдром личностных черт, появляю-
щийся, согласно теории Фрейда, в результате фиксации на фалличе-
ской фазе онтогенеза, впаяне может произойти такая неудача. Ни
одному исследователю не удалось сконструировать валидное средст-
во измерения этой переменной (см. Kline, 1972; Fisher и Greeaberg,
1977). Представляется, что в этом случае нет корреляции между
составляющими ее чертами. Следовательно, тест не может быть
сконструирован. Как я уже утверждал при обсуждении внутренней
согласованности, при измерении синдромов, включающих широкий
набор черт, допустимо, чтобы значение коэффициента надежности
было ниже, чем для других более однородных переменных, если же
нет корреляции, то даже это становится невозможным. Если это
имеет место, от данного теста лучше отказаться.
КАК ПОКАЗАТЬ, ЧТО ПЕРЕМЕННАЯ НЕ СУЩЕСТВУЕТ
Единственный обоснованный метод для проверки этой гипотезы,
отличный от выводов из природы той переменной, которую мы пыта-
емся измерить, - вычислить корреляцию между заданиями и, воз-
можно, подвергнуть их факторному анализу, хотя это и не всегда
необходимо.
Эта процедура не описывается подробно, так как она идентична
приводимой ниже процедуре конструирования факторизованных те-
стов. Приведем краткое описание. Вычисляются значения коэффи-
циента корреляции (р между заданиями. Если большинство из этих
значений низкие, меньше, чем 0,2 , или незначимые, то тогда ясно,
что черты, измеряемые данным тестом не образуют синдром. Если же
некоторые задания образуют кластеры, то должно быть изучено их
содержание. Если они все подобны - являются перефразированиями
друг друга или затрагивают явно одинаковые особенности поведения
- то это удовлетворительное объяснение их коррелированности. Ес-
ли же они охватывают по крайней мере часть синдрома, может ока-
199
заться, что они действительно формируют реально существующую
переменную, то есть синдром более узок, чем это описано в клиниче-
ской теории. В этом случае может оказаться полезным формулирова-
ние новых заданий такого же вида; эти новые задания будут затем
подвергнуты, вместе с исходными, процедуре анализа так, как было
описано.
При этом существует опасность, что при помощи этой процедуры
мы можем сконструировать специфический фактор - дутую, лож-
ную особенность (Cattell и Kline, 1977). Однако, это должно быть
выявлено при выполнении исследований валидности - этот фактор
не будет коррелировать ни с чем. Такой корреляционный анализ,
конечно, имеет смысл осуществлять в том случае, когда не удалось
сформировать тест и если мы пытаемся измерить переменную, суще-
ствование которой вызывает теоретические сомнения. Если бы мы
пытались измерить хорошо определенную переменную, такую как
вербальные способности, корреляционный анализ был бы бессмыс-
ленным, так как неудачу нельзя было бы приписать тому факту, что
такой переменной не существует.
Неудовлетворительные задания
Логично было бы в каждом случае неудачи при конструировании
теста предположить, что причиной этого является то, что подготов-
ленные задания просто не измеряют того, для измерения чего они
предназначались. Опять-таки, это более вероятно в случае личност-
ных и мотивационных тестов, чем для тестов способностей. Однако,
даже в последних противоречивые высказывания или плохо сформу-
лированные инструкции могут свести на нет их эффективность.
В том случае, когда мы следовали правилам формулирования
заданий (которые были описаны в главах 2 - 4, посвященных конст-
руированию тестов различных типов) и, что более важно, если мы
исправили слабые задания, исходя из требований процедуры их ана-
лиза для повторного испытания, как предлагалось выше, это малове-
роятно (за исключением обычно нескольких заданий, которые просто
отбрасываются).
Это объяснение может быть принято только тогда, когда мы убеж-
дены, что никакие другие причины не могут объяснить полученные
факты. В самом деле, единственный способ продемонстрировать это
- написать эффективные задания для последующих испытаний.
Задания нагружают (насыщают) несколько факторов
Одним из критических замечаний по процедуре анализа заданий
является то, что можно получить задания, нагружающие два корре-
200
пирующих фактора, для которых значение корреляции с общим по-
казателем все же будет высоким.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114