ТОП авторов и книг ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ
Здесь каждая половина теста рассматривается как выбор-
ка из генеральной совокупности. Это позволяет упростить формулу
для частного случая (при k=2). Формула Спирмена-Брауна для вы-
числения надежности теста при расщеплении его пополам имеет вид:
_ 2п2
1+П2
где /12 - корреляция между двумя половинами теста.
В самом деле, основная формула (1.6) выполняется независимо
от величины оцениваемых методик.
Надежность и выборки заданий
Методы вычисления надежности тестов, которые подробно для
практической разработки тестов будут описаны в главе 5, имеют свои
статистические основания в данной модели погрешностей измерения.
Действительно, для вычисления надежности теста может быть ис-
пользована формула Спирмена-Брауна. Однако, вычисление корре-
ляционных матриц является громоздким, и, в результате, были раз-
работаны другие методы, по сути, аналогичные, хотя и выглядят они
иначе.
39
КОЭФФИЦИЕНТ
И Cronbach (1971), и Nunnally (1978) рассматривают коэффици-
ента как наиболее важный показатель надежности теста, а формула
его вычисления относительно проста. Как показано у Nunnally
(1978), она выведена из классической модели погрешностей измере-
ния. Коэффициент а определяется как оценка корреляции данного
теста с другим тестом такой же длины из одной генеральной совокуп-
ности заданий. Квадратный корень из нее - это оценка корреляции
данного теста с истинным показателем. Таким образом:
coefficient О.
k
"k=\
()
(1.7)
(1.8)
где k - количество заданий в тесте, "Lo - сумма дисперсий для
заданий, и о у - дисперсия для данного теста.
Формула Kuder-Richardson 20 (K-R20) является частным случаем
коэффициента О. для заданий дихотомического типа:
k /1 PQ.
-Т(--.
где Р-доля испытуемых, давших правильные (ключевые) отве-
ты на задания, от общего количества испытуемых, Q ==1- Р,о
-дисперсия для теста.
Этот коэффициент прост для вычисления и, естественно, имеет те
же характеристики, что и коэффициент G., причем PQ является эк-
вивалентом и для дихотомического случая.
Из формулы коэффициента О. можно также сделать вывод, что
надежные тесты имеют большую дисперсию (и, следовательно, явля-
ются более дискриминативными), чем ненадежные тесты - важное
практическое следствие этого аспекта данной модели .
Используя классическую модель погрешностей измерения, мож-
но оценить истинные показатели по полученным эксперименталь-
ным показателям. Однако, это не имеет большого отношения к кон-
струированию тестов вследствие малой практической значимости, и
мы не будем обсуждать здесь этот вопрос.
Из данной модели можно получить одну важную статистическую
величину (она упоминалась в начале данного раздела) - стандар-
Дисперсия и дискриминативность связаны косвенно. При большой дисперсии
надежность низкая (в понимании повторяемости результатов) (Прим.ред.)
40
тную погрешность измерения. Это ожидаемое стандартное откло-
нение от показателей для любого индивидуума, выполняющего боль-
шое количество параллельных тестов. Оно может быть использовано
для определения доверительных границ полученных показателей,
хотя эти зоны располагаются симметрично вокруг истинного, а не
эмпирического показателя (момент, обычно игнорируемый на прак-
тике) .
ffmeas =Ox/VT
(I.I)
где х - это множество полученных показателей и t - это множе-
ство истинных показателей.
= CTx/Vl -Гхх
(надежность)
Таким образом, стандартная погрешность измерения является
стандартной погрешностью оценивания истинных показателей, ис-
ходя из полученных показателей.
О классической модели погрешностей измерения сказано уже до-
статочно. Надеюсь, что содержательные обоснования и статистиче-
ские основания психометрических формул, используемых при раз-
работкетестов, теперьмогутбыть понятыми. Онинеявляютсятолько
лишь изобретениями разработчиков тестов, а вытекают логически из
предположений о погрешностях измерения, которые допускаются в
классической психометрии. Поэтому, давайте завершим рассмотре-
ние этого вопроса и перейдем к следующей теме, гораздо более про-
стой, но, несмотря на это, очень полезной в области приложений
психологического тестирования.
Стандартизация и нормы
Дальнейшая характеристика эффективных тестов, не являющая-
ся, однако, внутренней особенностью, присущей самому тесту, - это
наличие нормативных данных. Нормы - это множество показателей
из четко определенных выборок, а разработка и процедуры получе-
ния этих показателей составляют процесс стандартизации теста.
Нормы позволяют использующему тест адекватно интерпретиро-
вать показатели, которые он получает от индивидуумов. Они, следо-
вательно, имеют большее значение для практического применения
тестов, чем для исследовательских целей, где используются исход-
ные, не подвергнутые обработке показатели теста и где нормы добав-
ляют лишь немного полезной информации.
В главе 8 будет описано, как должны определяться нормы для
различных видов тестов. Здесь же достаточно сказать, что комплек-
тование групп испытуемых должно быть адекватным, а их количест-
41
во - большим. В противном случае нормирование теста может ока-
заться скорее вредным, чем просто бесполезным, то есть, на самом
деле вводящим в заблуждение. Несмотря на это, если стандартизация
выполнена соответствующим образом, показатели психологических
тестов дают нам основу для сравнения, которого не может предоста-
вить ни одна нестандартизированная процедура.
Следует также понимать, что большинство методов испытаний,
отличных от тестов, не могут быть стандартизированы, так что эта
возможность является важной характеристикой психометрических
тестов.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114
ка из генеральной совокупности. Это позволяет упростить формулу
для частного случая (при k=2). Формула Спирмена-Брауна для вы-
числения надежности теста при расщеплении его пополам имеет вид:
_ 2п2
1+П2
где /12 - корреляция между двумя половинами теста.
В самом деле, основная формула (1.6) выполняется независимо
от величины оцениваемых методик.
Надежность и выборки заданий
Методы вычисления надежности тестов, которые подробно для
практической разработки тестов будут описаны в главе 5, имеют свои
статистические основания в данной модели погрешностей измерения.
Действительно, для вычисления надежности теста может быть ис-
пользована формула Спирмена-Брауна. Однако, вычисление корре-
ляционных матриц является громоздким, и, в результате, были раз-
работаны другие методы, по сути, аналогичные, хотя и выглядят они
иначе.
39
КОЭФФИЦИЕНТ
И Cronbach (1971), и Nunnally (1978) рассматривают коэффици-
ента как наиболее важный показатель надежности теста, а формула
его вычисления относительно проста. Как показано у Nunnally
(1978), она выведена из классической модели погрешностей измере-
ния. Коэффициент а определяется как оценка корреляции данного
теста с другим тестом такой же длины из одной генеральной совокуп-
ности заданий. Квадратный корень из нее - это оценка корреляции
данного теста с истинным показателем. Таким образом:
coefficient О.
k
"k=\
()
(1.7)
(1.8)
где k - количество заданий в тесте, "Lo - сумма дисперсий для
заданий, и о у - дисперсия для данного теста.
Формула Kuder-Richardson 20 (K-R20) является частным случаем
коэффициента О. для заданий дихотомического типа:
k /1 PQ.
-Т(--.
где Р-доля испытуемых, давших правильные (ключевые) отве-
ты на задания, от общего количества испытуемых, Q ==1- Р,о
-дисперсия для теста.
Этот коэффициент прост для вычисления и, естественно, имеет те
же характеристики, что и коэффициент G., причем PQ является эк-
вивалентом и для дихотомического случая.
Из формулы коэффициента О. можно также сделать вывод, что
надежные тесты имеют большую дисперсию (и, следовательно, явля-
ются более дискриминативными), чем ненадежные тесты - важное
практическое следствие этого аспекта данной модели .
Используя классическую модель погрешностей измерения, мож-
но оценить истинные показатели по полученным эксперименталь-
ным показателям. Однако, это не имеет большого отношения к кон-
струированию тестов вследствие малой практической значимости, и
мы не будем обсуждать здесь этот вопрос.
Из данной модели можно получить одну важную статистическую
величину (она упоминалась в начале данного раздела) - стандар-
Дисперсия и дискриминативность связаны косвенно. При большой дисперсии
надежность низкая (в понимании повторяемости результатов) (Прим.ред.)
40
тную погрешность измерения. Это ожидаемое стандартное откло-
нение от показателей для любого индивидуума, выполняющего боль-
шое количество параллельных тестов. Оно может быть использовано
для определения доверительных границ полученных показателей,
хотя эти зоны располагаются симметрично вокруг истинного, а не
эмпирического показателя (момент, обычно игнорируемый на прак-
тике) .
ffmeas =Ox/VT
(I.I)
где х - это множество полученных показателей и t - это множе-
ство истинных показателей.
= CTx/Vl -Гхх
(надежность)
Таким образом, стандартная погрешность измерения является
стандартной погрешностью оценивания истинных показателей, ис-
ходя из полученных показателей.
О классической модели погрешностей измерения сказано уже до-
статочно. Надеюсь, что содержательные обоснования и статистиче-
ские основания психометрических формул, используемых при раз-
работкетестов, теперьмогутбыть понятыми. Онинеявляютсятолько
лишь изобретениями разработчиков тестов, а вытекают логически из
предположений о погрешностях измерения, которые допускаются в
классической психометрии. Поэтому, давайте завершим рассмотре-
ние этого вопроса и перейдем к следующей теме, гораздо более про-
стой, но, несмотря на это, очень полезной в области приложений
психологического тестирования.
Стандартизация и нормы
Дальнейшая характеристика эффективных тестов, не являющая-
ся, однако, внутренней особенностью, присущей самому тесту, - это
наличие нормативных данных. Нормы - это множество показателей
из четко определенных выборок, а разработка и процедуры получе-
ния этих показателей составляют процесс стандартизации теста.
Нормы позволяют использующему тест адекватно интерпретиро-
вать показатели, которые он получает от индивидуумов. Они, следо-
вательно, имеют большее значение для практического применения
тестов, чем для исследовательских целей, где используются исход-
ные, не подвергнутые обработке показатели теста и где нормы добав-
ляют лишь немного полезной информации.
В главе 8 будет описано, как должны определяться нормы для
различных видов тестов. Здесь же достаточно сказать, что комплек-
тование групп испытуемых должно быть адекватным, а их количест-
41
во - большим. В противном случае нормирование теста может ока-
заться скорее вредным, чем просто бесполезным, то есть, на самом
деле вводящим в заблуждение. Несмотря на это, если стандартизация
выполнена соответствующим образом, показатели психологических
тестов дают нам основу для сравнения, которого не может предоста-
вить ни одна нестандартизированная процедура.
Следует также понимать, что большинство методов испытаний,
отличных от тестов, не могут быть стандартизированы, так что эта
возможность является важной характеристикой психометрических
тестов.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114