ТОП авторов и книг     ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  AZ

 


Следует отличать понятие надежности оценок теста в соответствии с моделью
Nunnally от концептуального содержания ретестовой надежности как свойства
измерительной процедуры. Так, при увеличении числа заданий растет вероят-
ность различных ответов на каждое из них, что, естественно, снижает надежность
в смысле меры повторяемости результатов (Прим.ред.)
36
Эти выводы из формулы (1.5) настолько полезны для практиче-
ских разработчиков тестов, что мы еще вернемся к их обсуждению.
Прежде всего я должен напомнить читателям значение стандартной
погрешности оценки корреляции заданий.
Она означает, что 68 % всех средних корреляций выборки попада-
ют в интервал между арифметическим средним плюс-минус одна
величина стандартной погрешности, и что 95% попадают в интервал
между арифметическим средним плюс-минус две величины стандар-
тной погрешности. Если предположить, что стандартное отклонение
корреляций для некоторого теста равно 0,15 (а это отнюдь не необыч-
ный случай) и применить формулу (1.5) к тестам, состоящим из 10,
20 и 30 заданий, мы получим следующие стандартные погрешности:
для теста из 10 заданий: 0,02
для теста из 20 заданий: 0,01
для теста из 30 заданий: 0,007
Из этих результатов становится видно, что даже при такой не-
большой величине теста, как 10 заданий, точность оценки надежно-
сти является удивительно большой. Это происходит благодаря тому
факту, что знаменатель формулы (1,5) быстро возрастает с увеличе-
нием количества заданий.
С точки зрения разработчика тестов, такая точность является
весьма воодушевляющей. На практике это означает, что в оценке
надежности присутствует небольшая погрешность из-за случайной
ошибки в выборе заданий. Другой важный вывод, как указывает
Nunnally (1978), состоит в том, что если явно параллельные тесты
имеют низкую взаимную корреляцию, это не может быть отнесено за
счет случайной ошибки при выборе заданий. Либо задания должны
представлять различные генеральные совокупности заданий (напри-
мер, они измеряют различные переменные), либо есть ошибка выбор-
ки, вносимая испытуемыми.
Таким образом, легко видеть, что формула ( 1.5) дает разработчи-
ку тестов уверенность в том, что случайные ошибки, похоже, не
смогут нарушить логику построения теста. Даже при наличии не-
большого количества заданий оценки надежности могут быть точны-
ми.
Nunnally (1978) выводит из этой классической модели ряд прин-
ципов, которые имеют значение при практическом конструировании
тестов. Методическая мощь этой классической модели заключается
в том, что из нее можно сделать много полезных выводов. Фактиче-
ски, охватываются три важных области : соотношение величины
теста и его надежности, надежность любой выборки заданий и оцени-
37
вание истинных показателей по полученным или выборочным пока-
зателям.
Надежность и величина теста
Представляется очевидным, что надежность возрастает с величи-
ной теста. Поскольку истинные показатели определены как показа-
тели генеральной совокупности заданий, должно выполняться пред-
положение, что чем больше величина теста, тем выше корреляция с
истинным показателем; в предельном случае рассматривается гипо-
тетическая ситуация, когда тест состоит из всех заданий генеральной
совокупности, за исключением одного.
С точки зрения разработчика тестов важной является быстрота
возрастания надежности с возрастанием количества заданий. Всегда
трудно разработать большое количество валидных заданий (напри-
мер, таких, которые принадлежат именно нужной генеральной сово-
купности); следовательно, если мы хотим продемонстрировать, что,
скажем, надежность двадцати пяти заданий (с заданной средней кор-
реляцией) является высокой, то достижение этой цели будет иметь
смысл. Nunnally (1978) показал, как это может быть сделано.
В результате получена формула Спирмена-Брауна (Spearman-
Brown Prophecy formula) (используемая в вычислении надежности
теста при его расщеплении на части):

= . + {k-l)T,
(1.6)
где rkk - надежность теста после расщепления, k - количество
заданий, и гц - средняя взаимная корреляция между заданиями.
Как было показано, формула Спирмена-Брауна является чрезвы-
чайно полезной при конструировании тестов. Предположим, что у
нас есть три набора заданий: (а) десять заданий, (Ь) двадцать зада-
ний, (с) тридцать заданий. Пусть средняя корреляция между задани-
ями равна 0,20. Тогда:
= 1 О) =
Set В = rkk
20х0.20
1+(19 X 0.20)
=L)=
rkk является надежностью теста, и квадратный корень из нее дает
нам оценочные корреляции заданий с истинным показателем. Даже
38
для теста из десяти заданий удается получить удовлетворительное
значение надежности, тогда как при тридцати достигается очень
большое ее значение. Причем эти цифры были получены для зада-
ний, взаимная корреляция которых была низкой, всего 0,20. Для
болееоднородного теста из 30 заданий, гдесредняя корреляция выше,
например, 0,40, получаем:
Set D = rkk
30х0.40
1+(29х0.40)
Таким образом, разработчик тестов, который может сформулиро-
вать большой набор однородных заданий, уже готов создать надеж-
ный тест. Следует также заметить, что, если он разобьет эти тридцать
заданий на две параллельные формы по пятнадцать заданий, они обе
также будут иметь удовлетворительную надежность. В самом деле,
rkk дает нам ожидаемую корреляцию теста, состоящего из k заданий,
с другим тестом из k заданий из одной и той же генеральной совокуп-
ности. rkk - это надежность, вычисляемая по взаимным корреля-
циям заданий теста.
Формула Спирмена-Брауна (1.6) используется при вычислении
надежности теста при расщеплении его на две части (когда корреля-
ция между половинами теста пересчитывается в зависимости от их
величины).
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114

ТОП авторов и книг     ИСКАТЬ КНИГУ В БИБЛИОТЕКЕ    

Рубрики

Рубрики