Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Надежность теста
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Anton
Кто может помочь трактовать результаты определения надежность теста (опросника)?

1). Альфа Кронбаха - 0,981
2). Половинное расщепление: альфа Кронбаха - 0,974 (43 пункта) и 0,974 (42 пункта); коэффициент Спирмена-Брауна 0,771, коэффициент половинного расщепления Гуттмана - 0,766.


Альфа колеблется от 0 до 1. А гуттман и спирмен?

заранее спасибо!
плав
Цитата(Anton @ 13.02.2008 - 16:05) *
Кто может помочь трактовать результаты определения надежность теста (опросника)?

1). Альфа Кронбаха - 0,981
2). Половинное расщепление: альфа Кронбаха - 0,974 (43 пункта) и 0,974 (42 пункта); коэффициент Спирмена-Брауна 0,771, коэффициент половинного расщепления Гуттмана - 0,766.
Альфа колеблется от 0 до 1. А гуттман и спирмен?

заранее спасибо!

Так же.
Не совсем понятно насчет альфа Кронбаха при половинном расщеплении (альфа Кронбаха иногда интерпретируется как усредненное значение надежности при всех возможных способах деления теста пополам).
Значение 0,981 хорошее, считается, что тестом можно пользоваться после 0,8, если больше 0,9 тест высоко надежный.
Anton
Спасибо!
Цитата
Не совсем понятно насчет альфа Кронбаха при половинном расщеплении

Расчет проводил в SPSS, в разделе Анализ надежности:
- выбирал модель Альфа - получал значение, указанное в п.1;
- выбирал модель Деление пополам - п.2
Тоже самое делал с межпункт. ковариациями и корреляциями - результат примерно тот же.

Правда, не уверен, что все сделал методически верно... Альфа вроде как предназначена для тестов "Да-Нет" (1-0), а если каждый ответ имеет свой балл (1-3)? frown.gif
плав
Цитата(Anton @ 14.02.2008 - 09:35) *
Спасибо!

Расчет проводил в SPSS, в разделе Анализ надежности:
- выбирал модель Альфа - получал значение, указанное в п.1;
- выбирал модель Деление пополам - п.2
Тоже самое делал с межпункт. ковариациями и корреляциями - результат примерно тот же.

Правда, не уверен, что все сделал методически верно... Альфа вроде как предназначена для тестов "Да-Нет" (1-0), а если каждый ответ имеет свой балл (1-3)? frown.gif

Мой совет - прежде, чем нажимать на клавиши в SPSS или любой другой программе прочитать хотя бы одну статью по тому разделу, с которым хочется работать. Альфа Кронбаха предназначена как раз для шкал с несколькими вариантами ответов (Ликертовские шкалы), правда они должны быть упорядочены (полностью согласен - совсем не согласен).
Anton
Цитата(плав @ 15.02.2008 - 12:39) *
Мой совет - прежде, чем нажимать на клавиши в SPSS или любой другой программе прочитать хотя бы одну статью по тому разделу, с которым хочется работать. Альфа Кронбаха предназначена как раз для шкал с несколькими вариантами ответов (Ликертовские шкалы), правда они должны быть упорядочены (полностью согласен - совсем не согласен).


Конечно читал. Иначе, откуда бы знал на какую клавишу нажимать! smile.gif Однако, разробраться крайне трудно. Нормальных книг/источников для врачей нет (чтобы там не говорили). Лично я был очень рад, когда нашел этот форум - сижу читаю все подряд.
плав
ну на самом деле книги есть, просто они расчитаны на психологов, а не врачей, поскольку опросники - это их хлеб (предмет - психодиагностика). Проблема в том, что создание опросника достаточно сложное мероприятие, требующее оценки контентной валидности, конструктной валидности - определенных подходов к формированию шкал (факторным анализом) и целого ряда других мероприятий, а не просто использования соответствующего модуля статистической программы. Наиболее полным - с моей точки зрения - руководством на русском языке является "Клайн П. Справочное руководство по конструированию тестов. ПАН Лтд, Киев, 1994", есть неплохие книги Шевандрина и других, хотя для серьезного изучения лучше раздобыть работы Nunnally по психометрии. Небольшое и древнее введение в методы конструирования опросников (для ориентировки) есть тут http://pubhealth.spb.ru/WHealth/evalu.htm (в конце текста, перед приказом Минобра).
DavVlad
Цитата(плав @ 13.02.2008 - 16:42) *
Так же.
Не совсем понятно насчет альфа Кронбаха при половинном расщеплении (альфа Кронбаха иногда интерпретируется как усредненное значение надежности при всех возможных способах деления теста пополам).
Значение 0,981 хорошее, считается, что тестом можно пользоваться после 0,8, если больше 0,9 тест высоко надежный.

Хотя и прошло уже немало времени от начала темы, рискну принять участие в обсуждении (очень большая нужда) и задать вопрос, как наиболее компетентному участнику дискуссии.
Не совсем понятно какую именно надежность рассчитывал автор темы?
И совсем пракическое продолжение. Помогите советом. Есть матрица ответов параллельных форм теста. Тип оценки дихотомический (0;1). При рассчете внутренней согласованности теста по результатам пробного тестирования в SPSS, что является вариационным рядом (Var) оценки одного тестируемого на разные вопросы теста или оценки разных тестируемых на один вопрос параллельных форм теста. Понимаю что вопрос примитивен, не побрезгуйте пожайлуста. И еще, при рассчете ретестовой надежности, как оценивается достоверность коэффициента корреляции, что означает его отрицательное значение? Есть ли смысл в этом случае считать корреляцию результатов ответов на отдельные задания или учитывать только один конечный результат ответа на весь тест? Коэффициент корелляции Пирсона единственный вариант или нет (Кендала, Спермана)?
Заранее спасибо.
плав
Вопрос не совсем понятен, попробую ответить так как понял:
1) Отричательный коэффициент корреляции при повторном тестировании означает, что тест ненадежен и его использовать нельзя (т.е. те, у кого были высокие значения, снизислиь, у кого были низкие - повысились, похоже на случайные колебания с регрессией к среднему
2) Корреляция считается по суммарному результату (суммарный бал до/после по всем испытуемым)
3) Чаще всего используется не корреляция по Пирсону, а Спирмановский коэффициент корреляции (поскольку значения ранговые)
4) Для внутрненней согласованности теста используются разные части одного и того же теста (например, четные и нечетные вопросы), параллельные формы теста - соответственно, две формы теста
DavVlad
Цитата(плав @ 3.06.2008 - 22:35) *
Вопрос не совсем понятен, попробую ответить так как понял:
1) Отрицательный коэффициент корреляции при повторном тестировании означает, что тест ненадежен и его использовать нельзя (т.е. те, у кого были высокие значения, снизислиь, у кого были низкие - повысились, похоже на случайные колебания с регрессией к среднему
2) Корреляция считается по суммарному результату (суммарный бал до/после по всем испытуемым)
3) Чаще всего используется не корреляция по Пирсону, а Спирмановский коэффициент корреляции (поскольку значения ранговые)
4) Для внутрненней согласованности теста используются разные части одного и того же теста (например, четные и нечетные вопросы), параллельные формы теста - соответственно, две формы теста

Спасибо за ответы по пунктам 2 и 3.
Отдельно хочу остановиться на пунктах 1 и 4.
1) На сколько я понимаю, вы имеете в виду повторное тестирование по одному и тому же тесту (имеющему идентичные задания) через небольшой промежуток времени (7-10 дней). У меня другая ситуация. Тест не психологический, он критериально-ориентированный. Методика ретеста изменена. Испытуемый тестируется дважды подряд по одному и тому же тесту, но задания, которые он получает разные. Это компьютерное тестировние и требование к тесту таково, что он должен состоять из кластеров фасетных заданий. Какие методы обработки следует использовать в этом случае и как оценивать их результаты.
4) Я слышал что наиболее эффективным является коэффициент альфа Кронбаха, так как существует проблема разбиения результатов тестирования на две части. Этот коэффициент является усредненным для всех возможных вариантов надежностей с разбиением на половины. Но возникает вопрос, если тест не психологический, он может и должен состоять из заданий разной сложности и разных форматов, что вполне естественно приводит к его внутренней несогласованности - несогласованности отдельных частей друг с другом и с конечным результатом.
плав
Цитата(DavVlad @ 4.06.2008 - 11:26) *
1) На сколько я понимаю, вы имеете в виду повторное тестирование по одному и тому же тесту (имеющему идентичные задания) через небольшой промежуток времени (7-10 дней). У меня другая ситуация. Тест не психологический, он критериально-ориентированный. Методика ретеста изменена. Испытуемый тестируется дважды подряд по одному и тому же тесту, но задания, которые он получает разные. Это компьютерное тестировние и требование к тесту таково, что он должен состоять из кластеров фасетных заданий. Какие методы обработки следует использовать в этом случае и как оценивать их результаты.
4) Я слышал что наиболее эффективным является коэффициент альфа Кронбаха, так как существует проблема разбиения результатов тестирования на две части. Этот коэффициент является усредненным для всех возможных вариантов надежностей с разбиением на половины. Но возникает вопрос, если тест не психологический, он может и должен состоять из заданий разной сложности и разных форматов, что вполне естественно приводит к его внутренней несогласованности - несогласованности отдельных частей друг с другом и с конечным результатом.

1) Терминология непонятная, критериально-ориентированными тестами обычно называют тесты в которых есть внешние критерии оценки (либо экспертные, либо какие-то другие). Это добаваляет к оценке обычной конструктной валидности (той, которая и проверяется альфа Кронбаха) еще и критериальную валидность, которая оценвается обычно при помощи коэффициентов согласия типа коэффициента каппа. Возможно, у Вас именно такая задача, но обычно в этом случае один и тот же тест дают разным оценщикам, а не наоборот. Однако общая логика одинакова - перво-наперво надо доказать, что все задания измеряют одно и то же (т.е. между ними существует корреляция и тут мы подходим к
4) Если в тесте несогласовнные задания, он не является тестом (по крайней мере внутри теста должны быть шкалы, состоящие из согласованных заданий). Если задания разной сложности и форматов это еще не означает, что они не будут согласованными, т.е. вероятность ответа на один вопрос (задание) повышает вероятность ответа на другой. Если тестовые задания независимы, то такой набор не считается тестом. А альфа Кронбаха как раз согласованность и измеряет. Ответ про деление пополам был связан с упоминанием Вами корреляционных коэффициентов, а расчет надежности через коэффициенты корреляции ведется только в случае деления теста пополам.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.