Помогите, пожалуйста, с выбором критерия |
Здравствуйте, гость ( Вход | Регистрация )
Помогите, пожалуйста, с выбором критерия |
29.01.2015 - 18:19
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 29.01.2015 Пользователь №: 26992 |
Уважаемые обитатели форума, подскажите, пожалуйста, неразумному бактериологу!
Вот у нас есть данные про наличие или отсутствие определенных бактерий у людей разного возраста. То есть выглядят они следующим образом: 1 - возраст 10 лет - нету 2 - возраст 12 лет - нету 3 - возраст 15 лет - есть 4 - возраст 25 лет - нету 5 - возраст 30 лет - есть и. .т. д. Вопрос - каким образом можно определить, зависит ли встречаемость данных бактерий от возраста? У меня возникла мысль, что так как эти данные можно представить в виде ...00101..., проранжировав пациентов по возрасту, то к данной последовательности можно применить критерий Манна-Уитни. Обычно для его применения априорно известный параметр дискретен (группа), а измеряемый непрерывен, а здесь получается наоборот. Прав ли я, что так можно? Если нет, то какой критерий лучше использовать? И что советуете почитать про это дело? Заранее большое спасибо! |
|
29.01.2015 - 19:23
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Уважаемые обитатели форума, подскажите, пожалуйста, неразумному бактериологу! Вот у нас есть данные про наличие или отсутствие определенных бактерий у людей разного возраста. То есть выглядят они следующим образом: 1 - возраст 10 лет - нету 2 - возраст 12 лет - нету 3 - возраст 15 лет - есть 4 - возраст 25 лет - нету 5 - возраст 30 лет - есть и. .т. д. Вопрос - каким образом можно определить, зависит ли встречаемость данных бактерий от возраста? У меня возникла мысль, что так как эти данные можно представить в виде ...00101..., проранжировав пациентов по возрасту, то к данной последовательности можно применить критерий Манна-Уитни. Обычно для его применения априорно известный параметр дискретен (группа), а измеряемый непрерывен, а здесь получается наоборот. Прав ли я, что так можно? Если нет, то какой критерий лучше использовать? И что советуете почитать про это дело? Заранее большое спасибо! Т.к. может быть нелинейная связь лучше строить таблицу частот. Постройте таблицу: в строках - возраст, в 2 колонках - количества людей с "есть", и с "нету". Возраста можно группировать в более крупные категории, например, 10-12, 13-14, 15-16... или 10-15, 16-20, 21-25... Пока это не строго, в принципе для анализа даже необязательно, чтобы ряд возрастов был нарезан на одинаковые отрезки категорий, т.е. можно, например, 10-12, 13-18, 19-25, 26-50 и более 50. Выбор должен делаться исходя из знаний о сути процесса и объёма материала, главное увидеть закономерность или её отсутствие. Статистически проверить такую таблицу сопряжённости можно критериями типа хи-квадрат, читайте про этот метод. Чтобы изобразить наглядно - рассчитайте по такой таблице % встречаемости бактерии для каждого возраста и отложите на графике. Если будет тренд увеличения или снижения частоты с возрастом, то таблицу сопряжённости лучше проверять не простым хи-квадратом, а критериями проверки на тренд (они есть в пакетах и онлайновых калькуляторах вроде тоже) - будет выигрыш в мощности. В принципе, если есть теоретические соображения о характере нелинейного тренда, можно проверить и на соответствие ему: описано в Закс Л. Статистическое оценивание и вроде бы программа StatXact такое позволяла задать. |
|
29.01.2015 - 20:23
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 29.01.2015 Пользователь №: 26992 |
Делить на группы по непрерывному параметру - логичный вариант, вот только мы ведь на этом теряем часть информации, а значит, по моему пониманию, должна теряться мощность. А у меня не так много наблюдений, плюс впоследствии придется делать поправки на множественные сравнения (так как такая бактерия не одна...), так что мощность терять на этом не хочется.
А если всё же сделать предположение, что зависимость частоты монотонная? Есть ли в таком случае возможность обойтись без таблиц сопряженности? |
|
29.01.2015 - 21:40
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Если я правильно понял структуру данных, Вам следует применять бисериальный коэффициент корреляции.
Формула и проверка значимости по критерию Стьюдента с примером имеются здесь http://studopedia.net/14_69172_biserialnie...rrelyatsii.html Анализ мощности имеется в программе G*Power. Где-то читал, что данный подход считается устаревшим. В SPSS можно вычислить статистику Эта, квадрат которой показывает долю объясненной дисперсии. Можно применить и перестановочный тест. Сообщение отредактировал anserovtv - 30.01.2015 - 10:41 |
|
29.01.2015 - 22:14
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 29.01.2015 Пользователь №: 26992 |
А тут пишут, что тест на ранговый бисериальный коэффициент корреляции математически эквивалентен тесту Манну-Уитни:
http://epm.sagepub.com/content/36/2/297 То есть, мое изначальное предположение верно? Или я томат? Сообщение отредактировал okolomedik - 31.01.2015 - 12:37 |
|
29.01.2015 - 22:20
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Бисериальный коэффициент корреляции вычисляется в пакете PAST.
Полагаю. что речь идет о достаточно разных вещах. В пакете для оценки значимости бисериального коэффициента корреляции имеется и перестановочный тест. Согласен, связь между тестами и статистиками есть: если корреляции нет, то распределения в группа одинаковы; если корреляция есть, то распределения в группах различны. Если к данным применить некоторые преобразования, то можно дополнительно использовать и критерий серий. Сообщение отредактировал anserovtv - 30.01.2015 - 22:54 |
|
30.01.2015 - 23:17
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Делить на группы по непрерывному параметру - логичный вариант, вот только мы ведь на этом теряем часть информации, а значит, по моему пониманию, должна теряться мощность. А у меня не так много наблюдений, плюс впоследствии придется делать поправки на множественные сравнения (так как такая бактерия не одна...), так что мощность терять на этом не хочется. А если всё же сделать предположение, что зависимость частоты монотонная? Есть ли в таком случае возможность обойтись без таблиц сопряженности? Предположения должны быть обоснованными. Необоснованные предположения называются фантазиями. Никто не может запретить человеку фантазировать. Но вы просили совета и я написал что полезно сделать в первую очередь, чтобы обнаружить наличие и форму связи (не зависимости, т.к. зависимость - пока только ещё одна фантазия, и её предстоит доказывать). Иначе можно брать любой более-менее понравившийся метод из замечательного справочника Кобзаря (Прикладная математическая статистика) и действовать в духе "а если всё же предположить...". По мне так лучше пожертвовать и положить часть информации в фундамент предположений, чем оставить всю и жонглировать ею по своему усмотрению. А то, что бактерий много указывает не столько на необходимость поправок, сколько на возможность "выкрутить" из этого материала интересные закономерности многомерными методами. Наиболее яркие вещи тогда можно подтвердить более простыми методами, но уже с более общей и сильной позиции, т.е. выбравшись из под гнёта необходимости поправок. Сообщение отредактировал nokh - 30.01.2015 - 23:19 |
|
31.01.2015 - 22:56
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Уважаемые обитатели форума, подскажите, пожалуйста, неразумному бактериологу! Вот у нас есть данные про наличие или отсутствие определенных бактерий у людей разного возраста. То есть выглядят они следующим образом: 1 - возраст 10 лет - нету 2 - возраст 12 лет - нету 3 - возраст 15 лет - есть 4 - возраст 25 лет - нету 5 - возраст 30 лет - есть и. .т. д. Вопрос - каким образом можно определить, зависит ли встречаемость данных бактерий от возраста? У меня возникла мысль, что так как эти данные можно представить в виде ...00101..., проранжировав пациентов по возрасту, то к данной последовательности можно применить критерий Манна-Уитни. Обычно для его применения априорно известный параметр дискретен (группа), а измеряемый непрерывен, а здесь получается наоборот. Прав ли я, что так можно? Если нет, то какой критерий лучше использовать? И что советуете почитать про это дело? Заранее большое спасибо! А может быть попробовать логистическую регрессию? Если она хорошо обучится по этой выборке, то площадь под ROC-кривой будет выполнять ту же функцию, что и R-квадрат. |
|
1.02.2015 - 14:18
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Для нескольких видов бактерий можно сделать следующее исследование:
если состав бактерий меняется с возрастом, то следует применить сериационный тест (биологич.) для проверки гипотезы о существовании тенденции. Полагаю, что данный тест полезен в любом случае, подтвердится нулевая гипотеза или нет. Сообщение отредактировал anserovtv - 2.02.2015 - 08:19 |
|
29.09.2015 - 15:12
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1 Регистрация: 29.09.2015 Пользователь №: 27560 |
Здравствуйте! Помогите, пожалуйста, очень нужен Ваш совет. Подскажите, пожалуйста, какой критерий использовать для рассчета достоверности различий в данной ситуации - обследуемые в количестве 121 человека разделены на 3 группы (по принадлежности к хронотипам), в 1-й группе - 74 чел, во 2-й - 39, в 3-й - 9. Необходимо сравнить данные группы по показателям ЭЭГ, вариабельности серд.ритма и т.д. Заранее благодарна за помощь и подсказку.
|
|
29.09.2015 - 22:18
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Anna
Нужны подробности и некоторые предварительные исследования. Если я правильно понимаю медтерминологию и типы шкал данных, то Вам необходимо использовать однофакторный дисперсионный анализ с апостериорными сравнениями.. Но прежде нужно проверить условия его применения для каждого показателя. Удобно использовать пакет PAST - есть проверка нормальности распределения остатков и др. Можно делать вычисления и в SPSS. Если данные измерены в других шкалах, то существует непараметрический аналог и др. Целесообразно использовать и перестановочные тесты и др.. Существуют и более сложные методы. Тема обсуждалась. Сообщение отредактировал anserovtv - 29.09.2015 - 22:26 |
|