Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Помогите, пожалуйста, с выбором критерия
okolomedik
сообщение 29.01.2015 - 18:19
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 3
Регистрация: 29.01.2015
Пользователь №: 26992



Уважаемые обитатели форума, подскажите, пожалуйста, неразумному бактериологу!
Вот у нас есть данные про наличие или отсутствие определенных бактерий у людей разного возраста. То есть выглядят они следующим образом:

1 - возраст 10 лет - нету
2 - возраст 12 лет - нету
3 - возраст 15 лет - есть
4 - возраст 25 лет - нету
5 - возраст 30 лет - есть
и. .т. д.

Вопрос - каким образом можно определить, зависит ли встречаемость данных бактерий от возраста?
У меня возникла мысль, что так как эти данные можно представить в виде ...00101..., проранжировав пациентов по возрасту, то к данной последовательности можно применить критерий Манна-Уитни. Обычно для его применения априорно известный параметр дискретен (группа), а измеряемый непрерывен, а здесь получается наоборот. Прав ли я, что так можно? Если нет, то какой критерий лучше использовать? И что советуете почитать про это дело?
Заранее большое спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 29.01.2015 - 19:23
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 1062
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(okolomedik @ 29.01.2015 - 20:19) *
Уважаемые обитатели форума, подскажите, пожалуйста, неразумному бактериологу!
Вот у нас есть данные про наличие или отсутствие определенных бактерий у людей разного возраста. То есть выглядят они следующим образом:

1 - возраст 10 лет - нету
2 - возраст 12 лет - нету
3 - возраст 15 лет - есть
4 - возраст 25 лет - нету
5 - возраст 30 лет - есть
и. .т. д.

Вопрос - каким образом можно определить, зависит ли встречаемость данных бактерий от возраста?
У меня возникла мысль, что так как эти данные можно представить в виде ...00101..., проранжировав пациентов по возрасту, то к данной последовательности можно применить критерий Манна-Уитни. Обычно для его применения априорно известный параметр дискретен (группа), а измеряемый непрерывен, а здесь получается наоборот. Прав ли я, что так можно? Если нет, то какой критерий лучше использовать? И что советуете почитать про это дело?
Заранее большое спасибо!

Т.к. может быть нелинейная связь лучше строить таблицу частот. Постройте таблицу: в строках - возраст, в 2 колонках - количества людей с "есть", и с "нету". Возраста можно группировать в более крупные категории, например, 10-12, 13-14, 15-16... или 10-15, 16-20, 21-25... Пока это не строго, в принципе для анализа даже необязательно, чтобы ряд возрастов был нарезан на одинаковые отрезки категорий, т.е. можно, например, 10-12, 13-18, 19-25, 26-50 и более 50. Выбор должен делаться исходя из знаний о сути процесса и объёма материала, главное увидеть закономерность или её отсутствие. Статистически проверить такую таблицу сопряжённости можно критериями типа хи-квадрат, читайте про этот метод. Чтобы изобразить наглядно - рассчитайте по такой таблице % встречаемости бактерии для каждого возраста и отложите на графике. Если будет тренд увеличения или снижения частоты с возрастом, то таблицу сопряжённости лучше проверять не простым хи-квадратом, а критериями проверки на тренд (они есть в пакетах и онлайновых калькуляторах вроде тоже) - будет выигрыш в мощности. В принципе, если есть теоретические соображения о характере нелинейного тренда, можно проверить и на соответствие ему: описано в Закс Л. Статистическое оценивание и вроде бы программа StatXact такое позволяла задать.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
okolomedik
сообщение 29.01.2015 - 20:23
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 3
Регистрация: 29.01.2015
Пользователь №: 26992



Делить на группы по непрерывному параметру - логичный вариант, вот только мы ведь на этом теряем часть информации, а значит, по моему пониманию, должна теряться мощность. А у меня не так много наблюдений, плюс впоследствии придется делать поправки на множественные сравнения (так как такая бактерия не одна...), так что мощность терять на этом не хочется.
А если всё же сделать предположение, что зависимость частоты монотонная? Есть ли в таком случае возможность обойтись без таблиц сопряженности?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 29.01.2015 - 21:40
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Если я правильно понял структуру данных, Вам следует применять бисериальный коэффициент корреляции.
Формула и проверка значимости по критерию Стьюдента с примером имеются здесь
http://studopedia.net/14_69172_biserialnie...rrelyatsii.html
Анализ мощности имеется в программе G*Power.
Где-то читал, что данный подход считается устаревшим.
В SPSS можно вычислить статистику Эта, квадрат которой показывает долю объясненной дисперсии.
Можно применить и перестановочный тест.

Сообщение отредактировал anserovtv - 30.01.2015 - 10:41
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
okolomedik
сообщение 29.01.2015 - 22:14
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 3
Регистрация: 29.01.2015
Пользователь №: 26992



А тут пишут, что тест на ранговый бисериальный коэффициент корреляции математически эквивалентен тесту Манну-Уитни:
http://epm.sagepub.com/content/36/2/297
То есть, мое изначальное предположение верно? Или я томат?

Сообщение отредактировал okolomedik - 31.01.2015 - 12:37
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 29.01.2015 - 22:20
Сообщение #6


Дух форума
*

Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Бисериальный коэффициент корреляции вычисляется в пакете PAST.
Полагаю. что речь идет о достаточно разных вещах.
В пакете для оценки значимости бисериального коэффициента корреляции имеется и перестановочный тест.
Согласен, связь между тестами и статистиками есть: если корреляции нет, то распределения в группа одинаковы;
если корреляция есть, то распределения в группах различны.
Если к данным применить некоторые преобразования, то можно дополнительно использовать и критерий серий.

Сообщение отредактировал anserovtv - 30.01.2015 - 22:54
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 30.01.2015 - 23:17
Сообщение #7


Дух форума
*

Группа: Пользователи
Сообщений: 1062
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(okolomedik @ 29.01.2015 - 22:23) *
Делить на группы по непрерывному параметру - логичный вариант, вот только мы ведь на этом теряем часть информации, а значит, по моему пониманию, должна теряться мощность. А у меня не так много наблюдений, плюс впоследствии придется делать поправки на множественные сравнения (так как такая бактерия не одна...), так что мощность терять на этом не хочется.
А если всё же сделать предположение, что зависимость частоты монотонная? Есть ли в таком случае возможность обойтись без таблиц сопряженности?

Предположения должны быть обоснованными. Необоснованные предположения называются фантазиями. Никто не может запретить человеку фантазировать. Но вы просили совета и я написал что полезно сделать в первую очередь, чтобы обнаружить наличие и форму связи (не зависимости, т.к. зависимость - пока только ещё одна фантазия, и её предстоит доказывать). Иначе можно брать любой более-менее понравившийся метод из замечательного справочника Кобзаря (Прикладная математическая статистика) и действовать в духе "а если всё же предположить...". По мне так лучше пожертвовать и положить часть информации в фундамент предположений, чем оставить всю и жонглировать ею по своему усмотрению.
А то, что бактерий много указывает не столько на необходимость поправок, сколько на возможность "выкрутить" из этого материала интересные закономерности многомерными методами. Наиболее яркие вещи тогда можно подтвердить более простыми методами, но уже с более общей и сильной позиции, т.е. выбравшись из под гнёта необходимости поправок.

Сообщение отредактировал nokh - 30.01.2015 - 23:19
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 31.01.2015 - 22:56
Сообщение #8


Дух форума
*

Группа: Пользователи
Сообщений: 671
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(okolomedik @ 29.01.2015 - 19:19) *
Уважаемые обитатели форума, подскажите, пожалуйста, неразумному бактериологу!
Вот у нас есть данные про наличие или отсутствие определенных бактерий у людей разного возраста. То есть выглядят они следующим образом:

1 - возраст 10 лет - нету
2 - возраст 12 лет - нету
3 - возраст 15 лет - есть
4 - возраст 25 лет - нету
5 - возраст 30 лет - есть
и. .т. д.

Вопрос - каким образом можно определить, зависит ли встречаемость данных бактерий от возраста?
У меня возникла мысль, что так как эти данные можно представить в виде ...00101..., проранжировав пациентов по возрасту, то к данной последовательности можно применить критерий Манна-Уитни. Обычно для его применения априорно известный параметр дискретен (группа), а измеряемый непрерывен, а здесь получается наоборот. Прав ли я, что так можно? Если нет, то какой критерий лучше использовать? И что советуете почитать про это дело?
Заранее большое спасибо!


А может быть попробовать логистическую регрессию?
Если она хорошо обучится по этой выборке, то площадь под ROC-кривой будет выполнять ту же функцию, что и R-квадрат.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 1.02.2015 - 14:18
Сообщение #9


Дух форума
*

Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Для нескольких видов бактерий можно сделать следующее исследование:
если состав бактерий меняется с возрастом, то следует применить сериационный тест (биологич.) для проверки гипотезы о существовании тенденции.
Полагаю, что данный тест полезен в любом случае, подтвердится нулевая гипотеза или нет.


Сообщение отредактировал anserovtv - 2.02.2015 - 08:19
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
annaplotnikoff
сообщение 29.09.2015 - 15:12
Сообщение #10


Дух форума
*

Группа: Пользователи
Сообщений: 1
Регистрация: 29.09.2015
Пользователь №: 27560



Здравствуйте! Помогите, пожалуйста, очень нужен Ваш совет. Подскажите, пожалуйста, какой критерий использовать для рассчета достоверности различий в данной ситуации - обследуемые в количестве 121 человека разделены на 3 группы (по принадлежности к хронотипам), в 1-й группе - 74 чел, во 2-й - 39, в 3-й - 9. Необходимо сравнить данные группы по показателям ЭЭГ, вариабельности серд.ритма и т.д. Заранее благодарна за помощь и подсказку.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 29.09.2015 - 22:18
Сообщение #11


Дух форума
*

Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Anna
Нужны подробности и некоторые предварительные исследования.
Если я правильно понимаю медтерминологию и типы шкал данных, то Вам необходимо использовать однофакторный дисперсионный анализ с апостериорными сравнениями..
Но прежде нужно проверить условия его применения для каждого показателя. Удобно использовать пакет PAST - есть проверка нормальности распределения остатков и др. Можно делать вычисления и в SPSS. Если данные измерены в других шкалах, то существует непараметрический аналог и др. Целесообразно использовать и перестановочные тесты и др.. Существуют и более сложные методы.
Тема обсуждалась.

Сообщение отредактировал anserovtv - 29.09.2015 - 22:26
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему