Зависимость локализации поражения от породы |
Здравствуйте, гость ( Вход | Регистрация )
Зависимость локализации поражения от породы |
20.05.2018 - 11:36
Сообщение
#31
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Кажется, это заметил passant: 8 пород (строк), 5 локализаций (столбцов) ? получается одна таблица сопряженности 8*5 = 40 ячеек. Число случаев (собак) = 88. Когда у собаки одно поражение, средние числа заполнения таблицы = 88/40=2. Минимальные числа в ячейках будут заведомо меньше средних чисел, значит метод хи-квадрат проверки независимости не подойдет. А вот точный критерий Фишера, свободный от ограничений минимальных значений в ячейках, поможет ответить на вопрос: зависит ли локализация поражения от породы собак.
Просто включи мозги => http://doctorstat.narod.ru
|
|
23.05.2018 - 06:53
Сообщение
#32
|
|
Группа: Модераторы Сообщений: 286 Регистрация: 1.02.2005 Из: Воронеж Пользователь №: 93 |
[moderator on] треп на грани потер.
О.Я.Кравец, д.т.н., проф.
|
|
23.05.2018 - 10:33
Сообщение
#33
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Собственно вот подробный мануал в котором есть рачет размера наблюдаемого эффекта и доверительного интервала
analiz_nominalnyh_dannyh_nezavisimye_nablyudeniya.pdf ( 1,45 мегабайт )
Кол-во скачиваний: 484
. |
|
26.08.2018 - 14:01
Сообщение
#34
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 5.05.2018 Пользователь №: 31338 |
Я прошу прощения, что так надолго пропала.
Напишу подробнее, что происходит. Российские ветеринарные врачи сформулировали гипотезу, что локализация кожных поражений у собак и тип инфекции (бактериальная, грибковая, смешанная) взаимосвязаны с породой. Исследование проспективное, собак набирали около года по протоколу. Все это исследование проходит при участии профессора из Германии. Это именно участие и помощь, он не статистик и не должен анализировать данные. Он помогает советами, так как имеет больший опыт. Я прикрепила таблицу с данными. Всего 88 собак, породные группы формировались, если собак этой породы было 3 и более. Получилось 8 породных групп плюс 11 собак разных пород. Локализаций поражений всего 8 (лапы, уши, морда, живот, спина и т.д.). У одной собаки может быть несколько пораженных областей. В свою очередь, каждое поражение может быть бактериальное ИЛИ грибковое ИЛИ смешанное. Исходя из этого получилось 8*3 = 24 переменные (зона_1_бакт, зона_1_грибк, зона_1_смеш, зона_2_бакт, и т.д.). Кроме того, рассматривали типы инфекции (бакт, грибк, смеш) без учета локализации. Например, у одной породы почти все поражения были грибковыми, у другой смешанными, у третьей - вообще не было инфекций (да, есть породы, у которых зуд и подтвержденный диагноз есть, но вторичной инфекции нет). Всего получилось 8 + 24 + 4 = 36 переменных (в таблице, мне кажется, понятней). Так вот. Я по каждой паре порода*переменная проводила анализ таблиц сопряженности. Статистически значимые результаты совпадали с клиническими наблюдениями дерматологов (ну это к слову). Немецкий профессор вчера написал, что при множественных сравнениях одних и тех же данных есть вероятность значимых результатов просто случайная, и необходимо использовать коррекцию Бонферрони (которая, конечно, все эти значимости сводит на нет). Мне вся эта задачка очень интересна, но не хватает знаний и опыта Буду очень благодарна за ваши мнения. Сообщение отредактировал Елена Гогуа - 26.08.2018 - 20:25
Прикрепленные файлы
|
|
27.08.2018 - 22:30
Сообщение
#35
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
1) Неправильно это придумывать самому уровни факторов и потом такую искусственную конструкцию распердоливать еще на дамми переменные. По зонам тоже не нужное такое кодирование (Все это игрища пустые, простое svd показывает реальная размерность такого датасета намного меньше.)
Есть два показателя "бинарных", условно _грибок_ и _бактерия_ (в обоих "нули", вот и ситуация когда "нет", в обоих единица, значит ситуация "оба"). 2) Ну а породы наоборот надо на дамми разложить, раз связь именно с ними надо показать. Эрго: Получается наличие прострой структуры размерностью 4 по данным с зонами поражений. Но что то лениво мне еще и все зоны описывать в нормальную кодировку (грибок+бактерия в зоне). Если смотреть только по обобщенным данным, то увы мощности данных не хватает что бы доказать наличие простой структуры. Но корреляционную картину можно сколько угодно интерпретировать Склонны к грибам породы 2 и 6. К бактериям склонна порода 1. Несклонна к бактериям порода 4. Склонность к бактериям или грибам независимы друг от друга для всех пород (ну можно что то ловить у 5й пытаться, она вроде как "ко всему умеренно не склонна"). Сообщение отредактировал p2004r - 27.08.2018 - 22:31 |
|
29.08.2018 - 12:51
Сообщение
#36
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 5.05.2018 Пользователь №: 31338 |
1.Дизайн исследования предполагает оценку взаимосвязи породы и типов воспаления, породы и локализаций, породы и типов воспаления в разных локализациях.
Мне не очень понятно, что значит "самому придумывать уровни факторов" и почему конструкция искусственная. Именно эти переменные (точнее, их взаимосвязь с породой) интересуют исследователей. С клинической точки зрения неверно комбинацию бактерии+грибы оценивать как простую сумму. Каждый из этих 3 типов воспаления (бактериальное, грибковое, комбинированное) - самостоятельный параметр. По крайней мере, дизайном исследования именно это подразумевается. То есть это примерно то же самое, как обозначить, например, наличие хеликобактера в желудке и гастрита за единицы, а язву желудка - как сумму двух единиц (пример корявый, да). 2.Так породы на дамми и разложены, нет? Принадлежность к интересуемой породе - 1, все остальные - 0. |
|
31.08.2018 - 22:48
Сообщение
#37
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
1.Дизайн исследования предполагает оценку взаимосвязи породы и типов воспаления, породы и локализаций, породы и типов воспаления в разных локализациях. Мне не очень понятно, что значит "самому придумывать уровни факторов" и почему конструкция искусственная. Именно эти переменные (точнее, их взаимосвязь с породой) интересуют исследователей. С клинической точки зрения неверно комбинацию бактерии+грибы оценивать как простую сумму. Каждый из этих 3 типов воспаления (бактериальное, грибковое, комбинированное) - самостоятельный параметр. По крайней мере, дизайном исследования именно это подразумевается. То есть это примерно то же самое, как обозначить, например, наличие хеликобактера в желудке и гастрита за единицы, а язву желудка - как сумму двух единиц (пример корявый, да). 2.Так породы на дамми и разложены, нет? Принадлежность к интересуемой породе - 1, все остальные - 0. 1. Не надо путать клиническую и математическую постановку. Все вот эти лишние столбики в суммарной статистике поражения благоглупости. Есть два независимых бинарных фактора -- "наличие грибка" и "наличие бактерий" без избыточности все описывающие, и никаких "грибок + бактерия" и "ничего нет" добавлятть не нужно. Что то такое дописывать в данные это и называется "самому придумывать уровни". Никаких степеней свободы в описание выборки эти взаимозависимые переменные не добавляют, а значит ни о каких "самостоятельных параметрах" фантазировать просто нет оснований. Ну не может например одновременно быть "наличие грибка" и "грибок+бактерия" в придуманной вами кодировке, а значит нет никакого "самостоятельного параметра" "грибок + бактерия". Перекодировать все эти введенные area_i_X во вменяемый вид (бинарные area_i_yearn и area_i_yeast) я простите не нанимался (это не интересная чисто техническая работа). Для общей статистики без локализации поражения данные трансформировал и озвучил результат в предыдущем посте. 2. Породы в таблице во втором столбце исходно как breed_i закодированы. Это никак не тянет на 0-1. |
|