Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V  < 1 2 3  
Добавить ответ в эту темуОткрыть тему
> Зависимость локализации поражения от породы
DoctorStat
сообщение 20.05.2018 - 11:36
Сообщение #31


Дух форума
*

Группа: Пользователи
Сообщений: 360
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Кажется, это заметил passant: 8 пород (строк), 5 локализаций (столбцов) ? получается одна таблица сопряженности 8*5 = 40 ячеек. Число случаев (собак) = 88. Когда у собаки одно поражение, средние числа заполнения таблицы = 88/40=2. Минимальные числа в ячейках будут заведомо меньше средних чисел, значит метод хи-квадрат проверки независимости не подойдет. А вот точный критерий Фишера, свободный от ограничений минимальных значений в ячейках, поможет ответить на вопрос: зависит ли локализация поражения от породы собак.


Signature
Просто включи мозг => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Олег Кравец
сообщение 23.05.2018 - 06:53
Сообщение #32


Редколлегия журнала "Врач-аспирант"
*

Группа: Модераторы
Сообщений: 274
Регистрация: 1.02.2005
Из: Воронеж
Пользователь №: 93



[moderator on] треп на грани потер.


Signature
О.Я.Кравец, д.т.н., проф.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 23.05.2018 - 10:33
Сообщение #33


Дух форума
*

Группа: Пользователи
Сообщений: 1036
Регистрация: 26.08.2010
Пользователь №: 22699



Собственно вот подробный мануал в котором есть рачет размера наблюдаемого эффекта и доверительного интервалаПрикрепленный файл  analiz_nominalnyh_dannyh_nezavisimye_nablyudeniya.pdf ( 1,45 мегабайт ) Кол-во скачиваний: 86
.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Елена Гогуа
сообщение 26.08.2018 - 14:01
Сообщение #34


Дух форума
*

Группа: Пользователи
Сообщений: 8
Регистрация: 5.05.2018
Пользователь №: 31338



Я прошу прощения, что так надолго пропала.

Напишу подробнее, что происходит.
Российские ветеринарные врачи сформулировали гипотезу, что локализация кожных поражений у собак и тип инфекции (бактериальная, грибковая, смешанная) взаимосвязаны с породой. Исследование проспективное, собак набирали около года по протоколу. Все это исследование проходит при участии профессора из Германии. Это именно участие и помощь, он не статистик и не должен анализировать данные. Он помогает советами, так как имеет больший опыт.

Я прикрепила таблицу с данными.

Всего 88 собак, породные группы формировались, если собак этой породы было 3 и более. Получилось 8 породных групп плюс 11 собак разных пород.
Локализаций поражений всего 8 (лапы, уши, морда, живот, спина и т.д.). У одной собаки может быть несколько пораженных областей. В свою очередь, каждое поражение может быть бактериальное ИЛИ грибковое ИЛИ смешанное. Исходя из этого получилось 8*3 = 24 переменные (зона_1_бакт, зона_1_грибк, зона_1_смеш, зона_2_бакт, и т.д.). Кроме того, рассматривали типы инфекции (бакт, грибк, смеш) без учета локализации. Например, у одной породы почти все поражения были грибковыми, у другой смешанными, у третьей - вообще не было инфекций (да, есть породы, у которых зуд и подтвержденный диагноз есть, но вторичной инфекции нет). Всего получилось 8 + 24 + 4 = 36 переменных (в таблице, мне кажется, понятней).

Так вот. Я по каждой паре порода*переменная проводила анализ таблиц сопряженности. Статистически значимые результаты совпадали с клиническими наблюдениями дерматологов (ну это к слову).

Немецкий профессор вчера написал, что при множественных сравнениях одних и тех же данных есть вероятность значимых результатов просто случайная, и необходимо использовать коррекцию Бонферрони (которая, конечно, все эти значимости сводит на нет).

Мне вся эта задачка очень интересна, но не хватает знаний и опыта smile.gif


Буду очень благодарна за ваши мнения.

Сообщение отредактировал Елена Гогуа - 26.08.2018 - 20:25
Прикрепленные файлы
Прикрепленный файл  breed_localization.xlsx ( 20,37 килобайт ) Кол-во скачиваний: 8
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.08.2018 - 22:30
Сообщение #35


Дух форума
*

Группа: Пользователи
Сообщений: 1036
Регистрация: 26.08.2010
Пользователь №: 22699



1) Неправильно это придумывать самому уровни факторов и потом такую искусственную конструкцию распердоливать еще на дамми переменные. По зонам тоже не нужное такое кодирование (Все это игрища пустые, простое svd показывает реальная размерность такого датасета намного меньше.)

Есть два показателя "бинарных", условно _грибок_ и _бактерия_ (в обоих "нули", вот и ситуация когда "нет", в обоих единица, значит ситуация "оба").

2) Ну а породы наоборот надо на дамми разложить, раз связь именно с ними надо показать.

Эрго:

Получается наличие прострой структуры размерностью 4 по данным с зонами поражений. Но что то лениво мне еще и все зоны описывать в нормальную кодировку (грибок+бактерия в зоне).

Если смотреть только по обобщенным данным, то увы мощности данных не хватает что бы доказать наличие простой структуры. Но корреляционную картину можно сколько угодно интерпретировать smile.gif

Склонны к грибам породы 2 и 6. К бактериям склонна порода 1. Несклонна к бактериям порода 4. Склонность к бактериям или грибам независимы друг от друга для всех пород (ну можно что то ловить у 5й пытаться, она вроде как "ко всему умеренно не склонна").

Сообщение отредактировал p2004r - 27.08.2018 - 22:31


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Елена Гогуа
сообщение 29.08.2018 - 12:51
Сообщение #36


Дух форума
*

Группа: Пользователи
Сообщений: 8
Регистрация: 5.05.2018
Пользователь №: 31338



1.Дизайн исследования предполагает оценку взаимосвязи породы и типов воспаления, породы и локализаций, породы и типов воспаления в разных локализациях.
Мне не очень понятно, что значит "самому придумывать уровни факторов" и почему конструкция искусственная. Именно эти переменные (точнее, их взаимосвязь с породой) интересуют исследователей.
С клинической точки зрения неверно комбинацию бактерии+грибы оценивать как простую сумму. Каждый из этих 3 типов воспаления (бактериальное, грибковое, комбинированное) - самостоятельный параметр. По крайней мере, дизайном исследования именно это подразумевается. То есть это примерно то же самое, как обозначить, например, наличие хеликобактера в желудке и гастрита за единицы, а язву желудка - как сумму двух единиц (пример корявый, да).

2.Так породы на дамми и разложены, нет? Принадлежность к интересуемой породе - 1, все остальные - 0.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 31.08.2018 - 22:48
Сообщение #37


Дух форума
*

Группа: Пользователи
Сообщений: 1036
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Елена Гогуа @ 29.08.2018 - 12:51) *
1.Дизайн исследования предполагает оценку взаимосвязи породы и типов воспаления, породы и локализаций, породы и типов воспаления в разных локализациях.
Мне не очень понятно, что значит "самому придумывать уровни факторов" и почему конструкция искусственная. Именно эти переменные (точнее, их взаимосвязь с породой) интересуют исследователей.
С клинической точки зрения неверно комбинацию бактерии+грибы оценивать как простую сумму. Каждый из этих 3 типов воспаления (бактериальное, грибковое, комбинированное) - самостоятельный параметр. По крайней мере, дизайном исследования именно это подразумевается. То есть это примерно то же самое, как обозначить, например, наличие хеликобактера в желудке и гастрита за единицы, а язву желудка - как сумму двух единиц (пример корявый, да).

2.Так породы на дамми и разложены, нет? Принадлежность к интересуемой породе - 1, все остальные - 0.


1. Не надо путать клиническую и математическую постановку. Все вот эти лишние столбики в суммарной статистике поражения благоглупости.

Есть два независимых бинарных фактора -- "наличие грибка" и "наличие бактерий" без избыточности все описывающие, и никаких "грибок + бактерия" и "ничего нет" добавлятть не нужно. Что то такое дописывать в данные это и называется "самому придумывать уровни". Никаких степеней свободы в описание выборки эти взаимозависимые переменные не добавляют, а значит ни о каких "самостоятельных параметрах" фантазировать просто нет оснований. Ну не может например одновременно быть "наличие грибка" и "грибок+бактерия" в придуманной вами кодировке, а значит нет никакого "самостоятельного параметра" "грибок + бактерия".

Перекодировать все эти введенные area_i_X во вменяемый вид (бинарные area_i_yearn и area_i_yeast) я простите не нанимался (это не интересная чисто техническая работа). Для общей статистики без локализации поражения данные трансформировал и озвучил результат в предыдущем посте.

2. Породы в таблице во втором столбце исходно как breed_i закодированы. Это никак не тянет на 0-1.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

3 страниц V  < 1 2 3
Добавить ответ в эту темуОткрыть тему