Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Зависимость локализации поражения от породы
Елена Гогуа
сообщение 6.05.2018 - 15:26
Сообщение #1





Группа: Пользователи
Сообщений: 13
Регистрация: 5.05.2018
Пользователь №: 31338




Здравствуйте. Я ветеринарный врач, увлечена клиническими исследованиями. Самоучка, так как в российской ветеринарной медицине этого направления пока нет. Поэтому прошу прощения за возможно глупые вопросы.

Коллеги попросили помочь с исследованием: оценка породной предрасположенности к определенной локализации и характеру кожных поражений у собак. Есть 8 пород (в исследование включались породы, где было 3 и больше пациентов) - всего 77 собак, и в качестве контрольной группы собаки, которых было представлено только по 1-2 штуки из породы (всего 11). Локализаций поражений 24.

Правильно ли я понимаю:
1.Это описательное исследование (зависимость локализации поражения от породы, нет вмешательства, нет исхода) и поэтому контрольная группа не нужна (но так посоветовал профессор из Германии..)?
2.Поскольку это независимые номинальные переменные (есть/нет поражения в этой области тела у этой породы), я должна провести анализ таблиц сопряженности для всех пар признаков?
3.Тот же профессор посоветовал использовать поправку Бонферрони, но я не уверена, что она тут к месту..

Буду благодарна за помощь и советы.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Статистик
сообщение 8.05.2018 - 13:03
Сообщение #2





Группа: Пользователи
Сообщений: 46
Регистрация: 19.07.2013
Из: Украина, Харьков
Пользователь №: 25002



А я тоже не очень понимаю, зачем все локализации в одну таблицу сваливать?
А если у одной и той же собаки были поражения и ушей, и лап, например, то как тогда такую многомерную таблицу можно составить?

Сообщение отредактировал Статистик - 8.05.2018 - 13:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 8.05.2018 - 15:35
Сообщение #3





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Статистик @ 8.05.2018 - 13:03) *
А я тоже не очень понимаю, зачем все локализации в одну таблицу сваливать?
А если у одной и той же собаки были поражения и ушей, и лап, например, то как тогда такую многомерную таблицу можно составить?


Вот поэтому вам и не быть в этой науке профессором, и не жить в Германии.)

Но вы не расстраивайтесь. Просто прочтите ветку не с конца, а с начала. Здесь уже в пятом посте выяснилось (?), что волшебное число 24, которое топикстартеру насчитали коллеги, - это декартово произведение двух факторов "Локализация"х"Тип поражения". Из этого с необходимостью следует, что либо фактор "Локализация" имеет 8 градаций при 3 у "Типа поражения", либо 6х4, либо 12х2, либо все эти люди не понимают, что они делают, либо этого не понимаю я. Это полная группа элементарных исходов. Тогда можно, конечно, больных особей (а их будет уже меньше 88) раскинуть по такой вот трехмерной таблице. Никто не запрещает. Только число сильно меньше 88 надо разместить в 8*6*4=192 ячейках теперь уже трехмерной таблицы. Топикстартера уже спрашивали во 2 посте, как далеко он намерен продвинуться в анализе такой слабонасыщенной таблицы. Ответа не последовало. Круг замкнулся.
Кроме того, многомерная таблица сопряженности - это кубик Рубика в том смысле, что если знаешь, как с ним обращаться, может быть когда-нибудь и соберешь. Это я к тому, что основным видом стат. анализа многомерной таблицы является ее логлинейная параметризация. А чтобы осмысленно провести логлинейный анализ многомерной таблицы, надо монографию Аптона "Анализ таблиц сопряженности" знать не просто наизусть, а лучше самого Аптона.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Елена Гогуа
сообщение 8.05.2018 - 18:51
Сообщение #4





Группа: Пользователи
Сообщений: 13
Регистрация: 5.05.2018
Пользователь №: 31338



Цитата(100$ @ 8.05.2018 - 15:35) *
Вот поэтому вам и не быть в этой науке профессором, и не жить в Германии.)

Но вы не расстраивайтесь. Просто прочтите ветку не с конца, а с начала. Здесь уже в пятом посте выяснилось (?), что волшебное число 24, которое топикстартеру насчитали коллеги, - это декартово произведение двух факторов "Локализация"х"Тип поражения". Из этого с необходимостью следует, что либо фактор "Локализация" имеет 8 градаций при 3 у "Типа поражения", либо 6х4, либо 12х2, либо все эти люди не понимают, что они делают, либо этого не понимаю я. Это полная группа элементарных исходов. Тогда можно, конечно, больных особей (а их будет уже меньше 88) раскинуть по такой вот трехмерной таблице. Никто не запрещает. Только число сильно меньше 88 надо разместить в 8*6*4=192 ячейках теперь уже трехмерной таблицы. Топикстартера уже спрашивали во 2 посте, как далеко он намерен продвинуться в анализе такой слабонасыщенной таблицы. Ответа не последовало. Круг замкнулся.
Кроме того, многомерная таблица сопряженности - это кубик Рубика в том смысле, что если знаешь, как с ним обращаться, может быть когда-нибудь и соберешь. Это я к тому, что основным видом стат. анализа многомерной таблицы является ее логлинейная параметризация. А чтобы осмысленно провести логлинейный анализ многомерной таблицы, надо монографию Аптона "Анализ таблиц сопряженности" знать не просто наизусть, а лучше самого Аптона.


Ох..
Коллеги разделили в разные группы
- бактериальное воспаление ушей
- грибковое воспаление ушей
- комбинированное воспаление ушей
- бак. воспаление лап
- грибковое воспаление лап
- комбинированное воспаление лап
и т.д., всего 24
Поскольку исследовательский вопрос - локализация, а не тип воспаления, логично объединить их в группы: воспаление ушей, лап и т.д. Но поскольку уши с лапами никак не связаны, мне представляется неважным количество групп (24 или 5), они все равно должны оцениваться отдельно друг от друга, но во взаимосвязи с породой:

Таблица 1.
_________________________уши больные__________уши здоровые

терьеры ______________________20__________________80

все остальные породы___________10___________________90


Таблица 2.
__________________________лапы больные___________лапы здоровые

терьеры __________________

все остальные______________

Всего 8 пород * 5 локализаций = 40 таблиц 2*2.

Я уже несколько раз спрашивала, оправданно ли использовать для оценки зависимости таблицы сопряженности, и если нет, то каким методом воспользоваться.
Еще я спрашивала, нужна ли здесь контрольная группа.
И еще я спрашивала, уместна ли здесь поправка Бонферрони.

Если бы я знала ответы на свои вопросы, я бы не создавала тему.

За ответные вопросы спасибо, они заставляют изучать тему, но ответов пока нет..

ПыСы: профессор германский не статистик, а дерматолог. Мирового уровня в ветеринарной медицине.



Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 8.05.2018 - 21:38
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Елена Гогуа @ 8.05.2018 - 20:51) *
...Я уже несколько раз спрашивала, оправданно ли использовать для оценки зависимости таблицы сопряженности, и если нет, то каким методом воспользоваться.
Еще я спрашивала, нужна ли здесь контрольная группа.
И еще я спрашивала, уместна ли здесь поправка Бонферрони.
Если бы я знала ответы на свои вопросы, я бы не создавала тему.

1. Можно сделать так, что поправка Бонферрони не понадобится. Ясно, что это можно сделать только в том случае, если суметь проанализировать весь материал разом.
2. Контрольная группа не нужна.
3. Как уже отметили ogurtsov и 100$, таблица получается очень большая и слабонасыщенная, а это плохо. Во-первых потому, что число степеней свободы будет столь велико, что статистически значимыми смогут оказаться только очень сильные эффекты, а не факт что они будут. Во-вторых, будет большое число ячеек с нулями и малыми значениями частот, а значит будет проблема допустимого минимального ожидаемого и проблемность использования критериев, основанных на распределении хи-квадрат. Правда тот же Аптон, вслед за Гудменом, считает полезным добавить ко всем ячейкам константу 0,5. Но ясно, что когда к реальным данным добавляется нечто виртуальное это уже не очень хорошо. Поэтому большую таблицу перед анализом желательно свернуть, объединив сходные породы, локализации поражений и их типы. Вся сложность в том, чтобы сделать это обоснованно.
4. Я в таких случаях использую связку из нескольких методов.
4.1. Сначала - разведочные многомерные методы. Здесь подойдут анализ соответствий (correspondence analysis) и канонический анализ соответствий (canonical...). Про них нужно читать. У данных методов есть один недостаток, который в некоторых случаях существенен: они используют расстояние статистики хи-квадрат, которая получается с учётом ячеек таблицы с отсутствующими категориями (например, нет грибкового заболевания на ухе и нет на ноге). Таким образом в основе сходства категорий может оказаться не столько их совместная встречаемость, сколько отсутствие встречаемости. Поэтому полезно также попробовать многомерное шкалирование с использованием в качестве меры сходства индекса сходства Жаккара. Так или иначе, но полученные в результате ординационные диаграммы покажут ассоциации категорий.
4.2. Полученные диаграммы и ассоциации нужно интерпретировать исходя из знаний в предметной области. Это позволит проводить свёртку большой таблицы обоснованно, хотя и опираясь на результат разведочной техники.
4.3. Свернуть таблицу и в зависимости от числа входов анализировать методами типа хи-квадрат или логлинейным анализом.
Статью с примером исследования по такой схеме прикрепил.

Если захотите, можно сделать нечто подобное, но от вас потребуется выложить сюда данные, т.к. многомерные техники - штука не всегда однозначная + может ещё кто захочет их покрутить. Чтобы обезопасить данные информацию по породам лучше закодировать (порода 1, порода 2, ...). Если согласны, то я напишу как должна выглядеть таблица.
Прикрепленные файлы
Прикрепленный файл  Нохрин_Д.Ю._и_др._Группы_крови_и_характер_2016.pdf ( 455,46 килобайт ) Кол-во скачиваний: 328
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 8.05.2018 - 22:50
Сообщение #6





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nokh @ 8.05.2018 - 21:38) *
Статью с примером исследования по такой схеме прикрепил.


В статье на 133 с. затаился косметический дефект: 10^5.88=758 578, а не 75 858.
Паче того: непонятно, как это для OR 6.69 ДИ [1.09 - 285.5] и для OR 2.46 ДИ [1.09 - 285.5]. При расчете ДИ берутся экспоненты: там малейшее изменение численности таблицы дает такие эффекты в верхней оценке ДИ, что диву даешься.

Сообщение отредактировал 100$ - 8.05.2018 - 23:13
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 8.05.2018 - 23:32
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(100$ @ 9.05.2018 - 00:50) *
В статье на 133 с. затаился косметический дефект: 10^5.88=758 578, а не 75 858.

Есть такой дефект. Там ещё где-то косяк с RR находил. Свой pdf подправить можно, но в журнале уже никак((

>Елена Гогуа. Отсутствие связи лап с ушами - это пока заблуждение. Если анализ данных покажет это - будем такой гипотезы и придерживаться, а если покажет ассоциацию этих локализаций для каких-то типов или пород - нужно будет искать этому объяснения. Также локализаций не 24 - см. ниже.

>passant. Таблица сложнее, упрощать не нужно: 8 пород х 5 локализаций х 4 типа поражения (отсутствует, грибковое, бактериальное, комбинированное). Т.е. входов три. Статистика хи-квадрат неаддитивна, точно на эффекты не разложить, поэтому только логлинейный анализ. Поскольку таблица получается наполовину пустой (77/160=0,48) анализировать исходную - плохая затея.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 9.05.2018 - 00:18
Сообщение #8





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(nokh @ 8.05.2018 - 23:32) *
>passant. Таблица сложнее, упрощать не нужно: 8 пород х 5 локализаций х 4 типа поражения (отсутствует, грибковое, бактериальное, комбинированное). Т.е. входов три. Статистика хи-квадрат неаддитивна, точно на эффекты не разложить, поэтому только логлинейный анализ. Поскольку таблица получается наполовину пустой (77/160=0,48) анализировать исходную - плохая затея.

Немного не так.
8 пород. 5 локализаций.
От типа поражения ТС отказалась.
Цитата(Елена Гогуа @ 8.05.2018 - 18:51) *
Поскольку исследовательский вопрос - локализация, а не тип воспаления, логично объединить их в группы: воспаление ушей, лап и т.д. Но поскольку уши с лапами никак не связаны...... они все равно должны оцениваться отдельно друг от друга, но во взаимосвязи с породой:

Итого в таблице 40 клеток.
У ТС 88 случаев (собачек) , т.е. не такая уж и пустая таблица получается. (88/40=2). Хотя очевидно, что несбалансирована, т.к. такс, например, всего 5 случаев (а хотелось бы ближе к 11).
На эффекты разлагать (см. вышеприведенную цитату) ТС целью как бы не ставит. Равно, как и поиск взаимосвязей между различными локализациями. (Впрочем, тут я допускаю, что мог чего-то не уловить). Так что пока - вполне классическая задача, а если количество "пациентов" увеличить - то и вообще, готов взять в качестве примера для студентов, хотя и не по профилю smile.gif .

Сообщение отредактировал passant - 9.05.2018 - 00:28
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 9.05.2018 - 00:48
Сообщение #9





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(passant @ 9.05.2018 - 00:18) *
Немного не так.
8 пород. 5 локализаций.
От типа поражения ТС отказалась.

Итого в таблице 40 клеток.
У ТС 88 случаев (собачек) , т.е. не такая уж и пустая таблица получается. (88/40=2). Хотя очевидно, что несбалансирована, т.к. такс, например, всего 5 случаев (а хотелось бы ближе к 11).


passant, а как вы дихотомическую переменную, имеющую биномиальное распределение "Отсутствует/Присутствует" сумели так ловко объединить с переменной, имеющей мультиномиальное распределение? Это ж прямо прорыв какой-то. Ловкость рук, и никакого мошенства.
Корректная оценка - 77/40=1,925.

Всё, парни. По домам.

Сообщение отредактировал 100$ - 9.05.2018 - 00:49
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 9.05.2018 - 13:19
Сообщение #10





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(100$ @ 9.05.2018 - 00:48) *
passant, а как вы дихотомическую переменную, имеющую биномиальное распределение "Отсутствует/Присутствует" сумели так ловко объединить с переменной, имеющей мультиномиальное распределение? Это ж прямо прорыв какой-то. Ловкость рук, и никакого мошенства.
Корректная оценка - 77/40=1,925.


1. Не пойму, о чем речь, честно.
Исходно данные о локализации- а их пять, по месту - действительно имеют дихотомическую природу. "Есть порожение в данной точке"/"Нет поражения в данной точке".
Т.е. привели собачку, появилась запись следующего вида:
"Порода: "Сербернар",
Поражено ухо: "Да",
Поражены лапы: "Да",
Поражен живот: "Нет",
Поражена спина: "Да",
Поражен хвост: "Нет".
У ТС набралось 88 таких записей. Для дальнейшего анализа объединяем их в единую таблицу по породам. В таблице оказалось восемь строк. Одна строка - данные об одной из пород. Каждая из строк выглядит так: "X1 собачек данной породы имеют локализацию поражения "Ухо",..... "X5 собачек данной породы имеют локализацию поражения "Хвост". В итоге получаем Классическое исходное представление таблицы сопряженности. Где тут вы нашли необычное "объединение биноминальной с мультиномиальнй переменной", и "ловкость рук и никакого мошенства"???

Кто-то тут ссылался на Аптона. Ну так открываем его книгу, глава 3. Примеры там приведенные - с точностью до переименования переменных - совпадают с рассматриваемой в данной теме задачей. На основе описанной таблицы легко можно получить ответ на вопрос, "отличается ли частота встречаемости локализации A" у бультерьера и пинчера. Или "отличается ли частота встречаемости локализации B" у спаниеля и "среднестатистической " собаки.

Причем в книге Аптона разжевано, и как доверительные интервалы для оценок получать, и что делать, если хи-квадрат мера почему-то не устраивает. И даже, если бы вдруг кто-то заинтересовался не просто вопросом локализации поражения, а такой экзотикой, как высота места поражения относительно земли (я понимаю, что экстравагантно, но все-же) , т.е. захотел бы анализировать не номинальный, а порядковый признак, и то ответ можно найти в указанной книге. О чем вообще спор??? О каком "прорыве" вы говорите?? Разве что элементарная подсказка ТС, где взять давно известное решение ее задач и на какой авторитет ссылаться, если что.

2. Поясните пожалуйста, откуда у Вас взялась цифра 77, когда автор пишет:
Цитата(Елена Гогуа @ 6.05.2018 - 17:34) *
У меня всего 88 собак


Сообщение отредактировал passant - 9.05.2018 - 13:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Елена Гогуа   Зависимость локализации поражения от породы   6.05.2018 - 15:26
- - ogurtsov   У вас таблица сопряженности получается 24х8 (192 я...   6.05.2018 - 16:27
|- - Елена Гогуа   Цитата(ogurtsov @ 6.05.2018 - 16:27)...   6.05.2018 - 17:34
- - 100$   Цитата(Елена Гогуа @ 6.05.2018 - 15...   6.05.2018 - 19:10
|- - Елена Гогуа   Цитата(100$ @ 6.05.2018 - 19:10...   7.05.2018 - 15:58
|- - 100$   Цитата(Елена Гогуа @ 7.05.2018 - 15...   7.05.2018 - 16:41
- - Статистик   А я тоже не очень понимаю, зачем все локализации в...   8.05.2018 - 13:03
|- - 100$   Цитата(Статистик @ 8.05.2018 - 13:03...   8.05.2018 - 15:35
|- - Елена Гогуа   Цитата(100$ @ 8.05.2018 - 15:35...   8.05.2018 - 18:51
||- - Статистик   Цитата(Елена Гогуа @ 8.05.2018 - 18...   8.05.2018 - 20:51
||- - 100$   Цитата(Елена Гогуа @ 8.05.2018 - 18...   8.05.2018 - 21:34
||- - nokh   Цитата(Елена Гогуа @ 8.05.2018 - 20...   8.05.2018 - 21:38
||- - 100$   Цитата(nokh @ 8.05.2018 - 21:38) Ста...   8.05.2018 - 22:50
||- - nokh   Цитата(100$ @ 9.05.2018 - 00:50...   8.05.2018 - 23:32
||- - passant   Цитата(nokh @ 8.05.2018 - 23:32) ...   9.05.2018 - 00:18
|||- - 100$   Цитата(passant @ 9.05.2018 - 00:18) ...   9.05.2018 - 00:48
|||- - passant   Цитата(100$ @ 9.05.2018 - 00:48...   9.05.2018 - 13:19
|||- - 100$   Цитата(passant @ 9.05.2018 - 13:19) ...   9.05.2018 - 13:50
||- - 100$   Цитата(nokh @ 8.05.2018 - 23:32) ...   9.05.2018 - 00:35
||- - nokh   Цитата(100$ @ 9.05.2018 - 02:35...   10.05.2018 - 01:07
||- - 100$   ЦитатаЗато вы всегда узнаваемы: цепляетесь ко всем...   10.05.2018 - 16:31
|- - Статистик   Цитата(100$ @ 8.05.2018 - 15:35...   8.05.2018 - 20:45
- - Елена Гогуа   Статистик, спасибо) Про контрольную группу - это ...   8.05.2018 - 21:39
|- - leo_biostat   Елена, Цитата(Елена Гогуа @ 8.05.2018 ...   9.05.2018 - 22:00
- - passant   Уважаемая Елена. Не будучи ни врачом, ни тем боле...   8.05.2018 - 22:01
- - Статистик   Хм, читаю, читаю ответи и не понимаю, почему никто...   10.05.2018 - 12:00
|- - 100$   Цитата(Статистик @ 10.05.2018 - 12:0...   10.05.2018 - 17:35
- - 100$   Елена, а если вы еще не утратили интерес к этой те...   11.05.2018 - 16:51
|- - Елена Гогуа   Уважаемые специалисты, спасибо огромное за активны...   13.05.2018 - 12:04
|- - 100$   Цитата(Елена Гогуа @ 13.05.2018 - 12...   13.05.2018 - 13:38
- - DoctorStat   Кажется, это заметил passant: 8 пород (строк), 5 л...   20.05.2018 - 11:36
- - Олег Кравец   [moderator on] треп на грани потер.   23.05.2018 - 06:53
- - p2004r   Собственно вот подробный мануал в котором есть рач...   23.05.2018 - 10:33
- - Елена Гогуа   Я прошу прощения, что так надолго пропала. Напиш...   26.08.2018 - 14:01
|- - p2004r   1) Неправильно это придумывать самому уровни факто...   27.08.2018 - 22:30
- - Елена Гогуа   1.Дизайн исследования предполагает оценку взаимосв...   29.08.2018 - 12:51
- - p2004r   Цитата(Елена Гогуа @ 29.08.2018 - 12...   31.08.2018 - 22:48


Добавить ответ в эту темуОткрыть тему