Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V   1 2 3 >  
Добавить ответ в эту темуОткрыть тему
> Зависимость локализации поражения от породы
Елена Гогуа
сообщение 6.05.2018 - 15:26
Сообщение #1





Группа: Пользователи
Сообщений: 13
Регистрация: 5.05.2018
Пользователь №: 31338




Здравствуйте. Я ветеринарный врач, увлечена клиническими исследованиями. Самоучка, так как в российской ветеринарной медицине этого направления пока нет. Поэтому прошу прощения за возможно глупые вопросы.

Коллеги попросили помочь с исследованием: оценка породной предрасположенности к определенной локализации и характеру кожных поражений у собак. Есть 8 пород (в исследование включались породы, где было 3 и больше пациентов) - всего 77 собак, и в качестве контрольной группы собаки, которых было представлено только по 1-2 штуки из породы (всего 11). Локализаций поражений 24.

Правильно ли я понимаю:
1.Это описательное исследование (зависимость локализации поражения от породы, нет вмешательства, нет исхода) и поэтому контрольная группа не нужна (но так посоветовал профессор из Германии..)?
2.Поскольку это независимые номинальные переменные (есть/нет поражения в этой области тела у этой породы), я должна провести анализ таблиц сопряженности для всех пар признаков?
3.Тот же профессор посоветовал использовать поправку Бонферрони, но я не уверена, что она тут к месту..

Буду благодарна за помощь и советы.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 6.05.2018 - 16:27
Сообщение #2





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



У вас таблица сопряженности получается 24х8 (192 ячейки). Подумайте, можно ли сделать какие-то выводы при наличии всего 77 собак.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Елена Гогуа
сообщение 6.05.2018 - 17:34
Сообщение #3





Группа: Пользователи
Сообщений: 13
Регистрация: 5.05.2018
Пользователь №: 31338



Цитата(ogurtsov @ 6.05.2018 - 16:27) *
У вас таблица сопряженности получается 24х8 (192 ячейки). Подумайте, можно ли сделать какие-то выводы при наличии всего 77 собак.



У меня всего 88 собак, в том числе 14 йоркширских терьеров. У 7 из них (50%) есть поражения в области ушей. При этом из всех остальных пород собак (74 штуки) поражения ушей есть у 11 (15%), p<0,05
Из тех же 88 собак 5 - таксы. У 3 из них локализация поражений - лапы. Из всех остальных собак (83) больные лапы у 5, p<0.05
У каждой породы может быть несколько локализаций поражений, например у лабрадоров и уши, и лапы, у французких бульдогов - морда, шея, лапы..

Если таблицы сопряженности неправильно использовать для каждой пары порода-локализация, то каким методом я должна воспользоваться для выявления зависимости?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 6.05.2018 - 19:10
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Елена Гогуа @ 6.05.2018 - 15:26) *
Коллеги попросили помочь с исследованием: оценка породной предрасположенности к определенной локализации и характеру кожных поражений у собак. Есть 8 пород (в исследование включались породы, где было 3 и больше пациентов) - всего 77 собак, и в качестве контрольной группы собаки, которых было представлено только по 1-2 штуки из породы (всего 11). Локализаций поражений 24.

Правильно ли я понимаю:
1.Это описательное исследование (зависимость локализации поражения от породы, нет вмешательства, нет исхода) и поэтому контрольная группа не нужна (но так посоветовал профессор из Германии..)?
2.Поскольку это независимые номинальные переменные (есть/нет поражения в этой области тела у этой породы), я должна провести анализ таблиц сопряженности для всех пар признаков?
3.Тот же профессор посоветовал использовать поправку Бонферрони, но я не уверена, что она тут к месту..


В целом вы все правильно понимаете. Поэтому в качестве самого первого шага стоит проверить гипотезу о том, что доля пораженных животных от породы к породе не меняется. Таблица сопряженности для 88 животных выглядит так:
______________________Больные___ Здоровые____Строчная сумма (Row sum)
Порода 1: Терьеры_________7_________ 7 ____________ 14
Порода 2: Таксы___________3__________2______________5
...
Порода 8:Фр. бульдоги
Итого: столбцовые суммы (Column sums)_________________88

При неотвержении H0 дальше вроде как и говорить не о чем.

При отвержении H0 нужно понимать, что если "Локализация" и "Характер поражения" - это разные факторы, то таблица сопряженности становится многомерной.
При этом если на тушке собаки насчитали аж 24 локализации, да еще пусть характер поражения - дихотомический, то 88 животных надо разбросать по 8*24*2=384 ячейкам многомерной таблицы.

Сообщение отредактировал 100$ - 6.05.2018 - 19:16
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Елена Гогуа
сообщение 7.05.2018 - 15:58
Сообщение #5





Группа: Пользователи
Сообщений: 13
Регистрация: 5.05.2018
Пользователь №: 31338



Цитата(100$ @ 6.05.2018 - 19:10) *
В целом вы все правильно понимаете. Поэтому в качестве самого первого шага стоит проверить гипотезу о том, что доля пораженных животных от породы к породе не меняется. Таблица сопряженности для 88 животных выглядит так:
______________________Больные___ Здоровые____Строчная сумма (Row sum)
Порода 1: Терьеры_________7_________ 7 ____________ 14
Порода 2: Таксы___________3__________2______________5
...
Порода 8:Фр. бульдоги
Итого: столбцовые суммы (Column sums)_________________88

При неотвержении H0 дальше вроде как и говорить не о чем.

При отвержении H0 нужно понимать, что если "Локализация" и "Характер поражения" - это разные факторы, то таблица сопряженности становится многомерной.
При этом если на тушке собаки насчитали аж 24 локализации, да еще пусть характер поражения - дихотомический, то 88 животных надо разбросать по 8*24*2=384 ячейкам многомерной таблицы.


Спасибо большое за ответ.

Да, коллеги сформировали 24 группы и по локализации, и по характеру, из-за чего по некоторым признакам единичные данные. Их логично можно объединить до 5.
Н0 отвергла, отдельно по каждой локализации (уши, лапы, тело и т.д.).

Но мне по-прежнему не понятно, почему я должна объединять все локализации в одну таблицу, если они не связаны. Клинически мы наблюдаем, что если на приеме лабрадор, то почти всегда у него поражены уши и лапы, и редко тело. А если это терьер, то чаще всего поражены лапы, живот и шея, и редко уши. У меня нет цели исследовать зависимость ушей от лап, но зависимость ушей (или лап, или живота, или и лап и живота) от породы очень явная.
Так получается 5 таблиц 8*2 (8 пород * есть/нет) для каждой локализации.

Или нужно использовать другие методы для оценки зависимости? Какие тогда?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 7.05.2018 - 16:41
Сообщение #6





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Елена Гогуа @ 7.05.2018 - 15:58) *
Спасибо большое за ответ.

Да, коллеги сформировали 24 группы и по локализации, и по характеру, из-за чего по некоторым признакам единичные данные. Их логично можно объединить до 5.
Н0 отвергла, отдельно по каждой локализации (уши, лапы, тело и т.д.).

Но мне по-прежнему не понятно, почему я должна объединять все локализации в одну таблицу, если они не связаны. Клинически мы наблюдаем, что если на приеме лабрадор, то почти всегда у него поражены уши и лапы, и редко тело. А если это терьер, то чаще всего поражены лапы, живот и шея, и редко уши. У меня нет цели исследовать зависимость ушей от лап, но зависимость ушей (или лап, или живота, или и лап и живота) от породы очень явная.
Так получается 5 таблиц 8*2 (8 пород * есть/нет) для каждой локализации.

Или нужно использовать другие методы для оценки зависимости? Какие тогда?


Ничего не понял, но если нулевая гипотеза из первого этапа исследования отвергается, то далее логично больных особей раскидать по 5 локализациям (таблица получится 8 пород х 5 локализаций ("лапы","шея" и т.д)) и проверить ее. А что тут еще предпринять? При этом никаких "зависимостей от ушей и лап" не проверяется. Проверяется сопряженность одного мультиномиального признака "Порода" с 8 градациями и второго мультиномиального признака "Локализация" с 5 градациями. Только и всего.

В ветеринары, штоле, податься...

Сообщение отредактировал 100$ - 7.05.2018 - 16:48
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Статистик
сообщение 8.05.2018 - 13:03
Сообщение #7





Группа: Пользователи
Сообщений: 46
Регистрация: 19.07.2013
Из: Украина, Харьков
Пользователь №: 25002



А я тоже не очень понимаю, зачем все локализации в одну таблицу сваливать?
А если у одной и той же собаки были поражения и ушей, и лап, например, то как тогда такую многомерную таблицу можно составить?

Сообщение отредактировал Статистик - 8.05.2018 - 13:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 8.05.2018 - 15:35
Сообщение #8





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Статистик @ 8.05.2018 - 13:03) *
А я тоже не очень понимаю, зачем все локализации в одну таблицу сваливать?
А если у одной и той же собаки были поражения и ушей, и лап, например, то как тогда такую многомерную таблицу можно составить?


Вот поэтому вам и не быть в этой науке профессором, и не жить в Германии.)

Но вы не расстраивайтесь. Просто прочтите ветку не с конца, а с начала. Здесь уже в пятом посте выяснилось (?), что волшебное число 24, которое топикстартеру насчитали коллеги, - это декартово произведение двух факторов "Локализация"х"Тип поражения". Из этого с необходимостью следует, что либо фактор "Локализация" имеет 8 градаций при 3 у "Типа поражения", либо 6х4, либо 12х2, либо все эти люди не понимают, что они делают, либо этого не понимаю я. Это полная группа элементарных исходов. Тогда можно, конечно, больных особей (а их будет уже меньше 88) раскинуть по такой вот трехмерной таблице. Никто не запрещает. Только число сильно меньше 88 надо разместить в 8*6*4=192 ячейках теперь уже трехмерной таблицы. Топикстартера уже спрашивали во 2 посте, как далеко он намерен продвинуться в анализе такой слабонасыщенной таблицы. Ответа не последовало. Круг замкнулся.
Кроме того, многомерная таблица сопряженности - это кубик Рубика в том смысле, что если знаешь, как с ним обращаться, может быть когда-нибудь и соберешь. Это я к тому, что основным видом стат. анализа многомерной таблицы является ее логлинейная параметризация. А чтобы осмысленно провести логлинейный анализ многомерной таблицы, надо монографию Аптона "Анализ таблиц сопряженности" знать не просто наизусть, а лучше самого Аптона.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Елена Гогуа
сообщение 8.05.2018 - 18:51
Сообщение #9





Группа: Пользователи
Сообщений: 13
Регистрация: 5.05.2018
Пользователь №: 31338



Цитата(100$ @ 8.05.2018 - 15:35) *
Вот поэтому вам и не быть в этой науке профессором, и не жить в Германии.)

Но вы не расстраивайтесь. Просто прочтите ветку не с конца, а с начала. Здесь уже в пятом посте выяснилось (?), что волшебное число 24, которое топикстартеру насчитали коллеги, - это декартово произведение двух факторов "Локализация"х"Тип поражения". Из этого с необходимостью следует, что либо фактор "Локализация" имеет 8 градаций при 3 у "Типа поражения", либо 6х4, либо 12х2, либо все эти люди не понимают, что они делают, либо этого не понимаю я. Это полная группа элементарных исходов. Тогда можно, конечно, больных особей (а их будет уже меньше 88) раскинуть по такой вот трехмерной таблице. Никто не запрещает. Только число сильно меньше 88 надо разместить в 8*6*4=192 ячейках теперь уже трехмерной таблицы. Топикстартера уже спрашивали во 2 посте, как далеко он намерен продвинуться в анализе такой слабонасыщенной таблицы. Ответа не последовало. Круг замкнулся.
Кроме того, многомерная таблица сопряженности - это кубик Рубика в том смысле, что если знаешь, как с ним обращаться, может быть когда-нибудь и соберешь. Это я к тому, что основным видом стат. анализа многомерной таблицы является ее логлинейная параметризация. А чтобы осмысленно провести логлинейный анализ многомерной таблицы, надо монографию Аптона "Анализ таблиц сопряженности" знать не просто наизусть, а лучше самого Аптона.


Ох..
Коллеги разделили в разные группы
- бактериальное воспаление ушей
- грибковое воспаление ушей
- комбинированное воспаление ушей
- бак. воспаление лап
- грибковое воспаление лап
- комбинированное воспаление лап
и т.д., всего 24
Поскольку исследовательский вопрос - локализация, а не тип воспаления, логично объединить их в группы: воспаление ушей, лап и т.д. Но поскольку уши с лапами никак не связаны, мне представляется неважным количество групп (24 или 5), они все равно должны оцениваться отдельно друг от друга, но во взаимосвязи с породой:

Таблица 1.
_________________________уши больные__________уши здоровые

терьеры ______________________20__________________80

все остальные породы___________10___________________90


Таблица 2.
__________________________лапы больные___________лапы здоровые

терьеры __________________

все остальные______________

Всего 8 пород * 5 локализаций = 40 таблиц 2*2.

Я уже несколько раз спрашивала, оправданно ли использовать для оценки зависимости таблицы сопряженности, и если нет, то каким методом воспользоваться.
Еще я спрашивала, нужна ли здесь контрольная группа.
И еще я спрашивала, уместна ли здесь поправка Бонферрони.

Если бы я знала ответы на свои вопросы, я бы не создавала тему.

За ответные вопросы спасибо, они заставляют изучать тему, но ответов пока нет..

ПыСы: профессор германский не статистик, а дерматолог. Мирового уровня в ветеринарной медицине.



Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Статистик
сообщение 8.05.2018 - 20:45
Сообщение #10





Группа: Пользователи
Сообщений: 46
Регистрация: 19.07.2013
Из: Украина, Харьков
Пользователь №: 25002



Цитата(100$ @ 8.05.2018 - 15:35) *
Вот поэтому вам и не быть в этой науке профессором, и не жить в Германии.)

Но вы не расстраивайтесь. Просто прочтите ветку не с конца, а с начала. Здесь уже в пятом посте выяснилось (?), что волшебное число 24, которое топикстартеру насчитали коллеги, - это декартово произведение двух факторов "Локализация"х"Тип поражения". Из этого с необходимостью следует, что либо фактор "Локализация" имеет 8 градаций при 3 у "Типа поражения", либо 6х4, либо 12х2, либо все эти люди не понимают, что они делают, либо этого не понимаю я. Это полная группа элементарных исходов. Тогда можно, конечно, больных особей (а их будет уже меньше 88) раскинуть по такой вот трехмерной таблице. Никто не запрещает. Только число сильно меньше 88 надо разместить в 8*6*4=192 ячейках теперь уже трехмерной таблицы. Топикстартера уже спрашивали во 2 посте, как далеко он намерен продвинуться в анализе такой слабонасыщенной таблицы. Ответа не последовало. Круг замкнулся.
Кроме того, многомерная таблица сопряженности - это кубик Рубика в том смысле, что если знаешь, как с ним обращаться, может быть когда-нибудь и соберешь. Это я к тому, что основным видом стат. анализа многомерной таблицы является ее логлинейная параметризация. А чтобы осмысленно провести логлинейный анализ многомерной таблицы, надо монографию Аптона "Анализ таблиц сопряженности" знать не просто наизусть, а лучше самого Аптона.


Я как раз ветку прочитала сначала и не один раз.
ТС уже сказала, что ей 24 градации на самом деле и не нужны. Фактически, ей интересна именно локализация, а не тип поражения, если я правильно ее поняла. Ей не важно, бактериальная это инфекция или грибковая, ей важно, где именно (локализация) было поражение (усы, лапы или хвост). Отсюда уже не 24 градации, а всего 5 осталось, если я правильно поняла.
И вроде как уже 88 собак нужно распределить в таблице 8 (прод)*5 (локлизиций), если бы не одно но...
ТС написала, что у одной и то же собаки может быть несколько локализаций поаржений. Отсюда не получится заполнить таблицу 8*5.
А дальше нужно отталкиваться от целей исследования. Если стоит вопрос, связана ли конкретная порода с конкретной локализацией поражения, то и нужно тогда составлять отедльные таблицы сопряженности для каждой из выбранных локализаций.

Сообщение отредактировал Статистик - 8.05.2018 - 20:46
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Статистик
сообщение 8.05.2018 - 20:51
Сообщение #11





Группа: Пользователи
Сообщений: 46
Регистрация: 19.07.2013
Из: Украина, Харьков
Пользователь №: 25002



Цитата(Елена Гогуа @ 8.05.2018 - 18:51) *
Я уже несколько раз спрашивала, оправданно ли использовать для оценки зависимости таблицы сопряженности, и если нет, то каким методом воспользоваться.

мне кажется, что можно
но, боюсь, придут монстры статистики побьют меня ногами за мое мнение)))

Цитата(Елена Гогуа @ 8.05.2018 - 18:51) *
Еще я спрашивала, нужна ли здесь контрольная группа.

Я из первого поста не поняла, какие собаки составили контрольную группу.
И с какой целью была составлена контрольная группа? Ответ на какой вопрос Вы хотите получить?

Цитата(Елена Гогуа @ 8.05.2018 - 18:51) *
И еще я спрашивала, уместна ли здесь поправка Бонферрони.

сама постою-послушаю ответ на этот вопрос
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 8.05.2018 - 21:34
Сообщение #12





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Елена Гогуа @ 8.05.2018 - 18:51) *
Ох..
Коллеги разделили в разные группы
- бактериальное воспаление ушей
- грибковое воспаление ушей
- комбинированное воспаление ушей
- бак. воспаление лап
- грибковое воспаление лап
- комбинированное воспаление лап
и т.д., всего 24
Поскольку исследовательский вопрос - локализация, а не тип воспаления, логично объединить их в группы: воспаление ушей, лап и т.д. Но поскольку уши с лапами никак не связаны, мне представляется неважным количество групп (24 или 5), они все равно должны оцениваться отдельно друг от друга, но во взаимосвязи с породой:

Таблица 1.
_________________________уши больные__________уши здоровые

терьеры ______________________20__________________80

все остальные породы___________10___________________90


Таблица 2.
__________________________лапы больные___________лапы здоровые

терьеры __________________

все остальные______________

Всего 8 пород * 5 локализаций = 40 таблиц 2*2.

Я уже несколько раз спрашивала, оправданно ли использовать для оценки зависимости таблицы сопряженности, и если нет, то каким методом воспользоваться.
Еще я спрашивала, нужна ли здесь контрольная группа.
И еще я спрашивала, уместна ли здесь поправка Бонферрони.

Если бы я знала ответы на свои вопросы, я бы не создавала тему.

За ответные вопросы спасибо, они заставляют изучать тему, но ответов пока нет..

ПыСы: профессор германский не статистик, а дерматолог. Мирового уровня в ветеринарной медицине.


Хорошо, отвечу на вопросы.
1. Контрольная группа не нужна. Это не исследование Case-Control.
2. Это исследование сводится к анализу таблиц сопряженности на первом и втором этапах.
3. Поправка Бонферрони не нужна. Это будет ясно из дальнейшего изложения.

Так вот, мы договорились, что третий фактор "Тип/характер воспаления" (с как минимум тремя градациями: грибковое, бактериальное, комбинированное) оставляем в покое.
Остаются два "Порода" и "Локализация". В факторе "Локализация" нельзя выделить градацию "Отсутствие локализации", т.е. в эту таблицу не могут попасть здоровые животные. Все, что вам надо сделать - это не множить таблицы сопряженности, а заполнить одну для 77 пораженных животных:

________________________ Морда____Шея______Уши______Лапы______Хвост___,,,______Итого
1. Таксы___________________ 2_______0_________1_________0_________0_______________3
2. Бультерьеры
...
8. Фр. Бульдоги___________________________________________________________________77

И все. Вуаля. Одна гипотеза - и никаких корректировок достигаемого уровня значимости.

Сообщение отредактировал 100$ - 8.05.2018 - 21:37
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 8.05.2018 - 21:38
Сообщение #13





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Елена Гогуа @ 8.05.2018 - 20:51) *
...Я уже несколько раз спрашивала, оправданно ли использовать для оценки зависимости таблицы сопряженности, и если нет, то каким методом воспользоваться.
Еще я спрашивала, нужна ли здесь контрольная группа.
И еще я спрашивала, уместна ли здесь поправка Бонферрони.
Если бы я знала ответы на свои вопросы, я бы не создавала тему.

1. Можно сделать так, что поправка Бонферрони не понадобится. Ясно, что это можно сделать только в том случае, если суметь проанализировать весь материал разом.
2. Контрольная группа не нужна.
3. Как уже отметили ogurtsov и 100$, таблица получается очень большая и слабонасыщенная, а это плохо. Во-первых потому, что число степеней свободы будет столь велико, что статистически значимыми смогут оказаться только очень сильные эффекты, а не факт что они будут. Во-вторых, будет большое число ячеек с нулями и малыми значениями частот, а значит будет проблема допустимого минимального ожидаемого и проблемность использования критериев, основанных на распределении хи-квадрат. Правда тот же Аптон, вслед за Гудменом, считает полезным добавить ко всем ячейкам константу 0,5. Но ясно, что когда к реальным данным добавляется нечто виртуальное это уже не очень хорошо. Поэтому большую таблицу перед анализом желательно свернуть, объединив сходные породы, локализации поражений и их типы. Вся сложность в том, чтобы сделать это обоснованно.
4. Я в таких случаях использую связку из нескольких методов.
4.1. Сначала - разведочные многомерные методы. Здесь подойдут анализ соответствий (correspondence analysis) и канонический анализ соответствий (canonical...). Про них нужно читать. У данных методов есть один недостаток, который в некоторых случаях существенен: они используют расстояние статистики хи-квадрат, которая получается с учётом ячеек таблицы с отсутствующими категориями (например, нет грибкового заболевания на ухе и нет на ноге). Таким образом в основе сходства категорий может оказаться не столько их совместная встречаемость, сколько отсутствие встречаемости. Поэтому полезно также попробовать многомерное шкалирование с использованием в качестве меры сходства индекса сходства Жаккара. Так или иначе, но полученные в результате ординационные диаграммы покажут ассоциации категорий.
4.2. Полученные диаграммы и ассоциации нужно интерпретировать исходя из знаний в предметной области. Это позволит проводить свёртку большой таблицы обоснованно, хотя и опираясь на результат разведочной техники.
4.3. Свернуть таблицу и в зависимости от числа входов анализировать методами типа хи-квадрат или логлинейным анализом.
Статью с примером исследования по такой схеме прикрепил.

Если захотите, можно сделать нечто подобное, но от вас потребуется выложить сюда данные, т.к. многомерные техники - штука не всегда однозначная + может ещё кто захочет их покрутить. Чтобы обезопасить данные информацию по породам лучше закодировать (порода 1, порода 2, ...). Если согласны, то я напишу как должна выглядеть таблица.
Прикрепленные файлы
Прикрепленный файл  Нохрин_Д.Ю._и_др._Группы_крови_и_характер_2016.pdf ( 455,46 килобайт ) Кол-во скачиваний: 327
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Елена Гогуа
сообщение 8.05.2018 - 21:39
Сообщение #14





Группа: Пользователи
Сообщений: 13
Регистрация: 5.05.2018
Пользователь №: 31338



Статистик, спасибо)

Про контрольную группу - это совет профессора sad.gif

Возможно, он считает, что нужно использовать не таблицы сопряжения, а другой метод анализа (Бонферрони?).


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 8.05.2018 - 22:01
Сообщение #15





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Уважаемая Елена.

Не будучи ни врачом, ни тем более ветеринаром smile.gif , каждый раз удивляюсь, как вы, медики, умеете все уcусложнять и нагорамождать кучу всего там, где технарь исходно будет пытаться все разложить по полочкам. smile.gif
Давайте пройдемся по вашей задаче еще раз. Итак, цель вашего исследования - доказать, что локализация (уши, лапы, хвост) поражения связана с породой. И ничего больше - вы не хотите обучать машину распознавать породу по месту раны, вы не хотите предсказывать место локализации по породе, не хотите выявлять зависимость поражения лап от поражения головы. Ничего такого заумно-сложного. Всего лишь ответить на вопрос, зависит ли дислокация раны от породы.
Что для этого надо. Да всего-лишь составить таблицу. По строкам - породы, по столбцам дислокация. (Какие 40 таблиц???? Одна единственная таблица!!!). На пересечении - количество обнаруженных случаев данной локализации у собак данной породы. Потом берем конкретную породу (строчку в таблице), строим еще одну "виртуальную" строчку, куда заносим сумму случаев каждой локализации для всех оставшихся пород. Теперь вам надо ответить на вопрос, который математически звучит так: выборки представителей "вашей породы" и "всех других пород" взяты из одной и той-же генеральной совокупности случаев (гипотеза H0) или из разных (альтернативная гипотеза H1). Причем на сколько я понял, у вас задача еще проще, и заключается в том, что вы ищете ответы на вопросы типа "повреждения хвоста у терьера встречается так же часто, как у всех собак (гипотеза H0)". Понятие "контрольная группа" тут бессмысленна, вернее "контрольная группа" - это все собаки других пород (та самая виртуальная строчка).
Если надо доказать статистическое значимое различие локализаций между представителями разных но конкретных пород, то "виртуальную" строчку делать не надо, надо просто из таблицы вырезать две строчки, соответствующие тем породам, которые вас интересуют и решать описанную задачу относительно них.
Если подумать, то ваша задача ничем не отличается от такой задачи, как например, выяснить, женщины чаще болеют болезнью "Х", чем мужчины или нет. Или "голубой цвет глаз встречается одинаково часто у представителей белой, желтой и черной рас или нет".
Задача статистически тривиальна, другое дело что 3 (три!!!!) представителя породы, это конечно очень мало для сколько-нибудь значимых и обобщаемых результатов. И это, пожалуй, самый "пробойный" и труднозащищаемый пункт всего вашего исследования. (На что вам, кстати, уже неявно указали).
Теперь следующий вопрос. Откуда вдруг возникает "пара признаков". Опять-же если я правильно понял, то вы хотите установить, "а правда ли, что пинчеры чаще ОДНОВРЕМЕННО вредят себе усы и хвост чем собаки других пород"? Я не берусь комментировать, на сколько это осмысленный вопрос, но если это так, то самый простой путь - для каждой породы (строчки в вышеописанной таблице) вам надо добавить столбцы, в которые заносить количество тех самых одновременных локализаций. Все остальные рассуждения остаются теми-же.

Еще раз перечитав тему понял, что вы сами в сообщении http://forum.disser.ru/index.php?showtopic...amp;#entry22948 вобщем-то корректно ответили на свои вопросы. А потом - чего-то испугались? И напрасно! rolleyes.gif
Удачи!

P.S. Поправка Бонферрони - это не "другой метод". Это всего-лишь дополнение к методу основному. Всего-лишь способ ужесточения порога значимости.

Сообщение отредактировал passant - 8.05.2018 - 22:20
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

3 страниц V   1 2 3 >
Добавить ответ в эту темуОткрыть тему