Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

25 страниц V   1 2 3 > » 

100$
Отправлено: 21.06.2018 - 11:39


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Zamira @ 20.06.2018 - 18:28) *
Рада, что доставила Вам повод посмеяться.


И, похоже, доставите еще не раз: вам говорят, что вы идете по ложному пути, а вы тут петросян-шоу затеяли.
  Форум: Медицинская статистика · Просмотр сообщения: #23086 · Ответов: 5 · Просмотров: 278

100$
Отправлено: 19.06.2018 - 13:03


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Суть исследования в оценке влияния биомаркеров в ранней диагностике диаб. болезни почек.


Да, это - бродячий сюжет в нефрологии. Складывается ощущение, что все нефрологи поголовно беременны идеей что-то там "ранне диагностировать", таращась до рези в глазах на все эти цитокины, интерлейкины и пр. Вот только убедительных результатов как не было, так и нет. Глядя на их публикации устанешь хохотать.

У вас - все то же самое, только еще смешнее: простая регрессия на константу прекрасно распознает всех ваших больных (скриншот 1).
Безо всяких там маркеров.
А добавление маркеров (скриншот 2) сделало незначимой даже константу.
Позвольте дальше не продолжать.
  Форум: Медицинская статистика · Просмотр сообщения: #23082 · Ответов: 5 · Просмотров: 278

100$
Отправлено: 14.06.2018 - 15:08


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Novokuznetsk @ 14.06.2018 - 12:58) *
Спасибо большое за ответ и за подсказку на счет функции =ЕЧИСЛО(). Взял на вооружение. Но к сожалению не помогло ни то, ни другое. Пробовал в других версиях Statistica, пишет тоже самое: "Обнаружена ячейка с частотой 0". Полностью убирал нулевые значения, не помогает. Пробовал проведение на двух, трех, пяти столбцах, результат тот же. В поддержку не знаю стоит ли писать, так как у меня не официальная версия продукта.


Так скачайте триал-версию с оф. сайта и попробуйте в ней. Обсуждать косяки пиратских копий мне недосуг.
  Форум: Медицинская статистика · Просмотр сообщения: #23067 · Ответов: 5 · Просмотров: 335

100$
Отправлено: 13.06.2018 - 16:02


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Понятно.
А у randomForest'a SRC (я даже и не знал о таком, вот уж "век живи ..., а дураком помрешь") есть какие-то очевидные/неочевидные преимущества перед "просто" randomForest?

А ROC-кривая и впрямь хороша. Прямо картина маслом. Хоть сейчас в рамку, да на стену.
  Форум: Медицинская статистика · Просмотр сообщения: #23063 · Ответов: 6 · Просмотров: 373

100$
Отправлено: 13.06.2018 - 14:13


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


1. Наверное, стоит еще раз с помощью функции =ЕЧИСЛО() убедиться в том, что в датасете все в порядке.
2. Попробовать для локализации ошибки загружать сначала два столбца и делать ДА, затем 3 и т.д., а потом попытаться понять, при добавдении какого столбца возникает ошибка, поскольку она не шибко информативна, и можно предполагать все, что угодно.

А лучше всего обратиться к разработчику на www.statsoft.ru. Потому что у меня Statistica однажды тоже под каким-то смешным предлогом наотрез отказалась делать проекцию на латентные структуры на внешне безупречном датасете. До сих пор не знаю, что это было.
  Форум: Медицинская статистика · Просмотр сообщения: #23061 · Ответов: 5 · Просмотров: 335

100$
Отправлено: 13.06.2018 - 14:03


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


А вот интересно, почему при выращивании леса узлы расщепляются по Gini, а при селекции переменных используется Minimal Depth? И почему при таком раскладе метод не смог выдать относительную важность предикторов (vimp=NA)? До такой степени плохой датасет?

А чем обусловлен выбор PCA3 vs. PCA5? В первых двух ГК все совсем плохо?
  Форум: Медицинская статистика · Просмотр сообщения: #23060 · Ответов: 6 · Просмотров: 373

100$
Отправлено: 5.06.2018 - 13:08


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


...
  Форум: Медицинская статистика · Просмотр сообщения: #23045 · Ответов: 10 · Просмотров: 2059

100$
Отправлено: 5.06.2018 - 12:10


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nikita_zab @ 5.06.2018 - 11:35) *
Спасибо за ответ.

Мой код выдал

A =c(619, 600, 490, 1076, 654, 955, 563, 955, 827, 873, 1253)
B =c(346, 507, 598, 228, 576, 338, 1153, 354, 560, 517, 381)

A <- apply(matrix(sample(A, rep=TRUE, 5000*length(A)), nrow=5000), 1, median)
B <- apply(matrix(sample(B, rep=TRUE, 5000*length(B)), nrow=5000), 1, median)
quantile(A-B, c(.025, 0.975))

2.5% 97.5%
59 601


Вроде не сильно отличается.


Весь приличный софт (и R в том числе) в качестве разности медиан выдает разность по Ходжесу - Леману с доверительными интервалами по Тьюки. Вы выдали буквально понятую разность и прикрутили к ней самое простенькое и незатейливое, что есть в природе, - Эфронов доверительный интервал. Прежде чем что-то кодярить, полезно задать себе вопрос : "А как так вышло, что вся рота идет не в ногу, и только прапорщик - в ногу?"

P.S. А как так вышло, что в разбираемом примере выборки объемом 11 и 13, а у вас - 2х11?
  Форум: Медицинская статистика · Просмотр сообщения: #23044 · Ответов: 10 · Просмотров: 2059

100$
Отправлено: 1.06.2018 - 00:30


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(DoctorStat @ 31.05.2018 - 21:56) *
Извините за отклонение от темы, но на этом форуме часто упоминается термин бутстреп. Я догадываюсь, что он означает, но у меня нет уверенности, что он работает как надо: дает сходимость, устойчивость и другие полезные качества. Можете привести ссылку, где объясняется правомочность применения бутстрепа в статистике ?


http://quantile.ru/03/03-SA.pdf
  Форум: Медицинская статистика · Просмотр сообщения: #23036 · Ответов: 10 · Просмотров: 2059

100$
Отправлено: 13.05.2018 - 13:38


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 13.05.2018 - 12:04) *
Уважаемые специалисты, спасибо огромное за активный отклик по моей теме! Интереса к ней я, конечно, не утратила smile.gif Много очень дел навалилось..

Я уточню с врачами, что именно их интересует (а то вдруг я неправильно поняла), отредактирую базу данных и здесь прикреплю.


Так вам в этой истории отведена роль испорченного телефона?

И, чтоб два раза не бежать, уточните у них заодно: как нам надо будет обрабатывать такой дважды парный орган как лапы?
Н-р, поражена одна лапа - ставим в локализацию "Лапы" единичку, поражены все 4 - тоже "1"? Иначе говоря, надо ли будет принимать во внимание степень поражения? Или только факт поражения?
  Форум: Медицинская статистика · Просмотр сообщения: #23000 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 11.05.2018 - 16:51


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Елена, а если вы еще не утратили интерес к этой теме, просветите меня, пожалуйста, на предмет того, а могут ли на одной собаке одновременно наблюдаться два или все три типа поражений? А то я ни разу не дерматолог, и патологии страшнее бородавок отродясь не видал.
  Форум: Медицинская статистика · Просмотр сообщения: #22993 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 10.05.2018 - 17:35


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Статистик @ 10.05.2018 - 12:00) *
Хм, читаю, читаю ответи и не понимаю, почему никто не обращает внимания, что у одной собаки может быть 2-3 локализации?
А раз так, то предлагаемые таблицы сопряженности попросту строить нельзя.


Вестимо. В таком случае единицей наблюдения будет не собака, а поражение, и если 88 собак принесли с собой 400 лишаев, то таблицу будем строить для этих 400 случаев.
  Форум: Медицинская статистика · Просмотр сообщения: #22987 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 10.05.2018 - 16:31


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Зато вы всегда узнаваемы: цепляетесь ко всему и ко всем... Но когда ради правого дела, я готов потерпеть wink.gif


Гы. Тоже мне, терпила smile.gif. Да я еще даже и не начинал. Вот прям щас и начну.

Цитата
3) Тип поражения - 3 категории (грибковое, бактериальное, комбинированное). Комбинированное нужно для обработки таблицы некоторыми методами (типа логлинейного анализа), чтобы каждая собака попала в какую-то ячейку многомерной таблицы частот. Но для некоторых методов можно обойтись без него, т.к. это просто наличие и первого, и второго типа поражений.


Вижу, вы отпраздновали по всем правилам smile.gif.

Градация "Комбинированная" с необходимостью должна присутствовать в таблице. И дело здесь не только в том, что сочетанная патология может быть гораздо "злее", нежели грибок или бактерии по отдельности и требовать от врача иных схем лечения. Меня интересуют простые вероятностные рассуждения: пусть мы имеем выборку из трех собак, у одной из которых наблюдается грибок (причем вероятность наблюдать такую=p1), у второй бактериальное поражение (с вероятностью наблюдать его=р2) и у третьей - сочетанная патология ( с вероятностью р3). Тогда для нашей выборки эмпирические априорные вероятности наблюдать каждый из этих случаев р1=р2=р3=1/3 и р1+р2+р3=1 как учили. Пока паззл сходится. Если комбинированная патология - это по вашей логике одновременное наблюдение "двух в одном", то такая вероятность должна равняться р3=р1*р2, т.е. 1/3*1/3=1/9. Однако она равна 1/3 по наблюдаемым данным и 1/3+1/3+1/9 уже не равна 1. Следовательно, в общем случае вероятность наблюдать сочетанную патологию не определяется вероятностями грибка и бактерий и представляет собой самостоятельный феномен.

Цитата
Если формировать матрицу данных построчно так, что каждая строка - отдельная собака, то "комбинированное" не понадобится, просто в колонках "грибковое" и "бактериальное" будут стоять единицы


В том-то и дело, что не будут. Ибо в данном случае "1"-это не индикатор события, а счетная переменная (т.е. объект наблюдения). В вашем варианте одна собака порождает строчную сумму равную 2.

Именно поэтому для моего рассуждения (вышеприведенного примера) строчная сумма равнялась трем, при отказе от столбца "Комбинированная" она будет равна 2. Чтобы восстановить строчную сумму, оставшуюся собаку надо как-то "размазать" по колонкам "Грибок" и "Бактерии", а как? Добавить в каждый по 0,5, Или туда 0,6, а сюда - 0,4?
Резюме: категорию "Комбинированная" оставляем.

Цитата
4) Наличие поражения - 2 категории (есть, нет)


Nokh, а зачем вы с упорством, достойным лучшего применения, пытаетесь прикрутить к этой несчастной вероятностно-статистической модели еще и дихотомию типа "Есть/Нет", "Жив/Мертв"? Мы наблюдаем только пораженных животных, у которых с единичной вероятностью есть хотя бы одно поражение. Если его нет - это здоровая шавка, которой некогда бегать по врачам. Вам что базовой таблице 8х5х3 нулей не хватает? smile.gif

Откажитесь от избыточного измерения и вам не придется ничего концентрировать. А то вы напоминаете незадачливого повара, который плеснул, не глядя, в котел лишнее ведро воды, получил концентрацию ухи на уровне "семь ведер - одна луковица" и теперь пытается раскочегарить огонь посильнее, чтобы лишняя влага побыстрее испарилась. Попутно вычерпывая ее руками. smile.gif
Резюме: 8х5х3.

Цитата
Однозначно нужно концентрировать информацию с опорой на ординационные техники.


Ну, не зна-а-а-ю. Статистический метод определяется природой данных. Данные таблицы сопряженности - это результаты прямого подсчета, измеренные в абсолютной шкале. Есть сильное подозрение, что к ним в принципе неприменимы никакие ординационные техники, основная забота которых - сохранение топологии данных и минимальные искажения расстояний при проецировании. Насколько мне известно, понятие "расстояние" для для таблиц сопряженности не определено. Об этом четко пишут в комментариях к корреспондентскому анализу, и при этом говорят о том, что видимые ассоциации точек на графике можно трактовать в смысле близости только если они принадлежат к одному профилю: столбцов или строк.

Цитата
Вы каким софтом логлинейный делаете?


Когда-то делал Статистикой 13. Там автоматически происходит селекция оптимальной модели. Alexwin1961 в своем блоге демонстрирует эту технику на R:
https://r-statistics.livejournal.com/7168.html
Но до логлинейщины в данном случае дело не дойдет: там же надо логарифмировать содержимое ячеек таблицы. Следовательно, нулевых ячеек там быть не должно. Значит, надо искать спасение в добавке 0,5 к каждой ячейке. Однако даже для таблицы 8х5 уже звучавшая оценка 88/40 имеет практически такой же "порядок малости", что и величина 0,5. Мы просто равномерно "размажем" все эффекты по этой шахматной доске и ничего более.
  Форум: Медицинская статистика · Просмотр сообщения: #22986 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 10.05.2018 - 14:30


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Статистик @ 10.05.2018 - 11:53) *
Да, я, когда писала про все критерии, почему-то подумла только о параметрических.
Конечно, в не парметрических степени вободы от длины выборки обычно не зависят.

Я правильно поняла, что если нет другого выхода, то таки сравнивать можно, но нужно учитыват, что это не очень хорошо с точки зрения мощности критерия?


Разумеется, правильно. А что, это как -то иначе можно понять?
И не пишите, пож-ста, про какие-то там "длины" выборок. У выборок - объем, слово "длина" зарезервировано за временными рядами.
  Форум: Медицинская статистика · Просмотр сообщения: #22984 · Ответов: 3 · Просмотров: 526

100$
Отправлено: 9.05.2018 - 13:50


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(passant @ 9.05.2018 - 13:19) *
2. Поясните пожалуйста, откуда у Вас взялась цифра 77, когда автор пишет:


Да, passant, тут вы правы: я почему-то решил, что эти 11 собак -здоровые, а они тоже больные.

А что касается моего основного вопроса, то я имел в виду то, что моделируя каждую локализацию биномиальным распределением (Есть поражение в данной точке ("1") / нет поражения в данной точке ("0")),и получив для всех 88 случаев этот столбец из 1 и 0 мы не можем оценивать вероятность успеха просто разделив количество 1 на 88, т.к. особи разделены на 8 неднородных пород.
Поэтому я и предлагаю (видимо, не вполне понятно сформулировав) строить вероятностную модель порождения данных на основе мультиномиального распределения, не включая в пространство элементарных исходов вариант отсутствия патологии.

P.S. Все ваши букеты из вопросительных знаков возвращаю вам в целости и сохранности. Мне они не подошли.
  Форум: Медицинская статистика · Просмотр сообщения: #22976 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 9.05.2018 - 00:48


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(passant @ 9.05.2018 - 00:18) *
Немного не так.
8 пород. 5 локализаций.
От типа поражения ТС отказалась.

Итого в таблице 40 клеток.
У ТС 88 случаев (собачек) , т.е. не такая уж и пустая таблица получается. (88/40=2). Хотя очевидно, что несбалансирована, т.к. такс, например, всего 5 случаев (а хотелось бы ближе к 11).


passant, а как вы дихотомическую переменную, имеющую биномиальное распределение "Отсутствует/Присутствует" сумели так ловко объединить с переменной, имеющей мультиномиальное распределение? Это ж прямо прорыв какой-то. Ловкость рук, и никакого мошенства.
Корректная оценка - 77/40=1,925.

Всё, парни. По домам.
  Форум: Медицинская статистика · Просмотр сообщения: #22973 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 9.05.2018 - 00:35


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 8.05.2018 - 23:32) *
>passant. Таблица сложнее, упрощать не нужно: 8 пород х 5 локализаций х 4 типа поражения (отсутствует, грибковое, бактериальное, комбинированное). Т.е. входов три. Статистика хи-квадрат неаддитивна, точно на эффекты не разложить, поэтому только логлинейный анализ. Поскольку таблица получается наполовину пустой (77/160=0,48) анализировать исходную - плохая затея.


Nokh, что-то я вас нынче не узнаю: фактор, измеренный по альтернативному признаку (Есть/Нет, Наличествует/Отсутствует) нельзя объявлять "типом" поражения и на равных включать в вектор (отсутствует, а потом присутствует в виде грибка, бактерий и их комбинации). Особи, для которых тип поражения="отсутствует" - это здоровые псы, которые к ветврачу не попадают, и для которых понятие "Локализация" не определено.

  Форум: Медицинская статистика · Просмотр сообщения: #22972 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 9.05.2018 - 00:01


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Статистик @ 8.05.2018 - 20:53) *
Ох, чую, что меня побьют за мой вопрос, но спрошу))

Есть ли ограничения на разницу между размерами двух сравниваемых выборок.
Например, длина одной 300, а другой 1200 случайных величин.


Прямых нет, а косвенных (связанных с пониманием того, что при прочих равных критерий по выборкам равного объема будет обладать наибольшей мощностью) - таки да.

Цитата
Интуитивно понимаю, что во всех критериях для учета длин выборок есть степени свободы.


Вы интуитивно понимаете, а я вот, н-р, точно знаю, что критерий Краскела - Уоллиса, построенный по двум выборкам объема 300 и 1200, будет распределен как хи-квадрат с одной степенью свободы. Правда, "женская догадка обладает большей точностью, чем мужская уверенность".
  Форум: Медицинская статистика · Просмотр сообщения: #22969 · Ответов: 3 · Просмотров: 526

100$
Отправлено: 8.05.2018 - 22:50


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 8.05.2018 - 21:38) *
Статью с примером исследования по такой схеме прикрепил.


В статье на 133 с. затаился косметический дефект: 10^5.88=758 578, а не 75 858.
Паче того: непонятно, как это для OR 6.69 ДИ [1.09 - 285.5] и для OR 2.46 ДИ [1.09 - 285.5]. При расчете ДИ берутся экспоненты: там малейшее изменение численности таблицы дает такие эффекты в верхней оценке ДИ, что диву даешься.
  Форум: Медицинская статистика · Просмотр сообщения: #22967 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 8.05.2018 - 21:34


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 8.05.2018 - 18:51) *
Ох..
Коллеги разделили в разные группы
- бактериальное воспаление ушей
- грибковое воспаление ушей
- комбинированное воспаление ушей
- бак. воспаление лап
- грибковое воспаление лап
- комбинированное воспаление лап
и т.д., всего 24
Поскольку исследовательский вопрос - локализация, а не тип воспаления, логично объединить их в группы: воспаление ушей, лап и т.д. Но поскольку уши с лапами никак не связаны, мне представляется неважным количество групп (24 или 5), они все равно должны оцениваться отдельно друг от друга, но во взаимосвязи с породой:

Таблица 1.
_________________________уши больные__________уши здоровые

терьеры ______________________20__________________80

все остальные породы___________10___________________90


Таблица 2.
__________________________лапы больные___________лапы здоровые

терьеры __________________

все остальные______________

Всего 8 пород * 5 локализаций = 40 таблиц 2*2.

Я уже несколько раз спрашивала, оправданно ли использовать для оценки зависимости таблицы сопряженности, и если нет, то каким методом воспользоваться.
Еще я спрашивала, нужна ли здесь контрольная группа.
И еще я спрашивала, уместна ли здесь поправка Бонферрони.

Если бы я знала ответы на свои вопросы, я бы не создавала тему.

За ответные вопросы спасибо, они заставляют изучать тему, но ответов пока нет..

ПыСы: профессор германский не статистик, а дерматолог. Мирового уровня в ветеринарной медицине.


Хорошо, отвечу на вопросы.
1. Контрольная группа не нужна. Это не исследование Case-Control.
2. Это исследование сводится к анализу таблиц сопряженности на первом и втором этапах.
3. Поправка Бонферрони не нужна. Это будет ясно из дальнейшего изложения.

Так вот, мы договорились, что третий фактор "Тип/характер воспаления" (с как минимум тремя градациями: грибковое, бактериальное, комбинированное) оставляем в покое.
Остаются два "Порода" и "Локализация". В факторе "Локализация" нельзя выделить градацию "Отсутствие локализации", т.е. в эту таблицу не могут попасть здоровые животные. Все, что вам надо сделать - это не множить таблицы сопряженности, а заполнить одну для 77 пораженных животных:

________________________ Морда____Шея______Уши______Лапы______Хвост___,,,______Итого
1. Таксы___________________ 2_______0_________1_________0_________0_______________3
2. Бультерьеры
...
8. Фр. Бульдоги___________________________________________________________________77

И все. Вуаля. Одна гипотеза - и никаких корректировок достигаемого уровня значимости.
  Форум: Медицинская статистика · Просмотр сообщения: #22963 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 8.05.2018 - 15:35


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Статистик @ 8.05.2018 - 13:03) *
А я тоже не очень понимаю, зачем все локализации в одну таблицу сваливать?
А если у одной и той же собаки были поражения и ушей, и лап, например, то как тогда такую многомерную таблицу можно составить?


Вот поэтому вам и не быть в этой науке профессором, и не жить в Германии.)

Но вы не расстраивайтесь. Просто прочтите ветку не с конца, а с начала. Здесь уже в пятом посте выяснилось (?), что волшебное число 24, которое топикстартеру насчитали коллеги, - это декартово произведение двух факторов "Локализация"х"Тип поражения". Из этого с необходимостью следует, что либо фактор "Локализация" имеет 8 градаций при 3 у "Типа поражения", либо 6х4, либо 12х2, либо все эти люди не понимают, что они делают, либо этого не понимаю я. Это полная группа элементарных исходов. Тогда можно, конечно, больных особей (а их будет уже меньше 88) раскинуть по такой вот трехмерной таблице. Никто не запрещает. Только число сильно меньше 88 надо разместить в 8*6*4=192 ячейках теперь уже трехмерной таблицы. Топикстартера уже спрашивали во 2 посте, как далеко он намерен продвинуться в анализе такой слабонасыщенной таблицы. Ответа не последовало. Круг замкнулся.
Кроме того, многомерная таблица сопряженности - это кубик Рубика в том смысле, что если знаешь, как с ним обращаться, может быть когда-нибудь и соберешь. Это я к тому, что основным видом стат. анализа многомерной таблицы является ее логлинейная параметризация. А чтобы осмысленно провести логлинейный анализ многомерной таблицы, надо монографию Аптона "Анализ таблиц сопряженности" знать не просто наизусть, а лучше самого Аптона.
  Форум: Медицинская статистика · Просмотр сообщения: #22958 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 7.05.2018 - 16:41


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 7.05.2018 - 15:58) *
Спасибо большое за ответ.

Да, коллеги сформировали 24 группы и по локализации, и по характеру, из-за чего по некоторым признакам единичные данные. Их логично можно объединить до 5.
Н0 отвергла, отдельно по каждой локализации (уши, лапы, тело и т.д.).

Но мне по-прежнему не понятно, почему я должна объединять все локализации в одну таблицу, если они не связаны. Клинически мы наблюдаем, что если на приеме лабрадор, то почти всегда у него поражены уши и лапы, и редко тело. А если это терьер, то чаще всего поражены лапы, живот и шея, и редко уши. У меня нет цели исследовать зависимость ушей от лап, но зависимость ушей (или лап, или живота, или и лап и живота) от породы очень явная.
Так получается 5 таблиц 8*2 (8 пород * есть/нет) для каждой локализации.

Или нужно использовать другие методы для оценки зависимости? Какие тогда?


Ничего не понял, но если нулевая гипотеза из первого этапа исследования отвергается, то далее логично больных особей раскидать по 5 локализациям (таблица получится 8 пород х 5 локализаций ("лапы","шея" и т.д)) и проверить ее. А что тут еще предпринять? При этом никаких "зависимостей от ушей и лап" не проверяется. Проверяется сопряженность одного мультиномиального признака "Порода" с 8 градациями и второго мультиномиального признака "Локализация" с 5 градациями. Только и всего.

В ветеринары, штоле, податься...
  Форум: Медицинская статистика · Просмотр сообщения: #22953 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 6.05.2018 - 21:30


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Антон Т. @ 6.05.2018 - 17:47) *
Еще один вопрос - при сравнении 2 или нескольких групп по большому количеству признаков (а в генетических исследованиях подобное встречается часто) получить значимые результаты после коррекции на множественность проблематично. Читая форумы по стат. обработке , встречал мысль, что можно вводить коррекцию не по числу сравниваемых признаков (20-30-...), а только по числу сравниваемых групп, что значительно более лояльно. Насколько это корректно?


Все процедуры коррекции заточены не на признаки и группы, а на число проверяемых гипотез: у вас может быть 4 30-мерных группы, которые вы попарно проверяете критерием Хотеллинга. Это означает, что вы проверяете Н0 целых 6 раз: 1vs.2 (p-value1), 1 vs. 3 ( c p-value2), 1 vs. 4 (p-value3), 2 vs. 3 (...), 2 vs. 4 (...), 3vs.4 (p-value6). Вот эти p-value вы и будете корректировать.
  Форум: Медицинская статистика · Просмотр сообщения: #22951 · Ответов: 6 · Просмотров: 753

100$
Отправлено: 6.05.2018 - 19:10


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 6.05.2018 - 15:26) *
Коллеги попросили помочь с исследованием: оценка породной предрасположенности к определенной локализации и характеру кожных поражений у собак. Есть 8 пород (в исследование включались породы, где было 3 и больше пациентов) - всего 77 собак, и в качестве контрольной группы собаки, которых было представлено только по 1-2 штуки из породы (всего 11). Локализаций поражений 24.

Правильно ли я понимаю:
1.Это описательное исследование (зависимость локализации поражения от породы, нет вмешательства, нет исхода) и поэтому контрольная группа не нужна (но так посоветовал профессор из Германии..)?
2.Поскольку это независимые номинальные переменные (есть/нет поражения в этой области тела у этой породы), я должна провести анализ таблиц сопряженности для всех пар признаков?
3.Тот же профессор посоветовал использовать поправку Бонферрони, но я не уверена, что она тут к месту..


В целом вы все правильно понимаете. Поэтому в качестве самого первого шага стоит проверить гипотезу о том, что доля пораженных животных от породы к породе не меняется. Таблица сопряженности для 88 животных выглядит так:
______________________Больные___ Здоровые____Строчная сумма (Row sum)
Порода 1: Терьеры_________7_________ 7 ____________ 14
Порода 2: Таксы___________3__________2______________5
...
Порода 8:Фр. бульдоги
Итого: столбцовые суммы (Column sums)_________________88

При неотвержении H0 дальше вроде как и говорить не о чем.

При отвержении H0 нужно понимать, что если "Локализация" и "Характер поражения" - это разные факторы, то таблица сопряженности становится многомерной.
При этом если на тушке собаки насчитали аж 24 локализации, да еще пусть характер поражения - дихотомический, то 88 животных надо разбросать по 8*24*2=384 ячейкам многомерной таблицы.
  Форум: Медицинская статистика · Просмотр сообщения: #22950 · Ответов: 32 · Просмотров: 2589

100$
Отправлено: 26.04.2018 - 17:28


Дух форума
*

Группа: Пользователи
Сообщений: 644
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(scholar @ 26.04.2018 - 14:37) *
100$, спасибо, очень ценная книжка.


Это так.
  Форум: Медицинская статистика · Просмотр сообщения: #22934 · Ответов: 3 · Просмотров: 473

25 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена