Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

25 страниц V   1 2 3 > » 

100$
Отправлено: 13.05.2018 - 13:38


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 13.05.2018 - 12:04) *
Уважаемые специалисты, спасибо огромное за активный отклик по моей теме! Интереса к ней я, конечно, не утратила smile.gif Много очень дел навалилось..

Я уточню с врачами, что именно их интересует (а то вдруг я неправильно поняла), отредактирую базу данных и здесь прикреплю.


Так вам в этой истории отведена роль испорченного телефона?

И, чтоб два раза не бежать, уточните у них заодно: как нам надо будет обрабатывать такой дважды парный орган как лапы?
Н-р, поражена одна лапа - ставим в локализацию "Лапы" единичку, поражены все 4 - тоже "1"? Иначе говоря, надо ли будет принимать во внимание степень поражения? Или только факт поражения?
  Форум: Медицинская статистика · Просмотр сообщения: #23000 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 11.05.2018 - 16:51


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Елена, а если вы еще не утратили интерес к этой теме, просветите меня, пожалуйста, на предмет того, а могут ли на одной собаке одновременно наблюдаться два или все три типа поражений? А то я ни разу не дерматолог, и патологии страшнее бородавок отродясь не видал.
  Форум: Медицинская статистика · Просмотр сообщения: #22993 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 10.05.2018 - 17:35


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Статистик @ 10.05.2018 - 12:00) *
Хм, читаю, читаю ответи и не понимаю, почему никто не обращает внимания, что у одной собаки может быть 2-3 локализации?
А раз так, то предлагаемые таблицы сопряженности попросту строить нельзя.


Вестимо. В таком случае единицей наблюдения будет не собака, а поражение, и если 88 собак принесли с собой 400 лишаев, то таблицу будем строить для этих 400 случаев.
  Форум: Медицинская статистика · Просмотр сообщения: #22987 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 10.05.2018 - 16:31


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Зато вы всегда узнаваемы: цепляетесь ко всему и ко всем... Но когда ради правого дела, я готов потерпеть wink.gif


Гы. Тоже мне, терпила smile.gif. Да я еще даже и не начинал. Вот прям щас и начну.

Цитата
3) Тип поражения - 3 категории (грибковое, бактериальное, комбинированное). Комбинированное нужно для обработки таблицы некоторыми методами (типа логлинейного анализа), чтобы каждая собака попала в какую-то ячейку многомерной таблицы частот. Но для некоторых методов можно обойтись без него, т.к. это просто наличие и первого, и второго типа поражений.


Вижу, вы отпраздновали по всем правилам smile.gif.

Градация "Комбинированная" с необходимостью должна присутствовать в таблице. И дело здесь не только в том, что сочетанная патология может быть гораздо "злее", нежели грибок или бактерии по отдельности и требовать от врача иных схем лечения. Меня интересуют простые вероятностные рассуждения: пусть мы имеем выборку из трех собак, у одной из которых наблюдается грибок (причем вероятность наблюдать такую=p1), у второй бактериальное поражение (с вероятностью наблюдать его=р2) и у третьей - сочетанная патология ( с вероятностью р3). Тогда для нашей выборки эмпирические априорные вероятности наблюдать каждый из этих случаев р1=р2=р3=1/3 и р1+р2+р3=1 как учили. Пока паззл сходится. Если комбинированная патология - это по вашей логике одновременное наблюдение "двух в одном", то такая вероятность должна равняться р3=р1*р2, т.е. 1/3*1/3=1/9. Однако она равна 1/3 по наблюдаемым данным и 1/3+1/3+1/9 уже не равна 1. Следовательно, в общем случае вероятность наблюдать сочетанную патологию не определяется вероятностями грибка и бактерий и представляет собой самостоятельный феномен.

Цитата
Если формировать матрицу данных построчно так, что каждая строка - отдельная собака, то "комбинированное" не понадобится, просто в колонках "грибковое" и "бактериальное" будут стоять единицы


В том-то и дело, что не будут. Ибо в данном случае "1"-это не индикатор события, а счетная переменная (т.е. объект наблюдения). В вашем варианте одна собака порождает строчную сумму равную 2.

Именно поэтому для моего рассуждения (вышеприведенного примера) строчная сумма равнялась трем, при отказе от столбца "Комбинированная" она будет равна 2. Чтобы восстановить строчную сумму, оставшуюся собаку надо как-то "размазать" по колонкам "Грибок" и "Бактерии", а как? Добавить в каждый по 0,5, Или туда 0,6, а сюда - 0,4?
Резюме: категорию "Комбинированная" оставляем.

Цитата
4) Наличие поражения - 2 категории (есть, нет)


Nokh, а зачем вы с упорством, достойным лучшего применения, пытаетесь прикрутить к этой несчастной вероятностно-статистической модели еще и дихотомию типа "Есть/Нет", "Жив/Мертв"? Мы наблюдаем только пораженных животных, у которых с единичной вероятностью есть хотя бы одно поражение. Если его нет - это здоровая шавка, которой некогда бегать по врачам. Вам что базовой таблице 8х5х3 нулей не хватает? smile.gif

Откажитесь от избыточного измерения и вам не придется ничего концентрировать. А то вы напоминаете незадачливого повара, который плеснул, не глядя, в котел лишнее ведро воды, получил концентрацию ухи на уровне "семь ведер - одна луковица" и теперь пытается раскочегарить огонь посильнее, чтобы лишняя влага побыстрее испарилась. Попутно вычерпывая ее руками. smile.gif
Резюме: 8х5х3.

Цитата
Однозначно нужно концентрировать информацию с опорой на ординационные техники.


Ну, не зна-а-а-ю. Статистический метод определяется природой данных. Данные таблицы сопряженности - это результаты прямого подсчета, измеренные в абсолютной шкале. Есть сильное подозрение, что к ним в принципе неприменимы никакие ординационные техники, основная забота которых - сохранение топологии данных и минимальные искажения расстояний при проецировании. Насколько мне известно, понятие "расстояние" для для таблиц сопряженности не определено. Об этом четко пишут в комментариях к корреспондентскому анализу, и при этом говорят о том, что видимые ассоциации точек на графике можно трактовать в смысле близости только если они принадлежат к одному профилю: столбцов или строк.

Цитата
Вы каким софтом логлинейный делаете?


Когда-то делал Статистикой 13. Там автоматически происходит селекция оптимальной модели. Alexwin1961 в своем блоге демонстрирует эту технику на R:
https://r-statistics.livejournal.com/7168.html
Но до логлинейщины в данном случае дело не дойдет: там же надо логарифмировать содержимое ячеек таблицы. Следовательно, нулевых ячеек там быть не должно. Значит, надо искать спасение в добавке 0,5 к каждой ячейке. Однако даже для таблицы 8х5 уже звучавшая оценка 88/40 имеет практически такой же "порядок малости", что и величина 0,5. Мы просто равномерно "размажем" все эффекты по этой шахматной доске и ничего более.
  Форум: Медицинская статистика · Просмотр сообщения: #22986 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 10.05.2018 - 14:30


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Статистик @ 10.05.2018 - 11:53) *
Да, я, когда писала про все критерии, почему-то подумла только о параметрических.
Конечно, в не парметрических степени вободы от длины выборки обычно не зависят.

Я правильно поняла, что если нет другого выхода, то таки сравнивать можно, но нужно учитыват, что это не очень хорошо с точки зрения мощности критерия?


Разумеется, правильно. А что, это как -то иначе можно понять?
И не пишите, пож-ста, про какие-то там "длины" выборок. У выборок - объем, слово "длина" зарезервировано за временными рядами.
  Форум: Медицинская статистика · Просмотр сообщения: #22984 · Ответов: 3 · Просмотров: 326

100$
Отправлено: 9.05.2018 - 13:50


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(passant @ 9.05.2018 - 13:19) *
2. Поясните пожалуйста, откуда у Вас взялась цифра 77, когда автор пишет:


Да, passant, тут вы правы: я почему-то решил, что эти 11 собак -здоровые, а они тоже больные.

А что касается моего основного вопроса, то я имел в виду то, что моделируя каждую локализацию биномиальным распределением (Есть поражение в данной точке ("1") / нет поражения в данной точке ("0")),и получив для всех 88 случаев этот столбец из 1 и 0 мы не можем оценивать вероятность успеха просто разделив количество 1 на 88, т.к. особи разделены на 8 неднородных пород.
Поэтому я и предлагаю (видимо, не вполне понятно сформулировав) строить вероятностную модель порождения данных на основе мультиномиального распределения, не включая в пространство элементарных исходов вариант отсутствия патологии.

P.S. Все ваши букеты из вопросительных знаков возвращаю вам в целости и сохранности. Мне они не подошли.
  Форум: Медицинская статистика · Просмотр сообщения: #22976 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 9.05.2018 - 00:48


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(passant @ 9.05.2018 - 00:18) *
Немного не так.
8 пород. 5 локализаций.
От типа поражения ТС отказалась.

Итого в таблице 40 клеток.
У ТС 88 случаев (собачек) , т.е. не такая уж и пустая таблица получается. (88/40=2). Хотя очевидно, что несбалансирована, т.к. такс, например, всего 5 случаев (а хотелось бы ближе к 11).


passant, а как вы дихотомическую переменную, имеющую биномиальное распределение "Отсутствует/Присутствует" сумели так ловко объединить с переменной, имеющей мультиномиальное распределение? Это ж прямо прорыв какой-то. Ловкость рук, и никакого мошенства.
Корректная оценка - 77/40=1,925.

Всё, парни. По домам.
  Форум: Медицинская статистика · Просмотр сообщения: #22973 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 9.05.2018 - 00:35


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 8.05.2018 - 23:32) *
>passant. Таблица сложнее, упрощать не нужно: 8 пород х 5 локализаций х 4 типа поражения (отсутствует, грибковое, бактериальное, комбинированное). Т.е. входов три. Статистика хи-квадрат неаддитивна, точно на эффекты не разложить, поэтому только логлинейный анализ. Поскольку таблица получается наполовину пустой (77/160=0,48) анализировать исходную - плохая затея.


Nokh, что-то я вас нынче не узнаю: фактор, измеренный по альтернативному признаку (Есть/Нет, Наличествует/Отсутствует) нельзя объявлять "типом" поражения и на равных включать в вектор (отсутствует, а потом присутствует в виде грибка, бактерий и их комбинации). Особи, для которых тип поражения="отсутствует" - это здоровые псы, которые к ветврачу не попадают, и для которых понятие "Локализация" не определено.

  Форум: Медицинская статистика · Просмотр сообщения: #22972 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 9.05.2018 - 00:01


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Статистик @ 8.05.2018 - 20:53) *
Ох, чую, что меня побьют за мой вопрос, но спрошу))

Есть ли ограничения на разницу между размерами двух сравниваемых выборок.
Например, длина одной 300, а другой 1200 случайных величин.


Прямых нет, а косвенных (связанных с пониманием того, что при прочих равных критерий по выборкам равного объема будет обладать наибольшей мощностью) - таки да.

Цитата
Интуитивно понимаю, что во всех критериях для учета длин выборок есть степени свободы.


Вы интуитивно понимаете, а я вот, н-р, точно знаю, что критерий Краскела - Уоллиса, построенный по двум выборкам объема 300 и 1200, будет распределен как хи-квадрат с одной степенью свободы. Правда, "женская догадка обладает большей точностью, чем мужская уверенность".
  Форум: Медицинская статистика · Просмотр сообщения: #22969 · Ответов: 3 · Просмотров: 326

100$
Отправлено: 8.05.2018 - 22:50


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 8.05.2018 - 21:38) *
Статью с примером исследования по такой схеме прикрепил.


В статье на 133 с. затаился косметический дефект: 10^5.88=758 578, а не 75 858.
Паче того: непонятно, как это для OR 6.69 ДИ [1.09 - 285.5] и для OR 2.46 ДИ [1.09 - 285.5]. При расчете ДИ берутся экспоненты: там малейшее изменение численности таблицы дает такие эффекты в верхней оценке ДИ, что диву даешься.
  Форум: Медицинская статистика · Просмотр сообщения: #22967 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 8.05.2018 - 21:34


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 8.05.2018 - 18:51) *
Ох..
Коллеги разделили в разные группы
- бактериальное воспаление ушей
- грибковое воспаление ушей
- комбинированное воспаление ушей
- бак. воспаление лап
- грибковое воспаление лап
- комбинированное воспаление лап
и т.д., всего 24
Поскольку исследовательский вопрос - локализация, а не тип воспаления, логично объединить их в группы: воспаление ушей, лап и т.д. Но поскольку уши с лапами никак не связаны, мне представляется неважным количество групп (24 или 5), они все равно должны оцениваться отдельно друг от друга, но во взаимосвязи с породой:

Таблица 1.
_________________________уши больные__________уши здоровые

терьеры ______________________20__________________80

все остальные породы___________10___________________90


Таблица 2.
__________________________лапы больные___________лапы здоровые

терьеры __________________

все остальные______________

Всего 8 пород * 5 локализаций = 40 таблиц 2*2.

Я уже несколько раз спрашивала, оправданно ли использовать для оценки зависимости таблицы сопряженности, и если нет, то каким методом воспользоваться.
Еще я спрашивала, нужна ли здесь контрольная группа.
И еще я спрашивала, уместна ли здесь поправка Бонферрони.

Если бы я знала ответы на свои вопросы, я бы не создавала тему.

За ответные вопросы спасибо, они заставляют изучать тему, но ответов пока нет..

ПыСы: профессор германский не статистик, а дерматолог. Мирового уровня в ветеринарной медицине.


Хорошо, отвечу на вопросы.
1. Контрольная группа не нужна. Это не исследование Case-Control.
2. Это исследование сводится к анализу таблиц сопряженности на первом и втором этапах.
3. Поправка Бонферрони не нужна. Это будет ясно из дальнейшего изложения.

Так вот, мы договорились, что третий фактор "Тип/характер воспаления" (с как минимум тремя градациями: грибковое, бактериальное, комбинированное) оставляем в покое.
Остаются два "Порода" и "Локализация". В факторе "Локализация" нельзя выделить градацию "Отсутствие локализации", т.е. в эту таблицу не могут попасть здоровые животные. Все, что вам надо сделать - это не множить таблицы сопряженности, а заполнить одну для 77 пораженных животных:

________________________ Морда____Шея______Уши______Лапы______Хвост___,,,______Итого
1. Таксы___________________ 2_______0_________1_________0_________0_______________3
2. Бультерьеры
...
8. Фр. Бульдоги___________________________________________________________________77

И все. Вуаля. Одна гипотеза - и никаких корректировок достигаемого уровня значимости.
  Форум: Медицинская статистика · Просмотр сообщения: #22963 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 8.05.2018 - 15:35


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Статистик @ 8.05.2018 - 13:03) *
А я тоже не очень понимаю, зачем все локализации в одну таблицу сваливать?
А если у одной и той же собаки были поражения и ушей, и лап, например, то как тогда такую многомерную таблицу можно составить?


Вот поэтому вам и не быть в этой науке профессором, и не жить в Германии.)

Но вы не расстраивайтесь. Просто прочтите ветку не с конца, а с начала. Здесь уже в пятом посте выяснилось (?), что волшебное число 24, которое топикстартеру насчитали коллеги, - это декартово произведение двух факторов "Локализация"х"Тип поражения". Из этого с необходимостью следует, что либо фактор "Локализация" имеет 8 градаций при 3 у "Типа поражения", либо 6х4, либо 12х2, либо все эти люди не понимают, что они делают, либо этого не понимаю я. Это полная группа элементарных исходов. Тогда можно, конечно, больных особей (а их будет уже меньше 88) раскинуть по такой вот трехмерной таблице. Никто не запрещает. Только число сильно меньше 88 надо разместить в 8*6*4=192 ячейках теперь уже трехмерной таблицы. Топикстартера уже спрашивали во 2 посте, как далеко он намерен продвинуться в анализе такой слабонасыщенной таблицы. Ответа не последовало. Круг замкнулся.
Кроме того, многомерная таблица сопряженности - это кубик Рубика в том смысле, что если знаешь, как с ним обращаться, может быть когда-нибудь и соберешь. Это я к тому, что основным видом стат. анализа многомерной таблицы является ее логлинейная параметризация. А чтобы осмысленно провести логлинейный анализ многомерной таблицы, надо монографию Аптона "Анализ таблиц сопряженности" знать не просто наизусть, а лучше самого Аптона.
  Форум: Медицинская статистика · Просмотр сообщения: #22958 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 7.05.2018 - 16:41


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 7.05.2018 - 15:58) *
Спасибо большое за ответ.

Да, коллеги сформировали 24 группы и по локализации, и по характеру, из-за чего по некоторым признакам единичные данные. Их логично можно объединить до 5.
Н0 отвергла, отдельно по каждой локализации (уши, лапы, тело и т.д.).

Но мне по-прежнему не понятно, почему я должна объединять все локализации в одну таблицу, если они не связаны. Клинически мы наблюдаем, что если на приеме лабрадор, то почти всегда у него поражены уши и лапы, и редко тело. А если это терьер, то чаще всего поражены лапы, живот и шея, и редко уши. У меня нет цели исследовать зависимость ушей от лап, но зависимость ушей (или лап, или живота, или и лап и живота) от породы очень явная.
Так получается 5 таблиц 8*2 (8 пород * есть/нет) для каждой локализации.

Или нужно использовать другие методы для оценки зависимости? Какие тогда?


Ничего не понял, но если нулевая гипотеза из первого этапа исследования отвергается, то далее логично больных особей раскидать по 5 локализациям (таблица получится 8 пород х 5 локализаций ("лапы","шея" и т.д)) и проверить ее. А что тут еще предпринять? При этом никаких "зависимостей от ушей и лап" не проверяется. Проверяется сопряженность одного мультиномиального признака "Порода" с 8 градациями и второго мультиномиального признака "Локализация" с 5 градациями. Только и всего.

В ветеринары, штоле, податься...
  Форум: Медицинская статистика · Просмотр сообщения: #22953 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 6.05.2018 - 21:30


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Антон Т. @ 6.05.2018 - 17:47) *
Еще один вопрос - при сравнении 2 или нескольких групп по большому количеству признаков (а в генетических исследованиях подобное встречается часто) получить значимые результаты после коррекции на множественность проблематично. Читая форумы по стат. обработке , встречал мысль, что можно вводить коррекцию не по числу сравниваемых признаков (20-30-...), а только по числу сравниваемых групп, что значительно более лояльно. Насколько это корректно?


Все процедуры коррекции заточены не на признаки и группы, а на число проверяемых гипотез: у вас может быть 4 30-мерных группы, которые вы попарно проверяете критерием Хотеллинга. Это означает, что вы проверяете Н0 целых 6 раз: 1vs.2 (p-value1), 1 vs. 3 ( c p-value2), 1 vs. 4 (p-value3), 2 vs. 3 (...), 2 vs. 4 (...), 3vs.4 (p-value6). Вот эти p-value вы и будете корректировать.
  Форум: Медицинская статистика · Просмотр сообщения: #22951 · Ответов: 6 · Просмотров: 461

100$
Отправлено: 6.05.2018 - 19:10


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Елена Гогуа @ 6.05.2018 - 15:26) *
Коллеги попросили помочь с исследованием: оценка породной предрасположенности к определенной локализации и характеру кожных поражений у собак. Есть 8 пород (в исследование включались породы, где было 3 и больше пациентов) - всего 77 собак, и в качестве контрольной группы собаки, которых было представлено только по 1-2 штуки из породы (всего 11). Локализаций поражений 24.

Правильно ли я понимаю:
1.Это описательное исследование (зависимость локализации поражения от породы, нет вмешательства, нет исхода) и поэтому контрольная группа не нужна (но так посоветовал профессор из Германии..)?
2.Поскольку это независимые номинальные переменные (есть/нет поражения в этой области тела у этой породы), я должна провести анализ таблиц сопряженности для всех пар признаков?
3.Тот же профессор посоветовал использовать поправку Бонферрони, но я не уверена, что она тут к месту..


В целом вы все правильно понимаете. Поэтому в качестве самого первого шага стоит проверить гипотезу о том, что доля пораженных животных от породы к породе не меняется. Таблица сопряженности для 88 животных выглядит так:
______________________Больные___ Здоровые____Строчная сумма (Row sum)
Порода 1: Терьеры_________7_________ 7 ____________ 14
Порода 2: Таксы___________3__________2______________5
...
Порода 8:Фр. бульдоги
Итого: столбцовые суммы (Column sums)_________________88

При неотвержении H0 дальше вроде как и говорить не о чем.

При отвержении H0 нужно понимать, что если "Локализация" и "Характер поражения" - это разные факторы, то таблица сопряженности становится многомерной.
При этом если на тушке собаки насчитали аж 24 локализации, да еще пусть характер поражения - дихотомический, то 88 животных надо разбросать по 8*24*2=384 ячейкам многомерной таблицы.
  Форум: Медицинская статистика · Просмотр сообщения: #22950 · Ответов: 30 · Просмотров: 1227

100$
Отправлено: 26.04.2018 - 17:28


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(scholar @ 26.04.2018 - 14:37) *
100$, спасибо, очень ценная книжка.


Это так.
  Форум: Медицинская статистика · Просмотр сообщения: #22934 · Ответов: 3 · Просмотров: 315

100$
Отправлено: 23.04.2018 - 15:57


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


https://books.google.ru/books?id=llXBvougIC...gth&f=false
  Форум: Медицинская статистика · Просмотр сообщения: #22928 · Ответов: 3 · Просмотров: 315

100$
Отправлено: 18.04.2018 - 16:45


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(scholar @ 17.04.2018 - 14:32) *
Я решил свой выпрос удалением выбросов:) Тема закрыта
код для удаление выбросов простой
remove_outliers <- function(x, na.rm = TRUE, ...) {
qnt <- quantile(x, probs=c(.25, .75), na.rm = na.rm, ...)
H <- 1.5 * IQR(x, na.rm = na.rm)
y <- x
y[x < (qnt[1] - H)] <- NA
y[x > (qnt[2] + H)] <- NA
y
}


Ваши публичные восторги по поводу собственной сообразительности нахожу слегка преждевременными. Когда вы удалили из временного ряда какие-то там выбросы, возникла проблема пропущенных значений. Не мешало бы их восстановить хотя бы фильтром Калмана.
  Форум: Медицинская статистика · Просмотр сообщения: #22916 · Ответов: 3 · Просмотров: 611

100$
Отправлено: 16.04.2018 - 14:14


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Cules2013 @ 16.04.2018 - 12:45) *
100$, вроде бы и за ответ спасибо, хоть какой-то, но вот таких вот умников терпеть не могу. Знаю я вас - в одном король, в другом... На каждого умника есть свой болт с левой резьбой, не забывайте. Будьте поскромнее. А то видите ли, соизволили с барской плеча черкануть пару строк, дабы я прикоснулся к вашему гению. Куда уж тут великим обращать внимание на какого-то рядового пользователя с его вопросами. А нафига тогда форум создали? Чтобы друг перед другом выделываться? Или может на вопросы отвечать. Я бы понял, если бы спросил какую-то фигню, что можно легко по первой же ссылке в интернете найти, или в любом учебнике прочитать.


Вы не очень-то наблюдательны. Я отвечал вовсе не вам. Я всего лишь пытался (из лучших побуждений) докричаться до потенциальных ответчиков, которые читать-читают, а отвечать не спешат. Так что просьба своим болтом размахивать где-нить в другом месте.
  Форум: Медицинская статистика · Просмотр сообщения: #22911 · Ответов: 5 · Просмотров: 1148

100$
Отправлено: 16.04.2018 - 01:23


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Cules2013 @ 15.04.2018 - 23:01) *
Почти две с половиной сотни просмотров и ни одного коммента? Это всем влом писать smile.gif или реально никто не знает ответа?


Действительно, господа созерцатели, безымянные читатели и анонимные знатоки, нарушьте уже обет молчания и ответьте, наконец, человеку. Сообщите ему, так, между прочим, что для решения задач типа 1 vs. 3 есть так называемые канонические корреляции (Canonical correlation analysis - CCA). Пущай усредняет показатели за 21 день и вперед, заре навстречу... Не с марковскими цепями же ему возиться, в самом-то деле, в поисках заветного распределения с древовидной структурой зависимостей...
  Форум: Медицинская статистика · Просмотр сообщения: #22908 · Ответов: 5 · Просмотров: 1148

100$
Отправлено: 7.04.2018 - 22:56


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(DrgLena @ 7.04.2018 - 22:33) *
smile.gif


Да, спасибо, хотя Nokh уже угостил ссылкой в #15. Правда, жизнь и впрямь слишком коротка, чтобы осиливать подобные талмуды.
По существу вопроса попутно могу сообщить, что в случае биномиального распределения при p1=p2=p Boschloo сконструирован так, что точной верхней гранью рассматриваемого критериального множества как раз и является результат точного метода Фишера (ТМФ).
  Форум: Медицинская статистика · Просмотр сообщения: #22895 · Ответов: 17 · Просмотров: 2088

100$
Отправлено: 7.04.2018 - 18:41


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 7.04.2018 - 18:12) *
Автор пакета "Exact" и здесь то же повторяет: https://stats.stackexchange.com/questions/1...hloo-or-barnard
Так что это, в отличие от x13, не ошибка какая-то, но я пока не понимаю что это значит unknw.gif
Поразбираться можно, но очень всё это ресурсозатратно. Видно проще хроники написать, чем нормальный учебник: https://errorstatistics.files.wordpress.com...ston-mielke.pdf


Я ворчал только по поводу формулы.
Вот оригинальная статья Boschloo (1970), но требуется регистрация:
https://onlinelibrary.wiley.com/doi/pdf/10.....1970.tb00104.x

Что касается "Хроник...", то - да, книженция любопытная, мне она попадалась в Google.books с очень малым числом страниц для просмотра.
  Форум: Медицинская статистика · Просмотр сообщения: #22893 · Ответов: 17 · Просмотров: 2088

100$
Отправлено: 7.04.2018 - 17:07


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
т.к. итак узнал сегодня много нового:)).


Вашими стараниями я - тоже, особенно вот это (из Exact.pdf):

Boschloo:
Uses the p-value from Fisher?s exact test as the test statistic.

Кстати, в Exact.pdf не обошлось без ошибки в самой первой же формуле: в таблице 2х2 не может появиться элемент X13

Вот так, бывало, некритично отнесешься к прочитанному и все - пиши -"пропало"...
  Форум: Медицинская статистика · Просмотр сообщения: #22890 · Ответов: 17 · Просмотров: 2088

100$
Отправлено: 6.04.2018 - 20:08


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


А теперь дадим слово разработчикам SPSS:

Monte Carlo Estimation

To compute a Monte Carlo estimate of an exact p-value, PROC FREQ generates a
random sample of tables with the same total sample size, row totals, and column to-
tals as the observed table. PROC FREQ uses the algorithm of Agresti, Wackerly, and
Boyett (1979), which generates tables in proportion to their hypergeometric proba-
bilities conditional on the marginal frequencies.
  Форум: Медицинская статистика · Просмотр сообщения: #22880 · Ответов: 17 · Просмотров: 2088

100$
Отправлено: 6.04.2018 - 16:58


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 6.04.2018 - 16:07) *
Критерий Фишера разработан на основе гипергеометрического распределения, тогда как в реальной жизни мы не имеем фиксированных краевых частот таблицы сопряжённости по всем входам. Т.е. критерий предполагает гипергеометрическое распределение, а мы используем его на практике для анализа би- или полиномиального распределения. С теоретической точки зрения это нехорошо, хотя на практике выводы получаются сходными. Поэтому лучше пытаться реализовать точный рандомизационный критерий или Монте-Карло.


Чистая правда, но я уместил это в два слова: "Фишеровская парадигма". Где и как в популярных пакетах реализован подход Барнарда (на основе би- и поли-) мне не ведомо.
  Форум: Медицинская статистика · Просмотр сообщения: #22878 · Ответов: 17 · Просмотров: 2088

25 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена