Здравствуйте, гость ( Вход | Регистрация )
17.05.2019 - 00:17
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Провели анализ микробных ассоциаций в ожоговых ранах, выборка хорошая - более 400 проб. При оценке значимости ассоциаций с помощью индекса Жаккара в R-пакете jaccard выявилась такая штука: относительно большие индексы могли оказаться незначимыми (J=0.32; Р=0,504), а почти нулевые - значимыми (J=0.06; P=0.049). Если интересно - могу выложить данные, хотя я понял почему так происходит и сделал простой маленький пример. Стал искать другие пути, но не получается справиться самостоятельно. Буду очень признателен за помощь. Описание проблемы и вопросы в прикреплённом файле Help. Второй файл - статья, на которую есть надежда. Может ещё какие варианты подскажите...
Сообщение отредактировал nokh - 17.05.2019 - 00:49
Прикрепленные файлы
Real_The_probabilistic_basis_of_Jaccard_s_index_1996.pdf ( 638,93 килобайт )
Кол-во скачиваний: 467
Help.pdf ( 203,41 килобайт )
Кол-во скачиваний: 611 |
|
|
![]() |
![]() |
![]() |
19.05.2019 - 05:55
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Благодарю откликнувшихся!
1) <p2004r. Индекс Жаккара неэквивалентен достигнутому Р - в этом вся тонкость ситуации. Эквивалентом р является индекс Раупа-Крика: он тасует методом Монте-Карло строки второго столбца и строит распределение J для нулевой гипотезы отсутствия ассоциации с отсечением площади Р для наблюдаемого исходного значения. Индекс Раупа-Крика=1-РМонте-Карло. Поскольку ноли из ячейки D тоже участвуют в перестановках, этот индекс кардинально отличаются от J (хотя этот результат - безусловно оценка значимости ассоциации). В принципе, то что делает пакет jaccard ещё круче, т.к. в варианте exact он реализует все возможные перестановки. Тогда (1-Рexact) будет являться точной версией индекса Раупа-Крика. То, как работает exact я показал в Help и мне это не понравилось (в контексте интерпретации такого P в качестве Р для индекса Жаккара). Бутстреп будет играться со строками выборки целиком (а не со значениями одного столбца) и т.о. полученные бутстреп-реплики J вероятно не будут подвержены влиянию ячейки D. По точке нижней границе доверительного интервала такого бутстрепированного индекса Жаккара ещё не включающего ноль можно вычислить Р. Это - хорошая идея, попробую на своих примерчиках и данных. 2) <100$. Получается, что формула рабочая, это я её неправильно читаю(( Буду разбираться и пытаться программировать, хотя скорее всего здесь у меня из R получится BASIC. 3) А что вы думаете по поводу такого подхода: удалить из набора данных строки двойных нулей (ячейка D) и считать Монте-Карло или exact только оставшиеся ячейки? |
|
|
![]() |
![]() |
nokh Индекс сходства Жаккара. 17.05.2019 - 00:17
p2004r Цитата(nokh @ 17.05.2019 - 00:17) Пр... 17.05.2019 - 12:07
100$ Цитата(nokh @ 17.05.2019 - 00:17) Пр... 17.05.2019 - 20:53
100$ ЦитатаБуду разбираться и пытаться программировать,... 19.05.2019 - 14:12
nokh Цитата(100$ @ 19.05.2019 - 16:1... 19.05.2019 - 22:09
100$ Цитата(nokh @ 19.05.2019 - 22:09) Бу... 20.05.2019 - 16:51
nokh Цитата(100$ @ 20.05.2019 - 18:5... 20.05.2019 - 22:06
100$ Цитата(nokh @ 20.05.2019 - 22:06) Ог... 20.05.2019 - 22:16
100$ Цитата(nokh @ 20.05.2019 - 22:06) С ... 21.05.2019 - 11:33
nokh Цитата(100$ @ 21.05.2019 - 13:3... 21.05.2019 - 12:57
100$ Цитата(nokh @ 21.05.2019 - 12:57) Уж... 21.05.2019 - 13:32
DrgLena Цитата(nokh @ 17.05.2019 - 00:17) Ес... 21.05.2019 - 10:16
nokh Цитата(DrgLena @ 21.05.2019 - 12:16)... 21.05.2019 - 12:43![]() ![]() |