![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 30.08.2011 Пользователь №: 23261 ![]() |
Коллеги, у меня случился приступ кретинизма и сомнений.
Прошу помочь в двух вопросах. 1. На руках данные - скорость наступления события N (две переменных, начало = 0, конец = t, цензурированных и пропущенных нет, событие N наступило для всех наблюдений, других эпизодов наблюдений нет, окно наблюдения также не опредлено). Задача - оценить скорость наступления события N для разных групп обследуемых. Заказчик честно утверждает, что это Kaplan-Meier estimation+piecewise constant exponential models. Я столь же честно смотрю на данные и думаю, что все-таки нужно использовать только ANOVA, без бессмсыленных изысков анализа выживаемости. Прав ли я? 2. надо проверить связь двух переменных (или оценить влияние) - одна дихотомическая, вторая ранговая, порядка 10 градаций. Из методов в голову приходит только традиционная ранговая корреляция r-Спирмена. Но меня внезапно стали терзать смутные сомнения, может - есть еще что более подходящее задаче. Чем бы вы воспользовались? В обоих случаях выборка - несколько тысяч наблюдений. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
(1). А я согласен с Leer. И Каплан-Мейер, и Кокс нужны для грамотной обработки цензурированных наблюдений. А раз цензурированных наблюдений нет - нечего и огород городить. В отсутствие цензурированных наблюдений оценка Каплана-Мейера сводится к обычной накопленной частоте эмпирического распределения. Поэтому из обычного анализа распределения времени до наступления события (не хочу называть его скоростью: скорость - это события в единицу времени) можно получить всю необходимую информацию: ту же медиану, квартили, среднее и т.д. Более того если данных так много можно поискать и другие полезные особенности распределений, а не только оценить центральную тенденцию в виде медианы. Поэтому и сравнения можно организовать интереснее: не только по среднему в ANOVA (после преобразования к нормальной шкале) или в Краскеле-Уоллисе, но и по форме распределений: скажем нарезать распределения на кусочки и анализировать как таблицу частот. Думаю скорее всего заказчик "передрал" терминологию требований из работ с цензурированными данными. Единственное разумное объяснение - для возможности сравнения с результатами аналогичных исследований. Т. е если обычно анализируются цензурированные данные и результаты выражаются в каких-то рисках, то для обеспечения возможности сравнения нужно и эти данные обсчитывать аналогично. Хотя, повторюсь, для ответа на вопрос исследования этого не нужно.
(2) rank-biserial correlation. Софта не искал, если найдёте - прошу поделиться ссылкой. Сообщение отредактировал nokh - 31.08.2011 - 13:19 |
|
![]() |
![]() |
![]() ![]() |