Каким методом воспользоваться? - Форум врачей-аспирантов

Каким методом воспользоваться?

Leer Просмотр профиля	30.08.2011 - 22:33 Сообщение #1
Группа: Пользователи Сообщений: 13 Регистрация: 30.08.2011 Пользователь №: 23261	Коллеги, у меня случился приступ кретинизма и сомнений. Прошу помочь в двух вопросах. 1. На руках данные - скорость наступления события N (две переменных, начало = 0, конец = t, цензурированных и пропущенных нет, событие N наступило для всех наблюдений, других эпизодов наблюдений нет, окно наблюдения также не опредлено). Задача - оценить скорость наступления события N для разных групп обследуемых. Заказчик честно утверждает, что это Kaplan-Meier estimation+piecewise constant exponential models. Я столь же честно смотрю на данные и думаю, что все-таки нужно использовать только ANOVA, без бессмсыленных изысков анализа выживаемости. Прав ли я? 2. надо проверить связь двух переменных (или оценить влияние) - одна дихотомическая, вторая ранговая, порядка 10 градаций. Из методов в голову приходит только традиционная ранговая корреляция r-Спирмена. Но меня внезапно стали терзать смутные сомнения, может - есть еще что более подходящее задаче. Чем бы вы воспользовались? В обоих случаях выборка - несколько тысяч наблюдений.

Ответов

Leer Просмотр профиля	31.08.2011 - 17:07 Сообщение #2
Группа: Пользователи Сообщений: 13 Регистрация: 30.08.2011 Пользователь №: 23261	DrgLena, nokh - благодарю. 2 DrgLena если вдаваться в подробности, то данные - мультиэпизодная panel data. заказчика интересует только первый эпизод, время поиска работы (от нуля до какого-то значения, когда он, собственно, и нашел работу). Выглядит как данные, организованные для анализа выживаемости и прочих временных штудий. Однако по ближайшем рассмотрении мне показалось, что это все-таки просто интервальные данные времени поиска работы. Поэтому, с учетом отсутствия цензурированных наблюдений, и встал вопрос об уместности оценки Каплана-Мейера/регрессии Кокса. К тому же, визуально оценивать график сложно - 11 кривых, с наложениями и т.д. А как Вы работаете с таблицами сопряженности большой размерности? Я внятно могу интерпретировать только таблицы 2*2, дальше уже путаюсь и теряюсь. за ранговые оценки различий - спасибо большое, я как-то выпустил этот блок методов, привык их использовать на ненормально распределенных данных, по преимуществу. задача здесь простая - оценить, респонденты с каким уровнем образования восстанавливаются в вузах, а для кого - начинают с самого начала. видимо, сделаю проще в выборе Kaplan-Meier vs ANOVA - обрисую свою позицию и все "за" и "против" заказчику, и попрошу определиться. 2nokh угу, я примерно такими же соображениями и руководствовался, когда думал о том, что каплан/кокс не нужен. И, думаю, Вы правы в том, что заказчик просто следует тренду обработки - применение piecewise constant models, Kapla-Meier, Cox модны среди немецких социологов (как я понял, заказчик жестко на них ориентируется ). расскажите, пожалуйста, подробнее, как Вы делаете "анализ по форме распределений: скажем нарезать распределения на кусочки и анализировать как таблицу частот"? я с такой формой анализа не встречался. кстати, а для чего Вы делаете преобразование к нормальному распределению для ANOVA? Ведь, насколько я помню, дисперсионный анализ больше требователен к гомогенности дисперсий, и не оперирует параметрами распределения. Я обхожусь проверкой на гомогенность (критерий Левена) или на сферичность - при многомерном дисперсионном (критерий Бокса). бисериальный...спасибо, подумаю. софта как такового не видел, но знаю, что для SPSS написан макрос - http://rivita.ru/files/KO_Various_proximities_RU.zip возможно, есть реализация в R, но я с ним пока не работаю

p2004r Просмотр профиля	1.09.2011 - 09:35 Сообщение #3
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(Leer @ 31.08.2011 - 16:07) .............. А как Вы работаете с таблицами сопряженности большой размерности? Я внятно могу интерпретировать только таблицы 2*2, дальше уже путаюсь и теряюсь. ................. возможно, есть реализация в R, но я с ним пока не работаю надо начинать mosaicplot(x, ...) x: a contingency table in array form, with optional category labels specified in the ?dimnames(x)? attribute. The table is best created by the ?table()? command. вот пример картинки (из http://r-statistics.livejournal.com/12710.html ) mydata<-read.csv("http://dl.dropbox.com/u/17112096/mydata.csv") mosaicplot(table(mydata$ev_answer,mydata$rec_answer,mydata$freq)) http://r-statistics.livejournal.com/

Leer Просмотр профиля	1.09.2011 - 10:33 Сообщение #4
Группа: Пользователи Сообщений: 13 Регистрация: 30.08.2011 Пользователь №: 23261	Цитата(p2004r @ 1.09.2011 - 10:35) надо начинать меня коллеги уже чуть ли не пинками в сторону R гонят пока сошлись на странном компромиссе - принюхиваюсь к Stata, которая тоже командная собственно, ralfer, на пост которого Вы ссылаетесь - один из моих коллег-друзей а про таблицы сопряженности - как сделать-то понятно вопрос в том, как качественно содержательно интерпретировать таблицы больше, чем 22 Сообщение отредактировал Leer* - 1.09.2011 - 11:20

Сообщений в этой теме

Leer Каким методом воспользоваться? 30.08.2011 - 22:33

DrgLena 1. Заказчик абсолютно прав. Нужен анализ скорости ... 31.08.2011 - 11:37

nokh (1). А я согласен с Leer. И Каплан-Мейер, и Кокс н... 31.08.2011 - 13:02

Leer DrgLena, nokh - благодарю. 2 DrgLena если вдавать... 31.08.2011 - 17:07

p2004r Цитата(Leer @ 31.08.2011 - 16:07) ..... 1.09.2011 - 09:35

Leer Цитата(p2004r @ 1.09.2011 - 10:35) н... 1.09.2011 - 10:33

p2004r Цитата(Leer @ 1.09.2011 - 09:33) мен... 1.09.2011 - 18:30

DoctorStat Цитата(Leer @ 1.09.2011 - 11:33) а п... 1.09.2011 - 21:44

DrgLena Интерпретация таблиц вытекает из их содержания, на... 1.09.2011 - 12:11

nokh Цитата(Leer @ 31.08.2011 - 20:07) ра... 1.09.2011 - 22:30

p2004r Цитата(nokh @ 1.09.2011 - 21:30) Диа... 2.09.2011 - 00:35

Leer 1. большое спасибо за разъяснения по анализу табли... 3.09.2011 - 16:19

DrgLena Я сейчас со STATA не работаю. Не совсем понимаю за... 7.09.2011 - 07:49

Leer 2 DrgLena. спасибо за ответ. Данные имеют структу... 8.09.2011 - 09:45

DrgLena Если интересует только время первой работы, то выб... 11.09.2011 - 19:57

Leer 2DrgLena несколько заболел, поэтому не сразу отве... 19.09.2011 - 10:54

« Предыдущая тема · Медицинская статистика · Следующая тема »