![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 30.08.2011 Пользователь №: 23261 ![]() |
Коллеги, у меня случился приступ кретинизма и сомнений.
Прошу помочь в двух вопросах. 1. На руках данные - скорость наступления события N (две переменных, начало = 0, конец = t, цензурированных и пропущенных нет, событие N наступило для всех наблюдений, других эпизодов наблюдений нет, окно наблюдения также не опредлено). Задача - оценить скорость наступления события N для разных групп обследуемых. Заказчик честно утверждает, что это Kaplan-Meier estimation+piecewise constant exponential models. Я столь же честно смотрю на данные и думаю, что все-таки нужно использовать только ANOVA, без бессмсыленных изысков анализа выживаемости. Прав ли я? 2. надо проверить связь двух переменных (или оценить влияние) - одна дихотомическая, вторая ранговая, порядка 10 градаций. Из методов в голову приходит только традиционная ранговая корреляция r-Спирмена. Но меня внезапно стали терзать смутные сомнения, может - есть еще что более подходящее задаче. Чем бы вы воспользовались? В обоих случаях выборка - несколько тысяч наблюдений. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 30.08.2011 Пользователь №: 23261 ![]() |
1. большое спасибо за разъяснения по анализу таблиц размерности не 2*2. я примерно так и работаю с таблицами 2*n, сложности возникают при таблицах средних, примерно 4*4, когда, как сказала DrgLena, таблица расползается. впрочем, общую идею из комментариев я уловил.
2nokh - особое спасибо за разъяснение по работе с формой распределений. кстати, я психолог, и работаю, в основном, с интервальными данными. номинальные/ранговые или time-series данные - для меня, скорее, исключение и редкость. на этом форуме потому и зарегестрировался, что совершенно другие данные и задачи - ресурс для обучения очень хороший ![]() 2. по первоначальному сабжу. все-таки оказалось, что идиот я. еще раз, перед тем как отправить письмо заказчику, свежим взглядом пересмотрел данные, и понял, что первоначально неправильно интерпретировал их структуру. целевая переменная - время поиска работы. я принял это как первый эпизод, что совершенно неверно, так как большая часть респондентов нашли работу только на третий-пятый-девятй эпизоды. а до этого - не работали, получали образование и т.д. и у меня сейчас первоначальная задача - трансформировать данные из многовходового/nested/long вида в одновходовый/wide вид. с учетом того, что мне нужно определить эпизод, в котором респондент находит первый раз работу, и зафиксировать его уровень образования на этот момент. поэтому вопрос, скорее DrgLena, и к другим специалистам, кто работал с Stata - как это можно сделать средствами Stata? да и вообще, стоит ли работать с такими преобразованиями, правильно ли я делаю. |
|
![]() |
![]() |
![]() ![]() |