![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() ![]() |
![]() |
![]()
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 30.08.2011 Пользователь №: 23261 ![]() |
2DrgLena
несколько заболел, поэтому не сразу отвечаю. Спасибо за Ваш ответ. По задаче ? мне нужно проследить, как я уже говорил, влияние уровня образования на время поиска первой работы. Однако нужны данные не по всем эпизодам. Мне кажется, что необходимо трансформировать данные из long формата в wide (в файле примера данных оба формата представлены). Время поиска работы я определяю как значение переменной Begin в том эпизоде, когда переменная Job впервые принимает значение ?1?. А уровень образования ? это значение переменной Edu_level в последнем эпизоде (до эпизода начала работы), когда переменная Edu принимает значение ?1?. И потом, на переструктурированных данных, проверять гипотезу уже методами дисперсионного анализа. Эпизоды не равноценны, так как сконструированы на основе биографических данных. Многие из них носят технический характер и созданы для того, чтобы в переменных времени (begin/end) не было разрывов. Именно поэтому я считаю, что мы не имеем возможности пользоваться анализами, характерными для time-series data - нет строгого временного окна наблюдения, нет цензурированности данных (вероятность поиска работы для всех респондентов равна 1 - в конце концов, находят все. вопрос в том, как быстро). файл примера данных лежит здесь: http://sb-group.info/example.xls (форум не дает мне загружать в сообщении файлы подобного типа) По командам Stata ? подозреваю, что необходимо использовать вложенные циклы (foreach/forvalues), или просто писать программу с использованием счетчика while. Но я достаточно слабый программист, и затрудняюсь с алгоритмом. И, впринципе, не уверен, что рою в нужном направлении. Буду рад, если сможете чем-либо помочь ? хотя бы скажете, какими инструментами следует решать эту проблему. Спасибо! |
|
![]() |
![]() |
![]() ![]() |