Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Статистический анализ данных - нужна помощь, сравнительный анализ, монофакторный и многофакторный анализ
AnnGl
сообщение 16.02.2009 - 14:32
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 16.02.2009
Пользователь №: 5819



Здравствуйте, уважаемые участники форума! Помогоите, пожалуйста! Есть выборка - около 900 пациентов. Группирующая переменная - клинический исход (наступил, нет).
1)Проверка данных на нормальность распределения показала, что практически все количественные переменные (кроме возраста) распределены не нормально. Соответственно, сравнительный анализ проводился с использованием непараметрических методов и результаты представлены в виде Ме(25%;75%);(М) - для количественных переменных. Однако, в электронном учебнике StatSoft нашла следующее: " Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, n > 100), то не имеет смысла использовать непараметрические статистики." Скажите пожалуйста, так ли это на самом деле? И надо ли в таком случае переделать эту часть анализа?
2) Сравнительный анализ выявил различия между группами по ряду показателей. Однако при более внимательном рассмотрении оказалось, что в о вторую группу вошли больные, у которых исход наступил раньше и больные, которые умерли в течение наблюдения (речь идет о госпитализациях). Таким образом, если вторую группу теперь разделить на три подгруппы, то видно, что в большинстве случаев разница между группами 1 и 2 обусловлена именно этими указанными двумя подгруппами. Как же в таком случае следует отображать результаты? Сравнение по 2 группам или все-таки уже по 4. И следует ли в этом случае использовать поправку Бонферрони?
3)Извините, пожалуйста, за неграмотность, но остается не очень понятным какие переменные анализировать в факторном анализе. Включаю в анализ те переменные, по которым получены различия между группами. Правильно ли я делаю или надо еще и другие факторы тоже? К примеру по полу больные вгруппах не различались, а по возрасту значимо отличались только умершие.
4) Если для определенной переменной много пропущенных данных (например, 60% - пропуски) надо ли такой фактор оценивать в однофакторном анализе? Понятно, что в многофакторном - лучше не надо. Это верно?
5) Как лучше анализировать количественные данные в логистичесой регрессии? Все-таки найти точку разделения и создать бинарные?
Очень надеюсь на Вашу помощь! Заранее спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему