Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Статистический анализ данных - нужна помощь, сравнительный анализ, монофакторный и многофакторный анализ
AnnGl
сообщение 16.02.2009 - 14:32
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 16.02.2009
Пользователь №: 5819



Здравствуйте, уважаемые участники форума! Помогоите, пожалуйста! Есть выборка - около 900 пациентов. Группирующая переменная - клинический исход (наступил, нет).
1)Проверка данных на нормальность распределения показала, что практически все количественные переменные (кроме возраста) распределены не нормально. Соответственно, сравнительный анализ проводился с использованием непараметрических методов и результаты представлены в виде Ме(25%;75%);(М) - для количественных переменных. Однако, в электронном учебнике StatSoft нашла следующее: " Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, n > 100), то не имеет смысла использовать непараметрические статистики." Скажите пожалуйста, так ли это на самом деле? И надо ли в таком случае переделать эту часть анализа?
2) Сравнительный анализ выявил различия между группами по ряду показателей. Однако при более внимательном рассмотрении оказалось, что в о вторую группу вошли больные, у которых исход наступил раньше и больные, которые умерли в течение наблюдения (речь идет о госпитализациях). Таким образом, если вторую группу теперь разделить на три подгруппы, то видно, что в большинстве случаев разница между группами 1 и 2 обусловлена именно этими указанными двумя подгруппами. Как же в таком случае следует отображать результаты? Сравнение по 2 группам или все-таки уже по 4. И следует ли в этом случае использовать поправку Бонферрони?
3)Извините, пожалуйста, за неграмотность, но остается не очень понятным какие переменные анализировать в факторном анализе. Включаю в анализ те переменные, по которым получены различия между группами. Правильно ли я делаю или надо еще и другие факторы тоже? К примеру по полу больные вгруппах не различались, а по возрасту значимо отличались только умершие.
4) Если для определенной переменной много пропущенных данных (например, 60% - пропуски) надо ли такой фактор оценивать в однофакторном анализе? Понятно, что в многофакторном - лучше не надо. Это верно?
5) Как лучше анализировать количественные данные в логистичесой регрессии? Все-таки найти точку разделения и создать бинарные?
Очень надеюсь на Вашу помощь! Заранее спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
DoctorStat
сообщение 16.02.2009 - 15:53
Сообщение #2





Группа: Пользователи
Сообщений: 381
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(AnnGl @ 16.02.2009 - 14:32) *
1)Однако, в электронном учебнике StatSoft нашла следующее: " Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, n > 100), то не имеет смысла использовать непараметрические статистики."
Это спорное утверждение. Первый путь решения проблемы - непараметрические методы следует использовать в случае, когда тесты показали, что распределение данных отлично от нормального. Второй путь решения - пытаться, как это предложил плав, с помощью различных преобразований из ненормальных данных получить нормально-распределенные, для анализа которых использовать хорошо разработанные статистические методы. Но найдете ли Вы такие преобразования?

Сообщение отредактировал DoctorStat - 16.02.2009 - 16:01


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему