Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Многофакторный анализ
yko
сообщение 26.02.2009 - 19:58
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 26.02.2009
Пользователь №: 5861



Здравствуйте.

Подскажите, пожалуйста, какой метод лучше использовать?
Что имеем:
1) зависимая переменная - количественная непрерывная интервальная (возраст детей), распределение НЕнормальное
2) независимые переменные:
- количественные непрерывные интервальные (возраст), не имеют дробную часть, распределение НЕнормальное
- бинарные (ответы на вопросы "хорошо"-"плохо", "правильно"-"неправильно", "давали"-"не давали" и т.д.)
- качественные (?) - (источники информации - родители, врачи, медсестры, литература)

Сравниваться будут 2 группы примерно по 400 человек. Независимых переменных около 50, но они разделены на 5 неравных групп по смыслу (теоретические, практические, социальные и т.д. факторы)

Что сделал?
Описательная статистика +
Корреляционный анализ - в основном слабая или средняя степень корреляции предикторов с зависимой переменной, но P<0,05 и даже P<0,001

При простой оценке влияния отдельных независимых факторов на зависимую переменную видно значимое влияние. Например, в группе обученных этот показатель выше, чем в группе необученных P<0,05, хотя корреляция слабая.

Что нужно?
Как я понимаю, тут нужен многофакторный (?) анализ - посмотреть влияние каждой группы факторов на зависимую переменную и каждого фактора (в группе) на зависимую переменную. Так? Или лучше что-то иное применить?
Ну и хотя бы в двух словах в какую сторону двигаться.

Программа обработки Statistica

Спасибо.



Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 26.02.2009 - 21:45
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(yko @ 26.02.2009 - 19:58) *
Здравствуйте.

Подскажите, пожалуйста, какой метод лучше использовать?
Что имеем:
1) зависимая переменная - количественная непрерывная интервальная (возраст детей), распределение НЕнормальное
2) независимые переменные:
- количественные непрерывные интервальные (возраст), не имеют дробную часть, распределение НЕнормальное
- бинарные (ответы на вопросы "хорошо"-"плохо", "правильно"-"неправильно", "давали"-"не давали" и т.д.)
- качественные (?) - (источники информации - родители, врачи, медсестры, литература)

Сравниваться будут 2 группы примерно по 400 человек. Независимых переменных около 50, но они разделены на 5 неравных групп по смыслу (теоретические, практические, социальные и т.д. факторы)

Что сделал?
Описательная статистика +
Корреляционный анализ - в основном слабая или средняя степень корреляции предикторов с зависимой переменной, но P<0,05 и даже P<0,001

При простой оценке влияния отдельных независимых факторов на зависимую переменную видно значимое влияние. Например, в группе обученных этот показатель выше, чем в группе необученных P<0,05, хотя корреляция слабая.

Что нужно?
Как я понимаю, тут нужен многофакторный (?) анализ - посмотреть влияние каждой группы факторов на зависимую переменную и каждого фактора (в группе) на зависимую переменную. Так? Или лучше что-то иное применить?
Ну и хотя бы в двух словах в какую сторону двигаться.

Программа обработки Statistica

Спасибо.

А каким образом у Вас возраст детей и зависимая и независимая переменная, и вообще как возраст детей может быть ЗАВИСИМЫМ от ответов родителей, врачей и т.п.? Попробуйте сформулировать мысль поточнее.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
yko
сообщение 27.02.2009 - 02:16
Сообщение #3





Группа: Пользователи
Сообщений: 4
Регистрация: 26.02.2009
Пользователь №: 5861



Цитата(плав @ 27.02.2009 - 01:45) *
А каким образом у Вас возраст детей и зависимая и независимая переменная, и вообще как возраст детей может быть ЗАВИСИМЫМ от ответов родителей, врачей и т.п.? Попробуйте сформулировать мысль поточнее.

ОК.
Зависимая переменная - это фактически длительность лактации в месяцах. То есть, до какого возраста ребенок получал грудное молоко.
Необходимо оценить влияние НА этот показатель возраста введения твердых и жидких дополнительных пищевых продуктов (чем раньше вводят, тем короче лактация), возраста матери, образования матери (высшее или другое), уровня знаний матерей (положительные ответы на теоретические вопросы), уровня практической реализации в роддоме (раннее прикладывание к груди в роддоме, адекватная или нет частота кормлений) и источников информации по данному вопросу ("слушают"-"не слушают" родителей, медицинских работников, читают-не читают книжки). Если просто смотреть - длительность лактации больше у матерей с высшим образованием, у матерей, которые на большинство вопросов отвечают правильно, часто кормят в течение суток (без ограничений по частоте в отличии от "ограничивающих" частоту). Длительность лактации меньше у менее образованных и молодых матерей, у тех, которые вводят твердые и жидкие дополнительные продукты в раннем возрасте ребенка (в 1 месяц, в 2 месяца, 3 месяца и т.д. - чем раньше, тем хуже), дают воду ребенку, кормят редко и обучаются у медицинских работников и своих родителей. Различия длительности лактации получаются достоверные. Вроде как и видно, но хотелось бы "пощупать" это с позиций влияния сразу многих факторов. Так же к этому подталкивают слабая и умеренная корреляция этих факторов с зависимой переменной. Кроме того, для меня сложность в том, что в одной группе факторов, например, социальных, одновременно присутствуют и цифры (возраст матери), и "да/нет" (высшее образование-другое образование).

Сами по себе группы матерей (по 400 человек) отличаются между собой уровнем образования (во второй чаще встречается высшее), возрастом матерей (во второй они более старшие), уровнем теоретических знаний (во второй группе чаще отвечали правильно на вопросы) и т.д. Влияние независимых переменных на длительность лактации есть в обеих группах, но более отчетливо во второй.
Зачем нужно оценивать влияние многих факторов на длительность лактации? Кроме этих двух групп матерей есть еще третья (примерно 400 человек беременных) и четвертая (450 человек девочек-подростков). Так вот в дальнейшем предполагается по данным оценки влияния различных факторов на длительность лактации у матерей в 1 и 2 группах прогнозировать возможность реализации этого у будущих матерей в зависимости от различных исходных "параметров". Например, при определенном уровне теоретической подготовки из определенных источников информации у будущих матерей мы можем "предполагать" различные "перспективы" в отношении длительности лактации. Зная на что нужно акцентировать внимание при подготовке беременных, мы можем положительно влиять на длительность лактации. Если короче, то очертить круг предикторов, которыми стоит заниматься и которыми смысла нет заниматься. Плюс те факторы, которые никак не зависят от медицинских работников (высшее образование матери, её возраст и пр.)

Длительность лактации - это показатель адекватности питания ребенка первого года жизни. По России он очень низкий.
Вторая часть (прогнозирование и перспективы) сейчас пока не интересуют, поскольку для меня это вообще темный лес.
Кроме длительности лактации еще будет оцениваться аналогичным способом показатель возраста введения дополнительных продуктов (уже как зависимая переменная), поскольку второй по России также очень низкий. Я про него не стал даже писать, поскольку "обсчет" будет такой же.

У буржуев такая оценка есть - в отдельных работах по влиянию нескольких факторов на те же показатели. У наших чаще всего встречается просто оценка достоверности различий между группами без анализа влияния многих факторов.

Вот. Спасибо, что дочитали smile.gif

Сообщение отредактировал yko - 27.02.2009 - 02:31
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 27.02.2009 - 17:32
Сообщение #4





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(yko @ 27.02.2009 - 02:16) *
ОК.
Зависимая переменная - это фактически длительность лактации в месяцах.

Длительность лактации - это показатель адекватности питания ребенка первого года жизни. По России он очень низкий.
Вторая часть (прогнозирование и перспективы) сейчас пока не интересуют, поскольку для меня это вообще темный лес.
Кроме длительности лактации еще будет оцениваться аналогичным способом показатель возраста введения дополнительных продуктов (уже как зависимая переменная), поскольку второй по России также очень низкий.

Это совершенно четкая задача анализа времени выживания (т.е. продолжительность лакации или время до ее прекращения). Естественно, что этт параметр распределен не номрально (первый пост) и проверять его на нормальность (а тем более описывать это статье) не разумно. Распределение будет либо экспоненциальным, либо Вейбулла, либо Гомперца, либо...
Поскольку форма распределения Вас вряд ли интересует (т.е. задачей не является определение средней-медианной продолжительности лактации), то я бы рекомендовал использовать для анализа модель Кокса. Обычно модель требует две зависимых переменных - время до наступления события и показатель дествительно ли наступило событие или же данные отсутствуют (например, известно, что на 3 месяце мама кормила, а затем она перестала приходить на обследование. тогда время будет 5 мес, показател цензурирования - да, цензурировано (обычно принято кодировать исход 1, цензурированное наблюдение - 0). Если цензурированных наблюдений нет, все значеия второй переменной будут 1. Кстати, рекомендую длительность лактации считать не в месяцах, а в днях или хотя бы в неделях (иначе шкала измерения очень грубая).
Далее анализ делается как обычно в регессионных моделях - превращение качественных переменных с несколькими уровнями в бинарные и т.д.
Отбор переменных для включения в анализ обычно делается путем сравнения кривых выживаемости Каплана-Мейера для подгрупп качественных показателей или унивариантной моделью Кокса для количественных.
Если надо определять и рассчитывать среднюю (точнее, медианную) продолжительность лактации, следует подбрать адекватную по распределению параметрическую модель из числа AFT (accelerated failure time) моделей, которые обсуждались в этом форуме ранее, типа регрессии по Вейбуллу.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
yko
сообщение 27.02.2009 - 19:30
Сообщение #5





Группа: Пользователи
Сообщений: 4
Регистрация: 26.02.2009
Пользователь №: 5861



Большое спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 28.02.2009 - 13:56
Сообщение #6





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(плав @ 27.02.2009 - 17:32) *
Это совершенно четкая задача анализа времени выживания (т.е. продолжительность лакации или время до ее прекращения)
yko нигде не упомянул, что кормящие женщины выбывали из исследования. В случае невыбывания (отсутствия цензурированных данных) или когда число выбывших пациентов мало по сравнению с объемом выборки методы выживания не применяются. Вместо них нужно использовать какой-либо вариант многофакторного анализа.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
yko
сообщение 28.02.2009 - 15:32
Сообщение #7





Группа: Пользователи
Сообщений: 4
Регистрация: 26.02.2009
Пользователь №: 5861



Цитата(DoctorStat @ 28.02.2009 - 17:56) *
yko нигде не упомянул, что кормящие женщины выбывали из исследования. В случае невыбывания (отсутствия цензурированных данных) или когда число выбывших пациентов мало по сравнению с объемом выборки методы выживания не применяются. Вместо них нужно использовать какой-либо вариант многофакторного анализа.

Этот метод я сделал. В качестве "выбывания" у меня было прекращение лактации. Там всё получилось нормально - и по каждой группе, и в сравнении между группами. Там обсчет идет не в зависимости от факторов, а просто как факт - вот такая-то кривая в такой-то группе.
По поводу многофакторного анализа - изначально у меня и был вопрос о конкретном методе, поскольку их много и у меня независимые переменные разных категорий. То ли брать какой-то универсальный (какой?), то ли брать для каждой категории отдельный.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 1.03.2009 - 14:23
Сообщение #8





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DoctorStat @ 28.02.2009 - 13:56) *
yko нигде не упомянул, что кормящие женщины выбывали из исследования. В случае невыбывания (отсутствия цензурированных данных) или когда число выбывших пациентов мало по сравнению с объемом выборки методы выживания не применяются. Вместо них нужно использовать какой-либо вариант многофакторного анализа.

Ну не надо говорить, если не вполне понимаете о чем, а особенно утверждать неверные вещи. Анализ выживания может использовать данные о цензурировании, но они не являются обязательными, это анализ, который делает определенное предположение о распределении случайной величины (а именно, что это величина распределена по распределениям, относящимся к распределением времен). И, на всякий случай, методы анализа выживаемости относятся к многофакторным.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему