Помогите выбрать статистический метод, Множественные сравнения? |
Здравствуйте, гость ( Вход | Регистрация )
Помогите выбрать статистический метод, Множественные сравнения? |
18.10.2015 - 14:20
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 17 Регистрация: 18.10.2015 Пользователь №: 27589 |
Добрый день! Помогите, пожалуйста, определиться с выбором метода.
Гипотеза: для больных старческого возраста применение данной операции также эффективно и безопасно, как для остальных. Имеется база из 100 пациентов. Ряд показателей: несколько опросников (до и после операции), оценка результата операции (по нескольким шкалам), наличие осложнение (несколько видов, измерены как "есть/нет"), оценка хода операции и восстановления после нее (длительность операции, длительность анестезии, длительность пребывания в стационаре?). Интересующая группа старческого возраста - 17 человек. Проверка данных на нормальность дала отрицательный результат. На первый взгляд хочется с помощью опросников до операции протестировать их исходную независимость от возраста. Затем посмотреть есть ли различие в остальных показателях в зависимости от возраста. Возникают вопросы по применяемым методам. Есть несколько соображений. 1. Смотреть зависимость: с помощью коэффициента корреляции (Спирмена, а для бинарных данных - бисериальный коэффициент корреляции). 2. Разбить выборку на 2 группы: до 75 лет и после. Затем сравнение с использованием Манна-Уитни. 3. Разбить выборку на 4 группы: 0-24; 25-49;50-74; 74 и более . Сделать сравнение по Краскеллу-Уоллису, а затем (если что-то было обнаружено), то применять критерий Данна. На фоне всех этих соображений гнетет вопрос о множественных сравнениях (так как кол-во показателей около 30). Есть ощущение, что данная проблема может обесценить предложенные подходы. Прошу помочь разобраться в данном вопросе и, при необходимости, порекомендовать куда "копать" дальше. Сообщение отредактировал E_VA - 18.10.2015 - 14:25 |
|
11.11.2015 - 21:22
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Должен ли будет алгоритм RandomForest показать успешную классификацию?
Не знаю, это будет зависеть и от того, какие другие переменные участвуют в модели. Если качество классификации будет высоким, а переменные не являются значимыми . то связи с ними нет /косвенный результат. Если качество классификации низкое, никакие выводы делать нельзя. И какой метод доказательства отсутствия связи будет уместен? Параметрические или непараметрические методы сравнения двух независимых выборок по каждой переменной - простой подход (при необходимости - с поправками). Тест Хотеллинга /при выполнении условий/ , перестановочные тесты для двух групп, в том числе и многомерные. Если переменных много и выявляются факторы, то эти же методы для факторных оценок (чуть сложнее). Более сложные - дискриминантный анализ, логрегрессия. деревья классификации и др. /перечислялись в этой теме выше. Если качество модели будет высоким, а переменные не являются значимыми, то связи с ними нет. В других случаях никакие выводы делать нельзя. Более универсальный и очень сложный метод - обобщенные уравнения оценки с бинарным откликом /нужно строить модель и проверять условия , есть в SPSS/. Если разумно выявляются категории, можно использовать таблицы сопряженности и логлинейный анализ таблиц сопряженности (менее мощные методы). Но я всегда прежде всего руководствуюсь здравым смыслом - связь может быть и ложной. Я не против применения метода Random Forest в этом исследовании, но для совсем других целей. Удачи! Сообщение отредактировал anserovtv - 12.11.2015 - 07:20 |
|