Логистическая регрессия или другое? Выбор оптимального метода - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Добавить ответ в эту тему

Открыть тему

Логистическая регрессия или другое? Выбор оптимального метода

Camel1000 Просмотр профиля	3.06.2013 - 17:56 Сообщение #1
Группа: Пользователи Сообщений: 17 Регистрация: 3.02.2013 Пользователь №: 24599	Всем доброго времени суток! Не помогут ли уважаемые джинны в определении направления действий в такой ситуации? Имеется два значения для экспрессии некоего гена - 0 и 1 (низкая и высокая). В выборке из 70 больных для каждого из них известна экспрессия и некоторый набор клинических показателей, часть - ординальные, часть -номинальные, часть - непрерывные (все виды). Хочется узнать, есть ли связь между уровнем экспрессии гена и любым набором этих показателей? То есть есть ли связь между экспрессией и каждым параметром по отдельности? Или между экспрессией и совокупностью одного-двух-трех-... показателей? Как это лучше сделать и как вычленить такие наборы? Логистическая регрессия? Кластерный анализ? Тест для тренда Кохрана-Армитажа или разновидность хи-квадрата для трендов? В каком направлении копать? Заранее спасибо!

nokh Просмотр профиля	3.06.2013 - 23:00 Сообщение #2
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(Camel1000 @ 3.06.2013 - 20:56) Всем доброго времени суток! Не помогут ли уважаемые джинны в определении направления действий в такой ситуации? Имеется два значения для экспрессии некоего гена - 0 и 1 (низкая и высокая). В выборке из 70 больных для каждого из них известна экспрессия и некоторый набор клинических показателей, часть - ординальные, часть -номинальные, часть - непрерывные (все виды). Хочется узнать, есть ли связь между уровнем экспрессии гена и любым набором этих показателей? То есть есть ли связь между экспрессией и каждым параметром по отдельности? Или между экспрессией и совокупностью одного-двух-трех-... показателей? Как это лучше сделать и как вычленить такие наборы? Логистическая регрессия? Кластерный анализ? Тест для тренда Кохрана-Армитажа или разновидность хи-квадрата для трендов? В каком направлении копать? Заранее спасибо! Раз нужно найти ниточки за которые распутывать клубок связей показателей и искать паттерны в большом наборе данных, то копать нужно в направлении Разведочного анализа данных (Exploratory data analysis, EDA). Здесь много техник, которые так или иначе помогут нащупать нужные совокупности показателей, которые потом можно подтвердить более традиционными техниками, скажем логистической регрессией. Если работать последней сразу - скорее всего ничего не получится, т.к. выборка для этой техники недостаточно большая. Мне нравится техника нелинейных главных компонет CATPCA из пакета SPSS (я писал про неё на этом форуме и здесь: http://www.livejournal.com/search/?journal...s&q=CATPCA). В R эта техника есть в пакете homals, по которому есть статья (http://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&ved=0CD4QFjAC&url=http%3A%2F%2Fcran.r-project.org%2Fweb%2Fpackages%2Fhomals%2Fvignettes%2Fhomals.pdf&ei=QfGsUfeAKISw4QS9wIDAAg&usg=AFQjCNE6GCkasV85w7SauitXkTXw4X69dg&sig2=Q8oDVmPP0OOc1hL4bVGrFQ&bvm=bv.47244034,d.bGE&cad=rjt), но нет внятной помощи по опциям. Можно попробовать анализ главных координат (PCoA), используя в качестве показателя связи между переменными корреляцию Спирмена "ро". Этот метод удобно сделан в бесплатном пакете PAST (http://folk.uio.no/ohammer/past/). Я не люблю кластерный анализ за примитивность, но на худой конец можно и им посмотреть с какими показателями в одной ветке окажется экспрессия. Это можно сделать в том же пасте; практика показывает, что лучше не использовать универсальнную меру Говера (Gower), лучше - корреляцию Rho Спирмена.

anserovtv Просмотр профиля	4.06.2013 - 09:13 Сообщение #3
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927	Если бы данных было чуть больше ,до 100. то я бы попробовал создать регрессионную модель в IBM SPSS Amos. Кроме значимых связей между независимыми переменными и зависимой в модели оцениваются и взаимодействия между независимыми переменными. Но сначала бы я попробовал логистическую регрессию ,возможно по категориям, если хватит данных. Сообщение отредактировал anserovtv - 30.09.2013 - 08:09

p2004r Просмотр профиля	5.06.2013 - 20:37 Сообщение #4
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(Camel1000 @ 3.06.2013 - 17:56) Всем доброго времени суток! Не помогут ли уважаемые джинны в определении направления действий в такой ситуации? Имеется два значения для экспрессии некоего гена - 0 и 1 (низкая и высокая). В выборке из 70 больных для каждого из них известна экспрессия и некоторый набор клинических показателей, часть - ординальные, часть -номинальные, часть - непрерывные (все виды). Хочется узнать, есть ли связь между уровнем экспрессии гена и любым набором этих показателей? То есть есть ли связь между экспрессией и каждым параметром по отдельности? Или между экспрессией и совокупностью одного-двух-трех-... показателей? Как это лучше сделать и как вычленить такие наборы? Логистическая регрессия? Кластерный анализ? Тест для тренда Кохрана-Армитажа или разновидность хи-квадрата для трендов? В каком направлении копать? Заранее спасибо! попытаться построить рандом форест который разделяет эти 0 и 1. и посмотреть вклад показателей. есть несколько методов поверх рандом форест которые могут оптимизировать набор показателей в направлении наилучшего разделения 0 и 1. например Boruta в R и еще один пакет по ROC смотрит оптимальные показатели того же рандом фореста. http://r-statistics.livejournal.com/

Camel1000 Просмотр профиля	6.06.2013 - 14:10 Сообщение #5
Группа: Пользователи Сообщений: 17 Регистрация: 3.02.2013 Пользователь №: 24599	Всем спасибо за помощь, этого мне хватит разбираться на месяц попробую покопать. Еще раз спасибо!

Енот Просмотр профиля	29.09.2013 - 21:18 Сообщение #6
Группа: Пользователи Сообщений: 14 Регистрация: 19.05.2013 Пользователь №: 24893	Коллеги! Если есть возможность, поделитесь, пожалуйста, статьями или ссылками на статьи в отечественных научных изданиях, в которых применялся метод регрессионного анализа. Они необходимы в качестве примера для написания собственной публикации с аналогичным видом анализа.

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2026 IPS, Inc.