Здравствуйте, гость ( Вход | Регистрация )
6.03.2012 - 13:58
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 6.03.2012 Пользователь №: 23546 |
Здравствуйте.
У меня 120 пациентов с сахарным диабетом. Также все они страдают ИБС. Изучаю я клинику - ТИА (транзиторной ишемической атаки) - это как осложнение ИБС. Так вот - у 55 пациентов - не было ни одной ТИА. А у 65 пациентов - была одна и более. Могу ли я использовать логистическую регрессию для того, чтобы выявить, какие переменные влияют на исход - ТИА. Сколько переменных я могу вводить? Если из расчета 1 к 10 - то у меня 12 переменных может участвовать в модели. Верно? |
|
|
![]() |
![]() |
![]() |
6.03.2012 - 19:34
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 6.03.2012 Пользователь №: 23546 |
Спасибо, хотелось бы еще мнений насчет правильности выбора данного метода (логистическая регрессия) в отношении данной задачи с данной выборкой.
Интересует только данный пример - в целом, грамотно я подхожу или нет? Ту p2004r - спасибо! + я работаю в стандартных пакетах, среду R освоить уже не успею. Интересует мнение с точки зрения соблюдения мною в данном вопросе статистической грамотности, а не поиск наилучшего способа. Ограничена в способах и других ресурсах. Ту Larina Tatjana - спасибо! + естественно, все переменные были проверены попарно. Остались значимые. Если их 12 - не многовато-ли для выборки в 120 (а группы - и того меньше(55 и 65)? |
|
|
![]() |
![]() |
6.03.2012 - 21:31
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Спасибо, хотелось бы еще мнений насчет правильности выбора данного метода (логистическая регрессия) в отношении данной задачи с данной выборкой. Интересует только данный пример - в целом, грамотно я подхожу или нет? Ту p2004r - спасибо! + я работаю в стандартных пакетах, среду R освоить уже не успею. Интересует мнение с точки зрения соблюдения мною в данном вопросе статистической грамотности, а не поиск наилучшего способа. Ограничена в способах и других ресурсах. И все таки ориентируйтесь на AIC моделей. Для одного и того же набора данных выбирайте модель с наименьшим AIC. Это есть _во_всех_ пакетах статистического анализа (теми где нет, наверное лучше прекратить пользоваться ![]() |
|
|
![]() |
![]() |
6.03.2012 - 22:33
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 6.03.2012 Пользователь №: 23546 |
Пакеты у меня самые простые - SPSS и STATISTICA.
Буду искать с AIC - не сталкивалась с этим критерием раньше... Спасибо! А по остальному моему набору - подход верный? |
|
|
![]() |
![]() |
15.03.2012 - 15:49
Сообщение
#5
|
|
![]() Группа: Пользователи Сообщений: 49 Регистрация: 3.03.2012 Из: USA Пользователь №: 23536 |
Ту Larina Tatjana - спасибо! + естественно, все переменные были проверены попарно. Остались значимые. Если их 12 - не многовато-ли для выборки в 120 (а группы - и того меньше(55 и 65)? Пакеты у меня самые простые - SPSS и STATISTICA. Буду искать с AIC - не сталкивалась с этим критерием раньше... Спасибо! А по остальному моему набору - подход верный? Привет, Olga30! Относительно попарных связей. Эта проверка не означает, что нужно оставлять в анализе лишь те пары, для которых связи значимы. Ведь пошаговые алгоритмы логит-регрессии учитывают не только парные, но множественные, фактически цепочечные связи. А проверка парных связей поможет лишь в интерпретации основных эффектов. Относительно пакетов. Это действительно "простые - SPSS и STATISTICA", т.е. не для профессионального анализа и оценки логит-уравнений. Когда мне выполнили заказ по оценке таких уравнений, то я получила несколько десятков разных уравнений, с разными наборами предикторов. И получены они были также разными алгоритмами. И вот дальше началось самое интересное. Я выбрала из этого множества уравнений наиболее ценные, и в тоже время самые надёжные и недорогие предикторы. В итоге окончательный набор уравнений включал 5 вариантов, которые далее и были использованы для оформления патентов. Если речь идёт о публикации внутри России, то прав наш коллега TheThing, не забивайте голову. Всё равно никому, кроме Вас, это не будет интересно и понятно. Ну а если всё же хочется докопаться до истины, то обращайтесь к профессионалам, пусть они оценят. Или можете прочитать упомянутую TheThing книгу Model selection and multimodel inference: A practical information, theoretic approach" by K. Burnham, D. Anderson по адресу http://books.google.ru/books?id=BQYR6js0CC...p;q&f=false Раньше она лежала на Гиге, но сейчас её прихлопнули, и увы... Успехов! |
|
|
![]() |
![]() |
15.03.2012 - 18:38
Сообщение
#6
|
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
Привет, Olga30! Относительно попарных связей. Эта проверка не означает, что нужно оставлять в анализе лишь те пары, для которых связи значимы. Ведь пошаговые алгоритмы логит-регрессии учитывают не только парные, но множественные, фактически цепочечные связи. А проверка парных связей поможет лишь в интерпретации основных эффектов. Относительно пакетов. Это действительно "простые - SPSS и STATISTICA", т.е. не для профессионального анализа и оценки логит-уравнений. Когда мне выполнили заказ по оценке таких уравнений, то я получила несколько десятков разных уравнений, с разными наборами предикторов. И получены они были также разными алгоритмами. И вот дальше началось самое интересное. Я выбрала из этого множества уравнений наиболее ценные, и в тоже время самые надёжные и недорогие предикторы. В итоге окончательный набор уравнений включал 5 вариантов, которые далее и были использованы для оформления патентов. Если речь идёт о публикации внутри России, то прав наш коллега TheThing, не забивайте голову. Всё равно никому, кроме Вас, это не будет интересно и понятно. Ну а если всё же хочется докопаться до истины, то обращайтесь к профессионалам, пусть они оценят. Или можете прочитать упомянутую TheThing книгу Model selection and multimodel inference: A practical information, theoretic approach" by K. Burnham, D. Anderson по адресу http://books.google.ru/books?id=BQYR6js0CC...p;q&f=false Раньше она лежала на Гиге, но сейчас её прихлопнули, и увы... Успехов! Здравствуйте, Татьяна! Я интуитивно догадываюсь, что Ваша работа была выполнена в пакете SAS. Вы могли бы сказать (или спросить у того человека, который проводил анализ), что может SAS и чего не может SPSS в плане логистической регрессии. Например, алгоритмов построения модели, упомянутые Вами, в SPSS версии 17.0 (в 20 кажется не прибавилось) - 7, насколько больше их в SAS? Да и сложно найти у нас кандидатскую/докторскую, в которой бы применялись хотя бы 3 разных алгоритма включения предикторов, в основном используется метод Enter / Block. К тому же в литературе существуют противоречивые данные относительно того, стоит ли применять forward / backward selection алгоритм, некоторые - за, другие - критикуют. Мне бы хотелось найти в иНете авторитетную статью (не заказную), которая бы провела сравнительный анализ пакетов SPSS и SAS, и, как вывод, заявила, что SPSS - игрушка для детей, а SAS - для профи. Увы, пока не нашел. В компании "Боинг" стоит R, мне кажется, что там хватает профессионалов Вы бы могли еще объяснить, что имеете ввиду под недорогими предикторами? Спасибо! |
|
|
![]() |
![]() |
22.03.2012 - 11:34
Сообщение
#7
|
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
Здравствуйте, Татьяна! что может SAS и чего не может SPSS в плане логистической регрессии? Вот интересная статья, где проводится анализ 6 статистических пакетов (жаль, что R нет, хотя обычно в нем реализованы новейшие алгоритмы) в плане логистической регрессии, рассказывается про плюсы и минусы каждого. Для тех, кому будет лень прочитать статью полностью (читается как художественный роман), привожу выдержку, которая относится к теме обсуждения: We recommend the versatile SAS package and BMDP LR for researchers experienced with logisitc regression and programming. Diagnostoc statistics in SAS are based either on observations or covariate patterns. Several unique goodness-of-fit indexes and selection methods are provided in SAS. Its ability to fit a broad class of binary response models, plus its provision to correct for oversampling, overdispersion and bias introduced into predicted probabilities, sets it apart from the other five (stat. packages). If either SPSS or STATA is the only package available, researchers must be aware that both compute goodness-of-fit and diagnostic statistics from individual observations. Consequently, these statistics are innappropriate for statistical tests. Вот так вот..
Прикрепленные файлы
|
|
|
![]() |
![]() |
Olga30 Логистическая регрессия - правильный выбор? (медицина) 6.03.2012 - 13:58
p2004r Цитата(Olga30 @ 6.03.2012 - 13:58) З... 6.03.2012 - 14:09
Larina Tatjana Цитата(Olga30 @ 6.03.2012 - 20:28) З... 6.03.2012 - 18:09
p2004r Цитата(Olga30 @ 6.03.2012 - 22:33) П... 7.03.2012 - 22:06

TheThing ЦитатаЕсли их 12 - не многовато-ли для выборки в 1... 15.03.2012 - 11:58

Larina Tatjana Цитата(TheThing @ 16.03.2012 - 01:08... 16.03.2012 - 16:19

Вале а Цитата(TheThing @ 15.03.2012 - 19:38... 16.03.2012 - 17:20
Larina Tatjana Цитата(Olga30 @ 7.03.2012 - 05:03) П... 30.04.2012 - 16:05
TheThing Неплохой тьюториал по AIC, может пригодится тем, к... 15.03.2012 - 15:30
TheThing Спасибо за ответы, статья и вправду хорошая. 16.03.2012 - 17:38
YVR Цитата(Olga30 @ 6.03.2012 - 15:58) З... 20.03.2012 - 14:51![]() ![]() |