Регрессия: доверительный интервал? - Форум врачей-аспирантов

Регрессия: доверительный интервал?

stok1946 Просмотр профиля	15.02.2013 - 20:56 Сообщение #1
Группа: Пользователи Сообщений: 27 Регистрация: 10.05.2012 Пользователь №: 23748	Насколько я помню из теории, различают два вида доверительных областей: а) Доверительная область для линии регрессии RD(x), (т.е. точнее, для прогнозов модели) б) Доверительная область для самих значений зависимой переменной YD(x) С понятием а) все понятно: если многократно извлекать из генеральной совокупности различные выборки из N пар (x,y) значений и строить по ним модели регрессии, то за пределами "доверительной трубы" окажется 100alfa% таких линий (alfa, например, равно 0.05). Назовем эту "трубу" RD(x), поскольку она зависит от текущего значения х. Эту самую RD(x) можно лихо и точно просчитать бутстрепом для самых различных функций, включая сплайны и ядерные. Теперь относительно ДИ под буковкой б). Это - интервал, определяющий границы, за пределами которых могут оказаться не более 100alfa% экспериментальных точек наблюдений при Х = х. Он, вообще говоря (как пишет, в частности Гланц на стр. 243), складывается из разброса значений вокруг линии регресии и неопределенности положения самой этой линии (второе мы уже посчитали как RD(x)). Характеристикой разброса значений y вокруг линии регрессии является только остаточное стандартное отклонение sy\|x. Я могу ширину этой части доверительного интервала оценить только по эмпирической выборке SD = t(1-alfa/2, N-2) * sqr(RSS/(N - K)), где RSS - сумма квадратов остатков. И это - постоянная величина на всем интервале определения независимой переменной. И тут такие вопросы: а) когда в STATISTICA и др. прикладных программах считают доверительные интервалы, то что имеют в виду RD(x), YD(x) или SD? Например, Гайдышев в Approximations (APX) AtteStat выводит SD и называет это "Доверительные интервалы оценок модели" (но ведь "оценки" - это и есть прогнозы модели?); б) справедливо ли выражение , YD(x) = RD(x) + SD? в) почему на картинке к http://ru.wikipedia.org/wiki/%D0%A0%D0%B5%...%D0%BA%D0%B0%29 95%-е доверительные области для линии регрессии RD(x) показаны криволинейными, и для значений YD(x) - прямыми красненькими линиями, хотя, согласно там же приведенных формул, YD(x) включает RD(x) . Или мне это мерещится? Сообщение отредактировал stok1946 - 6.03.2013 - 13:08

Ответов

DrgLena Просмотр профиля	3.07.2013 - 11:26 Сообщение #2
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Судя по первому посту, Вы работаете в SPSS, а поэтому можете, в отличие от программы Statistica, выполнить лог регрессию с категориальной переменной, имеющей более 2-х значений. В опциях модуля для бинарной лог регрессии выбираете в качестве предиктора нужную переменную, и указываете ту категорию, которая будет референтной. Полученные значения OR для оставшихся категорий будут означать риск относительно этой категории (в итоговой таблице она будет отсутствовать). Поэтому , удобно выбрать категорию с меньшим влиянием на прогнозируемы плохой исход ( легче будет трактовать OR для остальных категорий). Когда вы получите значения OR для остальных категорий, вы сможете объединять некоторые из них для обоснованных выводов, что именно является фактором риска прогнозируемого состояния. 4 категории могут впоследствии быть редуцированы до двух и анализ может быть проведен для бинарной переменной. ДИ к OR обычно приводят в публикациях, вы просто отмечаете в опциях нужный выбор.

Сообщений в этой теме

stok1946 Регрессия: доверительный интервал? 15.02.2013 - 20:56

nokh Цитата(stok1946 @ 15.02.2013 - 23:56... 16.02.2013 - 14:20

stok1946 Цитата(nokh @ 16.02.2013 - 15:20) Мн... 17.02.2013 - 10:58

Larina Tatjana Цитата(stok1946 @ 16.02.2013 - 03:26... 21.02.2013 - 12:07

stok1946 ЦитатаРекомендую почитать хорошие книги по регресс... 21.02.2013 - 22:25

nokh Проблема с нелинейной регрессией оказалась куда сл... 25.02.2013 - 09:29

100$ Цитата(nokh @ 25.02.2013 - 09:29) Пр... 25.02.2013 - 18:42

nokh Цитата(100$ @ 25.02.2013 - 21:4... 26.02.2013 - 22:15

100$ Цитата(nokh @ 26.02.2013 - 22:15) Дл... 27.02.2013 - 10:40

nokh Цитата(100$ @ 27.02.2013 - 13:4... 11.03.2013 - 22:04

100$ Цитата(nokh @ 11.03.2013 - 22:04) Ка... 13.03.2013 - 20:37

stok1946 Мне все же кажется, что время приближенных (т.е. о... 21.03.2013 - 20:19

p2004r Цитата(stok1946 @ 21.03.2013 - 20:19... 23.03.2013 - 13:06

Енот Задам вопрос в этой теме, чтобы не открывать новую... 1.07.2013 - 15:44

TheThing Цитата(Енот @ 1.07.2013 - 15:44) Зад... 1.07.2013 - 16:15

Енот Ссылку на статью не могу - она не опубликована, во... 1.07.2013 - 19:26

TheThing Цитата(Енот @ 1.07.2013 - 19:26) Ссы... 1.07.2013 - 20:46

Liz <The Thing: Посмотрите например эту статью...... 1.07.2013 - 23:01

Енот Большое спасибо! 2.07.2013 - 07:11

Енот Нужно провести анализ методом логистической регрес... 3.07.2013 - 10:27

DrgLena Судя по первому посту, Вы работаете в SPSS, а поэт... 3.07.2013 - 11:26

Енот 'DrgLena' Большое спасибо! ЦитатаСудя... 3.07.2013 - 12:20

DrgLena Да, в Statictica не предусмотрена работа с категор... 3.07.2013 - 12:27

DrgLena В программе Statistica возможна работа с количеств... 3.07.2013 - 12:31

Енот Цитата(DrgLena @ 3.07.2013 - 13:31) ... 3.07.2013 - 14:40

DrgLena У вас примерно все так, как в прикрепленном файле ... 3.07.2013 - 15:29

Енот Большое спасибо! Это многое прояснило! у ... 3.07.2013 - 16:15

Енот Работаю над иностранной статьей, там речь идет о ... 5.02.2014 - 20:35

100$ Цитата(Енот @ 5.02.2014 - 21:35) Под... 6.02.2014 - 08:33

nokh Цитата(Енот @ 5.02.2014 - 23:35) Под... 6.02.2014 - 13:06

Енот Нашла, что GMR в данной статье есть geometric mean... 6.02.2014 - 17:04

Енот Помогите, пожалуйста разобраться с таким вопросом.... 9.03.2014 - 12:57

100$ Цитата(Енот @ 9.03.2014 - 13:57) Пом... 9.03.2014 - 14:01

Енот Это единственно возможная причина? Ведь принципе ... 9.03.2014 - 14:26

100$ Цитата(Енот @ 9.03.2014 - 15:26) Это... 13.03.2014 - 15:41

« Предыдущая тема · Медицинская статистика · Следующая тема »