РАЗНЫЕ ПАКЕТЫ _ РАЗНЫЕ РЕЗУЛЬТАТЫ? |
Здравствуйте, гость ( Вход | Регистрация )
РАЗНЫЕ ПАКЕТЫ _ РАЗНЫЕ РЕЗУЛЬТАТЫ? |
23.03.2016 - 12:16
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 14.03.2016 Из: Город Киев Пользователь №: 28072 |
Разбираясь с логистической регрессией, с интересом ознакомился с соответствующими ветками Форума. Хорошо, что сформировалась группа знающих людей, которые терпеливо и доброжелательно уже многие годы делятся опытом. Ведь есть вопросы, интересующие многих. Например, недавно на ветках Флуоресценция и Отбор лучших переменных прозвучало о возможности различия результатов, получаемых по сути одними и теми же методами, разными средствами (пакетами). Существуют ли такие различия и как к ним относится? Так, в SPSS есть пример, приведенный во многих источниках ( Ахим Бююль, Петер Цефель). Бинарный отклик, Х1 - интервальная шкала, Х2 - бинарная. Пропустил его на STATIATICA 10.0 . При включении только Х1 совпали таблицы 2х2, В0, В1,. Но значительно различаются SE. Например, для В0 - SPSS - 5,581 ; STATISTICA - 9,454. Примерно вдвое и для В1. Много это или мало, вопрос второй, почему? При включении х1 и х2 уже отличаются все три коэффициента и таблицы классификации. Соответственно 20 4 5 16 и 19 5 7 14. Отсюда - 80,0% и 73,33%. Похожее и у нас. Флуоресценция. DrgLena (очень ценю ее сообщения) указывает на минимальную ошибку классификации при пороге 4,11 таблица 64 19 28 59. STATISTICA предлагает порог 4,64 и 66 17 33 54. 70,59% Какие у кого мнения? Спасибо, всем творческих успехов!
|
|
23.03.2016 - 16:32
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Все или почти все подобные расхождения можно объяснить всего двумя причинами:
1) Разные программы на самом деле рассчитывают разные величины, например стандартные ошибки и какие-нибудь "скорректированные" ошибки. Без чтения первоисточников по методам и по софту в этом разобраться нереально. 2) Человеческий фактор: исследователь жмет не на ту кнопку, неправильно кодирует факторы и/или пропущенные значения и пр. При "изучении" предметной области по форумам все эти ошибки будут вашими верными спутниками. |
|
23.03.2016 - 21:58
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 14.03.2016 Из: Город Киев Пользователь №: 28072 |
Спасибо. Для того, что бы в этом разобраться, очень полезно формировать контрольный портфель на основе примеров и их решений из авторитетных источников (монографии, учебники и т.п.). Опубликованные результаты сравнивать с теми, которые получены своими средствами и технологиями. Думаю, это интересно и полезно, особенно для тех, кто хочет откопать что-то серьезное.
|
|
23.03.2016 - 23:49
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
George, при чем тут пороги флюоресценции, которые мы обсуждали в ROC анализе к названию вашего поста. Есть пример, описанный в упомянутой книге, так воспроизведите его хотя бы сначала в SPSS, как описано, и получите совпадающие с книгой значения. Потом идите дальше, Statistica даст вам тот же результат, если только в наборе предикторов не будут категориальные переменные, но это тоже подробно обсуждалось на форуме.
|
|
24.03.2016 - 09:33
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Спасибо. Для того, что бы в этом разобраться, очень полезно формировать контрольный портфель на основе примеров и их решений из авторитетных источников (монографии, учебники и т.п.). Опубликованные результаты сравнивать с теми, которые получены своими средствами и технологиями. Думаю, это интересно и полезно, особенно для тех, кто хочет откопать что-то серьезное. Это |
|
28.03.2016 - 11:17
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 14.03.2016 Из: Город Киев Пользователь №: 28072 |
Вы правы, полученные Вами результаты для двух предикторов в STATISTICA совпадают с SPSS (почему-то!). Буду разбираться. Но все-таки - если включить только первый предиктор, то значения В0 и В1 совпадают, а их ст. ошибки - нет. Хоть это уже детали, но, думаю, на подобные вещи иногда полезно обращать внимание. Это тем, кому интересно. А, пользуясь случаем, спрошу - как понимать приведенные в таблице параметров модели ОТН. ШАНСОВ ( ед. изм и размах). Зачем приводят для В0? Почему оно совпадает с отношением, полученным по табл. классификации только в случае бинарного предиктора? Спасибо!
|
|
28.03.2016 - 12:08
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Вы правы, полученные Вами результаты для двух предикторов в STATISTICA совпадают с SPSS (почему-то!). Буду разбираться. А что же тут странного, если пример из учебника, пошагово подробно описанный, дает совпадающий с учебником результат и в SPSS и в Statistica. Другой результат можно получить, только если нажимать не те кнопочки в программе. |
|
28.03.2016 - 13:04
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 14.03.2016 Из: Город Киев Пользователь №: 28072 |
По поводу авторитетов. Разбирая какой-либо метод и его реализацию в пакете, пропускаю примеры из А. Афифи, С. Эйзен, Н.Дрейпер, Г. Смит, Дж. Флейс и др. Прекрасно изложены особенности применения методов, трактовка результатов и возможные неоднозначности. Часто в публикациях видим, что математика (статистика) применяется формально, математик(статистик, инженер, студент или пр. консультант) не вникает в суть проблемы, а заказчик (врач) не знаком с возможностями и условиями применения методов. Хотя есть врачи, очень грамотные в статистике. Так что авторитеты не помешают, при желании их можно не заметить.
|
|
28.03.2016 - 13:07
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 14.03.2016 Из: Город Киев Пользователь №: 28072 |
Будем учить матчасть. Спасибо. Творческих успехов!
|
|
28.03.2016 - 13:13
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Но все-таки - если включить только первый предиктор, то значения В0 и В1 совпадают, а их ст. ошибки - нет. Хоть это уже детали, но, думаю, на подобные вещи иногда полезно обращать внимание. Это тем, кому интересно. Ну, если вам интересно, то Statistica Const.B0 B1 Estimate -1,435084 3,109061 Standard Error 0,4976268 0,8022222 А в пришпиленной файле результат в SPSS Если вы , действительно хотите изучать логистическую регрессию, то посчитайте руками OR для вашего примера для одного предиктора, по таблице 2х2, где abcd =21 3 5 15 тогда вопрос о ед. изм. отпадет и вы будете понимать что такое отношение шансов.
Прикрепленные файлы
|
|
28.03.2016 - 17:39
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 14.03.2016 Из: Город Киев Пользователь №: 28072 |
В случае, когда предиктор один и есть бинарная переменная, ОШ и табл. 2х2 совпадают, это ясно. Но если предиктор количественный , то для него оба пакета выдают В0=-19,005 и В1=0,278. НО, STATISTICA выдает еще и ОШ - 0,000000... в графе В0 и 1,320 в гр. var1. Как понимать ЭТИ значения? Для чего они? Спасибо.
|
|
28.03.2016 - 20:58
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
В случае, когда предиктор один и есть бинарная переменная, ОШ и табл. 2х2 совпадают, это ясно. Но если предиктор количественный , то для него оба пакета выдают В0=-19,005 и В1=0,278. НО, STATISTICA выдает еще и ОШ - 0,000000... в графе В0 и 1,320 в гр. var1. SPSS тоже выдает, по умолчанию, если вы не против вы ОШ просто не узнали exp(-19,005)=5,57E-9 и exp (0,278)=1,32 |
|
28.03.2016 - 21:16
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 14.03.2016 Из: Город Киев Пользователь №: 28072 |
Действительно, не обратил внимания, большое спасибо. Но какой смысл несет ОШ для В0? Т.е., если свободный член имеет вот такую величину, извините, то уже имеется некий риск? Такая же условность, как и натуральный логарифм функции правдоподобия для нулевой модели log(L0)? Спасибо за желание разъяснить.
|
|
29.03.2016 - 08:35
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
По поводу авторитетов. Разбирая какой-либо метод и его реализацию в пакете, пропускаю примеры из А. Афифи, С. Эйзен, Н.Дрейпер, Г. Смит, Дж. Флейс и др. Прекрасно изложены особенности применения методов, трактовка результатов и возможные неоднозначности. Часто в публикациях видим, что математика (статистика) применяется формально, математик(статистик, инженер, студент или пр. консультант) не вникает в суть проблемы, а заказчик (врач) не знаком с возможностями и условиями применения методов. Хотя есть врачи, очень грамотные в статистике. Так что авторитеты не помешают, при желании их можно не заметить. Вы определенно каких то "сектантских откровений" ищете . Кто все эти люди? Имеет значение только конкретный датасет, а его тут на три экрана постов как не было так и нет. (не считать же за него рекламу какой то книжки отсутствующей в свободном доступе?) |
|
29.03.2016 - 11:26
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Тут пример из Ахим Бююля и линк на файл hkarz.sav
http://www.learnspss.ru/hndbook/glava16/cont9.htm Сообщение отредактировал DrgLena - 29.03.2016 - 11:28 |
|