Цитата(DrgLena @ 9.01.2012 - 22:46)

Я не спорю с вами в отношении числа градаций в переменной пол (sex, биологическая характеристика) или гендер (социально-психологический атрибут) где выделяется смешанная категория, имеющая общие признаки ?гермафродит? в переменной пол и гермафродитный в переменной гендер. Именно поэтому, на указанной странице sex перечислен вместе с расой, как нуждающийся в создании дополнительно переменной для логистической регрессии. Но вы правы ? это спор для других форумов.
Для начала, гермафродит - не пол и не гендер, а заболевание. См. МКБ-10
http://mkb10.com/Q99.1 Если требуется изучить влияние других признаков, то и нужно вводить в модель эти признаки (например, имеющие отношение к теме физические, психические и т.д.), а не нагружать несвойственными функциями другие общепринятые признаки.
Полагаю, что признак sex перечислен вместе с расой потому, что sex - не бинарный признак, а номинальный с двумя градациями (и гермафродит, а также другие врожденные, приобретенные и психические отклонения тут не при чем), поэтому для него также требуется в логистической модели вводить фиктивные (dummy) переменные. Конечно, в каких-то опросниках можно закодировать пол как 0 и 1, но применение данных чисел в расчетах приведет к ошибке - признаки для расчетов необходимо перекодировать в dummy переменные.
Кстати, о расе. Представляется, что точнее будет говорить о других признаках, характеризующих расу, а не только, скажем цвет кожи, разрез глаз, форма черепа, наличие эпикантуса и т.п. Возможно, здесь нужно говорить исключительно о гаплогруппах, а вовсе не о вторичных признаках. Т.е. расу, как признак, я бы вообще исключил из рассмотрения, как совершенно неинформативный. Хотя для иллюстрации метода пример сгодится.
Цитата(Вале а @ 10.01.2012 - 17:19)

еще интересует, какие предположения могут быть выдвинуты для остатков в рамках логистической регрессии (для построения достоверной, стабильной модели)
Думаю, не нужно "заморачиваться" относительно остатков. "Достоверность" логистической модели, как Вы выразились, принято оценивать ROC анализом, понимая под качеством модели ее приемлемую разрешающую, предсказывающую способность. В двух ссылках, которые я приводил выше, об этом наглядно рассказано.