Цитата("Наташа @ 15.07.2023 - 17:31)

А что вы думаете на счет следующего:
В статьях, посвещенных исследованию выживаемости зарубежные авторы все как один (касаемо узкой и относительно недавней тематики) поступают следующим образом: проводят РОК-анализ с целью оптимально разбинарить на два класса предсказующую переменную (она количественная, разброс от 0 до 1500, это объем в см3). Вот эта вот переменная имеет прямую связь с исходом. Так вот в исходе 1- это случился рецидив, а в 0 - он центрирован до конца наблюдения, либо вышел из него без исхода. При этом, большинство больных покинуло наблюдение с 0 на очень ранних сроках, соответственно информации о них никакой.
Так вот, исследователи бинарят нашу предсказывающую переменную и вводят ее в анализ Капана-Мейера, как исходно низкий уровень и исходно высокий уровень, что бы получить различия при оценке прогнозируемой выживаемости. Руководитель настаивает - сделай также!!! на доводы о том что отрицательный класс может быть не отрицательным мне говорят так все делают, нам нужно определиться с пороговыми значениями. Подскажите, как лучше выйти из ситуации? Еще данные статьи изобилуют графиками с рок кривыми, а для пороговых величин указывают значения чувствительности и специфичности... Зачем... Не пойму чего то, может в этом есть смысл...
Я еще подумала, что это возможно как то обьяснить тем, что в рамках сравнения двух предсказывающих переменных, какая из них точнее п (ну вроде выборка одна, и если страдает чувствительность, так она (возможно)))) везде страдает одинаково. В общем, что вы думаете?
Вопрос не совсем статистический, поэтому и ответ такой же. Нужно понимать, что:
1) Любые попытки понизить шкалу от шкалы отношений или интервальной до порядковой или дальше до дихотомической сопровождаются потерей информации. Или у вас есть конкретные значения, скажем массы чего-то, либо просто "малая-средняя-большая", либо просто "больше или меньше медианы (нормы или др. граничного значения) - разница большая. Вот вы будете устраиваться на новую работу, и вам скажут: "зарплата будет большой!", но не скажут большой относительного чего. Хватит вам этой информации, чтобы уйти с прежнего места? Поэтому если человек пытается в рамках анализа понижать шкалу, значит он просто некомпетентен и не знает как нужно сделать грамотно, либо делает это от какой-то безысходности, обстоятельств, стандартизации, и т.п., не имеющих отношения к грамотному анализу данных, т.е.
применению лучшей модели к конкретным данным.
2)
У вас плохие данные. Не вообще, а сейчас. Когда пройдёт время и все исходы случатся (ну или хотя бы случатся у больше чем половины пациентов) они станут хорошими, с ними можно будет работать стандартными методами. Я не вник в то, что кто-то там делает, но всё это производит впечатление притянуть за уши хоть что-то, лишь бы не ждать, а принимать решение и писать статьи уже сейчас. За рубежом статистические редакторы строгие, поэтому если такое прокатывает, значит прокатывает (но не значит, что так нужно радостно делать).
3). Научный руководитель взял на себя обязательство довести вас до успешной защиты. Он может не знать конкретных статистических методов, но он ориентируется в ситуации, в требованиях учёного совета и др. нюансах. Поэтому если вы не хотите ждать пока ваши данные станут хорошими,
нужно просто сделать как он говорит. Потому что так "прокатит" и если сошлётесь на зарубежные работы, где так делают, никто из оппонентов не полезет в бутылку и не будет уже доказывать, что так сомнительно/не совсем корректно/некорректно. Но это не совет статистику, исследователю или врачу, это совет соискателю. Вот что я об этом думаю).