Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Цензурированная выборка, Что делать с выпадающими точками?
selak
сообщение 2.08.2014 - 22:28
Сообщение #1





Группа: Пользователи
Сообщений: 1
Регистрация: 2.08.2014
Пользователь №: 26558



Сейчас анализирую данные для своей кандидатской диссертации. Есть выборка больных, точнее даже контрольная группа и больные. У них определялся в крови определённый параметр (тропонин). У большей части контрольной группы значение параметра оказалось ниже возможностей тест-системы ( менее 3 пкг/мл). В тоже время у больных почти у всех он выше 3, но среди них есть несколько субъектов у кого он ниже. Как посоветуете поступить с этими точками? Может превратить их в ноль или в 3? Учитывая, что это второстепенный показатель и о нём будет упоминаться в диссертации вскользь, как это можно сделать проще? Заранее спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 3.08.2014 - 18:02
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(selak @ 3.08.2014 - 01:28) *
Сейчас анализирую данные для своей кандидатской диссертации. Есть выборка больных, точнее даже контрольная группа и больные. У них определялся в крови определённый параметр (тропонин). У большей части контрольной группы значение параметра оказалось ниже возможностей тест-системы ( менее 3 пкг/мл). В тоже время у больных почти у всех он выше 3, но среди них есть несколько субъектов у кого он ниже. Как посоветуете поступить с этими точками? Может превратить их в ноль или в 3? Учитывая, что это второстепенный показатель и о нём будет упоминаться в диссертации вскользь, как это можно сделать проще? Заранее спасибо.

Самое простое, действительно, дихотомизировать данные, свести в таблицу сопряжённости 2х2 и проанализировать критериями типа хи-квадрат. Только не "ноль или 3", нужно более основательно подойти к точке разделения. Например, можно подсчитать количество цензурированных (ЦН) и полных наблюдений в обеих группах, или, как часто дихотомизируют: количество до медианы и свыше медианы (для вас первый вариант выглядит более естественным). Хотя, как я понял, для вас это не принципиально, но при таком подходе будет потеря информации: все полные наблюдения попадут в одну категорию независимо от значения. Правильнее было бы воспользоваться специальными критериями для работы с такими данными, например критерием Гехана - обобщением критерия Уилкоксона - Манна - Уитни на случай неполных данных. Если окажется (сам не пробовал, но вполне может быть), что в пакетах он "заточен" на НД типа "более чем", то НД типа "менее чем" можно легко перевести в нужный формат преобразовав как 1/х. Есть и другие варианты для сравнения групп с ЦН.
В любом случае, помимо значимости различий вам нужно будет представить данные описательной статистики для этих групп. % выше и ниже границы чувствительности будет как-то по-студенчески. Грамотный исследователь привёл бы среднее значение и 95%-ный доверительный интервал несмотря на ЦН. Вариантов расчёта их предложено много, я когда есть нондетекты использую робастный метод Хелсела из пакета "Uncensor 4.0" ( http://www.vims.edu/research/departments/e...nt/index.php#bs ). Есть и более крупные пакеты для анализа ЦН типа "менее чем", но думаю вам хватит и Uncensor.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему