Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Выбор достоверности различия
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
OrOHEK
2 группы больных, оперированных по 2 методикам, хочется разобраться по какой методике определять достоверности для следующих параметров (40 чел в 1 группе, 120 в 2 группе):
1. возраст
2. пол
3. длительность заболевания
4. наличие или отсутствие сопутствующей патологии (диабет, гипертония и т.д. - сделано по разным полям)
5. фракция выброса до и после операции (сравнить надо и в группе и между группами)
6. осложнения
7. летальность

Пользуюсь программой SPSS.

Большое спасибо!
плав
1. Возраст - количественная переменная, можно сравнивать либо t-тестом либо тестом Мэнна-Уитни. Я бы рекомендовал t-тест
2. Пол - критерий хи2 или точный тест Фишера (если рассчитает программа)
3. Либо Мэнна-Уитни, либо логарифмировать и затем t-тест
4. см. пункт 2
5. Рассчитать разность фракций выброса до и после операции и затем работать с этой величиной как в пункте 1.
6. См. пункт 2.
7. Анализ выживаемости (Каплана-Мейера со сравнением по Вилкоксону ил Пето, если надо учесть различия по другим параметрам - то модель пропорционального риска Кокса)

Но на самом деле совет - найти приличную книжку по статистике вначале и прочитать ее (например Гланца - как введение).
Игорь
Судя по первому посту, автор имеет 2 группы многомерных данных в смешанных шкалах.

1. Из сравнения каждого параметра первой группы с соответствующим параметром второй, как предлагает плав, конечно, можно получить полезную информацию.

2. Но вот занятно было бы посчитать для группы показатель положения, учитывающий весь массив разнородных данных сразу. Для этого разработаны специальные методы, идущие из такого прикладного раздела, как обработка экспертных оценок. Для решения предлагаю воспользоваться медианой Кемени или средним Кемени.

3. Еще интереснее было бы статистически сравнить вычисленные в п. 2 показатели.
плав
Иногда разумно подумать над тем, что записано в данных, а не просто смотреть на все данные как на "массив разнородных данных". Если задуматься на приведенными переменными, то становится очевидным, что:
1. возраст - независимая переменная, влияет на исход
2. пол - независимая переменная, влияет на исход
3. длительность заболевания - независимая переменная, влияет на исход
4. наличие или отсутствие сопутствующей патологии (диабет, гипертония и т.д. - сделано по разным полям) - независимая переменная, влияет на исход
5. фракция выброса до и после операции (сравнить надо и в группе и между группами) - возможная зависимая переменная
6. осложнения - возможная зависимая переменная
7. летальность - зависимая переменная
Итак, какая тут обработка экспертных оценок? Классическая задача обработки результатов клинических испытаний, и не надо ничего придумывать. Три показателя исхода - изменения фракции выброса (можно оценить у всех пациентов), Летальность - должно быть достаточно большое исследование, чтобы результаты были надежными и осложнения - аналогично летальности. Если исследование большое надо использовать летальность/осложнения, поскольку это более важный для пациента исход (тогда изменения фракции выброса, особенно до операции, превращаются в зависимую переменную). Если небольшое - опираться на изменения фракции выброса.
Никаких эзотерических методов. Модель пропорционального риска Кокса/логистическая регрессия для летальности/осложнений, дисперсионный анализ (общая линейная модель) для разностей фракции выброса.
OrOHEK
спасибо! очень интересно
Игорь
Цитата(плав @ 4.07.2008 - 22:00) *
Итак, какая тут обработка экспертных оценок?
...
Никаких эзотерических методов.

Действительно, не нужно экзотики. Могут возникнуть сложности при защите. Делайте, как плав велел.
hongma
Здравствуйте smile.gif
Прежде всего, какие задачи вообще решает статобработка?
1. Для одной группы данных, например, возраст. Характер распределения, наличие значений, отклоняющихся от "нормы". Это гистограмма, анализ соответствия известным распределениям/чаще всего нормальному/ по характерным для этих распределений параметрам и критерию хи-квадрат, выявление "выбросов",например, по Q-критерию.
2. Есть 2 группы данных.
а/ Идентичные или разные. Сравнение по характерам распределений. Сравнение по средним. Распределения: сначала гистограмма, затем по параметрам распределений, по критерию хи-квадрат и другим более редким критериям. По средним: если близко к нормальному распределению (!) - Стьюдент. Если существенно ненормальное распределение или Стьюдент не дал то,что надо - непараметрические критерии. Последние позволяют иногда сравнить одновремено и средние и распределения.
б/ Наличие сопряженности. Коэффициент корреляции, дисперсионный анализ. Второй универсальнее, но дает ответ в виде наличия или отсутствия вообще какой-то связи, ничего не говоря о ее характере.

Сказанное относится в первую очередь к "статическим" данным. Если данные могут быть представлены как временные зависимости, общий алгоритм исследования сохраняется, но методы будут другими
плав
Цитата(hongma @ 9.08.2008 - 13:38) *
Здравствуйте smile.gif
Прежде всего, какие задачи вообще решает статобработка?
1. Для одной группы данных, например, возраст. Характер распределения, наличие значений, отклоняющихся от "нормы". Это гистограмма, анализ соответствия известным распределениям/чаще всего нормальному/ по характерным для этих распределений параметрам и критерию хи-квадрат, выявление "выбросов",например, по Q-критерию.
2. Есть 2 группы данных.
а/ Идентичные или разные. Сравнение по характерам распределений. Сравнение по средним. Распределения: сначала гистограмма, затем по параметрам распределений, по критерию хи-квадрат и другим более редким критериям. По средним: если близко к нормальному распределению (!) - Стьюдент. Если существенно ненормальное распределение или Стьюдент не дал то,что надо - непараметрические критерии. Последние позволяют иногда сравнить одновремено и средние и распределения.
б/ Наличие сопряженности. Коэффициент корреляции, дисперсионный анализ. Второй универсальнее, но дает ответ в виде наличия или отсутствия вообще какой-то связи, ничего не говоря о ее характере.

Сказанное относится в первую очередь к "статическим" данным. Если данные могут быть представлены как временные зависимости, общий алгоритм исследования сохраняется, но методы будут другими


Для информации.
1) Дисперсионный анализ является генерализацией метода сравнения средних, т.е. он из той же группы, что и тест Стьюдента. Насчет наличия или отсутствия какой-либо связи вообще путаница. Дисперсионный анализ проверяет гипотезу о равенстве выборочных средних.
2) Коэффициент корреляции относится к показателям сопряженности, это правильно, но он не тестирует никакой гипотезы. Это статистика, такая же, как и коэффициент t. Показатель линейности связи между переменными. Является случайной величиной (поскольку получен в выборке). Соответственно, должен также проверяться (обычно проверяется гипотеза о равенстве коэффициента корреляции нулю).
3) Заявление, что "если Стьюдент не дал, то, что надо" весьма забавное. Вообще-то обычно статистическая обработка планируется ДО начала исследования. Соответственно, исследователь, запланировавший использование t-теста должен получить результат и жить с ним, а не испробовать методы до тех пор, пока не получит "нужный" результат. В противном случае, это уже не статистическая обработка данных, а "рыбалка".
Игорь
Цитата(hongma @ 9.08.2008 - 12:38) *
выявление "выбросов",например, по Q-критерию.

Если можно, поподробнее, это что за Q-критерий "выявления" выбросов?
Цитата(hongma @ 9.08.2008 - 12:38) *
... близко к нормальному распределению (!) - Стьюдент. Если существенно ненормальное распределение ...

Если можно, уточните, что автор понимает под "близко" и что означает "существенно ненормальное".

Есть целый раздел прикладного анализа, посвященный проверке нормальности. Разработаны десятки объективных методов, в результате расчета дающих стандартные общепринятые статистические выводы (P-значения, доверительные интервалы). Может, имеет смысл не выдумывать новую терминологию, а изучить данные методы и поступать формально?

Остальное плав сказал.
inview
Цитата(Игорь @ 10.08.2008 - 19:50) *
Если можно, поподробнее, это что за Q-критерий "выявления" выбросов?

http://www.spcpa.ru/learning/zao/a5m.html
или
http://chemstat.com.ru/node/9
Там в самом начале, правда, он почему-то отнесен к разделу о проверке вида распределения.


Игорь
Цитата(inview @ 10.08.2008 - 19:20) *
http://www.spcpa.ru/learning/zao/a5m.html
или
http://chemstat.com.ru/node/9
Там в самом начале, правда, он почему-то отнесен к разделу о проверке вида распределения.


Понятно. Это известный из литературы критерий Дина-Диксона. Действительно, при чем тут нормальность? Еще ссылки со страницы (в частности, на таблицу) битые.

И почему-то Пирсон дважды назван "Пирсеном". Но при этом описан критерий хи-квадрат Фишера. Кстати, хи-квадрат Фишера очень не прост, вопреки утверждению автора. Там столько "подводных камней", что само употребление данного теста для проверки нормальности под большим вопросом.
inview
Цитата(Игорь @ 11.08.2008 - 06:48) *
И почему-то Пирсон дважды назван "Пирсеном".

Хорошо, что не "Персеном" wink.gif (извиняюсь, за off-top)
OrOHEK
еще раз. сижу, наверно туплю...
вот таблица
Показатель с ИК (n=37) без ИК (n=137) p
SVD 0 (0%) 8 (5,8%) ????
DVD 1 (2,7%) 8 (5,8%) ????
TVD 36 (97,3%) 121 (88,3%) >0,05
SVD = single vessel disease; DVD = double vessel disease; TVD = triple vessel disease.

Различия SVD и DVD достоверны?
плав
Цитата(OrOHEK @ 28.10.2008 - 22:00) *
еще раз. сижу, наверно туплю...
вот таблица
Показатель с ИК (n=37) без ИК (n=137) p
SVD 0 (0%) 8 (5,8%) ????
DVD 1 (2,7%) 8 (5,8%) ????
TVD 36 (97,3%) 121 (88,3%) >0,05
SVD = single vessel disease; DVD = double vessel disease; TVD = triple vessel disease.

Различия SVD и DVD достоверны?

Странные цифры оценки, но проверка хи2 (и его вариантами) показывает, чтоИК и количество пораженных сосудов не связаны. (т.е. ответ на вопрос - нет)
OrOHEK
здесь сравнивается между с ИК и без ИК. Посчитал хи2 данные в SVD - не достоверны, а DVD - достоверны. Спасибо за ответ!
плав
Цитата(OrOHEK @ 29.10.2008 - 16:56) *
здесь сравнивается между с ИК и без ИК. Посчитал хи2 данные в SVD - не достоверны, а DVD - достоверны. Спасибо за ответ!

И это как Вы по хи2 данные сравнивали только для DVD? Простите, но это не возможно. У Вас 157 человек с DVD Ваше предположение. Частота ИК одинаковая? Кроме того, если по суммарной группе различий между ИК и без ИК нет, то по отдельности сравнивать нельзя:
CODE

i j

Frequency?
Percent ?
Row Pct ?
Col Pct ? 1? 2? Total
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
1 ? 0 ? 8 ? 8
? 0.00 ? 4.60 ? 4.60
? 0.00 ? 100.00 ?
? 0.00 ? 5.84 ?
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
2 ? 1 ? 8 ? 9
? 0.57 ? 4.60 ? 5.17
? 11.11 ? 88.89 ?
? 2.70 ? 5.84 ?
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
3 ? 36 ? 121 ? 157
? 20.69 ? 69.54 ? 90.23
? 22.93 ? 77.07 ?
? 97.30 ? 88.32 ?
ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ
Total 37 137 174
21.26 78.74 100.00


Statistics for Table of i by j

Число
Степеней
Статистика Свободы Значение р
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
Chi-Square 2 2.9749 0.2260
Likelihood Ratio Chi-Square 2 4.7231 0.0943
Mantel-Haenszel Chi-Square 1 2.9573 0.0855
Phi Coefficient 0.1308
Contingency Coefficient 0.1297
Cramer's V 0.1308

WARNING: 33% of the cells have expected counts less
than 5. Chi-Square may not be a valid test.

Sample Size = 174

OrOHEK
Наверно таблица видится не правильно
Попробую текстом - 1 группа с ИК (37) и 2 - без ИК (137). В каждой группе есть SVD, DVD, TVD.
В группе с ИК - SVD - 0 чел., DVD - 1 чел., TVD - 36 чел. Без ИК - SVD - 8 чел., DVD - 36 чел., TVD - 121 чел.
Надо сравнить показатели SVD, DVD, TVD между группами. хи2?
плав
Цитата(OrOHEK @ 30.10.2008 - 08:52) *
Наверно таблица видится не правильно
Попробую текстом - 1 группа с ИК (37) и 2 - без ИК (137). В каждой группе есть SVD, DVD, TVD.
В группе с ИК - SVD - 0 чел., DVD - 1 чел., TVD - 36 чел. Без ИК - SVD - 8 чел., DVD - 36 чел., TVD - 121 чел.
Надо сравнить показатели SVD, DVD, TVD между группами. хи2?

Именно это и сделано в примере выше. Различий между группами с ИК и без ИК по всем показателям пораженности сосудов нет.
OrOHEK
спасибо! конечно нет, дошло наконец-то... smile.gif
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.