Выбор достоверности различия, как выбрать? |
Здравствуйте, гость ( Вход | Регистрация )
Выбор достоверности различия, как выбрать? |
1.07.2008 - 21:53
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 30.06.2008 Пользователь №: 5128 |
2 группы больных, оперированных по 2 методикам, хочется разобраться по какой методике определять достоверности для следующих параметров (40 чел в 1 группе, 120 в 2 группе):
1. возраст 2. пол 3. длительность заболевания 4. наличие или отсутствие сопутствующей патологии (диабет, гипертония и т.д. - сделано по разным полям) 5. фракция выброса до и после операции (сравнить надо и в группе и между группами) 6. осложнения 7. летальность Пользуюсь программой SPSS. Большое спасибо! |
|
1.07.2008 - 23:32
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
1. Возраст - количественная переменная, можно сравнивать либо t-тестом либо тестом Мэнна-Уитни. Я бы рекомендовал t-тест
2. Пол - критерий хи2 или точный тест Фишера (если рассчитает программа) 3. Либо Мэнна-Уитни, либо логарифмировать и затем t-тест 4. см. пункт 2 5. Рассчитать разность фракций выброса до и после операции и затем работать с этой величиной как в пункте 1. 6. См. пункт 2. 7. Анализ выживаемости (Каплана-Мейера со сравнением по Вилкоксону ил Пето, если надо учесть различия по другим параметрам - то модель пропорционального риска Кокса) Но на самом деле совет - найти приличную книжку по статистике вначале и прочитать ее (например Гланца - как введение). |
|
4.07.2008 - 13:39
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Судя по первому посту, автор имеет 2 группы многомерных данных в смешанных шкалах.
1. Из сравнения каждого параметра первой группы с соответствующим параметром второй, как предлагает плав, конечно, можно получить полезную информацию. 2. Но вот занятно было бы посчитать для группы показатель положения, учитывающий весь массив разнородных данных сразу. Для этого разработаны специальные методы, идущие из такого прикладного раздела, как обработка экспертных оценок. Для решения предлагаю воспользоваться медианой Кемени или средним Кемени. 3. Еще интереснее было бы статистически сравнить вычисленные в п. 2 показатели. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
4.07.2008 - 22:00
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Иногда разумно подумать над тем, что записано в данных, а не просто смотреть на все данные как на "массив разнородных данных". Если задуматься на приведенными переменными, то становится очевидным, что:
1. возраст - независимая переменная, влияет на исход 2. пол - независимая переменная, влияет на исход 3. длительность заболевания - независимая переменная, влияет на исход 4. наличие или отсутствие сопутствующей патологии (диабет, гипертония и т.д. - сделано по разным полям) - независимая переменная, влияет на исход 5. фракция выброса до и после операции (сравнить надо и в группе и между группами) - возможная зависимая переменная 6. осложнения - возможная зависимая переменная 7. летальность - зависимая переменная Итак, какая тут обработка экспертных оценок? Классическая задача обработки результатов клинических испытаний, и не надо ничего придумывать. Три показателя исхода - изменения фракции выброса (можно оценить у всех пациентов), Летальность - должно быть достаточно большое исследование, чтобы результаты были надежными и осложнения - аналогично летальности. Если исследование большое надо использовать летальность/осложнения, поскольку это более важный для пациента исход (тогда изменения фракции выброса, особенно до операции, превращаются в зависимую переменную). Если небольшое - опираться на изменения фракции выброса. Никаких эзотерических методов. Модель пропорционального риска Кокса/логистическая регрессия для летальности/осложнений, дисперсионный анализ (общая линейная модель) для разностей фракции выброса. |
|
5.07.2008 - 08:30
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 30.06.2008 Пользователь №: 5128 |
спасибо! очень интересно
|
|
5.07.2008 - 17:18
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Итак, какая тут обработка экспертных оценок? ... Никаких эзотерических методов. Действительно, не нужно экзотики. Могут возникнуть сложности при защите. Делайте, как плав велел. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
9.08.2008 - 12:38
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 29.06.2008 Пользователь №: 5123 |
Здравствуйте
Прежде всего, какие задачи вообще решает статобработка? 1. Для одной группы данных, например, возраст. Характер распределения, наличие значений, отклоняющихся от "нормы". Это гистограмма, анализ соответствия известным распределениям/чаще всего нормальному/ по характерным для этих распределений параметрам и критерию хи-квадрат, выявление "выбросов",например, по Q-критерию. 2. Есть 2 группы данных. а/ Идентичные или разные. Сравнение по характерам распределений. Сравнение по средним. Распределения: сначала гистограмма, затем по параметрам распределений, по критерию хи-квадрат и другим более редким критериям. По средним: если близко к нормальному распределению (!) - Стьюдент. Если существенно ненормальное распределение или Стьюдент не дал то,что надо - непараметрические критерии. Последние позволяют иногда сравнить одновремено и средние и распределения. б/ Наличие сопряженности. Коэффициент корреляции, дисперсионный анализ. Второй универсальнее, но дает ответ в виде наличия или отсутствия вообще какой-то связи, ничего не говоря о ее характере. Сказанное относится в первую очередь к "статическим" данным. Если данные могут быть представлены как временные зависимости, общий алгоритм исследования сохраняется, но методы будут другими |
|
9.08.2008 - 20:24
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Здравствуйте Прежде всего, какие задачи вообще решает статобработка? 1. Для одной группы данных, например, возраст. Характер распределения, наличие значений, отклоняющихся от "нормы". Это гистограмма, анализ соответствия известным распределениям/чаще всего нормальному/ по характерным для этих распределений параметрам и критерию хи-квадрат, выявление "выбросов",например, по Q-критерию. 2. Есть 2 группы данных. а/ Идентичные или разные. Сравнение по характерам распределений. Сравнение по средним. Распределения: сначала гистограмма, затем по параметрам распределений, по критерию хи-квадрат и другим более редким критериям. По средним: если близко к нормальному распределению (!) - Стьюдент. Если существенно ненормальное распределение или Стьюдент не дал то,что надо - непараметрические критерии. Последние позволяют иногда сравнить одновремено и средние и распределения. б/ Наличие сопряженности. Коэффициент корреляции, дисперсионный анализ. Второй универсальнее, но дает ответ в виде наличия или отсутствия вообще какой-то связи, ничего не говоря о ее характере. Сказанное относится в первую очередь к "статическим" данным. Если данные могут быть представлены как временные зависимости, общий алгоритм исследования сохраняется, но методы будут другими Для информации. 1) Дисперсионный анализ является генерализацией метода сравнения средних, т.е. он из той же группы, что и тест Стьюдента. Насчет наличия или отсутствия какой-либо связи вообще путаница. Дисперсионный анализ проверяет гипотезу о равенстве выборочных средних. 2) Коэффициент корреляции относится к показателям сопряженности, это правильно, но он не тестирует никакой гипотезы. Это статистика, такая же, как и коэффициент t. Показатель линейности связи между переменными. Является случайной величиной (поскольку получен в выборке). Соответственно, должен также проверяться (обычно проверяется гипотеза о равенстве коэффициента корреляции нулю). 3) Заявление, что "если Стьюдент не дал, то, что надо" весьма забавное. Вообще-то обычно статистическая обработка планируется ДО начала исследования. Соответственно, исследователь, запланировавший использование t-теста должен получить результат и жить с ним, а не испробовать методы до тех пор, пока не получит "нужный" результат. В противном случае, это уже не статистическая обработка данных, а "рыбалка". |
|
10.08.2008 - 18:50
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
выявление "выбросов",например, по Q-критерию. Если можно, поподробнее, это что за Q-критерий "выявления" выбросов? ... близко к нормальному распределению (!) - Стьюдент. Если существенно ненормальное распределение ... Если можно, уточните, что автор понимает под "близко" и что означает "существенно ненормальное". Есть целый раздел прикладного анализа, посвященный проверке нормальности. Разработаны десятки объективных методов, в результате расчета дающих стандартные общепринятые статистические выводы (P-значения, доверительные интервалы). Может, имеет смысл не выдумывать новую терминологию, а изучить данные методы и поступать формально? Остальное плав сказал. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
10.08.2008 - 19:20
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 34 Регистрация: 30.07.2008 Пользователь №: 5183 |
Если можно, поподробнее, это что за Q-критерий "выявления" выбросов? http://www.spcpa.ru/learning/zao/a5m.html или http://chemstat.com.ru/node/9 Там в самом начале, правда, он почему-то отнесен к разделу о проверке вида распределения. |
|
11.08.2008 - 05:48
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
http://www.spcpa.ru/learning/zao/a5m.html или http://chemstat.com.ru/node/9 Там в самом начале, правда, он почему-то отнесен к разделу о проверке вида распределения. Понятно. Это известный из литературы критерий Дина-Диксона. Действительно, при чем тут нормальность? Еще ссылки со страницы (в частности, на таблицу) битые. И почему-то Пирсон дважды назван "Пирсеном". Но при этом описан критерий хи-квадрат Фишера. Кстати, хи-квадрат Фишера очень не прост, вопреки утверждению автора. Там столько "подводных камней", что само употребление данного теста для проверки нормальности под большим вопросом. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
11.08.2008 - 08:40
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 34 Регистрация: 30.07.2008 Пользователь №: 5183 |
|
|
28.10.2008 - 22:00
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 30.06.2008 Пользователь №: 5128 |
еще раз. сижу, наверно туплю...
вот таблица Показатель с ИК (n=37) без ИК (n=137) p SVD 0 (0%) 8 (5,8%) ???? DVD 1 (2,7%) 8 (5,8%) ???? TVD 36 (97,3%) 121 (88,3%) >0,05 SVD = single vessel disease; DVD = double vessel disease; TVD = triple vessel disease. Различия SVD и DVD достоверны? |
|
29.10.2008 - 16:49
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
еще раз. сижу, наверно туплю... вот таблица Показатель с ИК (n=37) без ИК (n=137) p SVD 0 (0%) 8 (5,8%) ???? DVD 1 (2,7%) 8 (5,8%) ???? TVD 36 (97,3%) 121 (88,3%) >0,05 SVD = single vessel disease; DVD = double vessel disease; TVD = triple vessel disease. Различия SVD и DVD достоверны? Странные цифры оценки, но проверка хи2 (и его вариантами) показывает, чтоИК и количество пораженных сосудов не связаны. (т.е. ответ на вопрос - нет) |
|
29.10.2008 - 16:56
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 30.06.2008 Пользователь №: 5128 |
здесь сравнивается между с ИК и без ИК. Посчитал хи2 данные в SVD - не достоверны, а DVD - достоверны. Спасибо за ответ!
|
|