Форум врачей-аспирантов > Достоверность (t) при различных значениях p

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: Достоверность (t) при различных значениях p

Форум врачей-аспирантов > Разделы форума > Медицинская статистика

Statistica

29.12.2008 - 01:58

Помогите вычислить достоверность (t) при p<0,05, p<=0,01 и p<0,001
Сложность состоит в том что тут для каждого случая по две выборки. Нужны формулы.

Код

    Гемоглобин
    Экспериментальная    Контрольная
    до    после    до    после
№    V    V    V    V
1    137    138    166    161
2    139    141    122    114
3    131    141    126    125
4    107    122    128    132
5    121    145    132    121
6    126    129    123    128
7    103    115    128    152
8    131    131    146    116
9    89     95     142    117
10    146    149    140    136
11    132    131    135    157
12    118    117    129    145
13    120    119    158    129
14    128    121    140    135
15    149    148    162    141
16    154    160    137    115
17    177    149    113    117
18    131    165    155    147
19    143    128    122    103
20    156    166    131    133

Извините если тема существует, и я ее не нашла. Заранее спасибо за ваши ответы.

DrgLena

29.12.2008 - 12:19

Любой учебник по статистике поможет вам, там написано, что t это вовсе не достоверность, а также про связанные и не связанные выборки. Аналогичные англоязычные форумы имеют предупреждение, что домашние задания для учащихся не выполняются. Можем обсудить, что не понятно написано в имеющихся у вас учебниках.

DoctorStat

29.12.2008 - 12:35

Алгоритм решения задачи: вычислить разность значений "после" и "до". Если разность распределена нормально, то использовать парный критерий Стьюдента, если нет, то непараметрический критерий для повторных измерений. Все формулы расчетов можно посмотреть в книге Стентон Гланц "Медико-биологическая статистика", которую можно бесплатно скачать в Интернете.

Игорь

29.12.2008 - 13:19

Просто критерий Стьюдента, не парный, т.к. выборки относятся к разным индивидуумам (хотя численности выборок и равны).

Непараметрику здесь не нужно применять, т.к. проверка нормальности показала, что для первого массива разностей значение критерия Шапиро-Уилка равно 0,9382 (p = 0,2199), для второго массива разностей значение критерия 0,9593 (p = 0,5124). Данные показывают нормальность распределения.

Расчет показывает, что статистика критерия Стьюдента для независимых выборок в данном случае равна 2,0033 (одностороннее p = 0,0262). Критерий Уэлча дает 2,0033 (p = 0,0263).

Что-то мне подсказывает, что предупреждение DrgLena имеет место быть.

DrgLena

29.12.2008 - 15:39

Автор поста не сформулировал цель исследования, а советы уже готовы. Что же нужно проанализировать, степень изменения показателя, т.е. динамику в одной группе сравнить с динамикойв другой группе, тогда это дисперсионный с повторными измерениями и t здесь совсем не причем.
Но автор поста хочет получить t при разных р, а это наверное, означает, указать критический уровень t, а это -в конце учебника и приведенные здесь данные ни при чем. А если сравнить динамику, то - дисперсионный с повторными измененями, а после уж сравнивайте что и чем угодно угодно в post hoc.

Statistica

1.01.2009 - 01:43

DrgLena, чтобы утверждать что-то (что это домашнее задание), надо быть в этом уверенной, а следовательно спросить.
Это не мое домашнее задание и от медицины я очень далек. Друг попросил решить как бывшего математика.

DoctorStat, если "вычислить разность значений "после" и "до"", то после возведения в квадрат уже не будет явно то, что это было повышения количества гемаглобина или его понижение. Или я неправильно понимаю.
Благодарю за предложенную книгу. Уже нашел, просматриваю.

Игорь, я так понимаю для рассчетов вы использовали некую программу. Вы не можете подсказать использованные формулы, у меня еще целый ряд выборок.

DrgLena, цель исследования такова, проверить эффективность воздействие облучения крови, в частности увеличения уровня элементов крови.
Возможно я не правильно сформулировал свой вопрос. Необходимо вычислить эффективность применения облучения воспользовавшись достоверностью.

nokh

1.01.2009 - 11:54

Цитата(Statistica @ 1.01.2009 - 03:43)

если "вычислить разность значений "после" и "до"", то после возведения в квадрат уже не будет явно то, что это было повышения количества гемаглобина или его понижение

Хочется спросить как биологу математика: дак а зачем же возводить разность в квадрат?

Если я возьму у вас денег в долг, а потом возведем все в квадрат, то будет сложно сказать кто кому должен? А вообще, инвариантность к преобразованиям не является критерием правильности решения, и в повседневной жизни тоже. Если измерения до и после выполнялись у одних и тех же объектов, то нужно использовать дисперсионный анализ с повторными измерениями, как советует DrgLena (фиксированные факторы: "выборка" (2 градации - контроль и эксперимент) и "срок" (2 градации - до и после), случайный фактор - "донор внутри выборки"). Достоверное событие - событие с вероятностью 1. В статистическом оцениванивании таких нет, поэтому лучше говорить не о достоверности, а о статистической значимости различий.

DrgLena

1.01.2009 - 20:27

Новогоднее предостережение!
Бывшему математику никакие ошибки, которые он совершит, ничем не грозят. А вот его другу будущему доктору, могут повредить, поскольку неверно проведенный анализ результата исследования может не только привести к неправильным выводам работы, но и повредить конкретному больному, который поверит, что ему следует ожидать эффект от такого лечения.
Скоропостижный совет DoctorStat анализировать разницу после и до лечения привел к тому, что Игорь увлекся этой идеей и, проверив нормальность полученной разницы, что формально совершенно верно, но только объектов всего 20. При этом в экспериментальной выборке эта средняя разница составила 3,6 при SD=12,98, а в контроле средняя разница составила 5,55 при SD=15,8. А дальше, по каким таким формулам Игорь получил различия по критерию Стьюдента на уровне р=0,026 не ясно. Вы что учитывали знак разницы? Возможно, первичные данные были несколько отредактированы, у меня тоже график не совпал с сегодняшними данными.
У меня же получилось р=0,67
Что же на рисунке, который иллюстрирует результат дисперсионного анализа для повторных изменений. Представлены средние значения до лечения в экспериментальной и контрольной группах и их значения после лечения.
gr R1 Mean Std.Err. -95.00% +95.00%
1 1 до 131.9 4.274 123.2 140.6 20
2 1 после 135.5 3.803 127.8 143.2 20
3 2 до 135.5 4.274 126.8 144.2 20
4 2 после 131.2 3.803 123.5 138.9 20

Ни по одному из критериев (множественного сравнения) различий в группах нет. До лечения средние в группах не отличались статистически достоверно. После лечения ни в одной из групп не произошло статистически достоверного повышения гемоглобина (р=0,68 Н-К), как в первой группе или понижения, как во второй группе средних значений гемоглобина (р=0,58).
Если не использовать дисперсионный анализ, то по t критерию (для связанных выборок) для первой группы средняя разница составляет 3,6; SD разницы =12,98, t=1,24 и р=0,23. Для второй группы разница 4,3; SD разницы=24,0; t=0,80; p=0,43. Т.о. как в экспериментальной, так и в контрольной группах не произошли статистически значимые изменения уровня гемоглобина. Так, что нужно подумать какие вам нужны формулы.

Statistica

1.01.2009 - 21:23

Цитата(DrgLena @ 1.01.2009 - 20:27)

Не хотелось бы разочаровывать друга, если не ошибаюсь это из его диссертации. Не поясните более подробно что вы имеете здесь ввиду.

DrgLena

1.01.2009 - 22:25

Вы не можете сказать какие формулы вам нужны, значит не знаете, какими методами собираетесь анализировать данные. Мой анализ отличается от предложенного другими участниками дискуссии, и результат сравнения совершенно различный. Ваш друг может воспользоваться любыми книгами по статистике, там не только формулы, но и принцип методов анализа изложен, причем не для профессиональных математиков, а для потребителей прикладной статистики. Кстати, руками уже мало кто считает, в основном пользуются программами, одна их них Attestat известна на этом форуме, в хелпах имеются формулы.

Statistica

1.01.2009 - 22:34

Дополнение
В эксперементальной группе наблюдалось повышение количества гемоглабина в крови. Вычислить данную достоверность.)

DrgLena

1.01.2009 - 22:54

Вы проигнорировали замечание nokh по поводу терминологии. Достоверность чего вы анализируете? Или вам все же нужен уровень значимости различий р-level.

Statistica

1.01.2009 - 23:52

Достоверность того что количество гемоглобина в Экспериментальной группе увеличилось больше чем в чем в Контрольной группе.

Игорь

2.01.2009 - 12:16

Что заказали, то и получили. Программа - инструмент. Хотим, отклонения сравним. Хотим - в пределах группы посчитаем. Нет проблем. Главное - постановка и интерпретация. А вот тут уже опыт медицинского статистика нужен.

Цитата(Statistica @ 1.01.2009 - 02:43)

Игорь, я так понимаю для рассчетов вы использовали некую программу. Вы не можете подсказать использованные формулы, у меня еще целый ряд выборок.

Пользовался AtteStat. Можно было бы и просто в Excel посчитать. Критерий Шапиро-Уилка см. в известной книге Хана и Шапиро. Стьюдент в любой книге по прикладной статистике есть.

Посмотрел на данные еще раз. Заметил странности:
1. Почему в опыте и контроле колонки "до" и "после"? В опыте и контроле "до" должны быть одинаковыми. Нет?
2. Что в контроле означает "после"? После чего? После контроля? В контроле "до" и "после" должны быть одинаковыми. Или тут что, квантовые процессы микромира измеряются, и измерение нарушает исходную систему?

В принципе, логика DoctorStat понятна - проанализировать только изменения. Что мы и сделали. Какой уж тут множественный анализ?

В-общем, просчеты дизайна исследования.

DrgLena

2.01.2009 - 16:50

Вот я и пытаюсь объяснить к чему приводят и просчеты дизайна и скоропостижный анализ разниц. То, что тут две группы пациентов и до воздействия у них были свои значения гемоглобина и вовсе не обязательно, что они должны быть одинаковыми. Первое сравнение - доказать, что до воздействия группы статистически достоврено не различались по гемоглобину. И это действительно так. Что группы одинаковые - это совпадение, они могут быть и разновеликими. Далее в экспериментальной группе проводили воздействие - облучение, которое как хочется авторам, увеличило уровень гемоглобина. И это нужно доказать - второе сравнение до и после в экспериментальной группе. А в контрольной группе может ничего не делали, а может гематоген применяли и тоже нужно сравнить до и после, т.е. еще одно сравнение. А потом нужно сравнить где эффект был больше у облучения или у гематогена. Это я так поняла дизайн исследования, но тогда сравнений тут много. Поэтому - дисперсионный анализ с повторными измененями я и продемонстрировала. И вывод простой ни в экспериментальной, ни в контрольной группах статистически достоверного изменения уровня гемоглобина не отмечено.
Но бывший математик и ником "Statistica" настаивает на том, чтобы посчитать "достоверность" того что повышение гемоглобина в экспериментальной группе выше, чем в контрольной.

Поэтому можно пойти дальше, в экспериментальной группе повышение гемоглобина на величину от 6 единиц ( на 2 единицы вряд ли клинически заметный успех) отмечен в 40% случаев, при этом без изменений в 45% и у 15% - снижение показателя. Статистический анализ этих данных также не позволяют сделать вывод о положительном влиянии облучения на гемоглобин. Сравнивая 40% и 60% по критерию хи кв. р=0,34. В контрольной группе увеличение показателя от 5 единиц отмечено в 55% случаев, снижение - в 30%, без изменения -15%. Никакие статистически методы не дают основания утверждать, что облучение повышает гемоглобин.
Поскольку в результате воздействия происходит разнонаправленное изменение показателя, то я против того чтобы анализировать среднюю разницу до и после в двух группах, такие средние сопровождаются большой ощибкой и неверным результатам.

"Statistica" должен посмотреть в интернете, если нет книг под рукой, определение термина достоверность, вероятность и уровень значимости. Я думаю, что вы хотите посчитать Р=1-р, где р - уровень значимости критерия, но какого вы еще не определились.

Statistica

3.01.2009 - 00:52

Игорь
1. "до" различны т.к. лечению подвергались разные группы людей.
2. Обе группы подвергались некоторому лечению, но эксперементальная группа в период лечения к тому же подвергалась некотором облучению.

Statistica

3.01.2009 - 01:25

Как показало наблюдение DrgLena поняла меня лучше меня самого.
А вот вас я с трудо...)
Я так понял, вы хотели сказать в предыдущем посте, что вычитать друг из друга разные показатали одной и той же группы нельзя?

Игорь

3.01.2009 - 12:12

Цитата(Statistica @ 3.01.2009 - 01:52)

Различие в начальных параметрах групп свидетельствует, что рандомизация при отборе не использовалась. К тому же неизвестно, достаточны ли численности групп.

И сами в терминологии не разобрались, и других в заблуждение вводите. К тому же не даете полную информацию об изучаемом явлении.

Если есть экспериментальная группа и контрольная группа, то они отличаются только тем, что в экспериментальной группе изучаемый фактор действует, а в контрольной - нет. Другие воздействия, имеющие влияние на исход, исключаются.

У Вас же в первой группе воздействие заключается в получении лечения + еще некоторое воздействие, а во второй - только лечение (то же самое?). Т.е. Вы изучаете не опыт и контроль, а опыт 1 (2 вида лечения) и опыт 2 (1 вид лечения), причем исходные состояния групп (патология, тяжесть?) различны. И пытаетесь получить из результата лечения влияние дополнительного воздействия, имеющего место в группе 1. В такой постановке задача не имеет решения. Еще раз отмечаю ошибки в дизайне, точнее его отсутствие.

DrgLena

3.01.2009 - 15:44

Цитата(Игорь @ 3.01.2009 - 13:12)

Различие в начальных параметрах групп свидетельствует, что рандомизация при отборе не использовалась. К тому же неизвестно, достаточны ли численности групп.

Зачем же запугивать бывшего математика такими страшными словами, как рандомизация. Проверка показала как раз отсутствие различий в уровне гемоглобина в сравниваемых группах до воздействия, повезло!
А в остальном, дизайн вполне типичный для наших диссертаций и цель тоже типичная, показать, что добавляя чего нибудь, мы в экспериментальной группе достигаем большего положительного сдвига средних значений, чем в группе сравнения. Не повезло только, что никакими средствами статистики нельзя по представленным данным сделать вывод о положительном сдвиге ни в экспериментальной, ни в контрольной группе.

Цитата(Игорь @ 3.01.2009 - 13:12)

Различие в начальных параметрах групп свидетельствует, что рандомизация при отборе не использовалась. К тому же неизвестно, достаточны ли причем исходные состояния групп (патология, тяжесть?) различны. .... В такой постановке задача не имеет решения.

Возможно, группы сравнения и не различны, т.е. всегда можно встретить дежурную фразу "группы сравнения были сопоставимы по возрасту и полу, реже пишут, что и по тяжести состояния. Я думаю, что задача имеет решение и я ее решила дисперсионным анализом для повторных измерений, но только как статистик. С точки зрения медицины, не ясно, зачем ставить перед собой задачу сравнения степени повышения гемоглобина у пациентов имеющих нормальные его значения. Например, в экспериментальной группе повышение с 156 до 166 - это расценивается как успех, а в контрольной группе изменение с 166 до 161 - как неудача.
Проблема в том, что наши медицинские диссертации посвящены как раз анализом таких "эффектов воздействия", куча показателей иммунологии, биохимии и т.д., которые могут рассматриваться только как суррогатные контрольные точки исследования, которые могут быть связаны с истинным исходом, а могут и не быть связанны с ним, занимают основное место в работах. Сдвиг средних значений - основная цель! А нужно сформулировать что такое "успех" и что такое "неудача" в лечении. А потом проанализировать что влияет на исход. Придется доказать, что повышение гемоглобина в среднем на 3,5 единицы приближает к "успеху". В чем я лично сомневаюсь.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.