Форум врачей-аспирантов > Медицинская статистика

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: Медицинская статистика

Форум врачей-аспирантов > Разделы форума > Медицинская статистика

tikitak

9.06.2005 - 14:03

Какие программы для статистики вы используете?

logvin

9.06.2005 - 15:10

Statistica 6.0

Очень хорошая программа, именно ее рекомендуют использовать для статистического анализа центральные научно-медицинские журналы.

medreview

10.06.2005 - 16:34

Полностью согласен с Евгением.
Среди плюсов можно отметить очень хороший файл справки - можно прочитать и разобраться, если что-то не ясно.
Из минусов - есть несколько сообщений о глюках при работе с Excel' ем - вылетает при копировании из него и вставке в программу.

logvin

10.06.2005 - 16:50

Кстати, tikitak, по Statistica 6.0 есть замечательное руководство О.Ю. Ребровой "Статистический анализ медицинских данных". Полгода назад его можно было заказать по почте в издательстве "Медиа Сфера" http://www.mediasphera.ru

tikitak

13.06.2005 - 18:20

Спасибо за информацию! Вот только где можно эту программу раздобыть?

medreview

21.06.2005 - 21:25

У меня дистрибутив есть. 80 метров. Надо продумать технические вопросы по передаче.
Но учтите, Вы будете использовать пиратскую копию программы, в некоторых странах это будет грозить судебным преследованием

logvin

22.06.2005 - 05:22

Цитата

У меня дистрибутив есть. 80 метров. Надо продумать технические вопросы по передаче.

По моим приблизительным подсчетам файл "весом" 80 Мб модем будет качать не менее 7 часов. Час Интернета стоит около 15 руб.

Цитата

Вы будете использовать пиратскую копию программы

Трудно будет найти в Росии хостинг, на котором разрешат разместить "крякнутую" программу. SkyWeb точно не разрешит

tikitak, купите диск с Statistica 6.0
Обычно в каждом городе есть своя компьютерная "Горбушка" - туда и сходите за диском.

medreview

22.06.2005 - 22:06

Зачем же по модему качать такие файлы? На худой конец по выделенке с безлимитным тарифом или просто бесплатной (в месте учебы или работы).

Уважаемый tikitak, если Вы живете в Москве, и не сможете закачать программу по сети, и не сможете (как верно сказал Евгений) купить диск на Горбушке - я его там видел, с хорошим кряком - 200 р - то я Вам могу передать его лично.

lma

29.06.2005 - 18:55

Я всё сделал в Экселе. Коэффициент корреляции Эксель считает без проблем, набил ещё пару-тройку формул от руки (сигма, процентное распределение, хи-квадрат для четырёхпольной таблицы) и, как ни странно, этого на всё хватило.

mila

5.09.2005 - 10:34

Скажите пожалуйста, може кто-то знает, какие расчеты необходимо сделать для обработки полученных данных (обследовано 27 пациентов, смотрели биохиимические показатели), это надо для статьи (достоверность и т.д.) и есть ли эти функции в Экселе ??? У меня статистика только зимой, а шеф требует статью

Leonov

6.09.2005 - 05:31

Цитата(mila @ 5.09.2005 - 07:34)

[snapback]701[/snapback]

Перечень используемых методов статистического анализа определяется перечнем решаемых задач исследования. Можете выслать мне Ваши данные с их описанием (примеры описания см. на БИОМЕТРИКА ) Я помогу Вам с формированием такого перечня. Мой мэйл есть на первой странице сайта БИОМЕТРИКА

logvin

9.10.2005 - 16:36

На сайте Виталия Герасевича появилась статья Современное программное обеспечение для статистической обработки биомедицинских исследований

Barabek

3.03.2006 - 10:48

Всем Привет!

Пользуюсь SigmaStat. Удобная програмулина (на английском). Хороший справочник. Сам подсказывает методы, проверяет на Normality. Без проблем работает с Excel Access. Сказал бы "исчерпывающий" инструмент для статистической обработки.

Оля

10.03.2006 - 21:35

Всем привет! помогите мне пожалуйста - как рассчитать величину р и ошибку средней? у меня все данные в Excel.
заранее спасибо!

Choledochus

14.03.2006 - 12:32

Есть переплетённая ксерокопия известной серьёзной, но адаптированной для медиков и биологов книжки: P.Armitage, G Berry. Statistical Methods In Medical Research. Second edition.- 560с. Из-во Blackwell.
Язык - английский.
Судя по ссылкам в западной литературе она на порядок цитируется больше, чем переведённая Гланц С. Медико-биологическая статистика.

Состояние идеальное. Советую тем, кто хочет реально разобраться в этом предмете (не на уровне вшитых возможностей Excel)

Dr_Andrew

16.03.2006 - 10:00

Цитата(Оля @ 10.03.2006 - 21:35)

Всем привет! помогите мне пожалуйста - как рассчитать величину р и ошибку средней? у меня все данные в Excel.

Думал, что скажут своё слово профессионалы биостатистики, но эксперты молчат, поэтому приходится брать слово дилетанту.

Ну, чем могу - помогу.

Excel позволяет оценить уровень значимости (p) с использованием встроенной функции ТТЕСТ. В медицине считается достаточным уровень значимости, равный 0,05. Уровень значимости означает вероятность случайного наступления изучаемого события. Поэтому при p < 0,05 случайное наступление события считется маловероятным, и с вероятностью безошибочного прогноза 95% мы можем утверждать, что наступление события неслучайно.
p используют для сравнения двух групп (обычно исследуемая / опытная и контрольная) по так называемому критерию различия t (Стъюдента). Если говорить просто: к примеру, есть 2 группы лихорадящих больных. Одним давали некий препарат, во второй группе - нет. Проще всего сравнить 2 группы по средним температуры. Однако выявленное различие (если оно есть) может быть и случайным. По этому поводу есть известный медицинский анекдот: если сложить температуру лихорадящих больных в больнице с температурой умерших, то получившаяся средняя температура будет нормальной.

Поэтому выдвигается гипотеза: "Средние двух выборок относятся к одной и той же совокупности". Критерий Стъюдента t позволяет найти вероятность того, что обе средних относятся к одной совокупности (т.е. различия между средними случайны). Если же эта вероятность НИЖЕ уровня принятого уровня значимости (в нашем случае p < 0,05), то различие между средними двух групп НЕСЛУЧАЙНЫ.
Следует помнить, что могут быть два варианта постановки задачи оценки различия двух групп:
1) группы состоят из различных больных (например, оценка эффективности применения ципрофлоксацина у больных с кишечными инфекциями по сравнению с эффективности ципрофлоксацина у больных с пневмониями);
2) группы состоят из одних и тех же больных, но до и после применения лечебного воздействия (см. пример выше).
Для чего вся эта теория? Дело в том, что Вы не указали, для какого типа задачи необходимо вычислять p. А в Excel критерий Стъюдента для каждого типа задач вычисляется по-разному. Можете поверить мне на слово (а можете проверить), что при одинаковых исходных данных значения различных типов критерия Стъюдента будут отличаться.

Недаром говорится, что есть три способа донести до собеседника информацию: 1) говорить правду, 2) врать и 3) статистика...

Маленькое отступление: в этой связи вспоминается работа, в которой одна бойкая тётенька "исходя из позиций доказательной медицины представила убедительные данные о большей эффективности применения сердечных гликозидов при лечении дифтерийных миокардитов у детей по сравнению со стрихнина нитратом".

А тётенька просто поручила медицинскому статистику провести расчёт, на основании которого и сделала свои грандиозные выводы. Та подобрала группы (методом сплошной выборки), руководствуясь признаками 1) дифтерийный миокардит в диагнозе; 2) применение либо сердечных гликозидов, либо стрихнина нитрата в лечении. При этом не учитывалось, что а) при лёгкой степени дифтерийных миокардитов могут отсутствовать нарушения проводимости; б) у пролеченных противодифтерийной сывороткой больных (т.е. при нейтрализации дифтерийного токсина) при сохраняющейся сердечной недостаточности сердечные гликозиды могут осторожно применяться с неплохим успехом. Т.е. был нарушен принцип однородности подбора групп, т.к. медицинский статистик была в этом вопросе некомпетентна. А ведь это дело чуть было не пошло в стандарты лечения, "исходя из принципов доказательной медицины", поскольку с точки зрения математики всё было безупречно. К счастью, в Казахстане врачи слишком хорошо помнят эпидемию дифтерии 1995-1998 гг. и знают, что такое полная поперечная блокада, разрыв сердечной мышцы, и почему назначить гликозид больному дифтерией в разгар заболевания - это лучший способ его убить, так что ляп не прошёл (а вот в России я аналогичную работу встречал на вполне официальном уровне). Я к тому, что для самого себя нужно чётко формулировать задачу, не полагаться на мнение гуру и помнить, что применение статистики в медицине (которое сейчас туманно и напыщенно именуют "доказательной медициной", как будто иная медицина бездоказательна) не имеет смысла без других методов исследования (описательно-исторического, анализа нормативных документов, экспертных оценок и т.д. и т.п.). Но это лирическое отступление. Теперь конкретно к задачам.
Вариант 1 (см. выше)
Вводим в столбик (т.е. скажем, в ячейку A1, A2, A3 и т.п.) в Excel измеренные значения признака / варианты первой группы (например, температуру тела, общий билирубин венозной крови и т.п.) цифрами. То же - для второй группы (лучше рядом - в ячейки B1, B2, B3 и т.п.). В свободную ячейку, куда будет выводиться результат (например, C1), установим табличный курсор. После этого нажать на панели инструментов кнопку Вставка функции (fx). В появившемся диалоговом окне Мастер функций выбрать категорию Статистические и функцию ТТЕСТ, после чего нажать кнопку ОК. Отодвинуть появившееся диалоговое окно вправо от данных. Указателем мыши ввести диапазон данных первой группы (первый столбик) в поле Массив 1. В поле Массив 2 ввести диапазон данных второй группы (второй столбик). В поле Хвосты всегда вводится цифра 2, а в поле Тип цифру 3 (цифра 3 вводится для того, чтобы указатьСельке, что нужно рассчитывать критерий Стъюдента для независимых групп - так называемый двухвыборочный t-критерий). Всё! Жмём ОК и в ячейке C1 смотрим результат вероятности. Эту цифру сравниваем с принятым уровнем значимости (p = 0.05). So, если наша цифра больше 0,05, то нулевая гипотеза принимается - различие между группами недостоверно. Если же меньше - нулевая гипотеза отвергается (различие достоверно).
Вариант 2. Всё то же самое, но в поле тип вводим цифру 1. При тех же данных результат другой.

Я так долго расписывал Excel потому, что это было указано в условии представления данных. Но вообще-то, если у Вас пиратский софт (а судя по репликам на форуме, что "диск с программой недорого стоит" именно он у вас и стоит

), то вас могут посадить на 3 года. В России это ПОКА не так, но в США и у нас, в Казахстане запросто могут посадить не только распространителя, но и конечного потребителя крякнутого ("дешёвого") софта. Для тех, кто не знал: нормальный (законный) офис (я о наборе программ) стоит примерно с половину хорошего компа без монитора. Кстати, если Вы делаете работу по гранту, и грантодатель ЗАПОДОЗРИТ, что Вы используете нелегальщину для проведения расчётов, то Вы лишитесь всех денежек в момент, а то и свои заплатите.
Поэтому пользуйтесь свободным (официально бесплатным) софтом. OpenOffice Calc, например. Весь расчёт, как для Excel. Единственно, жать кнопу Мастер: функции, данные вводятся в поля Данные 1 и Данные 2, для задачи 1 в поле Режим ввести 2, а для задачи 2 - 1 (т.е. всё наоборот получилось

), в поле Тип вводите 2 (т.е. два хвоста).
При использовании Excel, да и других универсальных статистических пакетов, как мы видим, достаточно неудобно вводить расчётные данные (плохая эргономика) и вызывать соответствующие расчётные функции именно из-за универсальности программ. Кроме того, будьте готовы к тому, что если значение вероятности окажется слишком маленьким, то вместо цифр в ячейке вы увидете кракозяблы, и придётся править формат вывода вручную. Кроме того, к недостаткам можно отнести отсутствие промежуточных результатов вычислений, которые часто тоже нужны.
Поэтому для себя я написал программу, рассчитывающую коэффициент Стъюдента и активно ей пользуюсь. Те, кто сидит под Linux, могут забрать её здесь: http://www.linmedsoft.narod.ru/KVars.zip
Скриншот программы здесь: http://www.linmedsoft.narod.ru/KVars.png
Но лучше подождите обновления, т.к. вчера я подготовил версию 1.1 программы (встроил защиту от дурака, которая мне самому как-то не нужна была...

). О популярности KVars говорит то, что она уже замелькала на варезных сайтах с пометкой "автор неизвестен".

Учитывая многочисленные просьбы трудящихся, я откомпилировал версию и под Windows, так что желающие могут подождать моего отдельного объявления. А пока - пользуйтесь OpenOffice, ну его в баню, этот проприетарный софт.

Малыш

15.04.2006 - 14:59

Цитата(Dr_Andrew @ 16.03.2006 - 11:00) [snapback]1205[/snapback]

Вводим в столбик (т.е. скажем, в ячейку A1, A2, A3 и т.п.) в Excel измеренные значения признака / варианты первой группы (например, температуру тела, общий билирубин венозной крови и т.п.) цифрами. То же - для второй группы (лучше рядом - в ячейки B1, B2, B3 и т.п.).

Не понял, вводятся усредненные значения разных параметров (температура, кровь, АД, и др.) всей группы, или же разные показатели одного параметра в пределах группы?? Ведь в ответ на действие одного фактора не все параметры будут изменяться одинаково интенсивно... Если, к примеру, нужно оценить достоверность изменений количества (Х) различных клеток в биоптате (в N полях зрения) до и после терапии, следует вводить N значений в N ячеек (А1-А3... и В1-В3... ) соответственно, и делать это Х раз? Или можно сразу использовать средние арифметические (М)? Но тогда столбиков не получится... Что-то никак не въеду....

Dr_Andrew

18.04.2006 - 12:03

Цитата(Малыш @ 15.04.2006 - 14:59) [snapback]1304[/snapback]

Пример для оценки различий средних по t-критерию Стъюдента в случае связанных друг с другом данных.
Группа из 7 больных, которым измеряется билирубин в жёлчи до и после дуоденального введения пенициллина.
Вначале расположим цифры билирубина, измеренные до лечения ОДНОКРАТНО (1-й столбик - ячейки A1-A7):
62
100
50
100
100
200
210
Потом внесём в ячейки B1-B7 (2-й столбик) цифры билирубина, измеренные после введения пенициллина (после лечения):
100
100
200
106
210
200
300
Тогда в ячейке C1 можно будет представить результат, запустив Мастер функций по вышееописанной методе.
Что до конкретно Вашего примера, то, число клеток подсчитывается в трёх полях зрения, после чего берётся среднее арифметическое от количеств клеток в этих полях. Но! Эта средняя и будет считаться однократным измерением признака, вариантой, которая и заносится в ячейку таблицы Excel.

Leonov

18.04.2006 - 12:46

Забавно наблюдать всю эту переписку

Так и хочется сказать "Ржунимогу"

Коллеги, пора понять, что таким образом невозможно научить делать что-то полезное и серьёзное. Пустая трата времени. Для дилетанта всё кажется очень просто: ввёл числа в столбцы, нажал на кнопки в его программулине, и вот он, долгожданный ответ. Интересно, читал ли он когда-нибудь о проблеме Беренса-Фишера? Знает ли он о том, что использование критерия Стьюдента имеет некоторые ограничения, и что проверить эти ограничения необходимо до того, как вычислять этот самый критерий Стьюдента? С таким же успехом можно заочно обучать хирурга ампутации, акушера принимать роды, стоматолога лечить зубы и т.д. Впрочем, одно лишь утешает, что никто эти статьи с такими результатами использования статистики воспринимать всерьёз не будет, и нужны они лишь для галочки при очередном подведении итогов "социалистического соревнования"

И печатают их обычно в "братских могилах", то бишь в сборниках тезисов докладов конфренциq в Урюпинске или Мухосранске. Учиться надо, однако, "товарисщ аспирант"

Dr_Andrew

18.04.2006 - 14:18