Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Медицинская статистика
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
tikitak
Какие программы для статистики вы используете?
logvin
Statistica 6.0

Очень хорошая программа, именно ее рекомендуют использовать для статистического анализа центральные научно-медицинские журналы.
medreview
Полностью согласен с Евгением.
Среди плюсов можно отметить очень хороший файл справки - можно прочитать и разобраться, если что-то не ясно.
Из минусов - есть несколько сообщений о глюках при работе с Excel' ем - вылетает при копировании из него и вставке в программу.
logvin
Кстати, tikitak, по Statistica 6.0 есть замечательное руководство О.Ю. Ребровой "Статистический анализ медицинских данных". Полгода назад его можно было заказать по почте в издательстве "Медиа Сфера" http://www.mediasphera.ru
tikitak
Спасибо за информацию! Вот только где можно эту программу раздобыть?
medreview
У меня дистрибутив есть. 80 метров. Надо продумать технические вопросы по передаче.
Но учтите, Вы будете использовать пиратскую копию программы, в некоторых странах это будет грозить судебным преследованием smile.gif
logvin
Цитата
У меня дистрибутив есть. 80 метров. Надо продумать технические вопросы по передаче.

По моим приблизительным подсчетам файл "весом" 80 Мб модем будет качать не менее 7 часов. Час Интернета стоит около 15 руб.

Цитата
Вы будете использовать пиратскую копию программы

Трудно будет найти в Росии хостинг, на котором разрешат разместить "крякнутую" программу. SkyWeb точно не разрешит wink.gif

tikitak, купите диск с Statistica 6.0
Обычно в каждом городе есть своя компьютерная "Горбушка" - туда и сходите за диском.
medreview
Зачем же по модему качать такие файлы? На худой конец по выделенке с безлимитным тарифом или просто бесплатной (в месте учебы или работы).

Уважаемый tikitak, если Вы живете в Москве, и не сможете закачать программу по сети, и не сможете (как верно сказал Евгений) купить диск на Горбушке - я его там видел, с хорошим кряком - 200 р - то я Вам могу передать его лично.
lma
Я всё сделал в Экселе. Коэффициент корреляции Эксель считает без проблем, набил ещё пару-тройку формул от руки (сигма, процентное распределение, хи-квадрат для четырёхпольной таблицы) и, как ни странно, этого на всё хватило.
mila
Скажите пожалуйста, може кто-то знает, какие расчеты необходимо сделать для обработки полученных данных (обследовано 27 пациентов, смотрели биохиимические показатели), это надо для статьи (достоверность и т.д.) и есть ли эти функции в Экселе ??? У меня статистика только зимой, а шеф требует статью eek.gif
Leonov
Цитата(mila @ 5.09.2005 - 07:34)
Скажите пожалуйста, може кто-то знает, какие расчеты необходимо сделать для обработки полученных данных (обследовано 27 пациентов, смотрели биохиимические показатели), это надо для статьи (достоверность и т.д.) и есть ли эти функции в Экселе?
[snapback]701[/snapback]

Перечень используемых методов статистического анализа определяется перечнем решаемых задач исследования. Можете выслать мне Ваши данные с их описанием (примеры описания см. на БИОМЕТРИКА ) Я помогу Вам с формированием такого перечня. Мой мэйл есть на первой странице сайта БИОМЕТРИКА
Barabek
Всем Привет!

Пользуюсь SigmaStat. Удобная програмулина (на английском). Хороший справочник. Сам подсказывает методы, проверяет на Normality. Без проблем работает с Excel Access. Сказал бы "исчерпывающий" инструмент для статистической обработки.
Оля
Всем привет! помогите мне пожалуйста - как рассчитать величину р и ошибку средней? у меня все данные в Excel.
заранее спасибо!
Choledochus
Есть переплетённая ксерокопия известной серьёзной, но адаптированной для медиков и биологов книжки: P.Armitage, G Berry. Statistical Methods In Medical Research. Second edition.- 560с. Из-во Blackwell.
Язык - английский.
Судя по ссылкам в западной литературе она на порядок цитируется больше, чем переведённая Гланц С. Медико-биологическая статистика.

Состояние идеальное. Советую тем, кто хочет реально разобраться в этом предмете (не на уровне вшитых возможностей Excel)
Dr_Andrew
Цитата(Оля @ 10.03.2006 - 21:35)
Всем привет! помогите мне пожалуйста - как рассчитать величину р и ошибку средней? у меня все данные в Excel.

Думал, что скажут своё слово профессионалы биостатистики, но эксперты молчат, поэтому приходится брать слово дилетанту. rolleyes.gif Ну, чем могу - помогу. cool.gif
Excel позволяет оценить уровень значимости (p) с использованием встроенной функции ТТЕСТ. В медицине считается достаточным уровень значимости, равный 0,05. Уровень значимости означает вероятность случайного наступления изучаемого события. Поэтому при p < 0,05 случайное наступление события считется маловероятным, и с вероятностью безошибочного прогноза 95% мы можем утверждать, что наступление события неслучайно.
p используют для сравнения двух групп (обычно исследуемая / опытная и контрольная) по так называемому критерию различия t (Стъюдента). Если говорить просто: к примеру, есть 2 группы лихорадящих больных. Одним давали некий препарат, во второй группе - нет. Проще всего сравнить 2 группы по средним температуры. Однако выявленное различие (если оно есть) может быть и случайным. По этому поводу есть известный медицинский анекдот: если сложить температуру лихорадящих больных в больнице с температурой умерших, то получившаяся средняя температура будет нормальной. wink.gif Поэтому выдвигается гипотеза: "Средние двух выборок относятся к одной и той же совокупности". Критерий Стъюдента t позволяет найти вероятность того, что обе средних относятся к одной совокупности (т.е. различия между средними случайны). Если же эта вероятность НИЖЕ уровня принятого уровня значимости (в нашем случае p < 0,05), то различие между средними двух групп НЕСЛУЧАЙНЫ.
Следует помнить, что могут быть два варианта постановки задачи оценки различия двух групп:
1) группы состоят из различных больных (например, оценка эффективности применения ципрофлоксацина у больных с кишечными инфекциями по сравнению с эффективности ципрофлоксацина у больных с пневмониями);
2) группы состоят из одних и тех же больных, но до и после применения лечебного воздействия (см. пример выше).
Для чего вся эта теория? Дело в том, что Вы не указали, для какого типа задачи необходимо вычислять p. А в Excel критерий Стъюдента для каждого типа задач вычисляется по-разному. Можете поверить мне на слово (а можете проверить), что при одинаковых исходных данных значения различных типов критерия Стъюдента будут отличаться. wink.gif
Недаром говорится, что есть три способа донести до собеседника информацию: 1) говорить правду, 2) врать и 3) статистика... insane.gif
Маленькое отступление: в этой связи вспоминается работа, в которой одна бойкая тётенька "исходя из позиций доказательной медицины представила убедительные данные о большей эффективности применения сердечных гликозидов при лечении дифтерийных миокардитов у детей по сравнению со стрихнина нитратом". eek.gif А тётенька просто поручила медицинскому статистику провести расчёт, на основании которого и сделала свои грандиозные выводы. Та подобрала группы (методом сплошной выборки), руководствуясь признаками 1) дифтерийный миокардит в диагнозе; 2) применение либо сердечных гликозидов, либо стрихнина нитрата в лечении. При этом не учитывалось, что а) при лёгкой степени дифтерийных миокардитов могут отсутствовать нарушения проводимости; б) у пролеченных противодифтерийной сывороткой больных (т.е. при нейтрализации дифтерийного токсина) при сохраняющейся сердечной недостаточности сердечные гликозиды могут осторожно применяться с неплохим успехом. Т.е. был нарушен принцип однородности подбора групп, т.к. медицинский статистик была в этом вопросе некомпетентна. А ведь это дело чуть было не пошло в стандарты лечения, "исходя из принципов доказательной медицины", поскольку с точки зрения математики всё было безупречно. К счастью, в Казахстане врачи слишком хорошо помнят эпидемию дифтерии 1995-1998 гг. и знают, что такое полная поперечная блокада, разрыв сердечной мышцы, и почему назначить гликозид больному дифтерией в разгар заболевания - это лучший способ его убить, так что ляп не прошёл (а вот в России я аналогичную работу встречал на вполне официальном уровне). Я к тому, что для самого себя нужно чётко формулировать задачу, не полагаться на мнение гуру и помнить, что применение статистики в медицине (которое сейчас туманно и напыщенно именуют "доказательной медициной", как будто иная медицина бездоказательна) не имеет смысла без других методов исследования (описательно-исторического, анализа нормативных документов, экспертных оценок и т.д. и т.п.). Но это лирическое отступление. Теперь конкретно к задачам.
Вариант 1 (см. выше)
Вводим в столбик (т.е. скажем, в ячейку A1, A2, A3 и т.п.) в Excel измеренные значения признака / варианты первой группы (например, температуру тела, общий билирубин венозной крови и т.п.) цифрами. То же - для второй группы (лучше рядом - в ячейки B1, B2, B3 и т.п.). В свободную ячейку, куда будет выводиться результат (например, C1), установим табличный курсор. После этого нажать на панели инструментов кнопку Вставка функции (fx). В появившемся диалоговом окне Мастер функций выбрать категорию Статистические и функцию ТТЕСТ, после чего нажать кнопку ОК. Отодвинуть появившееся диалоговое окно вправо от данных. Указателем мыши ввести диапазон данных первой группы (первый столбик) в поле Массив 1. В поле Массив 2 ввести диапазон данных второй группы (второй столбик). В поле Хвосты всегда вводится цифра 2, а в поле Тип цифру 3 (цифра 3 вводится для того, чтобы указатьСельке, что нужно рассчитывать критерий Стъюдента для независимых групп - так называемый двухвыборочный t-критерий). Всё! Жмём ОК и в ячейке C1 смотрим результат вероятности. Эту цифру сравниваем с принятым уровнем значимости (p = 0.05). So, если наша цифра больше 0,05, то нулевая гипотеза принимается - различие между группами недостоверно. Если же меньше - нулевая гипотеза отвергается (различие достоверно).
Вариант 2. Всё то же самое, но в поле тип вводим цифру 1. При тех же данных результат другой. wink.gif
Я так долго расписывал Excel потому, что это было указано в условии представления данных. Но вообще-то, если у Вас пиратский софт (а судя по репликам на форуме, что "диск с программой недорого стоит" именно он у вас и стоит rolleyes.gif ), то вас могут посадить на 3 года. В России это ПОКА не так, но в США и у нас, в Казахстане запросто могут посадить не только распространителя, но и конечного потребителя крякнутого ("дешёвого") софта. Для тех, кто не знал: нормальный (законный) офис (я о наборе программ) стоит примерно с половину хорошего компа без монитора. Кстати, если Вы делаете работу по гранту, и грантодатель ЗАПОДОЗРИТ, что Вы используете нелегальщину для проведения расчётов, то Вы лишитесь всех денежек в момент, а то и свои заплатите.
Поэтому пользуйтесь свободным (официально бесплатным) софтом. OpenOffice Calc, например. Весь расчёт, как для Excel. Единственно, жать кнопу Мастер: функции, данные вводятся в поля Данные 1 и Данные 2, для задачи 1 в поле Режим ввести 2, а для задачи 2 - 1 (т.е. всё наоборот получилось laugh.gif ), в поле Тип вводите 2 (т.е. два хвоста).
При использовании Excel, да и других универсальных статистических пакетов, как мы видим, достаточно неудобно вводить расчётные данные (плохая эргономика) и вызывать соответствующие расчётные функции именно из-за универсальности программ. Кроме того, будьте готовы к тому, что если значение вероятности окажется слишком маленьким, то вместо цифр в ячейке вы увидете кракозяблы, и придётся править формат вывода вручную. Кроме того, к недостаткам можно отнести отсутствие промежуточных результатов вычислений, которые часто тоже нужны.
Поэтому для себя я написал программу, рассчитывающую коэффициент Стъюдента и активно ей пользуюсь. Те, кто сидит под Linux, могут забрать её здесь: http://www.linmedsoft.narod.ru/KVars.zip
Скриншот программы здесь: http://www.linmedsoft.narod.ru/KVars.png
Но лучше подождите обновления, т.к. вчера я подготовил версию 1.1 программы (встроил защиту от дурака, которая мне самому как-то не нужна была... laugh.gif ). О популярности KVars говорит то, что она уже замелькала на варезных сайтах с пометкой "автор неизвестен". rolleyes.gif Учитывая многочисленные просьбы трудящихся, я откомпилировал версию и под Windows, так что желающие могут подождать моего отдельного объявления. А пока - пользуйтесь OpenOffice, ну его в баню, этот проприетарный софт. cool.gif
Малыш
Цитата(Dr_Andrew @ 16.03.2006 - 11:00) [snapback]1205[/snapback]
Вводим в столбик (т.е. скажем, в ячейку A1, A2, A3 и т.п.) в Excel измеренные значения признака / варианты первой группы (например, температуру тела, общий билирубин венозной крови и т.п.) цифрами. То же - для второй группы (лучше рядом - в ячейки B1, B2, B3 и т.п.).


Не понял, вводятся усредненные значения разных параметров (температура, кровь, АД, и др.) всей группы, или же разные показатели одного параметра в пределах группы?? Ведь в ответ на действие одного фактора не все параметры будут изменяться одинаково интенсивно... Если, к примеру, нужно оценить достоверность изменений количества (Х) различных клеток в биоптате (в N полях зрения) до и после терапии, следует вводить N значений в N ячеек (А1-А3... и В1-В3... ) соответственно, и делать это Х раз? Или можно сразу использовать средние арифметические (М)? Но тогда столбиков не получится... Что-то никак не въеду.... frown.gif
Dr_Andrew
Цитата(Малыш @ 15.04.2006 - 14:59) [snapback]1304[/snapback]
Не понял, вводятся усредненные значения разных параметров (температура, кровь, АД, и др.) всей группы, или же разные показатели одного параметра в пределах группы?? Ведь в ответ на действие одного фактора не все параметры будут изменяться одинаково интенсивно... Если, к примеру, нужно оценить достоверность изменений количества (Х) различных клеток в биоптате (в N полях зрения) до и после терапии, следует вводить N значений в N ячеек (А1-А3... и В1-В3... ) соответственно, и делать это Х раз? Или можно сразу использовать средние арифметические (М)? Но тогда столбиков не получится... Что-то никак не въеду.... frown.gif


Пример для оценки различий средних по t-критерию Стъюдента в случае связанных друг с другом данных.
Группа из 7 больных, которым измеряется билирубин в жёлчи до и после дуоденального введения пенициллина.
Вначале расположим цифры билирубина, измеренные до лечения ОДНОКРАТНО (1-й столбик - ячейки A1-A7):
62
100
50
100
100
200
210
Потом внесём в ячейки B1-B7 (2-й столбик) цифры билирубина, измеренные после введения пенициллина (после лечения):
100
100
200
106
210
200
300
Тогда в ячейке C1 можно будет представить результат, запустив Мастер функций по вышееописанной методе.
Что до конкретно Вашего примера, то, число клеток подсчитывается в трёх полях зрения, после чего берётся среднее арифметическое от количеств клеток в этих полях. Но! Эта средняя и будет считаться однократным измерением признака, вариантой, которая и заносится в ячейку таблицы Excel.
Leonov
Забавно наблюдать всю эту переписку laugh.gif Так и хочется сказать "Ржунимогу" eek.gif Коллеги, пора понять, что таким образом невозможно научить делать что-то полезное и серьёзное. Пустая трата времени. Для дилетанта всё кажется очень просто: ввёл числа в столбцы, нажал на кнопки в его программулине, и вот он, долгожданный ответ. Интересно, читал ли он когда-нибудь о проблеме Беренса-Фишера? Знает ли он о том, что использование критерия Стьюдента имеет некоторые ограничения, и что проверить эти ограничения необходимо до того, как вычислять этот самый критерий Стьюдента? С таким же успехом можно заочно обучать хирурга ампутации, акушера принимать роды, стоматолога лечить зубы и т.д. Впрочем, одно лишь утешает, что никто эти статьи с такими результатами использования статистики воспринимать всерьёз не будет, и нужны они лишь для галочки при очередном подведении итогов "социалистического соревнования" weep.gif И печатают их обычно в "братских могилах", то бишь в сборниках тезисов докладов конфренциq в Урюпинске или Мухосранске. Учиться надо, однако, "товарисщ аспирант" smile.gif
Dr_Andrew
Цитата(Leonov @ 18.04.2006 - 12:46) [snapback]1323[/snapback]
Так и хочется сказать "Ржунимогу" eek.gif


Тем не менее, не надо. Уж не знаю, за какие заслуги руководство сайта назначило меня модератором, но я активный участник движения "мы умеем говорить по-русски". Никаких "аффтаров", буду плюсить! wink.gif

Цитата(Leonov @ 18.04.2006 - 12:46) [snapback]1323[/snapback]
Коллеги, пора понять, что таким образом невозможно научить делать что-то полезное и серьёзное. Пустая трата времени.


Каким образом? Путём переписки в форуме? Ну, если это Ваша позиция, то зачем Вы здесь? Или Вы имеете в виду что-то другое? Тогда поконкретнее, если можно... rolleyes.gif

Цитата(Leonov @ 18.04.2006 - 12:46) [snapback]1323[/snapback]
Для дилетанта всё кажется очень просто: ввёл числа в столбцы, нажал на кнопки в его программулине, и вот он, долгожданный ответ. Интересно, читал ли он когда-нибудь о проблеме Беренса-Фишера? Знает ли он о том, что использование критерия Стьюдента имеет некоторые ограничения, и что проверить эти ограничения необходимо до того, как вычислять этот самый критерий Стьюдента?


Полагаю, что да, поскольку а) это разбирается в рамках подготовки к экзамену кандидатского минимума "Медицинская информатика и обработка медико-биологических данных" (другой разговор, что это смотря в каком ВУЗе, а то ведь бывает, что выпускник медико-профилактического!!! факультета на предложение посчитать линейную эпидемическую тенденцию отвечает "Нас этому не учили" frown.gif ); б) если уж человек берётся применять метод, то он знает сам или от друзей, область и ограничения его применения. Я лично предпочитаю о собравшихся здесь думать хорошо, если только они не докажут обратного.
Ну а если кто о проблеме Беренса-Фишера и не слыхал, то может прочитать об этом на Вашем сайте здесь ( http://www.biometrica.tomsk.ru/lis/index27.htm ), благо, эта страница у Вас незапаролена. wink.gif
Видите, какое полезное дело форум? Вот Ваш сайт прорекламировали, да заодно и некое число народа просветили. А Вы ржать собирались... smile.gif
Правда, она (статья) у Вас несколько неконкретна, не даёт рецепта решения. Более подробный разбор применения критерия Стъюдента (если опять-таки кто интересуется) можно найти в статье А.И. Орлова здесь: http://www.statplus.net.ua/ru/lib/homogen_check.php
Там, кстати, предлагается альтернативный Стъюденту метод проверки однородности независимых выборок - критерий Крамера-Уэлча.
Кстати, кому интересно, решить упомянутую проблему Беренса-Фишера можно, рассчитав критерий Пагуровой с помощью вот этой программы ( http://www.download.ru/russian/sp/13175.htm?cc - да, да, ещё одна программа-самоделка Алексея Симачёва); она, правда, 500 рублей стоит, но всё дешевле буржуинской Statistica...

Цитата(Leonov @ 18.04.2006 - 12:46) [snapback]1323[/snapback]
С таким же успехом можно заочно обучать хирурга ампутации, акушера принимать роды, стоматолога лечить зубы и т.д.


Хм... как ремарка: но Вы же статистике заочно учите??? eek.gif Как насчёт Вашего дистантного курса?
Что до форума, то тут ведь не учат ничему, собственно. Тут дают конкретные ответы на конкретные вопросы. Способствуют поиску необходимой информации. Вы бы, как специалист, тоже подключались, а то: то язвите не по теме, то ссылки на запароленные страницы даёте. А на последнее ведь можно посмотреть и как на нарушение пункта 5-го правил форума (несанкционированная реклама), как модератор отмечаю... frown.gif

Цитата(Leonov @ 18.04.2006 - 12:46) [snapback]1323[/snapback]
Учиться надо, однако, "товарисщ аспирант" smile.gif


Это-то бесспорно... Только Вы к кому это адресуете? Кто тут не учится? cool.gif
patator
Dr_Andrew
Кроме 0.05 варианты уровня значимости не рассматриваются?
И как это применить при сравнении процентов?
В частности при нулевом значении. Например А1=0% B1=22.3%
N-Danava
Использование Экселя для статистической обработки результатов выдает статистическую беспомощность автора. Во-первых в Экселе ее толком не провести или нужна очень высокая математико-статистическая квалификация исследователя, во-вторых уже давно доказано, что функции, встроенные в микросовтоские статистические библиотеки ошибаются и не проходят тестов, которые должна проходить серьезная стат. программа (могу дать ссылки). По крайней мере лучше не включать в раздел материалов и методов фразу об использовании Экселя. Наиболее серьезные проги - SAS, Minitab, возможно, SPSS. Statistica - более облегченный вариант, но безусловно очень удобный. Одно из удобств - нахождение всех модулей в одной программе, а не в куче. Делаю в ней около 70% всех расчетов. Для аспирантов и научных работников рекомендую также бесплатный шедевр - KyPlot. Понимает файлы экселя напрямую и просто не имеет аналогов по возможностям создания научной графики. Единственный минус - нужна винда на FAT32, под NTFS глючит и не сохраняет русский шрифт в графиках. Последняя бесплатная версия ныне коммерческой проги: http://freestatistics.altervista.org/kyp2b15.zip

Цитата(patator @ 26.05.2006 - 17:39) [snapback]1420[/snapback]
Кроме 0.05 варианты уровня значимости не рассматриваются?
И как это применить при сравнении процентов?
В частности при нулевом значении. Например А1=0% B1=22.3%

Рассматриваются. 0,05 может быть мягким уровнем для строгого эксперимента (нужно 0,01) или слишком жестким для разведочного анализа (достаточно 0,10). Обычно случаи когда P>0,10 следует трактовать как отсутсвие чего-либо (различий, связей, зависимостей), случаи когда Р<=0,05 - напротив. Если 0,05<P<=0,10, то можно говорить о тенденции к различиям (связям, зависимостям).

С 0% - сложнее. Тесты на сравнение % основаны на распределении хи-квадрат и перестают хорошо приближать полиномиальное распределение если минимальные ожидаемые в таблице <4 или 5. Наиболее простой, но сомнительный способ - добавить ко всем ячейкам таблицы 0,5 и считать обычным пирсоновским хи-квадратом или G-критерием. Почти столь же сомнительны поправки Йейтса и Уильямса. Точное решение основано на прямом использовании биномиального или полиномиального распределения. Если таких случаев в исследовании много - скачайте прогу StatXact (около 20 метров) - она считает напрямую или (для больших таблиц) с использованием моделирования Монте-Карло. Это будет решение, достойное настоящего кандитата наук smile.gif
sleb
Цитата(N-Danava @ 5.06.2006 - 00:38) [snapback]1439[/snapback]
Использование Экселя для статистической обработки результатов выдает статистическую беспомощность автора. Во-первых в Экселе ее толком не провести или нужна очень высокая математико-статистическая квалификация исследователя, во-вторых уже давно доказано, что функции, встроенные в микросовтоские статистические библиотеки ошибаются и не проходят тестов, которые должна проходить серьезная стат. программа (могу дать ссылки). По крайней мере лучше не включать в раздел материалов и методов фразу об использовании Экселя. Наиболее серьезные проги - SAS, Minitab, возможно, SPSS. Statistica - более облегченный вариант, но безусловно очень удобный.


Не знаю что Вам выдает беспомощность автора. Мне, например, только неверные расчеты, неоправданное применение той или иной процедуры и непонимание ее смысла. Я наоборот поощряю студентов к использованию Excel. Зная нужные формулы, в нем можно посчитать все что угодно. А если студент решит просто тупо нажать на кнопку - так это ведь отразится на результате... А Вы, видимо, исходите из омерзительной оставшейся от совка практики не пересчитывать данные за автором? Пересчитайте и обнаружьте, беспомощен он или нет. Боритесь с собственной ленью, коллега.

Как Вы верно заметили, встроенные статформулы в Excel прописаны коряво. Только что же Вам помешало заметить, что не менее коряво они прописаны, например, в SPSS (по крайней мере, в тот, что ослом скачивается и по 60 рублей продается)?!
А потому что ручками все считать надо, ручками. И не надо верить дяде. Excel позволяет это делать элементарно, а синтаксис в статпакетах еще учить надо.

И ничего достойного в том чтобы как мартышка нажимать на кнопки, следуя чужим советам и получая плохо понятные цифры, я не вижу. Достойным было бы овладение наконец курсом матстата, благо свой учебник Гаральд Крамер написал не вчера, равно как не вчера его перевели на русский.
tyagirina
здравствуйте, уважаемые коллеги! Подскажите, пожалуйста, если при сравнении симптомов 3-х групп в одной есть нулевые значения, мне посоветовали избавиться от них чтобы получить достоверность, есть ли другой способ корректной оценки данных условно обозначаемых 0- не отмечен у больного, 1-слабо выражен, 2- умеренно выражен, 3 - выражен. Меня эти три с половиной сосны закружили, работаю в ста.6.0
nokh
Цитата(tyagirina @ 28.03.2011 - 21:49) *
здравствуйте, уважаемые коллеги! Подскажите, пожалуйста, если при сравнении симптомов 3-х групп в одной есть нулевые значения, мне посоветовали избавиться от них чтобы получить достоверность, есть ли другой способ корректной оценки данных условно обозначаемых 0- не отмечен у больного, 1-слабо выражен, 2- умеренно выражен, 3 - выражен. Меня эти три с половиной сосны закружили, работаю в ста.6.0

Почитайте про анализ частот. Вам нужно свести данные в таблицу сопряжённости 3 х 4 со входами "группы" и "выраженность симптома". В принципе, обсчитывается и простым хи-квадратом, но после вывода о значимом различии групп по степени выраженности симптома потребуется дополнительный анализ остатков, чтобы понять за счёт чего они проявились. Более корректный и мощный подход учтёт, что ваши 4 категории были не номинальными, а упорядоченными. В Statistica такого анализа нет, но можно посчитать вручную (см. Закс Л. Статистическое оценивание, про проверку на тренд) или воспользоваться программой StatXact. Почитайте также эту тему: http://forum.disser.ru/index.php?showtopic=2459
DrgLena
Nokh серьезно ответил на столь оригинальный вопрос, который достоин быть в самостоятельной ветке, а не быть в хвосте темы пятилетней давности.
Избавиться от больных с нулевым значением признака ?чтобы получить достоверность? - садистский ?совет?, однако. Перед корректной оценкой должно быть корректное планирование, а тут планируется непременно ?получить достоверность?. Достоверность исследования при таком подходе приближается к ?0?!
Возможно, вы хотите доказать, что 3 группы статистически не различались до проведения лечения по распределению оценок 0,1,2,3. Тогда, вполне допустимо, что в двух клетках таблицы сопряженности 4х3 будут нулевые значения и вполне возможно, что по критерию хи-квадрат группы не будут различаться. А после лечения исследователя может интересовать, в какой группе больше прибавится именно нулевых значений и это может рассматриваться как эффективность по этому признаку. Так что, от больных лучше не избавляться, а лучше планировать исследование. Хи-квадрат для тренда, но для таблиц 2хn есть также в программе MedCalc.
tyagirina
благодарю вас, все встало на свои места!
schta
1) Excel от мелкомягких (куда же без него gigi.gif )
2) Statistika 6.1 (выборка, достоверность, ну и корелляции на крайный случай)
3) SPSS v.17 (тоже бывает нужна)
p2004r
גם זו יעבור
Игорь
Цитата(schta @ 24.11.2011 - 09:49) *
1) Excel от мелкомягких (куда же без него gigi.gif )
2) Statistika 6.1 (выборка, достоверность, ну и корелляции на крайный случай)
3) SPSS v.17 (тоже бывает нужна)

Цитата(p2004r @ 24.11.2011 - 17:08) *
גם זו יעבור

1. Excel - не статистическая программа. Статистические возможности обеспечиваются надстройками, одна из которых (хотя примитивная, но считает практически верно) входит в комплект поставки. Статистические функции имеются, и они могут оказать помощь при конструировании собственных схем алгоритмов, но аналогичный набор входит и в бесплатные электронные таблицы Calc и Gnumeric. Исчезнет ли Excel? - Вряд ли, пока есть: а) желающие платить за функции, которые и так доступны бесплатно, 2) желающие украсть - полагаю, что большинство установок Excel на домашних компьютерах пользователей (я встречал лишь несколько человек, которые данный пакет купили) - ворованные.
2. Statistica - набор функций архаичен (как и у аналогов, впрочем), цена высока. Встречался только один случай, когда я видел купленную Statistica - когда покупал ее сам для своей организации (комплект - самописанный диск, размноженное на ксероксе лицензионное соглашение и электронный ключ), причем парадокс - ею не пользуются, предпочитая иные программы, например, бесплатную AtteStat. При цене 70 тысяч рублей очевидно - на домашних компьютерах уворовано почти 100% установок. На что живут разработчики - непонятно.
3. С переходом под IBM программа SPSS будет существовать вечно.
p2004r
Цитата(Игорь @ 27.11.2011 - 18:55) *
1. Excel -
2. Statistica -
3. С переходом под IBM программа SPSS будет существовать вечно.


нимало не подвергая сомнению выдвинутые тезисы, хочу добавить один штрих smile.gif

во всех трех продуктах успешно интегрирован R, причем только для ексель не силами производителя.
Игорь
Цитата(p2004r @ 27.11.2011 - 23:17) *
во всех трех продуктах успешно интегрирован R, причем только для ексель не силами производителя.

Пробовал ROOo - продукт для интеграции OpenOffice.org и R, созданный разработчиками RExcel ( http://rcom.univie.ac.at/ ), который тоже произвел странное впечатление (а именно, в чем же функционал?), но с разбегу ничего не получилось - продукт просто не работал. Есть ли примеры успешной, опробованной кем-либо лично (а не на основе рекламных сообщений) интеграции Excel и R, а также OOo и R?
p2004r
Цитата(Игорь @ 28.11.2011 - 08:41) *
Пробовал ROOo - продукт для интеграции OpenOffice.org и R, созданный разработчиками RExcel ( http://rcom.univie.ac.at/ ), который тоже произвел странное впечатление (а именно, в чем же функционал?), но с разбегу ничего не получилось - продукт просто не работал. Есть ли примеры успешной, опробованной кем-либо лично (а не на основе рекламных сообщений) интеграции Excel и R, а также OOo и R?


Я не использую электронные таблицы мне быстрее работать напрямую с data.frame с помощью [ .

Но вот техника литературного программирования вне всяких похвал для моломальски объемной работы. Обычно конечно я использую Sweave() и LaTeX, получая на выходе статью или отчет в pdf.

Но лично использовал R и odfWeave (и соответственно опенофис) в ситуации когда потребовался на конференцию именно формат ворда. Успешно smile.gif

PS вот советов кучу полезных нашел по воркфлов именно в оо http://socialdatablog.com/?tag=odfweave
Игорь
В 1992 году я экспериментировал с хранением исходных данных (ограниченных особыми тегами) в отчетах и считыванием их оттуда программой анализа с выводом результатов в тот же файл. Все исправно работало (программа называлась MegaStat for DOS - позже данное название появилось с США для обозначения совсем другого проекта и с нами никак не связано). Дальше опытов дело не пошло, т.к. показалось не слишком удобно для пользователей.

У нас пользователи даже Word осваивают с трудом, и мало кому это удается. Освоить программирование на R, программы на котором встроены в отчет - это из области фантастики. Нужно все-таки дать возможность комфортной работы в R напрямую из электронных таблиц или некоего подобия электронных таблиц, подобно классическим программам анализа данных (те же SPSS, Statistica). Именно - работать с функциями R, но без программирования в R. Например, как это сделано у меня в Ubuntu в RKWard.

Хотя, честно, удобство - понятие субъективное. Для меня проще любой сколь угодно сложный алгоритм запрограммировать на Си из командной строки без всякой графики, чем разбираться с чужой программой.
p2004r
Цитата(Игорь @ 28.11.2011 - 13:47) *
Дальше опытов дело не пошло, т.к. показалось не слишком удобно для пользователей.

У нас пользователи даже Word осваивают с трудом, и мало кому это удается. Освоить программирование на R, программы на котором встроены в отчет - это их области фантастики. Нужно все-таки дать возможность комфортной работы в R напрямую из электронных таблиц или некоего подобия электронных таблиц, подобно классическим программам анализа данных (те же SPSS, Statistica). Именно - работать с функциями R, но без программирования в R. Например, как это сделано у меня в Ubuntu в RKWard.


Все таки конечная цель пользователей текстовый документ в который вставлены таблицы, графики и конкретные числа.

Когда это происходит внутри набираемого в текстовом редакторе документа это _на порядок_ снижает сложность получения итогового отчета или статьи.

Одна вставка графики которая происходит как бы "сама собой" дорогого стоит. Представьте что 5-10 иллюстраций нужно сохранить в статпакете, потом вставить в ворд не перепутав ...

И теперь на сцену выходит основное --- после исправления любой ошибки получить чистый от неё итоговый документ ничего не стоит! Только набрать/повторить команду.

Это _настолько_ облегчает труд, что любой вменяемый человек будет учить такой способ даже если использует его раз в квартал.

Для начинающих опытный человек может написать шаблоны с уже вставленным основным кодом. Да фактически любой ранее написанный документ становится таким шаблоном.

Ну а для профессионала другого пути нет. Сложный расчет не возможно удержать в памяти, а терять из-за забывчивости возможность проверять гипотезы до которых просто в данный момент руки не успевают дойти (проверка предыдущей занимает ковыряния на пару часов хотя бы) очень даже неинтересно.

Ну и следующий шаг когда планирование (и контроль выполнения) всей работы, журнал, календарь, написание статей и программ (причем не только на R) сливаются воедино --- org-mode редактора emacs. smile.gif
yltinka
Всякая статистика обрабатывает определенное поле и по сему уникально удовлетворяющей всех статистики быть не может. Так что берем блокнот и ручку и тправляемся делать опрос.
p2004r
Цитата(yltinka @ 24.12.2011 - 21:25) *
Всякая статистика обрабатывает определенное поле и по сему уникально удовлетворяющей всех статистики быть не может. Так что берем блокнот и ручку и тправляемся делать опрос.


Вы наверное тоже из физиков? В них большой отпечаток оставила теория относительности.

Ну хоть существование "удовлетворяющей всех" таблицы умножения Вы допускаете?
Игорь
Цитата(p2004r @ 25.12.2011 - 01:34) *
Вы наверное тоже из физиков? В них большой отпечаток оставила теория относительности.

В том смысле, что вся современная космология и теория относительности, в частности, представляют собой кучу лоскутов, сшитых белыми нитками?
p2004r
Цитата(Игорь @ 25.12.2011 - 16:29) *
В том смысле, что вся современная космология и теория относительности, в частности, представляют собой кучу лоскутов, сшитых белыми нитками?


обычно просто у физиков теоретическое обоснование имеется под любой исход эксперимента, а выдвигаемые "доказательства" часто нестрогие по своей природе.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.