Цитата(Оля @ 10.03.2006 - 21:35)
Всем привет! помогите мне пожалуйста - как рассчитать величину р и ошибку средней? у меня все данные в Excel.
Думал, что скажут своё слово профессионалы биостатистики, но эксперты молчат, поэтому приходится брать слово дилетанту.

Ну, чем могу - помогу.
Excel позволяет оценить уровень значимости (p) с использованием встроенной функции ТТЕСТ. В медицине считается достаточным уровень значимости, равный 0,05. Уровень значимости означает вероятность случайного наступления изучаемого события. Поэтому при p < 0,05 случайное наступление события считется маловероятным, и с вероятностью безошибочного прогноза 95% мы можем утверждать, что наступление события неслучайно.
p используют для сравнения двух групп (обычно исследуемая / опытная и контрольная) по так называемому критерию различия t (Стъюдента). Если говорить просто: к примеру, есть 2 группы лихорадящих больных. Одним давали некий препарат, во второй группе - нет. Проще всего сравнить 2 группы по средним температуры. Однако выявленное различие (если оно есть) может быть и случайным. По этому поводу есть известный медицинский анекдот: если сложить температуру лихорадящих больных в больнице с температурой умерших, то получившаяся средняя температура будет нормальной.

Поэтому выдвигается гипотеза: "Средние двух выборок относятся к одной и той же совокупности". Критерий Стъюдента t позволяет найти вероятность того, что обе средних относятся к одной совокупности (т.е. различия между средними случайны). Если же эта вероятность НИЖЕ уровня принятого уровня значимости (в нашем случае p < 0,05), то различие между средними двух групп НЕСЛУЧАЙНЫ.
Следует помнить, что могут быть два варианта постановки задачи оценки различия двух групп:
1) группы состоят из различных больных (например, оценка эффективности применения ципрофлоксацина у больных с кишечными инфекциями по сравнению с эффективности ципрофлоксацина у больных с пневмониями);
2) группы состоят из одних и тех же больных, но до и после применения лечебного воздействия (см. пример выше).
Для чего вся эта теория? Дело в том, что Вы не указали, для какого типа задачи необходимо вычислять p. А в Excel критерий Стъюдента для каждого типа задач вычисляется по-разному. Можете поверить мне на слово (а можете проверить), что при одинаковых исходных данных значения различных типов критерия Стъюдента будут отличаться.
Недаром говорится, что есть три способа донести до собеседника информацию: 1) говорить правду, 2) врать и 3) статистика...
Маленькое отступление: в этой связи вспоминается работа, в которой одна бойкая тётенька "исходя из позиций доказательной медицины представила убедительные данные о большей эффективности применения сердечных гликозидов при лечении дифтерийных миокардитов у детей по сравнению со стрихнина нитратом".

А тётенька просто поручила медицинскому статистику провести расчёт, на основании которого и сделала свои грандиозные выводы. Та подобрала группы (методом сплошной выборки), руководствуясь признаками 1) дифтерийный миокардит в диагнозе; 2) применение либо сердечных гликозидов, либо стрихнина нитрата в лечении. При этом не учитывалось, что а) при лёгкой степени дифтерийных миокардитов могут отсутствовать нарушения проводимости; б) у пролеченных противодифтерийной сывороткой больных (т.е. при нейтрализации дифтерийного токсина) при сохраняющейся сердечной недостаточности сердечные гликозиды могут осторожно применяться с неплохим успехом. Т.е. был нарушен принцип однородности подбора групп, т.к. медицинский статистик была в этом вопросе некомпетентна. А ведь это дело чуть было не пошло в стандарты лечения, "исходя из принципов доказательной медицины", поскольку с точки зрения математики всё было безупречно. К счастью, в Казахстане врачи слишком хорошо помнят эпидемию дифтерии 1995-1998 гг. и знают, что такое полная поперечная блокада, разрыв сердечной мышцы, и почему назначить гликозид больному дифтерией в разгар заболевания - это лучший способ его убить, так что ляп не прошёл (а вот в России я аналогичную работу встречал на вполне официальном уровне). Я к тому, что для самого себя нужно чётко формулировать задачу, не полагаться на мнение гуру и помнить, что применение статистики в медицине (которое сейчас туманно и напыщенно именуют "доказательной медициной", как будто иная медицина бездоказательна) не имеет смысла без других методов исследования (описательно-исторического, анализа нормативных документов, экспертных оценок и т.д. и т.п.). Но это лирическое отступление. Теперь конкретно к задачам.
Вариант 1 (см. выше)
Вводим в столбик (т.е. скажем, в ячейку A1, A2, A3 и т.п.) в Excel измеренные значения признака / варианты первой группы (например, температуру тела, общий билирубин венозной крови и т.п.) цифрами. То же - для второй группы (лучше рядом - в ячейки B1, B2, B3 и т.п.). В свободную ячейку, куда будет выводиться результат (например, C1), установим табличный курсор. После этого нажать на панели инструментов кнопку Вставка функции (fx). В появившемся диалоговом окне Мастер функций выбрать категорию Статистические и функцию ТТЕСТ, после чего нажать кнопку ОК. Отодвинуть появившееся диалоговое окно вправо от данных. Указателем мыши ввести диапазон данных первой группы (первый столбик) в поле Массив 1. В поле Массив 2 ввести диапазон данных второй группы (второй столбик). В поле Хвосты всегда вводится цифра 2, а в поле Тип цифру 3 (цифра 3 вводится для того, чтобы указатьСельке, что нужно рассчитывать критерий Стъюдента для независимых групп - так называемый двухвыборочный t-критерий). Всё! Жмём ОК и в ячейке C1 смотрим результат вероятности. Эту цифру сравниваем с принятым уровнем значимости (p = 0.05). So, если наша цифра больше 0,05, то нулевая гипотеза принимается - различие между группами недостоверно. Если же меньше - нулевая гипотеза отвергается (различие достоверно).
Вариант 2. Всё то же самое, но в поле тип вводим цифру 1. При тех же данных результат другой.
Я так долго расписывал Excel потому, что это было указано в условии представления данных. Но вообще-то, если у Вас пиратский софт (а судя по репликам на форуме, что "диск с программой недорого стоит" именно он у вас и стоит

), то вас могут посадить на 3 года. В России это ПОКА не так, но в США и у нас, в Казахстане запросто могут посадить не только распространителя, но и конечного потребителя крякнутого ("дешёвого") софта. Для тех, кто не знал: нормальный (законный) офис (я о наборе программ) стоит примерно с половину хорошего компа без монитора. Кстати, если Вы делаете работу по гранту, и грантодатель ЗАПОДОЗРИТ, что Вы используете нелегальщину для проведения расчётов, то Вы лишитесь всех денежек в момент, а то и свои заплатите.
Поэтому пользуйтесь свободным (официально бесплатным) софтом. OpenOffice Calc, например. Весь расчёт, как для Excel. Единственно, жать кнопу Мастер: функции, данные вводятся в поля Данные 1 и Данные 2, для задачи 1 в поле Режим ввести 2, а для задачи 2 - 1 (т.е. всё наоборот получилось

), в поле Тип вводите 2 (т.е. два хвоста).
При использовании Excel, да и других универсальных статистических пакетов, как мы видим, достаточно неудобно вводить расчётные данные (плохая эргономика) и вызывать соответствующие расчётные функции именно из-за универсальности программ. Кроме того, будьте готовы к тому, что если значение вероятности окажется слишком маленьким, то вместо цифр в ячейке вы увидете кракозяблы, и придётся править формат вывода вручную. Кроме того, к недостаткам можно отнести отсутствие промежуточных результатов вычислений, которые часто тоже нужны.
Поэтому для себя я написал программу, рассчитывающую коэффициент Стъюдента и активно ей пользуюсь. Те, кто сидит под Linux, могут забрать её здесь:
http://www.linmedsoft.narod.ru/KVars.zip Скриншот программы здесь:
http://www.linmedsoft.narod.ru/KVars.pngНо лучше подождите обновления, т.к. вчера я подготовил версию 1.1 программы (встроил защиту от дурака, которая мне самому как-то не нужна была...

). О популярности KVars говорит то, что она уже замелькала на варезных сайтах с пометкой "автор неизвестен".

Учитывая многочисленные просьбы трудящихся, я откомпилировал версию и под Windows, так что желающие могут подождать моего отдельного объявления. А пока - пользуйтесь OpenOffice, ну его в баню, этот проприетарный софт.