Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Средняя температура по отделению ..
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Choledochus
Все-таки, как правильно считать?

Пример.

В отделении m палат по n больных в каждой. В каждой палате, например, своя нозология.
Как правильно подсчитать среднюю температуру больных в отделении?

1) Подсчитать среднюю температуру больных в каждой палате, потом усреднить полученные m средних по всему отделению.
2) Измерить температуру всех m*n больных независимо от палаты и усреднить.

Как правильно?
Чем отличаются эти 2 способа подсчета среднего значения?
Как правильно называть средние 1) и 2): средняя температура по палатам и средняя температура по больным?

Спасибо.
p2004r
Могли бы и менее троллеподобный пример выбрать.

В первом варианте подсчета необходимо сохранять размер группы в которой рассчитано среднее. Оно является фактически весом этого среднего. Иначе Вы теряете информацию и не можете рассчитывать среднюю по группам. Эта формула по моему есть везде.
Choledochus
По-моему, если число больных в палатах различно, то подход 1) намного универсальней.
Choledochus
Цитата(p2004r @ 5.04.2014 - 20:33) *
Могли бы и менее троллеподобный пример выбрать.

В первом варианте подсчета необходимо сохранять размер группы в которой рассчитано среднее. Оно является фактически весом этого среднего. Иначе Вы теряете информацию и не можете рассчитывать среднюю по группам. Эта формула по моему есть везде.


Например, где?
100$
А что, алгебраически среднее по сгруппированным данным отличается от среднего по несгруппированным? Или просто лень извилину напрячь?
nokh
Пример и "троллеподобный", и крайне неудачный. В некоторых задачах действительно важно как считать, но - как уже отметил 100$ - не в этой. Где важно как считать?

(1) Сразу вспоминаю цитогенетику, где я когда-то работал системой распознавания образов и счётной машиной. Там, например, очень важно было как усреднять хромосомные аберрации (ХА): по животным или по клеткам. Дело в том, что в сравнениях "опыт-контроль" выгоднее использовать клетки: их много и по критериям типа хи-квадрат различия часто оказываются статистически значимыми. Но прежде чем объединять материал от разных животных в кучу, нужно было, согласно МУ, убедиться что материал однороден, что делали хи-квадратом однородности. Если такая проверка показывала, что материал неоднороден, т.е. что существует статистически значимая индивидуальная изменчивость - от неё уже нельзя было отмахнуться. В этих случаях за единицу наблюдения принимали уже не клетку, а животное; для него находили индивидуальную частоту ХА, преобразовывали через угловое фи-преобразование и с этими значениями работали параметрическими критериями типа Стьюдента.

В целом, способ усреднения не отделим от контекста исследования, т.е. от того каким образом и на что вы собираетесь распространять полученные в исследовании выводы. Именно поэтому и существуют и случайные выборки, и стратифицированные, и ещё всякие. Как и способы дальнейших расчётов.

(2) Свежая байка в тему из недавней практики - буквально позавчера wink.gif . Рассчитывали индекс типа a/b. Для а и b встречались нулевые значения (согласно шагу разведения образца по методике, реально же - какие-то малые значения), причём всегда в паре. Нашли среднее а, среднее b, поделили их и получили индекс. Но без ДИ. Для расчёта ДИ понадобились индивидуальные значения a/b, но для части объектов его не рассчитать, т.к. на ноль не делится, а заменить ноль на малое значение обоснованно не получается. Мне стало любопытно, какой способ даст индекс ближе к рассчитанному по средним: 1) просто игнорировать значения с нулевыми a и b, или 2) учитывать их как ноль. В результате всех упражнений я пришёл к открытию smile.gif , что среднее частных не равно частному средних, хотя и очень близко. Оказалось, это можно доказать чисто алгебраически, безо всяких нулевых значений и статистики. А что делать с ДИ пока думаю...
p2004r
Цитата(Choledochus @ 5.04.2014 - 21:55) *
Например, где?


что и это надо доказывать?
Код
> x<-runif(10)
> mean(c(mean(sort(x)[1:5]), mean(sort(x)[6:10])))
[1] 0.5553904
> mean(x)
[1] 0.5553904
> mean(c(mean(sort(x)[1:3]), mean(sort(x)[4:10])))
[1] 0.4527382
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.