Средняя температура по отделению .. |
Здравствуйте, гость ( Вход | Регистрация )
Средняя температура по отделению .. |
5.04.2014 - 19:10
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 97 Регистрация: 14.03.2006 Из: Москва Пользователь №: 870 |
Все-таки, как правильно считать?
Пример. В отделении m палат по n больных в каждой. В каждой палате, например, своя нозология. Как правильно подсчитать среднюю температуру больных в отделении? 1) Подсчитать среднюю температуру больных в каждой палате, потом усреднить полученные m средних по всему отделению. 2) Измерить температуру всех m*n больных независимо от палаты и усреднить. Как правильно? Чем отличаются эти 2 способа подсчета среднего значения? Как правильно называть средние 1) и 2): средняя температура по палатам и средняя температура по больным? Спасибо. Сообщение отредактировал Choledochus - 5.04.2014 - 19:54 |
|
5.04.2014 - 20:33
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Могли бы и менее троллеподобный пример выбрать.
В первом варианте подсчета необходимо сохранять размер группы в которой рассчитано среднее. Оно является фактически весом этого среднего. Иначе Вы теряете информацию и не можете рассчитывать среднюю по группам. Эта формула по моему есть везде. |
|
5.04.2014 - 21:39
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 97 Регистрация: 14.03.2006 Из: Москва Пользователь №: 870 |
По-моему, если число больных в палатах различно, то подход 1) намного универсальней.
Сообщение отредактировал Choledochus - 5.04.2014 - 21:39 |
|
5.04.2014 - 21:55
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 97 Регистрация: 14.03.2006 Из: Москва Пользователь №: 870 |
Могли бы и менее троллеподобный пример выбрать. В первом варианте подсчета необходимо сохранять размер группы в которой рассчитано среднее. Оно является фактически весом этого среднего. Иначе Вы теряете информацию и не можете рассчитывать среднюю по группам. Эта формула по моему есть везде. Например, где? |
|
5.04.2014 - 22:14
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
А что, алгебраически среднее по сгруппированным данным отличается от среднего по несгруппированным? Или просто лень извилину напрячь?
|
|
6.04.2014 - 06:36
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Пример и "троллеподобный", и крайне неудачный. В некоторых задачах действительно важно как считать, но - как уже отметил 100$ - не в этой. Где важно как считать?
(1) Сразу вспоминаю цитогенетику, где я когда-то работал системой распознавания образов и счётной машиной. Там, например, очень важно было как усреднять хромосомные аберрации (ХА): по животным или по клеткам. Дело в том, что в сравнениях "опыт-контроль" выгоднее использовать клетки: их много и по критериям типа хи-квадрат различия часто оказываются статистически значимыми. Но прежде чем объединять материал от разных животных в кучу, нужно было, согласно МУ, убедиться что материал однороден, что делали хи-квадратом однородности. Если такая проверка показывала, что материал неоднороден, т.е. что существует статистически значимая индивидуальная изменчивость - от неё уже нельзя было отмахнуться. В этих случаях за единицу наблюдения принимали уже не клетку, а животное; для него находили индивидуальную частоту ХА, преобразовывали через угловое фи-преобразование и с этими значениями работали параметрическими критериями типа Стьюдента. В целом, способ усреднения не отделим от контекста исследования, т.е. от того каким образом и на что вы собираетесь распространять полученные в исследовании выводы. Именно поэтому и существуют и случайные выборки, и стратифицированные, и ещё всякие. Как и способы дальнейших расчётов. (2) Свежая байка в тему из недавней практики - буквально позавчера . Рассчитывали индекс типа a/b. Для а и b встречались нулевые значения (согласно шагу разведения образца по методике, реально же - какие-то малые значения), причём всегда в паре. Нашли среднее а, среднее b, поделили их и получили индекс. Но без ДИ. Для расчёта ДИ понадобились индивидуальные значения a/b, но для части объектов его не рассчитать, т.к. на ноль не делится, а заменить ноль на малое значение обоснованно не получается. Мне стало любопытно, какой способ даст индекс ближе к рассчитанному по средним: 1) просто игнорировать значения с нулевыми a и b, или 2) учитывать их как ноль. В результате всех упражнений я пришёл к открытию , что среднее частных не равно частному средних, хотя и очень близко. Оказалось, это можно доказать чисто алгебраически, безо всяких нулевых значений и статистики. А что делать с ДИ пока думаю... Сообщение отредактировал nokh - 6.04.2014 - 07:03 |
|
6.04.2014 - 10:53
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Например, где? что и это надо доказывать? Код > x<-runif(10)
> mean(c(mean(sort(x)[1:5]), mean(sort(x)[6:10]))) [1] 0.5553904 > mean(x) [1] 0.5553904 > mean(c(mean(sort(x)[1:3]), mean(sort(x)[4:10]))) [1] 0.4527382 |
|