![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 39 Регистрация: 12.11.2014 Пользователь №: 26808 ![]() |
Здравствуйте!
Я запутался в дисперсионном анализе, а именно в необходимости нормального распределения совокупности из которой сделана выборка ![]() На форуме упоминалось о том, что нормальность распределения не всегда обязательна при ДА, однако по всем источникам говорится о том, что распределение должно быть нормальным... У Гланца, так же необходимо нормальное распределение, он говорит, что оно может быть определено при помощи стандартного отклонения, то есть если стандартное отклонение умножить на два и вычесть из среднего, не должно получиться отрицательного значения. Однако потом приводит задачу для решения (3.8 стр. 80-81) где стандартное отклонение укладывается в не нормальное распределение и в ответах задача решена при помощи F критерия, то есть на сколько я понимаю, дисперсионного анализа... Как это можно понять? ![]() Я понимаю, что гипотетически (в задаче рассматривается вопрос про тромбоциты у здоровых людей) можно представить, применительно к данной задаче, присутствие нормального распределения, однако, как поступать при решении других задач, приведу свой пример: Длительность стояния дренажей после операции: 1 группа - 28 человек среднее 5,6 стандартное отклонение 2,7 дня, 2 группа 25 человек среднее 5 стандартное отклонение 3,1 день и 3 группа 38 человек среднее 7,4 стандартное отклонение 4,3 дня. При ДА р<0,05. Правильно ли применять здесь ДА? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Здравствуйте! Я запутался в дисперсионном анализе, а именно в необходимости нормального распределения совокупности из которой сделана выборка ![]() На форуме упоминалось о том, что нормальность распределения не всегда обязательна при ДА, однако по всем источникам говорится о том, что распределение должно быть нормальным... У Гланца, так же необходимо нормальное распределение, он говорит, что оно может быть определено при помощи стандартного отклонения, то есть если стандартное отклонение умножить на два и вычесть из среднего, не должно получиться отрицательного значения. Однако потом приводит задачу для решения (3.8 стр. 80-81) где стандартное отклонение укладывается в не нормальное распределение и в ответах задача решена при помощи F критерия, то есть на сколько я понимаю, дисперсионного анализа... Как это можно понять? ![]() Я понимаю, что гипотетически (в задаче рассматривается вопрос про тромбоциты у здоровых людей) можно представить, применительно к данной задаче, присутствие нормального распределения, однако, как поступать при решении других задач, приведу свой пример: Длительность стояния дренажей после операции: 1 группа - 28 человек среднее 5,6 стандартное отклонение 2,7 дня, 2 группа 25 человек среднее 5 стандартное отклонение 3,1 день и 3 группа 38 человек среднее 7,4 стандартное отклонение 4,3 дня. При ДА р<0,05. Правильно ли применять здесь ДА? Да зашвырните вы этого Гланца куда-нибудь на Плутон, или где там у него марсиане курят... На самокрутки... Требований ДА два: (1) нормальное распределение ошибки. Не набора данных, не выборок в наборе, а ошибки (остатков). Эту проверку делают все мало-мальски нормальные пакеты. И гистограмму распределения остатков строят (residual plot) и каким-нибудь критерием типа Шапиро-Уилка нормальность проверяют. Если нормальности нет и нет желания уходить в непараметрику - делают нормализующее преобразование данных (в лучшем случае преобразование Бокса-Кокса). (2) однородность дисперсий в группах. Проверяется с худшем случае критерием Бартлетта, в лучшем - критерием Левне, или какими-нибудь ресэмлинг-техниками. Если однородности нет и нет желания уходить в непараметрику - преобразуют данные или используют подход аналогичный подходу Уэлча для t-критерия. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 39 Регистрация: 12.11.2014 Пользователь №: 26808 ![]() |
Да зашвырните вы этого Гланца куда-нибудь на Плутон, или где там у него марсиане курят... На самокрутки... Требований ДА два: (1) нормальное распределение ошибки. Не набора данных, не выборок в наборе, а ошибки (остатков). Эту проверку делают все мало-мальски нормальные пакеты. И гистограмму распределения остатков строят (residual plot) и каким-нибудь критерием типа Шапиро-Уилка нормальность проверяют. Если нормальности нет и нет желания уходить в непараметрику - делают нормализующее преобразование данных (в лучшем случае преобразование Бокса-Кокса). (2) однородность дисперсий в группах. Проверяется с худшем случае критерием Бартлетта, в лучшем - критерием Левне, или какими-нибудь ресэмлинг-техниками. Если однородности нет и нет желания уходить в непараметрику - преобразуют данные или используют подход аналогичный подходу Уэлча для t-критерия. Спасибо, за разъяснения, к сожалению не статистикам тяжело разбираться в статистических критериях и прочих программах, поэтому многие читают Гланца как наиболее понятного. Я например врач и мне зачастую необходимо много времени, что бы разобраться во всех этих моментах и хочется какой-то точности, например точный критерий Фишера можно применять при оценке качественных признаков нескольких групп и все, в нем я более менее разобрался и могу его применить, а различные наборы которые Вы описали для меня вообще являются загадкой...(к сожалению). И в итоге я не понял главного, ДА можно применять при стандартном отклонении не укладывающемся в нормальные значения, или необходимо проводить полный анализ как написали Вы так как это правильно... |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Спасибо, за разъяснения, к сожалению не статистикам тяжело разбираться в статистических критериях и прочих программах, поэтому многие читают Гланца как наиболее понятного. Я например врач и мне зачастую необходимо много времени, что бы разобраться во всех этих моментах и хочется какой-то точности, например точный критерий Фишера можно применять при оценке качественных признаков нескольких групп и все, в нем я более менее разобрался и могу его применить, а различные наборы которые Вы описали для меня вообще являются загадкой...(к сожалению). И в итоге я не понял главного, ДА можно применять при стандартном отклонении не укладывающемся в нормальные значения, или необходимо проводить полный анализ как написали Вы так как это правильно... Ну и что, я тоже не статистик, а эколог. При желании всегда можно разобраться... И хотя специфика работы врача, действительно, оставляет меньше времени, на этом форуме было и есть достаточно грамотных людей работающих именно в медицине. А проверять нужно как написал я - смотреть остатки и однородность дисперсий. Если назовёте пакет(ы) где считаете - могу подсказать более конкретно. |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 39 Регистрация: 12.11.2014 Пользователь №: 26808 ![]() |
Ну и что, я тоже не статистик, а эколог. При желании всегда можно разобраться... И хотя специфика работы врача, действительно, оставляет меньше времени, на этом форуме было и есть достаточно грамотных людей работающих именно в медицине. А проверять нужно как написал я - смотреть остатки и однородность дисперсий. Если назовёте пакет(ы) где считаете - могу подсказать более конкретно. Спасибо за понимание и согласен если есть желание...но желание действительно есть, но... Если честно считаю практически все в ручную и через ексел, использую калькуляторы только для точного критерия фишера. Согласен можно скачать статистику на 30 дней, но что бы разобраться как в ней пользоваться уйдет больше времени (ну мне так кажется)... Просто до Вашего ответа думал, что все необходимое я узнал из Гланца, для оценки количественных показателей ДА, для качественных точный Фишера, для двойных Макнемар ну и все ![]() Если у Вас есть хоть малейшее желание мне помочь, буду Вам очень благодарен и признателен!!! |
|
![]() |
![]() |
![]() ![]() |