![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() ![]() |
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 5.05.2015 Пользователь №: 27211 ![]() |
Добрый вечер прошу помочь разобраться
Есть 2 равные группы, первая группа подвергается одному виду лечения, вторая группа альтернативному. Необходимо оценить достоверность различий между: 1. первой группой до лечения и второй группой до лечения 2. первой группой после лечения и второй группой после лечения 3. первой группой до лечения и первой группой после лечения 4. второй группой до лечения и второй группой после лечения Распределение в группах не нормальное. Первый подход это использование: критерия Манна Уитни для 1 и 2 сравнения (несвязанные выборки) и использование Вилкоксона для 3 и 4 сравнения (связанные выборки) Второй подход: учитывая наличие 4 выборок использования критерия Крускула Уолиса, игнорируя наличие 2-ух связанных выборок, 2 другие все равно-то несвязанные |
|
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Добрый вечер прошу помочь разобраться Есть 2 равные группы, первая группа подвергается одному виду лечения, вторая группа альтернативному. Необходимо оценить достоверность различий между: 1. первой группой до лечения и второй группой до лечения 2. первой группой после лечения и второй группой после лечения 3. первой группой до лечения и первой группой после лечения 4. второй группой до лечения и второй группой после лечения Распределение в группах не нормальное. Первый подход это использование: критерия Манна Уитни для 1 и 2 сравнения (несвязанные выборки) и использование Вилкоксона для 3 и 4 сравнения (связанные выборки) Второй подход: учитывая наличие 4 выборок использования критерия Крускула Уолиса, игнорируя наличие 2-ух связанных выборок, 2 другие все равно-то несвязанные Второй подход категорически неприемлем. Первый подход приемлем, но примитивен, к тому же имеет меньшую мощность и бОльшую ошибку первого рода. Грамотнее проанализровать данные в ходе дисперсионного анализа с повторными измерениями (модель с группированными и пересекающимися факторами, перекрёстно-иерархическая модель) - очень много обсуждался на форуме, поищите поиском. Для нормализации распределения ошибок дисперсионного комплекса данные нужно предварительно преобразовать подходящим нормализующим преобразованием, лучше преобразованием Бокса - Кокса. Если не преобразовывать, то для оценок в рамках такой модели можно использовать рандомизационный тест, но это нужно суметь правильно закодировать в пакетах, где это удобно - типа R. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 5.05.2015 Пользователь №: 27211 ![]() |
Подскажите а можно ли использовать дисперсионный анализ Фридмена и отказаться от нормализации данных, оставив ненормальное распределение???
|
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Подскажите а можно ли использовать дисперсионный анализ Фридмена и отказаться от нормализации данных, оставив ненормальное распределение??? Необходимая схема дисп. анализа содержит 3 фактора: 1) Индивиды (Группа) , т.е. индивиды внутри своей группы. 2) Группа (2 градации) 3) Время (2 градации: до-после). А анализ Фридмана или ещё лучше Даны Квейд (Quade Two-Way ANOVA) - двухфакторные методы. Т.е. ответ: нельзя. Если сильно хочется непараметрики, то можно использовать подход Коновера - Имана, т.е. провести желаемую параметрическую процедуру на рангах. Т.е. можно проранжировать все данные, а потом использовать дисп. анализ со сложными повторными измерениями, используя ранги вместо исходных данных. В серии работ эти авторы доказали правомочность такого подхода; их итоговая работа: Rank Transformations as a Bridge between Parametric and Nonparametric Statistics ( http://people.umass.edu/bioep740/topics/amstat-1985-iman.pdf ). Хотя почему-то этот подход не слишком распространён, по крайней мере я не встречал его применительно к обсуждаемой задаче, обычно преобразуют логарифмированием или Боксом - Коксом. Современный универсальный непараметрический подход - рандомизационный критерий, но как уже написал выше его сложнее реализовать на практике. Сообщение отредактировал nokh - 8.09.2015 - 21:35 |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 5.05.2015 Пользователь №: 27211 ![]() |
Необходимая схема дисп. анализа содержит 3 фактора: 1) Индивиды (Группа) , т.е. индивиды внутри своей группы. 2) Группа (2 градации) 3) Время (2 градации: до-после). А анализ Фридмана или ещё лучше Даны Квейд (Quade Two-Way ANOVA) - двухфакторные методы. Т.е. ответ: нельзя. Если сильно хочется непараметрики, то можно использовать подход Коновера - Имана, т.е. провести желаемую параметрическую процедуру на рангах. Т.е. можно проранжировать все данные, а потом использовать дисп. анализ со сложными повторными измерениями, используя ранги вместо исходных данных. В серии работ эти авторы доказали правомочность такого подхода; их итоговая работа: Rank Transformations as a Bridge between Parametric and Nonparametric Statistics ( http://people.umass.edu/bioep740/topics/amstat-1985-iman.pdf ). Хотя почему-то этот подход не слишком распространён, по крайней мере я не встречал его применительно к обсуждаемой задаче, обычно преобразуют логарифмированием или Боксом - Коксом. Современный универсальный непараметрический подход - рандомизационный критерий, но как уже написал выше его сложнее реализовать на практике. Уважаемый nokh, прошу прощения за глупый вопрос, но я не совсем понимаю почему данная схема дисперсионного анализа (я так понял необходимая мне схема называется 'Split-Plot' ANOVA) содержит 3 фактора?? Я думал, что есть 1 внутригрупповой фактор это до и после лечения и межгрупповой фактор (первая, вторая группа). Пытаюсь считать в spss, куда-то нужно заносить еще и не понятный мне фактор "1) Индивиды (Группа) , т.е. индивиды внутри своей группы."?????? Сообщение отредактировал Alexandrovich - 8.09.2015 - 22:51 |
|
![]() |
![]() |
![]()
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Уважаемый nokh, прошу прощения за глупый вопрос, но я не совсем понимаю почему данная схема дисперсионного анализа (я так понял необходимая мне схема называется 'Split-Plot' ANOVA) содержит 3 фактора?? Я думал, что есть 1 внутригрупповой фактор это до и после лечения и межгрупповой фактор (первая, вторая группа). Пытаюсь считать в spss, куда-то нужно заносить еще и не понятный мне фактор "1) Индивиды (Группа) , т.е. индивиды внутри своей группы."?????? Вопрос не глупый, это - различия в терминологии. Этот дисперсионный анализ можно провести используя 2 варианта общих линейных моделей: 1) Sigma-restricted parametrization model. Задаётся как описали вы. Если я правильно понимаю, то в пакетах может задаваться как частный случай классического АNOVA, а может через MANOVA-подход с соответствующим тербованиям сферичности. 2) Overparametrized model. Задаётся как описал я (постигал ANOVA по учебнику Монтгомери, привык так). Результаты идентичные, поэтому считайте 'Split-Plot' ANOVA как привыкли. Или можно использовать более современный гибкий подход анализа смешанных моделей: 3) Mixed Model Analysis Разные пакеты используют разные способы. Например, в SPSS через меню - 1, а 2 можно задать синтаксисом, в Statistica можно 1 и 2 через меню, в NCSS - только 2, в популярных пакетах R - 1. Mixed Model Analysis задаётся в модулях анализа обобщённых линейных моделей (Generalized Linear Models). Сообщение отредактировал nokh - 9.09.2015 - 01:06 |
|
![]() |
![]() |
![]()
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 5.05.2015 Пользователь №: 27211 ![]() |
Огромное спасибо!!!
|
|
![]() |
![]() |
![]()
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 5.05.2015 Пользователь №: 27211 ![]() |
Подскажите пожалуйста, а если бы я вдруг (делать так не буду, но все же) использовал попарное сравнение несвязанных выборок методом Манна Уитни, а связанных Вилкоксоном, то я правильно понимаю, что учитывая наличие 4 сравнений p-value должно быть скоригировано путем 0,05/4 =0,0125
И еще если можно последний вопрос: если производить нормализацию данных с помощью Box Cox как быть если допустим в 1, 2 и 3 выборке распределение нормальное, а в 4 нормальности нет? 1. первой группой до лечения и второй группой до лечения 2. первой группой после лечения и второй группой после лечения 3. первой группой до лечения и первой группой после лечения 4. второй группой до лечения и второй группой после лечения В ходе преобразования не будут ли испорчены и так нормальные данные в 1,2 и 3 группе??? Заранее очень благодарен за помощь!!! Сообщение отредактировал Alexandrovich - 9.09.2015 - 12:57 |
|
![]() |
![]() |
![]()
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Подскажите пожалуйста, а если бы я вдруг (делать так не буду, но все же) использовал попарное сравнение несвязанных выборок методом Манна Уитни, а связанных Вилкоксоном, то я правильно понимаю, что учитывая наличие 4 сравнений p-value должно быть скоригировано путем 0,05/4 =0,0125 Считается что да, нужно. Хотя поправка Бонферрони очень грубая, есть менее консервативные штуки для этого. Но я поправками стараюсь не пользоваться: гипотез обычно много и если использовать поправки шансов найти даже то что есть практически не остаётся. А что находится на таких малых уровнях значимости - всем уже давным давно известно... Поэтому если есть возможность обойтись без поправок, полагаю, нужно к этому стремиться. Скажем, если вы проведёте анализ на рангах и используете в качестве апостериорных сравнений метод HSD Тьюки, то, следуя логике Коновера и Имана, это будет эквивалентно непарметрическим множественным сравнениям методом Данна, который является популярным прямым ранговым аналогом метода Тьюки и используется для непараметрических множественных сравнений в пакете Statistica. Методы Тьюки и Данна - хорошие и даже несколько консервативные процедуры, позволяющие удерживать ошибку семейства гипотез на заданном уровне значимости. Поэтому к чему Бонферрони?... И еще если можно последний вопрос: если производить нормализацию данных с помощью Box Cox как быть если допустим в 1, 2 и 3 выборке распределение нормальное, а в 4 нормальности нет? 1. первой группой до лечения и второй группой до лечения 2. первой группой после лечения и второй группой после лечения 3. первой группой до лечения и первой группой после лечения 4. второй группой до лечения и второй группой после лечения В ходе преобразования не будут ли испорчены и так нормальные данные в 1,2 и 3 группе??? Заранее очень благодарен за помощь!!! 1. Общая линейная модель не требует нормального распределения в каждой выборке. Более того, не требует нормального распределения в популяции, откуда эта выборка сделана. Она требует нормального распределения ошибки модели, т.е. остатков (residuals), остающихся после вычитания из наблюдаемых данных общего среднего, эффектов факторов и их взаимодействий. Поэтому не смотрите на отдельные выборки, проводите преобразования для всего массива данных без учёта групп и смотрите распредление остатков: оно хотя бы визуально должно быть симметричным и более-менее колоколообразным. 2. Ну и вообще, как здесь писал когда-то плав, в фриквентистком подходе проверка гипотезы проводится исходя из справедливости нулевой гипотезы, поэтому мы считаем сначала, что выборки не различаются и проводим преобразование для всех групп вместе. И если даже что-то и "ухудштся" в конкретной выборке, остаётся выигрыш в целом - для всего подхода. |
|
![]() |
![]() |
![]()
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 5.05.2015 Пользователь №: 27211 ![]() |
Спасибо Вам большое за исчерпывающие ответы и потраченное время!!!! Теперь все прояснилось!!!
|
|
![]() |
![]() |
![]() ![]() |