Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Корректен ли тут дисперсионный анализ
kont
сообщение 19.06.2014 - 18:43
Сообщение #1





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



Подскажите, пожалуйста.
Вот есть у меня 10 штаммов бактерий. в каждом по 8 наблюдений. Был высчитан процент редукции.
Вопрос уместно ли использовать Дисперсионный анализ чтобы сравнить средний процент для каждого штамма .
Я проверил на нормальность распределения, но оно различается колмогоров-смирнов <0,05,однако .АНОВА показал достоверность различия
Решил сравнить по критерию Краскаля-Уоллиса , он тоже различия показал. Но Ведь он считает средние ранги, а не среднее значения.
Как в такой ситуации лучше поступить
Прикрепленные файлы
Прикрепленный файл  штамм.zip ( 9,1 килобайт ) Кол-во скачиваний: 311
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 20.06.2014 - 16:14
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(kont @ 19.06.2014 - 21:43) *
Подскажите, пожалуйста.
Вот есть у меня 10 штаммов бактерий. в каждом по 8 наблюдений. Был высчитан процент редукции.
Вопрос уместно ли использовать Дисперсионный анализ чтобы сравнить средний процент для каждого штамма .
Я проверил на нормальность распределения, но оно различается колмогоров-смирнов <0,05,однако .АНОВА показал достоверность различия
Решил сравнить по критерию Краскаля-Уоллиса , он тоже различия показал. Но Ведь он считает средние ранги, а не среднее значения.
Как в такой ситуации лучше поступить

1. Любой статистический критерий - это некая математическая модель, которую мы применяем к большому числу частных случаев. Исходные данные могут противоречить требованиям этой модели, а могут не противоречить. То, что данные не противоречат модели ещё не значит, что мы выбрали лучшую (наиболее мощную) модель: скорее всего есть другие методы, которые куда лучше подходят для работы конкретно с этими данными. Или же такой оптимальный метод под данные можно разработать и тогда подобных методов будет очень и очень много. Поэтому выбор метода анализа - всегда компромисс между мощностью и универсальностью, который ограничивается также возможностями конкретных пакетов в которых мы считаем. Критерий Краскела - Уоллиса менее мощный, но зато более универсальный тест, + гипотеза которую он проверяет включает в себя также сравнение мер положения (типа среднего, медианы). Поэтому при использовании Краскела - Уоллиса никакого конфликта нет, просто для сравнения штаммов мы используем не самый мощный метод. Если при этом мы не обнаружим интересующих межгрупповых различий, то ещё можем сомневаться, т.к. использовали не самый мощный тест, однако если обнаружим - можно быть спокойным: более мощный тест просто покажет для этих различий ещё меньшие значения р.

2. Несмотря на (1), остаётся вопрос соответствия описательных статистик для каких-то данных и методов анализа этих данных. В принципе в том, чтобы дать средние проценты, а сравнить К-У ошибки нет, но есть некоторая нелогичность. Если для сравнения мы используем критерии на порядковой статистике, то и описательную статистику логичнее давать порядковую, т.е. медиану и квартили, а не средние проценты. Т.е. примерно так:
а) Приводим медиану и квартили - сравниваем К-У (порядковая непараметрика)
б) Приводим средние и 95%-ные ДИ, вычисленные бутстрепом - сравниваем рандомизационным критерием (непараметрические ресемплинг-техники)
в) Приводим средние и 95%-ный ДИ, вычисленный по стандартной ошибке и t-распределению - сраниваем дисперсионным анализом (параметрика).

3. Проценты априори распредлены ненормально, т.к. это - проценты. Можно было по К-С и не проверять. Причём чем сильнее они к 0% или 100% - тем сильнее отклонение. Считается, что если данные лежат в области 30-70% (т.е. около 50%), то отклонением от норм. распределения можно пренебречь. Но я бы с вашими данными работал так:
а) Преобразовал бы относительные частоты (в долях единицы) угловым фи-преобразованием, который переводит ряд от 0 до 1 в ряд от 0 до 3,14 (пи) и нормализует проценты. x_tr=2*arcsin (sqrt(p)), где р - частотв в долях единицы, а арксинус выражен в радианах. Например вместо 10%, т.е. 0,1 будет 0,6435.
б) Сравнил фи-преобразованные данные в ходе однофакторного дисперсионного анализа, провел бы апостериорные сравнения в рамках дисп. комплекса.
в) Рассчитал бы средние и 95%-ные ДИ для преобразованных данных, а затем ретрансформировал бы их в исходную шкалу % обратным преобразованием.

PS. Нельзя проверять распределение на нормальность для заведомо неоднородных данных - групп-то несколько! Проверять нужно распределение остатков дисперсионного комплекса (т.е. из каждого значения в группе вычесть его групповое среднее и полученные остатки проверять)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 20.06.2014 - 23:14
Сообщение #3





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



Надеюсь Конт не будет возражать ,если задам свой вопрос, просто тоже неоднократно у меня было, что распределение не колокообразное а надо было проводить АНОВА,но оно не отличается от нормального Колмогоров >0,2 и так далее. Во-первых корректно ли говорить, что у всей генеральной совокупности оно не колокольное. Вообщем в случае если распределение не колокольное, но не отличается от нормального имею ли я право использовать только параметрические методы?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 21.06.2014 - 06:37
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(psychologist @ 21.06.2014 - 02:14) *
Надеюсь Конт не будет возражать ,если задам свой вопрос, просто тоже неоднократно у меня было, что распределение не колокообразное а надо было проводить АНОВА,но оно не отличается от нормального Колмогоров >0,2 и так далее. Во-первых корректно ли говорить, что у всей генеральной совокупности оно не колокольное. Вообщем в случае если распределение не колокольное, но не отличается от нормального имею ли я право использовать только параметрические методы?

О каком распределении идёт речь: (1) о распределении показателя без учёта деления на группы или (2) о распределении остатков?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 21.06.2014 - 10:36
Сообщение #5





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



о первом
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 21.06.2014 - 11:27
Сообщение #6





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(kont @ 19.06.2014 - 18:43) *
Вопрос уместно ли использовать Дисперсионный анализ чтобы сравнить средний процент для каждого штамма .

Вопрос, а есть ли дисперсия, в контроле точно нет, а в каждой их исследуемых групп она столь мала, что скорее у вас нет 8 наблюдений, а есть 8 измерений одного и того же. Формально в каждой вашей группе распределение нормальное, хотя по 8 значениям нормальность определять нет никакого смысла. А без деления на группы, как наверное сделали вы, не корректно проверять нормальность, как вам уже указал nokh. Используйте ANOVA, получите любые парные сравнения (только две группы между собой не различаются по средней редукции), а также графическое представление различий. На таким графики и видно, что в каждой группе ничтожный разброс.

Поскольку контроль у вас константа, никаких 8 наблюдений у вас нет, а потому можете использовать в анализе непосредственно измеряемую величину, результат будет такой же.

Например, у вас есть один мальчик и одна девочка и вы каждого 8 раз взвесили, сможете ли вы сделать вывод что мальчики весят больше девочек?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 21.06.2014 - 18:09
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(psychologist @ 21.06.2014 - 13:36) *
о первом

Это - заблуждение. Источник-книгу - в топку, источник-файл - стереть минуя корзину. Если группы хоть как-то отличаются средними, нормального распределения в их смеси никак не получится! А по поводу популяции не стоит и заморачиваться: во-первых, вы никогда её не изучите, поскольку под популяцией здесь подразумевается бесконечная (домысливаемая) генеральная совокупность, которая размазана как в пространстве, так и во времени. Во-вторых если даже предположить, что мы изучим распределение почти во всей популяции, оно не будет нормальным: с ростом объёмов выборки отклонения всё равно станут статистически значимыми. Люди пробовали - не получилось, т.к. нормальное распределение в популяции - абстракция. Строго говоря, модель дисперсионного анализа не требует нормального распределения в популяции, она требует нормального распределения ошибки (остатков)! Именно нормальное распределение остатков является проверяемым указанием на то, что данные извлечены из нормально распределённой генеральной совокупности. Найдите литературу где это прописано и разбирайтесь с ДА по ней.

Ещё большее заблуждение - нормальность распределения в каждой выборке. Некоторые даже умудряются пытаться проверять. Такого даже в плохих учебниках не найти! Во вполне корректных дисперсионных комплексах может быть и два наблюдения на ячейку комплекса и даже одно. Как проверить на нормальность 1-2 наблюдения? Всегда только остатки!

Если распределение остатков унимодальное, но скошенное - данные нужно преобразовывать. Это же - указание на то, что и в популяции признак скорее всего распределён асимметрично. А вот если распределение остатков не унимодальное, а имеет 2 или несколько явных мод - значит в исследовании не учитывается какой-то важный источник изменчивости и результатам анализа доверять нельзя: различия могут быть вызваны не действием изучаемого фактора, а разной пропорцией объектов с неизвестным источником изменчивости.

Сообщение отредактировал nokh - 21.06.2014 - 18:54
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 21.06.2014 - 18:48
Сообщение #8





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(DrgLena @ 21.06.2014 - 14:27) *
Поскольку контроль у вас константа, никаких 8 наблюдений у вас нет, а потому можете использовать в анализе непосредственно измеряемую величину, результат будет такой же.

Согласен. Для проверки статистической значимости различий будет даже лучше работать с исходными данными, а не с %. Ну а средние и ДИ можно вычислить через трансформацию/ретрансформацию. Конкретно в вашем случае они будут очень близки к обычным средним и ДИ, кроме группы с 10%.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
kont
сообщение 22.06.2014 - 23:17
Сообщение #9





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



Спасибо Вам. Все стало ясно=)
nokh , я тоже хочу на всякий случай посмотреть распределение остатков. как в СПСС это сделать. Там просто дисперсионный анализ высчитывается.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 23.06.2014 - 12:04
Сообщение #10





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



а я в таком случае не понимаю зачем нужны эти гистограммы распределения с криковой, а также с проверкой Колмогоровым-Смирновым, Шапиро-Уилкса. Если мне в любом случае надо смотреть на распределение остатков.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 23.06.2014 - 16:39
Сообщение #11





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(kont @ 22.06.2014 - 23:17) *
Спасибо Вам. Все стало ясно=)
nokh , я тоже хочу на всякий случай посмотреть распределение остатков. как в СПСС это сделать. Там просто дисперсионный анализ высчитывается.

Не уверена, что SPSS сохраняет остатки, но легко получить самим переменную остатки. Statistica выводит их на экран и вы можете проверить их распределение, ваши распределены нормально.
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 23.06.2014 - 19:16
Сообщение #12





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(kont @ 23.06.2014 - 02:17) *
Спасибо Вам. Все стало ясно=)
nokh , я тоже хочу на всякий случай посмотреть распределение остатков. как в СПСС это сделать. Там просто дисперсионный анализ высчитывается.

В модуле "Однофакторный дисп. анализ" никак. Странно, но действительно в SPSS смотреть остатки неудобно. Короче, нужно через общую линейную модель.
1) Путь: Анализ - Общая линейная модель - ОЛМ-одномерная
2) Зависимая переменная - "% редукции" (ну "опыт" или "фи-преобразованная частота"), фиксированные факторы - "штамм"
3) Модель - по умолчанию, Графики и Апостериорные сравнения настраиваете, в Сохранить ставите галочку в остатки Нестандартизованные - ОК
4) Убеждаетесь, что результаты анализа полностью идентичны тому, что вы получили в модуле "Однофакторный дисп. анализ" и больше этим пустым модулем не пользуйтесь.
5). В таблице данных появится колонка со значениями остатков. У меня - RES_1. Строите график (Графика - панель выбора диаграмм и т.д.). Тесты на нормальность быстро не нашёл, лень уже...
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 23.06.2014 - 19:30
Сообщение #13





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Дисперсионный анализ по опредделению не может иметь никаких остатков, ибо основан на идее Лексиса о разложении дисперсий. Так что остается только ДжиЭлЭм.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 23.06.2014 - 19:43
Сообщение #14





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(psychologist @ 23.06.2014 - 15:04) *
а я в таком случае не понимаю зачем нужны эти гистограммы распределения с криковой, а также с проверкой Колмогоровым-Смирновым, Шапиро-Уилкса. Если мне в любом случае надо смотреть на распределение остатков.

Так свет не сошёлся клином на дисперсионном анализе! Если у нас есть показатели для большой (50 и более) однородной группы объектов - очень желательно посмотреть их распределения: нормальны ли и если нет - то какие. Чтобы для асимметрично распределённых показателей не привести неуместную описательную статистику и графики. Эту информацию можно потом и в других методах использовать.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
kont
сообщение 25.06.2014 - 17:10
Сообщение #15





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



nokh благодарствую Вам
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему