Критерий Краскела-Уоллиса, использование критерия в программе Statistca |
Здравствуйте, гость ( Вход | Регистрация )
Критерий Краскела-Уоллиса, использование критерия в программе Statistca |
28.01.2014 - 08:31
Сообщение
#31
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Пожалуйста,помогите рассудить спор: обследовано 2 группы пациенток по 40 человек. В каждой группе всем пациенткам 3 раза за беременность изучали параметры АД (непараметрика). Для выявления различий между уровнями АД в 20, 30 и 36 недель беременности необходимо применять тест М-У. А рецензент делает замечание о необходимости применения Н критерия Крускала Уоллиса для сравнения АД между группами согласно срокам беременности.Разве он прав? Если вам надо трижды сравнить между собой две группы, то рецензент не прав. |
|
28.01.2014 - 13:41
Сообщение
#32
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.01.2014 Пользователь №: 25928 |
Спасибо за ответ, в том то и дело, что сравнить надо между собой 2 группы по 3 обследуемым точкам. В отношении внутригрупповых сравнений - нужно применять анализ повторных измерений Фридмана. Причем тут тест Крускала-Уоллиса????
|
|
6.02.2014 - 15:24
Сообщение
#33
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Накипело... Я написал статью, в которой показываю как использовать именно нелинейные главные компоненты, чтобы иметь возможность грамотно обчитать определённый тип данных. А рецензент мне говорит, что так считать нельзя, т.к. главные компоненты подразумевают линейность связей. Тоже приходится писать не то ответ, не то лекцию...
А применительно к вашим данным мне не нравится идея сравнивать попарно на каждом сроке. Вместо одного ответа о межгрупповых различиях в динамике АД во время беременности вы отвечаете трижды. Это, во-первых, увеличивает ошибку первого рода, а во-вторых снижает мощность исследования. Я бы считал здесь дисперсионным анализом с повторными измерениями - так получится проанализировать весь материал одновременно, что приведёт к уменьшению ошибки и росту мощности, а ответ о различии динамик проявится в виде значимости/незначимости взамодействия факторов Группа * Срок. Если распределение ненормальное можно преобразовать логарифмированием или Боксом-Коксом. Когда победите рецензента попробуйте на будущее такой вариант анализа. |
|
6.02.2014 - 16:24
Сообщение
#34
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Накипело... Я написал статью, в которой показываю как использовать именно нелинейные главные компоненты, чтобы иметь возможность грамотно обчитать определённый тип данных. А рецензент мне говорит, что так считать нельзя, т.к. главные компоненты подразумевают линейность связей. Тоже приходится писать не то ответ, не то лекцию... А применительно к вашим данным мне не нравится идея сравнивать попарно на каждом сроке. Вместо одного ответа о межгрупповых различиях в динамике АД во время беременности вы отвечаете трижды. Это, во-первых, увеличивает ошибку первого рода, а во-вторых снижает мощность исследования. Я бы считал здесь дисперсионным анализом с повторными измерениями - так получится проанализировать весь материал одновременно, что приведёт к уменьшению ошибки и росту мощности, а ответ о различии динамик проявится в виде значимости/незначимости взамодействия факторов Группа * Срок. Если распределение ненормальное можно преобразовать логарифмированием или Боксом-Коксом. Когда победите рецензента попробуйте на будущее такой вариант анализа. Одновременное наблюдение за двумя объектами в течение периода -это панельные данные (panel data) (кросс-наблюдения в динамике). И анализировать, вероятно, надо, исходя из этого. |
|
6.02.2014 - 19:00
Сообщение
#35
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Одновременное наблюдение за двумя объектами в течение периода -это панельные данные (panel data) (кросс-наблюдения в динамике). И анализировать, вероятно, надо, исходя из этого. Можно и так назвать, но анализировать-то всё равно грамотнее через общие линейные модели: либо классическим дисперсионным анализом (модель с группированными и пересекающимися факторами), либо современной смешанной моделью. Первый подход неоднократно обсуждался на форуме и где-то демонстрировался в пакете Statistica: мной через GLM, DrgLen'ой через Repeated measures ANOVA. По смешанным моделям мне пока не попался источник, в котором бы внятно прописывалось их преимущество перед классикой (точнее перед классикой, реализованной через GLM) - обычно просто объясняется как задать модель, как проверять требования нормальности остатков, сферичности и сложной симметрии, как интерпретировать... |
|
6.02.2014 - 19:04
Сообщение
#36
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Можно и так назвать, но анализировать-то всё равно грамотнее через общие линейные модели: либо классическим дисперсионным анализом (модель с группированными и пересекающимися факторами), либо современной смешанной моделью. Первый подход неоднократно обсуждался на форуме и где-то демонстрировался в пакете Statistica: мной через GLM, DrgLen'ой через Repeated measures ANOVA. По смешанным моделям мне пока не попался источник, в котором бы внятно прописывалось их преимущество перед классикой (точнее перед классикой, реализованной через GLM) - обычно просто объясняется как задать модель, как проверять требования нормальности остатков, сферичности и сложной симметрии, как интерпретировать... Очень согласен |
|
13.08.2014 - 09:50
Сообщение
#37
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 3.12.2013 Пользователь №: 25676 |
Добрый день! Столкнулся с такой проблемой. При проведении сравнительного анализа трех независимых групп критерием Краскела-Уоллиса в STATISTICA по некоторым параметрам значения р были менее 0.05. Но при проведении попарного сравнения методом Данна в этом же модуле программы все значения р оказываются более 0.05. Возможно ли такое? Как тогда корректно описать такой результат?
|
|
13.08.2014 - 19:39
Сообщение
#38
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Добрый день! Столкнулся с такой проблемой. При проведении сравнительного анализа трех независимых групп критерием Краскела-Уоллиса в STATISTICA по некоторым параметрам значения р были менее 0.05. Но при проведении попарного сравнения методом Данна в этом же модуле программы все значения р оказываются более 0.05. Возможно ли такое? Как тогда корректно описать такой результат? Попробуйте вот Это На Данне свет клином не сошелся. |
|
17.08.2014 - 19:59
Сообщение
#39
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Добрый день! Столкнулся с такой проблемой. При проведении сравнительного анализа трех независимых групп критерием Краскела-Уоллиса в STATISTICA по некоторым параметрам значения р были менее 0.05. Но при проведении попарного сравнения методом Данна в этом же модуле программы все значения р оказываются более 0.05. Возможно ли такое? Как тогда корректно описать такой результат? Такое возможно, хотя в этом случае некоторые значения р при попарных сравнениях будут всё равно близки к 0,05, ну скажем будут 0,08. Трактовать и описывать как есть, типа: "Различия были статистически значимыми: H(df) = ...; p=.... В ходе апостериорных сравнений методом Данна было обнаружено, что они были обусловлены преимущественно различиями групп 1 и 2 (р=0,08) и 2 и 3 (р=0,09), в то время как различия между группами 1 и 3 были несущественны (р=0,45)." Можно трактовать 0,05<p<=0,10 как "тенденцию к различиям", хотя многие такой термин и не приемлют. Можно, как предлагает 100$, использовать другие методы. Не нравится "тенденция" - держите Коновера-Инмана, который не удерживает ошибку семейства гипотез на заданном уровне значимости, но зато без "тенденции" (Если К-У показывает значимые различия, по Коноверу-Инману что-то всегда будет значимо). А вот критерий Стила-Двасса (ранговый аналог LSD Фишера) почти столь же консервативен как критерий Данна, но попробовать всё равно стоит. Он есть в KyPlot: https://yadi.sk/d/CpuBB21yWVrmN (группы - в соседние столбцы, выделить область значений, Statistics - Nonparametric Test - Nonparametric Mult. Comp.) Сообщение отредактировал nokh - 17.08.2014 - 20:01 |
|
4.01.2017 - 00:55
Сообщение
#40
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 31.12.2016 Пользователь №: 29139 |
Доброго времени.
Подскажите, пожалуйста: 1) вот критерием К-У выявил достоверность/недостоверность различий между тремя группами, далее там в программе статистика можно попарно сравнить группы между собой и выявить Н и р при парных уже сравнениях---как при этом трактовать результаты попарных сравнений внутри критерия К-У--? можно ли пользоваться такими попарными данными?-может это уже как критерий Манна-Уитни? или что это? 2) как лучше записывать результаты К-У---пример:"результаты между тремя группами были достоверно различимы (Н=....;df=...; р=0,014)"--или только (р=0,014)-? 3) иногда результаты К-У (сравнивая три группы) показывают уровень достоверности р=0,0000 (и всё--без какого-либо числа)----как данное трактовать и как записать в результат-пример:"различия были достоверны (р=0,0000)---корректна ли такая запись-? (или должно быть какое-то число, кроме 0 ) |
|
4.01.2017 - 11:00
Сообщение
#41
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Цитата(doc2012) 1) вот критерием К-У выявил достоверность/недостоверность различий между тремя группами, далее там в программе статистика можно попарно сравнить группы между собой и выявить Н и р при парных уже сравнениях---как при этом трактовать результаты попарных сравнений внутри критерия К-У--? можно ли пользоваться такими попарными данными?-может это уже как критерий Манна-Уитни? или что это? Предположим, что Критерий Крускала-Уоллиса выявил различие между тремя выборками. Далее, попарно сравнивая выборки, необходимо объединить их в однородные группы (алгоритм кластеризации).Цитата(doc2012) 2) как лучше записывать результаты К-У---пример:"результаты между тремя группами были достоверно различимы (Н=....;df=...; р=0,014)"--или только (р=0,014)-? Как правильно записывать результат, должно быть изложено в стандартах по оформлению статистических расчетовЦитата(doc2012) 3) иногда результаты К-У (сравнивая три группы) показывают уровень достоверности р=0,0000 (и всё--без какого-либо числа)----как данное трактовать и как записать в результат-пример:"различия были достоверны (р=0,0000)---корректна ли такая запись-? (или должно быть какое-то число, кроме 0 Скорее всего уровень значимости р<0,0001. Я бы так и записал в отчете.
Сообщение отредактировал DoctorStat - 4.01.2017 - 11:01 Просто включи мозги => http://doctorstat.narod.ru
|
|
4.01.2017 - 16:42
Сообщение
#42
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 31.12.2016 Пользователь №: 29139 |
Предположим, что Критерий Крускала-Уоллиса выявил различие между тремя выборками. Далее, попарно сравнивая выборки, необходимо объединить их в однородные группы (алгоритм кластеризации). Как правильно записывать результат, должно быть изложено в стандартах по оформлению статистических расчетов Скорее всего уровень значимости р<0,0001. Я бы так и записал в отчете. по пункту 1) так и осталось непонятным---что это за парные сравнения ВНУТРИ критерия К-У. Кто хоть раз открывал критерий К-У в программе статистика--там есть такая графа-"коды" (внутри критерия К-У)--подставляю уже две конкретные группы из трех и программа выводит вновь Н при N=1 и р.... (все значения другие от сравнения трех групп)---интересует что это за сравнения? корректно ли их использовать или обязательно надо в Манна-Уитни переходить (если К-У но при парных сравнениях похоже делает тоже самое)--? по пункту 2) К сожалению я не знаю про такие стандарты, так как со статистикой "познакомился" впервые, потому и обратился за помощью к тем, кто профессионально занимается статистикой, так как просмотренные мной статистические справочники и интернет ссылки (в плоть до иностранных) так и не разъяснили мне как писать (очень скудно по данной информации-перерыл интернет). Потому и прошу о КОНКРЕТНОЙ помощи. по пункту 3) программа выдает ЧЕТЫРЕ нуля после запятой, а не три нуля и 1. Интересует--как трактовать КОНКРЕТНО ЧЕТЫРЕ нуля после запятой и отсутствие какого-либо другого числа.-? Интересует КОНКРЕТНАЯ помощь ПРОФИ--кто хоть раз делал обработку данных критерием К-У и сталкивался с данными затруднениями. Для меня "новичка" в статистике важен ответ более статистически продвинутых людей. |
|
4.01.2017 - 17:55
Сообщение
#43
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
по пункту 1) так и осталось непонятным---что это за парные сравнения ВНУТРИ критерия К-У. Кто хоть раз открывал критерий К-У в программе статистика--там есть такая графа-"коды" (внутри критерия К-У)--подставляю уже две конкретные группы из трех и программа выводит вновь Н при N=1 и р.... (все значения другие от сравнения трех групп)---интересует что это за сравнения? корректно ли их использовать или обязательно надо в Манна-Уитни переходить (если К-У но при парных сравнениях похоже делает тоже самое)--? по пункту 2) К сожалению я не знаю про такие стандарты, так как со статистикой "познакомился" впервые, потому и обратился за помощью к тем, кто профессионально занимается статистикой, так как просмотренные мной статистические справочники и интернет ссылки (в плоть до иностранных) так и не разъяснили мне как писать (очень скудно по данной информации-перерыл интернет). Потому и прошу о КОНКРЕТНОЙ помощи. по пункту 3) программа выдает ЧЕТЫРЕ нуля после запятой, а не три нуля и 1. Интересует--как трактовать КОНКРЕТНО ЧЕТЫРЕ нуля после запятой и отсутствие какого-либо другого числа.-? Интересует КОНКРЕТНАЯ помощь ПРОФИ--кто хоть раз делал обработку данных критерием К-У и сталкивался с данными затруднениями. Для меня "новичка" в статистике важен ответ более статистически продвинутых людей. (Исполнившись дружелюбия) Начну с конца. 3. Если прога выдала ".0000", это значит, что в действительности достигаемый уровень значимости настолько мал, что нет необходимости выдавать его точное значение (,0000001 или ,00000001 в данном случае не имеет никакого значения). Это и так -достаточно сильное свидетельство против нулевой гипотезы: имеем право ее отвергнуть. 2. Граничное значение номинального уровня значимости (который может быть заявлен при планировании исследования) для мало-мальски сведущего в статистике гражданина - ,001. Поэтому, если достигаемый уровень значимости стат. критерия больше этого значения - его разумно указать точно, сопроводив это следующим комментарием: "...в дисперсионном комплексе обнаружены статистически значимые различия, р=,01", в противном случае "р<,001", ибо дальнейшие уточнения ",0000000001" или ",000000000000000000000000000000000000000000000000025" бессмысленны. 1. Doc, здесь мало фанатов "Статистики" , так что выкладывайте скрины из программы, и попробуем понять, что не так. P.S. В качестве пост хоков для Краскела - Уоллиса используют тесты Коновера - Имана (Conover - Iman), Шайха - Хамерле (Schaih - Hamerle), процедуру Стила - Двасса (Steel-Dwass-Critchlow-Fligner procedure). Сообщение отредактировал 100$ - 4.01.2017 - 18:18 |
|
4.01.2017 - 19:35
Сообщение
#44
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Уважаемый doc2012!
1. Попарные сравнения не внутри, а после К-У. Если нуль гипотеза отвергнута, то вас, наверное, интересует между какими именно группами имеется статистически значимое различие. Результаты попарных сравнений так и трактуются р1-2, р1-2 и р2-3 предоставляются в модуле множественные сравнения. Программы выдает вам 3 значения z и три значения р ( в виде симметричной матрицы). Как рассчитывается z и p подробно, с формулами и со ссылкой даны в хелпе программы. Так, что в М-У переходить не следует, коды в К-У вводятся для обозначения групп, которые требуется сравнить, ведь их может быть больше 3-х, например 5, я вы хотите сравнить только 3. А вот если их только две, пожалуйте в М-У. 2. То, что вы называете достоверность, таковой не является, подумайте сами, как воспринимается исследование, достоверность которого близка к нулю. 3. По поводу оформления, есть такая книга Ланга и Сесика ?Как описывать статистику в медицине?, раньше я пользовалась английской версией, точно есть в сети, но сейчас она издана на русском языке, перевод под редакцией В.П. Леонова . 4. Вы прицепили свои вопросы в ветке, где дискуссия закончилась рекомендациями аналогичными тем, которые вы получили в соей собственной ветке, где также было высказано обоснованное мнение в пользу параметрического дисперсионного анализа. В связи с этим у меня вопрос, вы 7 раз будете использовать К-У, в каждой временной точке? Сообщение отредактировал DrgLena - 4.01.2017 - 19:37 |
|
4.01.2017 - 20:08
Сообщение
#45
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Цитата(DrgLena) По поводу оформления, есть такая книга Ланга и Сесика "Как описывать статистику в медицине", раньше я пользовалась английской версией, точно есть в сети, но сейчас она издана на русском языке, перевод под редакцией В.П. Леонова.
Сообщение отредактировал DoctorStat - 4.01.2017 - 20:11 Просто включи мозги => http://doctorstat.narod.ru
|
|