Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Поправка Бонферрони или FDR
vas
сообщение 30.09.2013 - 04:01
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 30.09.2013
Пользователь №: 25350



Здравствуйте! У меня вопрос по поводу множественного сравнения. А конкретно, по поправке Бонферрони.

Как он считается? Я p делю на количество групп сравнения или на общее количество тестов? Вот допустим, у меня работа по полиморфизмам SNP, т.е есть индивиды с тремя генотипами, и они сравниваются между собой по 11 показателям. Мне делить p на 3 или на 33??? Или на 11?
И еще вопрос. Его мне применять ко всему исследованию или только к 1 полиморфизму???

Еще хотелось бы узнать преимущества FDR (False discovery rate) контроля. И про возможность его использования вместо поправки Бонферрони.

PS Читал нижний топик про тест Крускалл-Валлиса, но не совсем понял. Вот если я сравниваю три группы индивидов, и нахожу значимое различие по какому-нибудь показателю, то могу судить лишь о том, что они различаются между собой??? НО не могу, допустим, судить о том как они различаются.

Сообщение отредактировал vas - 30.09.2013 - 06:37
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 1.10.2013 - 13:30
Сообщение #2





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



В поправке Бонферрони уровень значимости альфа делится на число сравнений и р-значения сравниваются с этим уменьшенным уровнем значимости.
У вас , как я понимаю содержательную часть, будет делиться на 3 (число сочетаний из 3 по 2 или (3*2)/2 ) по каждому показателю отдельно.
Обычно множественные сравнения выполняются в среде статпакетов. По моим сведениям чаще применяется метод Шеффе. Из моего опыта: все поправки дают почти всегда одинаковый результат.
Применение поправок зависит и от равенства-неравенства дисперсий.
Если равенство дисперсий не выполняется , то применяются особые поправки.
Видимо, в вашем случае лучше применять многофакторный одномерный или многофакторный многомерный дисперсионный анализ.
По непараметрическим методам: если при сравнении нескольких независимых выборок по
критерию Крускала-Уоллеса нулевая гипотеза отвергается (различия значимы),
следует провести все попарные сравнения каждой группы со всеми другими по критерию Манна-Уитни.
Также можно применять критерий направленных альтернатив Джонкира-Терпстра и другие методы.
Все попарные сравнения с поправками легко сделать в пакетах программ.

Сообщение отредактировал anserovtv - 2.10.2013 - 20:28
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 1.10.2013 - 13:30
Сообщение #3





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Вы не написали, отвергается ли нулевая гипотеза при сравнении всех групп сразу.

Сообщение отредактировал anserovtv - 1.10.2013 - 13:35
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
vas
сообщение 2.10.2013 - 06:51
Сообщение #4





Группа: Пользователи
Сообщений: 3
Регистрация: 30.09.2013
Пользователь №: 25350



Большое спасибо за ответ!

По Крускалл-Валлису, нулевая гипотеза отвергается по некоторым показателям.

Цитата(anserovtv @ 1.10.2013 - 13:30) *
В поправке Бонферрони уровень значимости альфа делится на число сравнений и р-значения сравниваются с этим уменьшенным уровнем значимости.
У вас , как я понимаю содержательную часть, будет делиться на 3 (число сочетаний из 3 по 2 или (3*2)/2 ) по каждому показателю отдельно.
Обычно множественные сравнения выполняются в среде статпакетов. По моим сведениям чаще применяется метод Щеффе. Из моего опыта: все поправки дают почти всегда одинаковый результат.
Применение поправок зависит и от равенства-неравенства дисперсий.
Если равенство дисперсий не выполняется , то применяются особые поправки.
Видимо, в вашем случае лучше применять многофакторный одномерный или многофакторный многомерный дисперсионный анализ.
По непараметрическим методам: если при сравнении нескольких независимых выборок по
критерию Крускала-Уоллеса нулевая гипотеза отвергается (различия значимы),
следует провести все попарные сравнения каждой группы со всеми другими по критерию Манна-Уитни.
Также можно применять критерий направленных альтернатив Джонкира-Терпстра и другие методы.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 2.10.2013 - 10:14
Сообщение #5





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Все эти непараметрические критерии с попарными сравнениями и с поправками значимости имеются в пакете
SPSS версий 19-21 /с графической иллюстрацией!/.
Нужно использовать новые диалоговые окна и открывать средство просмотра модели.
В модели будут показаны и все попарные сравнения.
Значимые попарные различия на графе и в таблицах выделяются цветом.
Слева выбираете и (или) выделяете критерий. Внизу справа находятся окна для выбора модели.
Поправки на множественность сравнений в таблицах устроены следующим образом:
уровень значимости сохраняется (0,05) , а значимости /р-значения/ увеличиваются!!!

Сообщение отредактировал anserovtv - 2.10.2013 - 20:31
Прикрепленные файлы
Прикрепленный файл  докум_2.bmp ( 1,31 мегабайт ) Кол-во скачиваний: 1047
Прикрепленный файл  дос2.bmp ( 2,78 мегабайт ) Кол-во скачиваний: 782
Прикрепленный файл  дос3.bmp ( 3,2 мегабайт ) Кол-во скачиваний: 930
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
vas
сообщение 3.10.2013 - 03:19
Сообщение #6





Группа: Пользователи
Сообщений: 3
Регистрация: 30.09.2013
Пользователь №: 25350



anserovtv,

Большое спасибо за подробное объяснение!
И отдельное спасибо за картинки!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 3.10.2013 - 19:59
Сообщение #7





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(anserovtv @ 1.10.2013 - 13:30) *
В поправке Бонферрони уровень значимости альфа делится на число сравнений и р-значения сравниваются с этим уменьшенным уровнем значимости.
У вас , как я понимаю содержательную часть, будет делиться на 3 (число сочетаний из 3 по 2 или (3*2)/2 ) по каждому показателю отдельно.


... а потом придётся поделить и на число показателей в "ковровом бомбометании попарными сравнениями" smile.gif есть хороший комикс на эту тему.

Другое дело, что метод множественного сравнения намного более разумно должен разобраться с числом степеней свободы и структурой сравнений.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 22.02.2014 - 12:52
Сообщение #8





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



у меня была где то простая формула поправки бонферрони, но я её потерял. Если у меня 68 испыиуемых и 80 переменных. Напомните , полжалуйста, как мне высчитать поправку, уровень занчимости о,05.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 23.02.2014 - 06:50
Сообщение #9





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(psychologist @ 22.02.2014 - 15:52) *
у меня была где то простая формула поправки бонферрони, но я её потерял. Если у меня 68 испыиуемых и 80 переменных. Напомните , полжалуйста, как мне высчитать поправку, уровень занчимости о,05.

Это даже не формула, а дробь: сколько тестов делаете на столько и делите p. При 80 переменных парных корреляций будет: (80*80-80)/2=3160. р=0,05/3160=0,000016. При таком уровне значимости проще вообще не проводить никаких исследований, т.к. даже если значимые корреляции найдутся, ничего нового в научном плане они не принесут: столь сильные связи уже давно открыты и никому не интересны. При таком числе переменных о поправках нужно забыть. Ваш единственный выход - сворачивать пространства переменных и/или испытуемых техниками разведочного анализа, а затем тестировать малое число более осмысленных гипотез. Например, можно провести анализ главных компонент (ну или какой-нибудь любимый вариант факторного анализа, метрического шкалирования) и опираясь на результаты ординации выделить наиболее интересные направления для дальнейшего распутывания клубка связей. Хотя в любом учебнике написано, что для таких техник число объектов должно быть в 3-10 раз больше числа переменных (и, вообще говоря, об этом следует помнить планируя исследование с 80 переменными и только 68 испытуемыми!), на практике исследователи этого часто не соблюдают, т.к. результаты ординации полезны ВСЕГДА, даже если об устойчивости решения и значимости речи вообще не идёт. Далее с использованием полученных факторных меток (factor scores) в качестве новых переменных можно провести кластерный анализ и посмотреть на сколько групп схожих испытуемых разделяется выборка, что за группы и т.д.

Сообщение отредактировал nokh - 23.02.2014 - 07:06
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 24.02.2014 - 00:50
Сообщение #10





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



nokh, можно вас попросить пояснить почему мы 80*80 , а потом вычитаем 80?
Вот про разведочный анализ что-то слышал. Где о нем можно почитать с примерами. Метрическое шкалирование, вы имеете многомерное?
Самая главная ошибка в планирование исследований, это мало дается денег для мотивации испытуемых. Если вообще дается(
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.02.2014 - 09:29
Сообщение #11





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 24.02.2014 - 01:50) *
nokh, можно вас попросить пояснить почему мы 80*80 , а потом вычитаем 80?


Потому что для к уровней фактора число попарных сравнений определяется как k(k-1)/2

Сообщение отредактировал 100$ - 24.02.2014 - 09:30
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 24.02.2014 - 10:42
Сообщение #12





Группа: Пользователи
Сообщений: 381
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(100$ @ 24.02.2014 - 10:29) *
Потому что для к уровней фактора число попарных сравнений определяется как k(k-1)/2
Это число называется биномиальным коэффициентом из k по 2.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.02.2014 - 12:00
Сообщение #13





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DoctorStat @ 24.02.2014 - 11:42) *
Это число называется биномиальным коэффициентом из k по 2.


Не то слово, доктор. Сплошная комбинаторика.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.02.2014 - 12:49
Сообщение #14





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



> Вот про разведочный анализ что-то слышал. Где о нем можно почитать с примерами. Метрическое шкалирование, вы имеете многомерное?


Прочитайте просто справку в википедии про Анализ принципиальных(главных) компонент (PCA).

Примеры есть в любом руководстве по многомерной статистике.





Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 24.02.2014 - 17:36
Сообщение #15





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(psychologist @ 24.02.2014 - 03:50) *
Вот про разведочный анализ что-то слышал. Где о нем можно почитать с примерами. Метрическое шкалирование, вы имеете многомерное?

В вашем окружении обязательно должен быть человек, владеющий статистикой и многомерными техниками, т.к. без них психология давно превратилась бы из науки в то, какой она видится многим нашим акцентуированным до грани безумия практикующим психологам wink.gif Лучше, чтобы первый раз технологию многомерного анализа вам показал такой человек. Даже не так важно какую: главные компоненты, факторный анализ или многомерное метрическое шкалирование (главные координаты) - с практической точки зрения они похожи; важна сама последовательность действий и интерпретация результатов. Самому осваивать будет потруднее. Посмотрите разделы по факторному анализу и многомерному шкалированию здесь: http://www.statsoft.ru/home/textbook/default.htm. Нормальные для освоения книги:
Дункан Крамер (2007) Математическая обработка данных в социальных науках. Современные методы, 2007 (есть в сети в djvu)
Наследов А.Д. (2004) Математические методы психологического исследования (даны пошаговые инструкции для пакета SPSS, есть в сети в pdf)
Наследов А.Д. (2005) SPSS. Компьютерный анализ данных в психологии и социальных науках (есть в сети в pdf)
Джонгман (1999) Анализ данных в экологии сообществ (для расширения кругозора, у экологов много интересных наработок. Есть в сети в djvu).
А примеры гуглите в сети.

Сообщение отредактировал nokh - 24.02.2014 - 17:47
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.02.2014 - 19:08
Сообщение #16





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 24.02.2014 - 01:50) *
Метрическое шкалирование, вы имеете многомерное?


Псюхологист, с вашего позволения несколько уточнений косметического характера.

Ну, во-первых, никакого одномерного шкалирования и не бывает. Так что, конечно, многомерное.

Во-вторых, метрическое шкалирование Торгерсона (1952)-это исторически первая доведенная до ума техника. Однако, что в факторном анализе, что в МШ самый цимес-это возможность повращать оси полученного решения, в целях улучшения его интерпретируемости. Так что ваш случай (принимая во внимание размерность вашего признакового пространства) - это как раз НЕметрическое шкалирование Краскела (1964) и Гутмана (1968). Разумеется, размерность признакового пространства не мешало бы подскоратить. Даже проф. статпакет матрицу 80x80 может мусолить довольно долго. А потом получить вырожденное решение.
Но это, опять же, к слову. Можете не обращать внимания.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 24.02.2014 - 20:06
Сообщение #17





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



как раз-таки на такие тонкости я все больше и больше стал обращать внимание.Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.02.2014 - 21:05
Сообщение #18





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(100$ @ 24.02.2014 - 19:08) *
Разумеется, размерность признакового пространства не мешало бы подскоратить. Даже проф. статпакет матрицу 80x80 может мусолить довольно долго. А потом получить вырожденное решение.



это серьезно? smile.gif даже древний StatGraph в 1988 на 286 с 1 мегабайтом ОЗУ считал 150х150 PCA

Стандартная материнка (это 16 ГБайт ОЗУ) позволяет сделать svd разложение матрицы 32000х32000. Если взять программное распределяющее (не в режиме полного копирования обращаемой матрицы) вычисление на кластер, то для редукции размерности доступны хоть пентабайтные размеры данных (сколько суммарно физической памяти есть в машинах, такой размер и можно обращать).

PS Всё это посильно для обычного исследователя.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.02.2014 - 22:09
Сообщение #19





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(p2004r @ 24.02.2014 - 22:05) *
это серьезно? smile.gif даже древний StatGraph в 1988 на 286 с 1 мегабайтом ОЗУ считал 150х150 PCA

Стандартная материнка (это 16 ГБайт ОЗУ) позволяет сделать svd разложение матрицы 32000х32000. Если взять программное распределяющее (не в режиме полного копирования обращаемой матрицы) вычисление на кластер, то для редукции размерности доступны хоть пентабайтные размеры данных (сколько суммарно физической памяти есть в машинах, такой размер и можно обращать).

PS Всё это посильно для обычного исследователя.


Это хорошие новости
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 26.02.2014 - 13:12
Сообщение #20





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



А если бы я высчитывал бонферрони для Анова, по такому же принципу было? 80*80-80
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 26.02.2014 - 14:45
Сообщение #21





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 26.02.2014 - 14:12) *
А если бы я высчитывал бонферрони для Анова, по такому же принципу было? 80*80-80


Вестимо. Только многомерный ДА так топорно не делается.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
psychologist
сообщение 26.02.2014 - 20:26
Сообщение #22





Группа: Пользователи
Сообщений: 125
Регистрация: 2.04.2012
Пользователь №: 23616



а какие там поправки?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 26.02.2014 - 20:50
Сообщение #23





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(psychologist @ 26.02.2014 - 21:26) *
а какие там поправки?


Смысл ДА - в омнибусных тестах. ДА был придуман для того, чтобы избавиться (ну, или минимизировать, елико возможно) проблему множественных сравнений. А все эти поправки сводят проблему к тому, чего создатели ДА всячески пытались избежать.
Связи конец.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 23.03.2014 - 21:16
Сообщение #24





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(100$ @ 24.02.2014 - 22:08) *
...Так что ваш случай (принимая во внимание размерность вашего признакового пространства) - это как раз НЕметрическое шкалирование Краскела (1964) и Гутмана (1968).

Разбирался с терминами, действительно обычно под анализом главных координат (PCoA) подразумевается классическое метрическое шкалирование, тогда как в случае использования произвольных мер сходства говорят о неметрическом шкалировании. Меня смутили авторы пакета PAST, в учебнике по которому PCoА и метрическое шкалирование указываются как синонимы.

Пока гуглил по шкалированию, наткнулся на интересный пост (http://www.papont.su/2013/03/blog-post_26.html) и не удержался от любопытства, сам проанализировал данные по гаплогруппам Y-хромосомы (http://www.eupedia.com/europe/european_y-dna_haplogroups.shtml) с использованием разных мер сходства. В очередной раз убедился, что наиболее адекватную картину дают методы, основанные на соотношении величин, а не на их абсолютных значениях. В данном случае это хорошо видно по татарам и башкирам, которые, как скоро докажут, суть - белые порубежники, охранявшие южные границы Великой Тартарии и хапнувшие южных и жёлтых кровей. У автора же блога башкиры ближе к Дании и Исландии. Ниже подшил результаты НЕметрического многомерного шкалирования и кластерного анализа (UPGMA) с использованием в качестве меры сходства корреляции Спирмена (Rho). В связи с последними событиями не перстаю удивляться насколько успешно небольшой группе носителей хищных паттернов генов троглодитов и ракшасов удаётся и дальше стравливать и дробить кластер гиперборейцев!

Сообщение отредактировал nokh - 23.03.2014 - 21:22
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 23.03.2014 - 23:12
Сообщение #25





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(nokh @ 23.03.2014 - 21:16) *
Пока гуглил по шкалированию, наткнулся на интересный пост (http://www.papont.su/2013/03/blog-post_26.html) и не удержался от любопытства, сам проанализировал



"Перевернутую" карту Европы я увидел у Автора блога на первом же рисунке smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.03.2014 - 00:01
Сообщение #26





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



А гиперборейцы - это те самые голубоглазые блондины, от которых все и произошли?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 25.03.2014 - 22:24
Сообщение #27





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(100$ @ 24.03.2014 - 03:01) *
А гиперборейцы - это те самые голубоглазые блондины, от которых все и произошли?

Там, говорят, было больше арийских родов, чем славянских - соответственно, больше серо- и зеленогазых, чем голубо- и кареглазых. А по поводу "произошли" - нет, конечно. Как, скажем, негр может произойти от белого человека или наоборот? Эдак можно вообще договориться до того что люди от обезьян произошли eek.gif А произошла только современная цивилизация, восстановилась в новом виде после последней войны с кощеями. Говорят, вся Сибирь в руинах... Потому и стравливают, что прошлого не знаем. Перефразируя одного современного политика, "сегодня в завтрашний день в прошлое не все могут смотреть, вернее смотреть могут не только лишь все, мало кто может это делать!" smile.gif А современная история - лженаука, поэтому посмотрим что биологи и генетики лет через 20 скажут.
PS Если что, то ничего не курю (12 лет), не пью (скоро 7), грибы ем только съедобные, но дышу уральскими газами.

Сообщение отредактировал nokh - 25.03.2014 - 22:39
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.03.2014 - 22:31
Сообщение #28





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nokh @ 25.03.2014 - 23:24) *
Эдак можно вообще договориться до того что люди от обезьян произошли eek.gif


Nokh, исключительно в расчете на ваше чувство юмора. Еще с советских времен:

Я книжку читал. В ней написано было,
Что предки людей - шимпанзе и горилла.
Я долго не верил, но вас повстречав,
Вдруг понял, что Дарвин был все-таки прав. (с) не помню этого шутника.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 25.03.2014 - 23:00
Сообщение #29





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



выучу laugh.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему