Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Рандомизация, бутстреп и методы Монте-Карло, Примеры статистического анализа данных по биологии и экологии
stok1946
сообщение 8.08.2012 - 07:51
Сообщение #1





Группа: Пользователи
Сообщений: 27
Регистрация: 10.05.2012
Пользователь №: 23748



Уважаемые коллеги. К сожалению, у нас нет вопросов на форум (точнее, они, безусловно есть, но не о них речь).

Специалисты насчитывают сотни тысяч изданных книг по мат. статистике. И обычный читатель вряд ли в состоянии одолеть хотя бы 2% из них.
Но мы пошли на риск и начали писать еще одну книгу "Рандомизация, бутстреп и методы Монте-Карло. Примеры статистического анализа данных по биологии и экологии."
Написали три главы и по ряду причин сочли разумным выложить для свободного прочтения ее неполный вариант. Во-первых, время не ждет. Во-вторых, эти три первые главы имеют, в некотором смысле, общедисциплинарный характер и могут быть интересны и биологам, и экономистам, и врачам. Далее будут описаны многомерные методы, а они в значительной мере имеют экологическую специфику. И, наконец, в-третьих, мы с благодарностью примем любые замечания и пожелания (туда ли мы плывем и нужно ли все это).
Часть примеров была подготовлена в статистической среде R (скрипты представлены в приложении). Мы не имеем здесь совсем мало опыта и надеемся на доброжелательную критику специалистов в этой области. Кроме того, "Остапа часто несло" smile.gif , и в результате некоторые наши обороты могут быть статистически неполиткорректными. Мы надеемся, что закаленные в "терминологических битвах" и умудренные товарищи нас поправят.
А аспирантам по различным биологиям и медицинам новый взгляд на статистические вещи может быть весьма полезен.
А пока не сочтите за труд зайти на
http://www.ievbras.ru/ecostat/Kiril/Article/A32/Stare.htm
и скачать файл "Рандомизация, бутстреп и все, все, все..." в формате Acrobat Reader.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
pifagor
сообщение 1.09.2012 - 15:38
Сообщение #2





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130



В книге на стр. 29 написано критерий Стьюдента-Крамера-Уэлча. Прошу авторов разъяснить, откуда взято это название критерия. О чем идет речь? В доступной мне статистической литературе я не нашел такого названия, кроме опусов профессора Орлова. Но когда я зашел на форум к Орлову и задал вопрос, то не только не получил внятного ответа, но мои вопросы и сообщения были удалены без всякого объяснения. Похоже, он это придумал и это его вклад в современную статистику. Более того, Орлов пишет, что этот критерий является непараметрическим. Поэтому я задаю вопрос вроде бы как нормальным авторам: откуда? Откуда дровишки? Ссылаясь на Орлова, авторы также вносят вклад в современную статистику. Если вы помните, ложкой дегтя можно испортить бочку меда. Советую исключить из списка литературы опусы Орлова. Хотя если авторы профессора и Орлов профессор, то как говорится ...

Сообщение отредактировал pifagor - 1.09.2012 - 15:42
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
stok1946
сообщение 1.09.2012 - 23:15
Сообщение #3





Группа: Пользователи
Сообщений: 27
Регистрация: 10.05.2012
Пользователь №: 23748



Цитата(pifagor @ 1.09.2012 - 16:38) *
В книге на стр. 29 написано критерий Стьюдента-Крамера-Уэлча. Прошу авторов разъяснить, откуда взято это название критерия.

Глубокоуважаемый Pifagor. Вы, кажется, чем-то раздосадованы? Мы в чем-то виноваты? eek.gif
Но попробую ответить на конкретику.
1. Я набрал в Гугле "критерий Стьюдента-Крамера-Уэлча" - вывалилось несколько десятков ссылок. Правда говорят о критерии Стьюдента и его модификации - критерии Крамера-Уэлча. Но назвать всех их семейством критериев Стьюдента-Крамера-Уэлча - не есть криминал.
2. Относительно устойчивости бутстреп-процедур при негауссовом характере распределения выборки вроде много рассуждается и Эфроном и другими авторами (да и нами, в том числе на наших примерах). Если у Вас есть подходящая выборка - давайте попробуем поэкспериментировать.
3. Относительно книжки Манли - нашел только полуслепой скан весом около 200 Мб и только 1-го издания 90-х годов. Мы взяли из этой книжки только последовательность изложения (рубрикатор глав) и очень небольшие куски изложения. Почему просто не перевели?
Во-первых, там у него американские примеры, которые трудно повторно просчитать. Нам показалось интересным и полезным выполнить все расчеты самим и на собственных примерах (точнее, на информации, предоставленной нам нашими друзьями - биологами и экологами).
Во-вторых, изложение Манли вращается вокруг десятка фортрановских программ, которые он сам и сочинил. Я на Фортране уже не пишу лет 20. Поэтому мы вначале показали ресамплинг на двух простеньких программах (Ховелла и Ядвисчака), а потом все подряд стали просчитывать в статистической среде R (тем более, что программы Манли в многомерных случаях стали глючить). Так что наша книжка - еще и самоучитель по R-кодам.
В-третих, в англоязычной литературе иногда рассказывается о тех же вещах подробнее и интереснее, чем у Манли. Это просто потеряется при переводе. Как и те вещи, о которых Манли вообще не упоминает.
4. К сожалению, раздел по мета-анализу в упоминаемой Вами книги по большей части (и Ваша цитата, в частности) - голый перевод финской методички Sinha et al., 2006 (на нее трижды идет ссылка по тексту). Сам я никогда мета-анализом практически не занимался, каюсь. Но является ли криминалом попытка донести прочитанное до читателей в виде литературного обзора?
5. Не думаю также, что упоминание Орлова и его работ является криминалом. Можно по разному к нему относиться, как к ученому или человеку, но у него я впервые увидел в табличной форме список разъясняемых статистических терминов. Хорошо, правда, его устаканить, приблизить к грешной земле и узаконить.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
pifagor
сообщение 2.09.2012 - 09:16
Сообщение #4





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130



Цитата(stok1946 @ 2.09.2012 - 00:15) *
Глубокоуважаемый Pifagor. Вы, кажется, чем-то раздосадованы? Мы в чем-то виноваты? eek.gif
Но попробую ответить на конкретику.
1. Я набрал в Гугле "критерий Стьюдента-Крамера-Уэлча" - вывалилось несколько десятков ссылок. Правда говорят о критерии Стьюдента и его модификации - критерии Крамера-Уэлча. Но назвать всех их семейством критериев Стьюдента-Крамера-Уэлча - не есть криминал.
2. Относительно устойчивости бутстреп-процедур при негауссовом характере распределения выборки вроде много рассуждается и Эфроном и другими авторами (да и нами, в том числе на наших примерах). Если у Вас есть подходящая выборка - давайте попробуем поэкспериментировать.
3. Относительно книжки Манли - нашел только полуслепой скан весом около 200 Мб и только 1-го издания 90-х годов. Мы взяли из этой книжки только последовательность изложения (рубрикатор глав) и очень небольшие куски изложения. Почему просто не перевели?
Во-первых, там у него американские примеры, которые трудно повторно просчитать. Нам показалось интересным и полезным выполнить все расчеты самим и на собственных примерах (точнее, на информации, предоставленной нам нашими друзьями - биологами и экологами).
Во-вторых, изложение Манли вращается вокруг десятка фортрановских программ, которые он сам и сочинил. Я на Фортране уже не пишу лет 20. Поэтому мы вначале показали ресамплинг на двух простеньких программах (Ховелла и Ядвисчака), а потом все подряд стали просчитывать в статистической среде R (тем более, что программы Манли в многомерных случаях стали глючить). Так что наша книжка - еще и самоучитель по R-кодам.
В-третих, в англоязычной литературе иногда рассказывается о тех же вещах подробнее и интереснее, чем у Манли. Это просто потеряется при переводе. Как и те вещи, о которых Манли вообще не упоминает.
4. К сожалению, раздел по мета-анализу в упоминаемой Вами книги по большей части (и Ваша цитата, в частности) - голый перевод финской методички Sinha et al., 2006 (на нее трижды идет ссылка по тексту). Сам я никогда мета-анализом практически не занимался, каюсь. Но является ли криминалом попытка донести прочитанное до читателей в виде литературного обзора?
5. Не думаю также, что упоминание Орлова и его работ является криминалом. Можно по разному к нему относиться, как к ученому или человеку, но у него я впервые увидел в табличной форме список разъясняемых статистических терминов. Хорошо, правда, его устаканить, приблизить к грешной земле и узаконить.

1. Если можно, дайте ссылку, откуда скачать Манли. Очень прошу. Или поделитесь, если конечно не жалко.
2. Если можно, укажите распределение величины эффекта, какое же распределение этой величины. Я имею в виду вашу книгу, стр. 225. Эффект измеряется отношением разности средних к ст.отклонению разности. Книга гл.3 Современные подходы к статистическому анализу данных. Вы ушли от ответа. Или это не ваша книга?
3. Критерия Крамера-Уэлча (еще приплюсовали сюда и Стьюдента) нет. Крамер и Уэлч не имеют к этому отношения. Крамер в своей книге вообще не упоминает даже этот критерий.
Именно на эту книгу ссылается Орлов. Поймите, не надо заниматься профанацией прикладной статистики. Или вы используете традиционные критерии или предлагаете свой. В этом нет криминала. Но свой- давайте ему название, укажите как им пользоваться, таблицы и т.п. Но причем здесь Крамер? Это вызывает удивление. И причем здесь Уэлч? И почему этот критерий как пишет Орлов непараметрический? Где аргументы?
Назовите критерий - критерий Крамера-Уэлча-Фишера-Стьюдента-Саттарвайта-Рао. Орлов здесь примазывается к классикам. Ставит себя в этот ряд. Этот ряд можно продолжить. Добавить Вейра, Тьюки, Шеффе обязательно. Вот это будет критерий. Нужна элементарная добросовестность. А не использовать имена классиков в роли бренда. Элементарно, Ватсон. Вы или не понимаете или ваньку валяете.
Но- черт с ним, с этим Орловым. Орловых много.
Еще раз пожалуйста, книгу Манли. И распределение на стр. 225. Очень нужно для работы.
А так все ничего. Желаю удачи.

Сообщение отредактировал pifagor - 2.09.2012 - 10:43
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
stok1946
сообщение 3.09.2012 - 09:31
Сообщение #5





Группа: Пользователи
Сообщений: 27
Регистрация: 10.05.2012
Пользователь №: 23748



Цитата(pifagor @ 2.09.2012 - 10:16) *
Критерия Крамера-Уэлча (еще приплюсовали сюда и Стьюдента) нет. Но причем здесь Крамер? Это вызывает удивление. И причем здесь Уэлч? И почему этот критерий как пишет Орлов непараметрический? Где аргументы?
Назовите критерий - критерий Крамера-Уэлча-Фишера-Стьюдента-Саттарвайта-Рао.

Любой термин - "штамп межчеловеческого ожидания со сложно-переменным значением". Т.е. выборочная оценка истинного параметра. И, как английский суд, основана на прецедентах. smile.gif
За "Крамера-Уэлча" говорят, например:
http://www.machinelearning.ru/wiki/index.p...терий_Стьюдента
http://matstats.ru/kramer.html
Против - хотя бы дискуссия на нашем форуме:
http://forum.disser.ru/index.php?showtopic=2550&st=0
Мне, честно говоря, не кажется, что проблема точности в статистике сводится только к тому, следует ли упоминать Крамера среди творцов приближенных формул для решения проблемы Беренса-Фишера или ограничиться Уэлчем и Сатервайтом.
Столь же туманна и малозначима для меня лейбла "параметрический или непараметрический критерий" (то ли в числе предположений его использования есть требование соответствия данных какому-либо теоретическому распределению, то ли при оценке р-значения он на оное распределение опирается). Тот же Х2-критерий одни называют параметрическим, а другие - нет. Единственным индикатором здесь является сущность процедуры тестирования.
Но я с готовностью удалю из своей книги бедолагу Крамера, коль скоро он Вам не пришелся по душе (тем более, что я этот критерий вообще в книге не использовал).

Относительно мета-анализа прикрепляю файл, перевод которого явился основой для упоминаемого Вами раздела. Там в свою очередь есть ссылки, которые могут Вам помочь.

Как я уже упоминал, скан книжки Манли весит 200 Мегабайт. Порекомендуйте любимый файлообменник и свяжитесь со мной по электронной почте (есть причины не выкладывать ее в открытый доступ).
Прикрепленные файлы
Прикрепленный файл  MA_workshop.pdf ( 624,53 килобайт ) Кол-во скачиваний: 383
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- stok1946   Рандомизация, бутстреп и методы Монте-Карло   8.08.2012 - 07:51
- - TheThing   Спасибо за труд! Думаю, книга должна получитьс...   9.08.2012 - 17:55
- - stok1946   Большое спасибо TheThing за добрые слова и внимани...   9.08.2012 - 22:18
|- - TheThing   Цитата(stok1946 @ 9.08.2012 - 22:18)...   10.08.2012 - 13:21
- - 100$   ЦитатаДело в том, что популяционное среднее, как и...   10.08.2012 - 14:25
|- - TheThing   Цитата(100$ @ 10.08.2012 - 14:2...   10.08.2012 - 17:12
|- - 100$   Цитата(TheThing @ 10.08.2012 - 17:12...   10.08.2012 - 23:08
|- - stok1946   Цитата(100$ @ 11.08.2012 - 00:0...   11.08.2012 - 09:57
||- - 100$   Цитата(stok1946 @ 11.08.2012 - 09:57...   11.08.2012 - 14:17
|||- - TheThing   Цитата(100$ @ 11.08.2012 - 14:1...   11.08.2012 - 14:45
|||- - 100$   Цитата(TheThing @ 11.08.2012 - 14:45...   11.08.2012 - 16:40
||- - pifagor   Цитата(stok1946 @ 11.08.2012 - 10:57...   1.09.2012 - 15:52
|- - TheThing   Цитата(100$ @ 10.08.2012 - 23:0...   11.08.2012 - 13:17
- - nokh   Цитата(stok1946 @ 8.08.2012 - 10:51)...   12.08.2012 - 22:28
- - stok1946   Глубокоуважаемый nokh! Искренне благодарен за ...   13.08.2012 - 19:50
|- - TheThing   Цитата(stok1946 @ 13.08.2012 - 19:50...   13.08.2012 - 21:20
||- - stok1946   Цитата(TheThing @ 13.08.2012 - 22:20...   14.08.2012 - 21:54
|- - nokh   Цитата(stok1946 @ 13.08.2012 - 22:50...   15.08.2012 - 18:52
- - p2004r   Мне представляется недостатком, что число перевыбо...   14.08.2012 - 00:23
|- - stok1946   Цитата(p2004r @ 14.08.2012 - 01:23) ...   15.08.2012 - 18:32
|- - p2004r   Цитата(stok1946 @ 15.08.2012 - 18:32...   15.08.2012 - 23:59
|- - stok1946   Цитата(p2004r @ 16.08.2012 - 00:59) ...   16.08.2012 - 21:05
|- - p2004r   Цитата(stok1946 @ 16.08.2012 - 21:05...   16.08.2012 - 21:37
- - 100$   Джентльмены! Не могу в литературе найти подска...   14.08.2012 - 15:20
- - pifagor   В книге на стр. 29 написано критерий Стьюдента-Кра...   1.09.2012 - 15:38
|- - stok1946   Цитата(pifagor @ 1.09.2012 - 16:38) ...   1.09.2012 - 23:15
|- - pifagor   Цитата(stok1946 @ 2.09.2012 - 00:15)...   2.09.2012 - 09:16
|- - stok1946   Цитата(pifagor @ 2.09.2012 - 10:16) ...   3.09.2012 - 09:31
|- - pifagor   Цитата(stok1946 @ 3.09.2012 - 10:31)...   3.09.2012 - 13:52
- - pifagor   Предположим, у нас имеется генеральная совокупност...   1.09.2012 - 16:12
- - pifagor   Manly B. F. J. Randomization, bootstrap and Monte ...   1.09.2012 - 16:30
- - pifagor   ПРОБЛЕМЫ ЭКОЛОГИЧЕСКОГО ЭКСПЕРИМЕНТА (ПЛАНИРОВАНИЕ...   1.09.2012 - 18:20
- - pifagor   Я не применял бутстреп. Я мало знаком с примерами ...   4.09.2012 - 08:14
|- - stok1946   Цитата(pifagor @ 4.09.2012 - 09:14) ...   8.09.2012 - 15:28
|- - Диана   Цитата(stok1946 @ 8.09.2012 - 16:28)...   13.09.2012 - 13:10
|- - stok1946   Цитата(Диана @ 13.09.2012 - 14:10) з...   15.09.2012 - 18:34
|- - pifagor   Цитата(stok1946 @ 15.09.2012 - 19:34...   16.09.2012 - 13:01
- - Диана   в статье мед.журнала была фраза: Атрибутивное знач...   13.09.2012 - 14:08


Добавить ответ в эту темуОткрыть тему