Рандомизация, бутстреп и методы Монте-Карло

Рандомизация, бутстреп и методы Монте-Карло, Примеры статистического анализа данных по биологии и экологии

stok1946 Просмотр профиля	8.08.2012 - 07:51 Сообщение #1
Группа: Пользователи Сообщений: 27 Регистрация: 10.05.2012 Пользователь №: 23748	Уважаемые коллеги. К сожалению, у нас нет вопросов на форум (точнее, они, безусловно есть, но не о них речь). Специалисты насчитывают сотни тысяч изданных книг по мат. статистике. И обычный читатель вряд ли в состоянии одолеть хотя бы 2% из них. Но мы пошли на риск и начали писать еще одну книгу "Рандомизация, бутстреп и методы Монте-Карло. Примеры статистического анализа данных по биологии и экологии." Написали три главы и по ряду причин сочли разумным выложить для свободного прочтения ее неполный вариант. Во-первых, время не ждет. Во-вторых, эти три первые главы имеют, в некотором смысле, общедисциплинарный характер и могут быть интересны и биологам, и экономистам, и врачам. Далее будут описаны многомерные методы, а они в значительной мере имеют экологическую специфику. И, наконец, в-третьих, мы с благодарностью примем любые замечания и пожелания (туда ли мы плывем и нужно ли все это). Часть примеров была подготовлена в статистической среде R (скрипты представлены в приложении). Мы не имеем здесь совсем мало опыта и надеемся на доброжелательную критику специалистов в этой области. Кроме того, "Остапа часто несло" , и в результате некоторые наши обороты могут быть статистически неполиткорректными. Мы надеемся, что закаленные в "терминологических битвах" и умудренные товарищи нас поправят. А аспирантам по различным биологиям и медицинам новый взгляд на статистические вещи может быть весьма полезен. А пока не сочтите за труд зайти на http://www.ievbras.ru/ecostat/Kiril/Article/A32/Stare.htm и скачать файл "Рандомизация, бутстреп и все, все, все..." в формате Acrobat Reader.

Ответов

stok1946 Просмотр профиля	9.08.2012 - 22:18 Сообщение #2
Группа: Пользователи Сообщений: 27 Регистрация: 10.05.2012 Пользователь №: 23748	Большое спасибо TheThing за добрые слова и внимание к нашей скромной работе. Несколько слов пояснений. Мы пытались адресовать нашу книжку массовому слою аспирантов - биологам, экологам, медикам. В большинстве случаев у них едва остается время от основной экспериментальной работы, чтобы освоить один какой-нибудь стандартный пакет типа Statistica. Поэтому у них естественна тяга к простеньким модулям, запускаемым через меню ("просчитать и забыть"). И в этом их упрекнуть трудно. И лишь два из десяти аспирантов и будущих научных работников приобретают вкус к "статистической продвинутости" и начинают осваивать язык R, MathLab и проч. Программа Ховела при всей ее "демонстрационности" все же реализует 13 основных методов одно-двухмерной обработки, необходимость которых на практике наиболее велика (скажем так, это - рамки 70-80% защищаемых диссертаций). Но зачем им тогда рандомизация и бутстреп, если есть Statistica? Стандартные замечания оппонента к рецензируемой диссертации очень часто сводятся к "каверзным" фразам типа "А как Вы проверяли нормальность распределения показателя или равенство дисперсий в группах" или касаются иных предположений классического анализа. Ответ соискателя "Мы выполняли параллельно расчеты с использованием рандомизационного теста" - прекрасный способ аргументации, призванный убедить самый придирчивый Ученый Совет. Поэтому мы хотим написать не очередное руководство по использованию среды R, а описать смысл самих методов и представить весь спектр инструментальных средств расчета (от простых программулек для самых занятых до более сложных языковых конструкций для "продвинутых"). Что касается определения доверительных интервалов, то их в литературе довольно много и в целом они все нас устраивают. Мы "не гурманы, а потребители " и нам достаточна его интерпретация, основанная на интуиции: доверительный интервал почти наверняка содержит истинное значение оцениваемого параметра θ, если p достаточно велико (скажем, 0,95 или 0,99). Единственное, против чего мы - это использовать предложенное Гмурманом словосочетание "покрывает параметр", т.к. опыт работы на станции искусственного осеменения крупного рогатого скота вызывает в нас неординарные ассоциации.

TheThing Просмотр профиля	10.08.2012 - 13:21 Сообщение #3
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251	Цитата(stok1946 @ 9.08.2012 - 22:18) Что касается определения доверительных интервалов, то их в литературе довольно много и в целом они все нас устраивают. Мы "не гурманы, а потребители " и нам достаточна его интерпретация, основанная на интуиции: доверительный интервал почти наверняка содержит истинное значение оцениваемого параметра θ, если p достаточно велико (скажем, 0,95 или 0,99). Единственное, против чего мы - это использовать предложенное Гмурманом словосочетание "покрывает параметр", т.к. опыт работы на станции искусственного осеменения крупного рогатого скота вызывает в нас неординарные ассоциации. По-моему мнению, эта интуитивная интерпретация, которая приведена в Википедии или справочнике по прикладной статистике за 1989 год, не совсем удачно микшует 2 кардинально отличающиеся школы - школу Баеса и школу частотников. В школе Баеса, интервал доверия (credible interval) - это апостериорная вероятность, что некий параметр лежит в определенных диапазонах и она составляет например 0.9. Вот значение 0.9 - ассоциируется с вероятностью, с "почти наверняка". А в школе частотников доверительные интервалы не имеют никакого отношения к вероятностям. Я очень осторожно отношусь к определениям в Википедии - возьмите тоже определение p-value: "In statistical significance testing, the p-value is the probability of obtaining a test statistic ..... bla-bla-bla то есть p-value - это вероятность, а на самом деле это особый вид вероятности, а именно условная вероятность. Разница между вероятностью и условной вероятностью - небо и земля Большинство западных учебников дает неправильное определение из Вики (как обстоит дело с нашими учебниками Вы сами знаете ) и лишь немногие авторитетные источники (в том числе литература по SAS, которая для меня является практически эталоном качества) приводит правильные формулировки. А когда Вики переводится на русский язык, мы на защитах имеем, что р - это "достоверность отличий", р>0.05 - это "нет разницы между средними", p - это ошибка первого рода, р - это вероятность случайно получить наблюдаемые результаты и .т.д Я понял основное направление книги, с удовольствием читаю в свободную минуту! Сообщение отредактировал TheThing - 10.08.2012 - 13:38

Сообщений в этой теме

stok1946 Рандомизация, бутстреп и методы Монте-Карло 8.08.2012 - 07:51

TheThing Спасибо за труд! Думаю, книга должна получитьс... 9.08.2012 - 17:55

stok1946 Большое спасибо TheThing за добрые слова и внимани... 9.08.2012 - 22:18

TheThing Цитата(stok1946 @ 9.08.2012 - 22:18)... 10.08.2012 - 13:21

100$ ЦитатаДело в том, что популяционное среднее, как и... 10.08.2012 - 14:25

TheThing Цитата(100$ @ 10.08.2012 - 14:2... 10.08.2012 - 17:12

100$ Цитата(TheThing @ 10.08.2012 - 17:12... 10.08.2012 - 23:08

stok1946 Цитата(100$ @ 11.08.2012 - 00:0... 11.08.2012 - 09:57

100$ Цитата(stok1946 @ 11.08.2012 - 09:57... 11.08.2012 - 14:17

TheThing Цитата(100$ @ 11.08.2012 - 14:1... 11.08.2012 - 14:45

100$ Цитата(TheThing @ 11.08.2012 - 14:45... 11.08.2012 - 16:40

pifagor Цитата(stok1946 @ 11.08.2012 - 10:57... 1.09.2012 - 15:52

TheThing Цитата(100$ @ 10.08.2012 - 23:0... 11.08.2012 - 13:17

nokh Цитата(stok1946 @ 8.08.2012 - 10:51)... 12.08.2012 - 22:28

stok1946 Глубокоуважаемый nokh! Искренне благодарен за ... 13.08.2012 - 19:50

TheThing Цитата(stok1946 @ 13.08.2012 - 19:50... 13.08.2012 - 21:20

stok1946 Цитата(TheThing @ 13.08.2012 - 22:20... 14.08.2012 - 21:54

nokh Цитата(stok1946 @ 13.08.2012 - 22:50... 15.08.2012 - 18:52

p2004r Мне представляется недостатком, что число перевыбо... 14.08.2012 - 00:23

stok1946 Цитата(p2004r @ 14.08.2012 - 01:23) ... 15.08.2012 - 18:32

p2004r Цитата(stok1946 @ 15.08.2012 - 18:32... 15.08.2012 - 23:59

stok1946 Цитата(p2004r @ 16.08.2012 - 00:59) ... 16.08.2012 - 21:05

p2004r Цитата(stok1946 @ 16.08.2012 - 21:05... 16.08.2012 - 21:37

100$ Джентльмены! Не могу в литературе найти подска... 14.08.2012 - 15:20

pifagor В книге на стр. 29 написано критерий Стьюдента-Кра... 1.09.2012 - 15:38

stok1946 Цитата(pifagor @ 1.09.2012 - 16:38) ... 1.09.2012 - 23:15

pifagor Цитата(stok1946 @ 2.09.2012 - 00:15)... 2.09.2012 - 09:16

stok1946 Цитата(pifagor @ 2.09.2012 - 10:16) ... 3.09.2012 - 09:31

pifagor Цитата(stok1946 @ 3.09.2012 - 10:31)... 3.09.2012 - 13:52

pifagor Предположим, у нас имеется генеральная совокупност... 1.09.2012 - 16:12

pifagor Manly B. F. J. Randomization, bootstrap and Monte ... 1.09.2012 - 16:30

pifagor ПРОБЛЕМЫ ЭКОЛОГИЧЕСКОГО ЭКСПЕРИМЕНТА (ПЛАНИРОВАНИЕ... 1.09.2012 - 18:20

pifagor Я не применял бутстреп. Я мало знаком с примерами ... 4.09.2012 - 08:14

stok1946 Цитата(pifagor @ 4.09.2012 - 09:14) ... 8.09.2012 - 15:28

Диана Цитата(stok1946 @ 8.09.2012 - 16:28)... 13.09.2012 - 13:10

stok1946 Цитата(Диана @ 13.09.2012 - 14:10) з... 15.09.2012 - 18:34

pifagor Цитата(stok1946 @ 15.09.2012 - 19:34... 16.09.2012 - 13:01

Диана в статье мед.журнала была фраза: Атрибутивное знач... 13.09.2012 - 14:08

« Предыдущая тема · Медицинская статистика · Следующая тема »