Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >

pifagor
Отправлено: 16.09.2012 - 13:01





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(stok1946 @ 15.09.2012 - 19:34) *
pifagor имел в виду модификацию формулы параметрического критерия Стьюдента для оценки равенства средних двух выборок. которую выполнил Уэлч (Welch), чтобы применять ее для неравных дисперсий и объемов .
Это, вероятно, не относится к формуле Крамера для коэффициент связи в таблицах сопряженности (т.е. попытки нормировать ХиХи-статистику).
Даже pifagor сказал, что он - достойный дядька и ото всюду его изгонять нельзя. rolleyes.gif

Мы использовали при подборе моделей приведенный коэффициент детерминации (Adjusted R2), рассчитываемый по формулам средних квадратов.
Nagelkerke (1991) обобщил формулу для расчета коэффициента детерминации, используя оценки максимального правдоподобия ( она приведена, например, в http://en.wikipedia.org/wiki/Coefficient_of_determination )

Проф. Орлов иногда называет себя учеником Крамера, иногда учеником Боровкова (автор учебника), иногда учеником Большева (таблицы по математической статистике). На меньшее он не согласен. Только такие учителя и не иначе. Всех остальных он считает невеждами и плагиаторами. Так, например, он называет Кобзаря, автора полезного справочника по статистическим методам. Причина же, по-моему, кроется в том, что Кобзарь в своем обширном списке литературы, увы, не упоминает опусы Орлова. Амбиции, все амбиции. Обиды живых классиков.
  Форум: Медицинская статистика · Просмотр сообщения: #14170 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 9.09.2012 - 11:59





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(p2004r @ 7.09.2012 - 20:31) *
Если строите разницу, то гипотеза "выход 0 из построенного доверительного интервала". Тогда матожидания выборок различны с вероятностью ошибки меньше чем построенный интервал (в некотором диапазоне можно оценивать "точную" вероятность ошибки). Пока 0 внутри построенного доверительного интервала "данных недостаточно что бы опровергнуть".

Я взял массив данных из книги объемом 400. В экселе диаграмма симметричная, нормальное распределение. Потом извлечение двух выборок объемом по 5 способом бутстрепа. И рассчет в экселе критерия Стьюдента, средних, отклонений, различия средних. Что можно сказать? Бутстреп дает более узкие доверительные интервалы. Ошибочных решений нет. Доверительные интервалы по Стьюденту более широкие всегда. И это, когда нормальное распределение. А если нет? Еще попробую этот вариант. Бутстреп не требует нормальности. Не надо никаких критериев. И это на выборках сверхмалых объемом 5. Фантастика, но факт.
  Форум: Медицинская статистика · Просмотр сообщения: #14147 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 7.09.2012 - 12:49





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(p2004r @ 6.09.2012 - 19:43) *
раз не сказали какой уровень данного показателя у патологии, то и берем по минимуму. будет выборка с патологией -- будет нормальное решение по возможности их разделения.

А вот если мы имеем две небольшие выборки, объемом по 10-12 вариант. Как проверить с помощью бутстрепа гипотезу о неравенстве средних? Мы размножаем обе выборки, извлекаем случайно попарно того же объема и вычисляем разность средних. Таких разностей мы получаем допустим 1000. Ранжируем массив. И находим доверительный интервал разности средних. Я правильно понимаю? А гипотеза как? Что с ней? Я не работал с бутстрепом и потому спрашиваю.
  Форум: Медицинская статистика · Просмотр сообщения: #14136 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 6.09.2012 - 15:22





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(p2004r @ 1.09.2012 - 16:14) *
ну с такими подходами уж лучше оценить бутстрепом среднеквадратическое отклонение и задать интервал как "три сигмы"

А почему три сигмы, а не четыре или даже пять? Биологи часто работают с малыми выборками, 6, 8 или 12 субъектов.
  Форум: Медицинская статистика · Просмотр сообщения: #14134 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 4.09.2012 - 21:07





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(TheThing @ 4.09.2012 - 13:58) *
Если NHST (Null hypothesis significance testing) позволяет нам сказать например, что средние двух выборок статистически значимо отличаются (H0 = X1 - X2 = 0), то величина эффекта позволяет нам понять, насколько "сильно" ("много", "больше") они отличаются. Ведь при p < .05 они могут отличаться как на 0.000001 так и на значение, "далекое" от нуля. Существует приблизительно около 30 величин эффекта, все они в основном делятся на 2 группы: величина эффекта D Коэна (Cohen) и r Пирсона. Более подробно обо всем этом можно почитать в 2 замечательных книгах о величинах эффекта:

1) Effect size for research, a broad practical approach by Robert Grissom
2) Essential guide to effect size by Paul Ellis

Обе книги можно словить в свободном доступе.

Чтобы показать на пальцах, что может величина эффекта и не может NHST, посмотрите следующий пример, тем более я его завязал на любимом Вами критерии Стьюдента smile.gif

На рис. 1 выдержка из результатов анализа SPSS. Обратите внимание на колонку "разница средних" - Mean difference - в обеих случаях мы видим разницу в -2,20, но для первой таблицы разница в средних -2,20 является статистически значимой (p < .001), а для второго случая - стат. незначимой (p = .169, если предполагается равенство дисперсий). Как такое может быть? ответ находится в той же самой таблице wink.gif ).

На рис. 2 несколько другая ситуация. Разницы между средними нет (если говорить стат. языком - так говорить нельзя), как видно из колонки Mean difference - 0. Однако средние двух выборок статистически значимо отличаются друг от друга (p = .022). Как же это возможно? Ответ опять же есть в таблице.

Человек, который владеет лишь NHST, делает корректные стат. выводы, однако эти выводы не имеют никакой практической значимости, поскольку не был проведен анализ величин эффекта.
[attachment=802:1.png]
[attachment=803:2.png]

Книги хорошие, только хрен их скачаешь. 30 способов-это вы загнули.
  Форум: Медицинская статистика · Просмотр сообщения: #14130 · Ответов: 23 · Просмотров: 33384

pifagor
Отправлено: 4.09.2012 - 10:44





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(TheThing @ 13.08.2012 - 23:02) *
Здесь на форуме уже была статья Коэна "The earth is round, p < .05" (Cohen), где высмеивался данный подход. И это проблема не только массы страничек в интернете, а проблема подхода к анализу статистических данных вот уже более 50 лет. Поскольку статистика предполагает вероятностный исход результатов, то очень много людей именно и стремятся к получению заветной "достоверности". Про величину эффекта редко вспоминают. В Американской ассоциации психологов (APA) было предложение даже "забанить" практически трактовать статистически значимые результаты, основываясь лишь на p-value. Такое намерение конечно придушили..

Про величину эффекта как-то забывают. А что такое величина эффекта конкретно? Как и кто определяет эту самую величину?
  Форум: Медицинская статистика · Просмотр сообщения: #14126 · Ответов: 23 · Просмотров: 33384

pifagor
Отправлено: 4.09.2012 - 10:24





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(TheThing @ 4.09.2012 - 11:13) *
Единственная книга, которую я купил и прочитал на русском языке (а прочитал я их немало) - "Наглядная статистика - используем R", со-автором которой является человек, которого Вы саркастично называете "продвинутым", а если прочитать все посты p2004r на этом и других ресурсах и подсчитать, сколько людей сказали ему спасибо за оказанную помощь, можно понять, что сарказм здесь неуместен.

Предлагаю постить конкретные вещи, которые относятся к статистике, не переходить на личности и стараться быть не хуже японцев smile.gif

Это вы мне? Забавно. Вот и пишите о конкретных вещах. А от соавтора книги я просто отбиваюсь. Его стиль мне кого-то напоминает.
Проблемой нормы я занимался. И пишу, что думаю. В чем собственно дело? Это из моего опыта. Вам это кажется малозначимым. Я не против. И что?
  Форум: Медицинская статистика · Просмотр сообщения: #14125 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 4.09.2012 - 10:11





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(TheThing @ 4.09.2012 - 10:57) *
Ой, я уже сам не рад, что запостил эту статью smile.gif

Если Вы много лет используете критерий Стьюдента (или другие "классические" методы) и он полностью решает те задачи, с которыми Вы сталкиваетесь каждый день - это замечательно! Но поднятие более 5 некро-постов (давностью более 2 лет) - это вовсе не "классический" способ представиться новому комьюнити, и далеко не самый лучший, и на западе модераторы крупнейших статистических форумов (http://www.talkstats.com например) "фыркают" и не одобряют такое. У нас, как видите, люди более сдержаны и терпимы.

Если Вы хотите осветить нашему сообществу что-то новое - например то, что критерий Стьюдента считается непараметрическим, то одной статьи Боно будет недостаточно, поскольку есть очень много работ, где говорится, что это параметрический критерий, кроме того, статья Боно вышла около 50 лет назад, может быть за это время мы куда-то "двинулись"? rolleyes.gif Создайте новую тему на форуме, опишите "за" и "против" параметричности критерия с использованием нескольких источников и тогда завяжется конструктивная дискуссия. Я уверен, что статью Боно прочитали многие на этом форуме, но этого недостаточно, чтобы категорично утверждать, что это непараметрический критерий и панацея от всех наших проблем. Вам ведь не понравилось, когда на форуме Орлова Вас отсылали постоянно к книге "Прикладная статистика", категорично заявляли про существование определенного критерия и называли Вас невеждой при любой возможности. На этом ресурсе, создается такое впечатление, что Вы решили отыграться за прошлые обиды и поступаете абсолютно идентично.

Определенные стат. методы решает определенный круг задач и я не имею ничего против применения критерия Стьюдента, но я не использую его в своей работе как и другие "классические" методы, основанные на вероятностных предположениях, поскольку имею дело с генетическими исследованиями (в частности с Genome wide association studies, где изучаются 500К-2КК предиктивных факторов на выборках 2-4 тысячи) и классические методы статистики не могут решить эти задачи, поэтому "общаюсь" при помощи алгоритмов машинного обучения. "Классические" методы и тот же критерий Стьюдента на свалку никто не отправляет (довольно часто встречаю работы по оценке уровня микро-РНК с помощью критерия Стьюдента в журнале "Nature", импакт-фактор которого заставляет лишь мечтать и завидовать редакторов наших журналов). Опять же - всему свое применение.

P.S. Если будем постить на форум наши размышления, где пролегает граница между уверенностью и самоуверенностью, то форум придется переименовать с "Медицинской статистики" на что-то более философское smile.gif

Я написал свои сообщения в тему (см. название темы). Зачем открывать новую тему? Одной статьи Боно для меня достаточно. Одна статья Стьюдента положила начало современной статистики. Но если вы хотите, я приведу и другие статьи в духе Боно. 50 лет или 100 лет-какая разница? Кстати, использовался метод Монте-Карло. И очень толково.
Я ни на ком не отыгрываюсь. На вас уж тем более. Вы что-то не о том. Я просто и коротко пишу, что думаю. И что знаю. По-моему, вежливо пишу. Или нет? А размышления, если они есть в наличии, это всегда интересно. И вообще, я имею право агитировать за использование тех или иных методов. По своему опыту. И даже ничего не доказывая. Вы иначе думаете? Это замечательно. Пишите, что вы думаете. Для этого придуманы форумы.
  Форум: Медицинская статистика · Просмотр сообщения: #14123 · Ответов: 6 · Просмотров: 21666

pifagor
Отправлено: 4.09.2012 - 08:35





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(p2004r @ 3.09.2012 - 22:41) *
1. Восхитительно, собственное невежество как способ доказательства. Там ссылка вообще то была. Если Вы настолько невежественны в вопросах применения перевыборок, то зачем беретесь с таким апломбом (передергивая вдобавок) поучать?

2. Темы на нашем форуме говорят "что люди применяют", это да smile.gif Статьи по медицине русскоязычные имеют нулевое (со статистической точки зрения smile.gif ) количество ссылок на себя со стороны англоязычных публикаций (не думаю что у биологов классических что то сильно лучше (а биоинформатика она и в Африке биоинформатика)). Вот о чем, увы, говорит "люди применяют". Сидят такие овощи как Вы в советах, вот и применяют smile.gif.

3. Вы еще скажите "Мамой клянус!" smile.gif О! Для Вас заграница "свет в окошке" и только там умные люди живут. Ну так покажите мне англоязычную статью из медицинского или биологического журнала имеющего какой никакой рейтинг, где применен "критерий Стьюдента" (что бы Вы под этим не понимали smile.gif.

4. Вы учебник какой нибудь по арифметике "японский" не пробовали тыкать инженеру который балку или что там еще считает? smile.gif) Учебник!, как только человек начинает на учебники ссылаться, как на что то значащее, можно с таким фруктом заканчивать frown.gif ( [шепотом] Вы надеюсь ссылки на такие "японские учебники" в статьи не вставляете?)

PS Так как быть с логарифмической линейкой? Выбрасывать smile.gif

PPS Вы неинтересный тролль, негодный frown.gif

Ваш стиль напоминает мне герра профессора Орлова. Я не тролль. Если я вам не интересен, я не навязываюсь. Общайтесь с интересными людьми. Их много.
Я же просто высказываю свое мнение по разным вопросам. Имею право по кинституции.
Да, заграница для меня -свет в окошке. Ну что я могу сделать? Они пишут хорошие книги, много хороших книг. Я некоторые читаю. По некоторым даже учусь в меру сил. Что поделаешь? Вы же не пишете книг и я не пишу. А японцы пишут и еще какие. Супер!
  Форум: Медицинская статистика · Просмотр сообщения: #14121 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 4.09.2012 - 08:28





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(nokh @ 3.09.2012 - 22:40) *
Вы приписали что-то к моему ответу. Вероятно, он показался вам недостаточно полным. Давайте посмотрим, какого качества информацией вы его дополнили.

Доказано то, что проблема Беренса-Фишера для конкретных объёмов выборок может не иметь точного решения. А также то, что лучший подход в этом случае ? подход Вэлча. Слова "можно" и "надо" далеко не являются смысловыми синонимами. Возможно кто-то и доказал, что при каких-то условиях, скажем при равенстве объёмов выборок, МОЖНО использовать обычную формулу. Но я сильно сомневаюсь, что в увиденном вами источнике было доказано, что её именно "НАДО" использовать вместо подхода Вэлча. В любом случае, цитированный текст ником образом не расширяет мой ответ на вопрос топикстартера.

При каких-то отклонениях устойчив, при каких-то отклонениях - неустойчив, тебе - устойчив, мне неустойчив, рассказать вам сказку про белого бычка? Вообще, всякий раз, когда речь заходит об устойчивости, это начинает отдавать попыткой подменить корректный статистический анализ тем, что проще/доступнее. Любой статистический анализ это - применение определённой математической модели к реальному случаю. Естественно, что моделей меньше чем случаев и вопрос об устойчивости модели к каким-то отклонениям от случаев, для которых она была разработана, периодически возникает. Но критерий Стьюдента - не тот случай. Для него разработано достаточно альтернатив, едва уступающих или даже не уступающих ему в мощности. Я имею в виду критерий Манна-Уитни (асимптотическая эффективность - 95%), критерий Ван-дер-Вардена (100%), перестановочные критерии. Поэтому нет нужды в очередной раз проверять критерий Стьюдента на прочность и устойчивость. Хотя да, было доказано, что критерий Стьюдента устойчив и при отклонении распределения от нормального. При каких-то отклонениях. А при каких-то - менее устойчив ?, рассказать вам сказку про белого бычка? Хотя и в данном случае тезис ничего не добавляет к тому, что я уже ответил.

Слово "почти" - ненаучное. Почти сумма почти равна почти десяти. Если угодно классика - "почти беременная". Не бывает "почти непараметрического" критерия. Критерий Стьюдента - параметрический, причём самый что ни на есть параметрический! Потому как задействует сразу оба параметра нормального распределения: и математическое ожидание, и дисперсию (в отличие, скажем от другого параметрического критерия - F-критерия Снедекора-Фишера, задействующего всего один параметр - дисперсию). Так что это - глупости. То что он "мощный критерий" - безусловно. Логично, что раз он задействует больше конкретной информации о характере данных, то он и мощнее. Мощнее большинства своих непараметрических соперников, с этим не поспоришь... Но к чему это?

В итоге имеем 3 тезиса:
(1) не имеющих никакого отношения к ответу на вопросу топикстартера,
(2) не дополняющих и не корректирующих моего ответа,
(3) содержащих неверные или некорректно сформулированные сведения.
Право, стоило доставать вопрос трёхлетней (!) давности чтобы так блеснуть своей "эрудицией"! Впрочем это относится и к ряду других высказываний, которые вы столь самоуверенно успели наплодить на форуме за несколько дней.

PS. На заметку. Вильям Госсет был не столько гениальным, сколько порядочным и очень скромным человеком.

Я не со всем, что вы написали, согласен. Но я много лет использую критерий Стьюдента, есть некоторая литература. И я не думал вас как-то задеть. Вообще не думал. То, что вы называете самоуверенностью, может есть просто уверенность давнего почитателя критерия химика Стьюдента. Где пролегает граница между уверенностью и самоуверенностью?
Почти непараметрический? Здесь вы правы. Слово почти надо выбросить. Это Боно пишет в конце своей статьи о непараметричности критерия.. Статья есть на форуме. Можете прочитать. Мат. ожидание и дисперсию имеет любое распределениен, любое. Статья Боно. Советую.
  Форум: Медицинская статистика · Просмотр сообщения: #14120 · Ответов: 6 · Просмотров: 21666

pifagor
Отправлено: 4.09.2012 - 08:14





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Я не применял бутстреп. Я мало знаком с примерами его использования. Но я тем не менее выскажу свое мнение о вашей книге.

1) Ваша книга абсолютно нужна. Не вижу доступной литературы по бутстрепу и Монте-Карло для биологов на русском языке. Может она и есть, но как-то я не вижу.
Поэтому, ваша книга уверен будет востребована.
2) Позвольте профану высказать пожелания. Побольше примеров конкретных данных и сравнить классические методы и тот же бутстреп. Они есть в вашей книге. Но-больше. Пусть книга вырастет в объеме. Зато таких дубарей, как я, а нас много, убеждают примеры. Буквально брать примеры из Лакина, Урбаха, Гланца и - сравнение. Учебников много.
3) Примеры из биологии и медицины? Экологии? Плохое название для книги. Просто- использование таких-то методов в биологии, медицине и экологии.
4) Книга пишется хорошим языком.
5) Примеры типа Куйбышевское водохранилище? Я вас призываю писать учебное пособие по бутстрепу для биологов, медиков, экологов. Шире примеры. Опять больше примеров.
6) Список литературы с указанием сайтов - это современно и хорошо.

7) Что касается переводов зарубежных книг. Оно бы и надо, и вас стимулировала-бы конкуренция, но думаю, придется долго ждать. Даже в советские годы зарубежные книги выходили через несколько лет после их издания. Дорога ложка к обеду.
Так что желаю успеха (а успех будет, уверяю вас) и дописывайте остальные главы. Нужно. Молодежь и не только молодежь скажет спасибо. Тираж надо тысяч 10000. Или даже больше.
Вот такое мнение профана.
  Форум: Медицинская статистика · Просмотр сообщения: #14119 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 3.09.2012 - 21:04





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(p2004r @ 3.09.2012 - 21:04) *
1. Вы не ответили ни на один мой вопрос. Похоже это уже не статистическая закономерность smile.gif

Где Ваш контрпример? smile.gif Я то думал мы тут практически что то посчитаем, проверим.... Не интересно с Вами. frown.gif

2. При чем тут развитие теории и практическое применение? (Да и ковыряние в теории происходит во многом как раз тем же Монте-Карло smile.gif. Кроме того я не знаю других критериев кроме перевыборок для всех практически интересных, мало мальски сложных, методов анализа данных.)

То что вменяемые биологи "по Стьюденту" не считают Вам уже известно? Например что такое BUGS знаете? http://www.mrc-bsu.cam.ac.uk/bugs/ Так вот все современные исследования проверяют выдвинутые гипотезы относительно экспериментальных данных именно перевыборкой. Зачем пользоваться кем то сделанной таблицей когда повторить вычисления ничего не стоит?

Почему не отмерли методы не на перевыборках адхок основанные? Как знать smile.gif Ну отмерли же логарифмические линейки и таблицы синусов smile.gif

PS Вы не можете разобраться-запутались (разо... спорились smile.gif ) даже в названиях придуманных статкритериев, по моему это повод задуматься насколько адекватно все это хозяйство может применяться (раз такие споры уже на этапе названий критериев smile.gif ). Бутстреп приходится применять как способ позволяющий отвергнуть некорректное применение статкритерия. smile.gif

Что такое BUGS, честно говоря, не знаю. Биологи широко применяют и долго еще будут применять критерий Стьюдента. Внимательно посмотрите статью Боно. На форуме она есть.
Темы на нашем форуме говорят о том, что люди применяют классические методы, изучают их. Если вы такой продвинутый, ну что ж, кто-то же должен быть впереди на лихом коне. Только шею не сверните.
Название должно быть корректным. Каждая вещь, говорил Будда, имеет имя. Вот вас зовут,например, Вася. Если я назову вас Петей, вы не отзоветесь. Так и критерии в статистике.
Так что, будем закрывать классику, выбросим на свалку или нет? Вот сейчас на столе передо мной лежит учебник по статистике, перевод с японского. Классические методы. А ведь японцы умные. И считать умеют получше вас. Вот такие пироги, продвинутый вы наш.
  Форум: Медицинская статистика · Просмотр сообщения: #14114 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 3.09.2012 - 18:51





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(p2004r @ 3.09.2012 - 19:14) *
1. Вас попросили привести контрпример что бутстреп не работает. Вы _в_ответ_ просите (вообще то все время просите smile.gif привести доказательство что работает. У Вас все дискуссии в таком ключе?

2. Что значит "ограниченная"? n>96 это уже не "ограниченная"?

3. Если Вы хотя бы удосужитесь прочитать введение вот этой книги
http://gen.lib.rus.ec/search?req=%D1%8D%D1...p;nametype=orig
то найдете все интересующие Вас ссылки.

PS Еще раз могу сказать что Ваше предложение брать максимум и минимум
выборки (n>96) слабое подобие нормы. Кстате как Вы считаете каким
методом был получен критерий n>96 как ограничение метода? smile.gif

PPS Чуть не забыл !!!ОСТОРОЖНО!!! один из авторов предисловия носит
фамилию "Адлер" smile.gif)))

Все время прошу чего-то. Но в кредит. Когда-нибудь отдам. Эту книгу я знаю. Но опять прошу ответьте мне на вопрос. С появлением бутстрепа вся классическая статистика что не нужна? Почему же продолжают выходить книги по статистике за рубежом? Бутстреп все может. Техника для вычислений есть. В чем же дело? Вперед.
  Форум: Медицинская статистика · Просмотр сообщения: #14112 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 3.09.2012 - 13:56





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(p2004r @ 2.09.2012 - 19:54) *
Ну как же, максимум и минимум выборки (по Вашим словам) годятся а бутстреп нет... Вы уж "или трусы или крестик" (С) smile.gif

Вообще очень забавно посмотреть на задачу для которой "бутстреп не годится", особенно с объяснениями почему.

Это только высказывание. Покажите конкретные исследования, где доказано, что можно по ограниченной выборке с помощью бутстрепа построить 95% интервал, т.е. норму. Толерантый интервал проверен и перепроверен.
А петь дифирамбы бутстрепу не оригинально. Этому методу уже лет 50-60.
  Форум: Медицинская статистика · Просмотр сообщения: #14109 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 3.09.2012 - 13:52





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(stok1946 @ 3.09.2012 - 10:31) *
Любой термин - "штамп межчеловеческого ожидания со сложно-переменным значением". Т.е. выборочная оценка истинного параметра. И, как английский суд, основана на прецедентах. smile.gif
За "Крамера-Уэлча" говорят, например:
http://www.machinelearning.ru/wiki/index.p...терий_Стьюдента
http://matstats.ru/kramer.html
Против - хотя бы дискуссия на нашем форуме:
http://forum.disser.ru/index.php?showtopic=2550&st=0
Мне, честно говоря, не кажется, что проблема точности в статистике сводится только к тому, следует ли упоминать Крамера среди творцов приближенных формул для решения проблемы Беренса-Фишера или ограничиться Уэлчем и Сатервайтом.
Столь же туманна и малозначима для меня лейбла "параметрический или непараметрический критерий" (то ли в числе предположений его использования есть требование соответствия данных какому-либо теоретическому распределению, то ли при оценке р-значения он на оное распределение опирается). Тот же Х2-критерий одни называют параметрическим, а другие - нет. Единственным индикатором здесь является сущность процедуры тестирования.
Но я с готовностью удалю из своей книги бедолагу Крамера, коль скоро он Вам не пришелся по душе (тем более, что я этот критерий вообще в книге не использовал).

Относительно мета-анализа прикрепляю файл, перевод которого явился основой для упоминаемого Вами раздела. Там в свою очередь есть ссылки, которые могут Вам помочь.

Как я уже упоминал, скан книжки Манли весит 200 Мегабайт. Порекомендуйте любимый файлообменник и свяжитесь со мной по электронной почте (есть причины не выкладывать ее в открытый доступ).

В упомянутых вами ссылках неправильно используют название критерия, но хоть правильно пишут, как им пользоваться. А Орлов ни то, ни другое.
Крамер не бедолага, он крупный статистик, но просто не имеет отношения к вопросу.
А решений проблемы Беренса-Фишера в смысле приближенных много. Одно из них- процедура Вэлча. Есть работы, в которых авторы методом Монте-Карло показали сильную устойчивость процедуры Вэлча как к неравенству дисперсий, так и к ненормальности распределения. Вот и все дела.
  Форум: Медицинская статистика · Просмотр сообщения: #14108 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 2.09.2012 - 17:35





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(p2004r @ 1.09.2012 - 16:14) *
ну с такими подходами уж лучше оценить бутстрепом среднеквадратическое отклонение и задать интервал как "три сигмы"

Бутстреп не годится для данной задачи. Только толерантные интервалы или большой объем референтной группы. Если распределение не очень нормальное, следует применять преобразование данных (логарифм, корень квадратный, обратная величина и др.).
  Форум: Медицинская статистика · Просмотр сообщения: #14105 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 2.09.2012 - 09:16





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(stok1946 @ 2.09.2012 - 00:15) *
Глубокоуважаемый Pifagor. Вы, кажется, чем-то раздосадованы? Мы в чем-то виноваты? eek.gif
Но попробую ответить на конкретику.
1. Я набрал в Гугле "критерий Стьюдента-Крамера-Уэлча" - вывалилось несколько десятков ссылок. Правда говорят о критерии Стьюдента и его модификации - критерии Крамера-Уэлча. Но назвать всех их семейством критериев Стьюдента-Крамера-Уэлча - не есть криминал.
2. Относительно устойчивости бутстреп-процедур при негауссовом характере распределения выборки вроде много рассуждается и Эфроном и другими авторами (да и нами, в том числе на наших примерах). Если у Вас есть подходящая выборка - давайте попробуем поэкспериментировать.
3. Относительно книжки Манли - нашел только полуслепой скан весом около 200 Мб и только 1-го издания 90-х годов. Мы взяли из этой книжки только последовательность изложения (рубрикатор глав) и очень небольшие куски изложения. Почему просто не перевели?
Во-первых, там у него американские примеры, которые трудно повторно просчитать. Нам показалось интересным и полезным выполнить все расчеты самим и на собственных примерах (точнее, на информации, предоставленной нам нашими друзьями - биологами и экологами).
Во-вторых, изложение Манли вращается вокруг десятка фортрановских программ, которые он сам и сочинил. Я на Фортране уже не пишу лет 20. Поэтому мы вначале показали ресамплинг на двух простеньких программах (Ховелла и Ядвисчака), а потом все подряд стали просчитывать в статистической среде R (тем более, что программы Манли в многомерных случаях стали глючить). Так что наша книжка - еще и самоучитель по R-кодам.
В-третих, в англоязычной литературе иногда рассказывается о тех же вещах подробнее и интереснее, чем у Манли. Это просто потеряется при переводе. Как и те вещи, о которых Манли вообще не упоминает.
4. К сожалению, раздел по мета-анализу в упоминаемой Вами книги по большей части (и Ваша цитата, в частности) - голый перевод финской методички Sinha et al., 2006 (на нее трижды идет ссылка по тексту). Сам я никогда мета-анализом практически не занимался, каюсь. Но является ли криминалом попытка донести прочитанное до читателей в виде литературного обзора?
5. Не думаю также, что упоминание Орлова и его работ является криминалом. Можно по разному к нему относиться, как к ученому или человеку, но у него я впервые увидел в табличной форме список разъясняемых статистических терминов. Хорошо, правда, его устаканить, приблизить к грешной земле и узаконить.

1. Если можно, дайте ссылку, откуда скачать Манли. Очень прошу. Или поделитесь, если конечно не жалко.
2. Если можно, укажите распределение величины эффекта, какое же распределение этой величины. Я имею в виду вашу книгу, стр. 225. Эффект измеряется отношением разности средних к ст.отклонению разности. Книга гл.3 Современные подходы к статистическому анализу данных. Вы ушли от ответа. Или это не ваша книга?
3. Критерия Крамера-Уэлча (еще приплюсовали сюда и Стьюдента) нет. Крамер и Уэлч не имеют к этому отношения. Крамер в своей книге вообще не упоминает даже этот критерий.
Именно на эту книгу ссылается Орлов. Поймите, не надо заниматься профанацией прикладной статистики. Или вы используете традиционные критерии или предлагаете свой. В этом нет криминала. Но свой- давайте ему название, укажите как им пользоваться, таблицы и т.п. Но причем здесь Крамер? Это вызывает удивление. И причем здесь Уэлч? И почему этот критерий как пишет Орлов непараметрический? Где аргументы?
Назовите критерий - критерий Крамера-Уэлча-Фишера-Стьюдента-Саттарвайта-Рао. Орлов здесь примазывается к классикам. Ставит себя в этот ряд. Этот ряд можно продолжить. Добавить Вейра, Тьюки, Шеффе обязательно. Вот это будет критерий. Нужна элементарная добросовестность. А не использовать имена классиков в роли бренда. Элементарно, Ватсон. Вы или не понимаете или ваньку валяете.
Но- черт с ним, с этим Орловым. Орловых много.
Еще раз пожалуйста, книгу Манли. И распределение на стр. 225. Очень нужно для работы.
А так все ничего. Желаю удачи.
  Форум: Медицинская статистика · Просмотр сообщения: #14104 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 1.09.2012 - 20:21





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(100$ @ 1.09.2012 - 19:37) *
То есть проф. Орлов на своем форуме послал вас нах и вы решили свести с ним счеты здесь. Как остроумно.

Ничего нет идеального. Вы попробуйте зайти на форум Орлова и выскажите не то что критику его книги, а что-либо, идущее вразрез с тем, что он пишет в книге. Придете оттуда и расскажете мне о своих впечатлениях. Все познается на собственных ощущениях. А я вам посочувствую. Или нет.
Форум- это когда можно свободно обсуждать вопросы. Когда нет- это цирк одного клоуна.
  Форум: Медицинская статистика · Просмотр сообщения: #14098 · Ответов: 6 · Просмотров: 18414

pifagor
Отправлено: 1.09.2012 - 18:20





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


ПРОБЛЕМЫ ЭКОЛОГИЧЕСКОГО ЭКСПЕРИМЕНТА
(ПЛАНИРОВАНИЕ И АНАЛИЗ НАБЛЮДЕНИЙ)
Под редакцией чл.-корр. РАН Г.С. Розенберга
и д.б.н. Д.Б. Гелашвили
Если это ваша книга, так у меня вопрос по этой книге. В главе 3.2. Шитиков В.К., Розенберг Г.С., Крамаренко С.С., Якимов В.Н. Современные
подходы к статистическому анализу экспериментальных данных
на стр. 225 приводится мера воздействия как разность средних отнесенная к стандартному отклонению этой разности. Дальше приводится дисперсия этой величины. А как распределена эта величина и как вы получили формулу для дисперсии этой величины? Было бы весьма любопытно узнать как.
http://www.ievbras.ru/ecostat/Kiril/Download/Mepe.pdf По этой ссылке я скачал книгу.
  Форум: Медицинская статистика · Просмотр сообщения: #14096 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 1.09.2012 - 16:30





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Manly B. F. J. Randomization, bootstrap and Monte Carlo methods in biology.
Обращаюсь к авторам. Вы упоминаете эту книгу. Подскажите, где ее скачать или если у вас есть, поделитесь.
Может, просто перевести на русский язык эту книгу? И всего делов-то.
  Форум: Медицинская статистика · Просмотр сообщения: #14095 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 1.09.2012 - 16:12





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Предположим, у нас имеется генеральная совокупность, тьфу ты, популяция Орловых. И мы у них измерили некий показатель скажем хамства. Обозначим этот показатель ОХ. И у нас этих Охов скажем 10 000. Находим центр распределения (нормальное распределение), дисперсию популяции. Потом извлекаем случайно выборку. И подвергаем этих ОХов бутстрепу. Оцениваем генеральную среднюю, строим доверительный интервал. Так вот, если это повторить 5000 раз, в скольких процентах доверительный интервал накроет популяционную среднюю? Каков процент правильных интервалов? А если эти орловы распределены не по нормальному закону? Тогда? Если можно, приведите конкретные исследования ваши или дайте ссылки. Лучше ссылки.
  Форум: Медицинская статистика · Просмотр сообщения: #14094 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 1.09.2012 - 15:52





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(stok1946 @ 11.08.2012 - 10:57) *
Если уточнять терминологию, то весь нерусскоязычный мир использует термин population parametrs, имея в виду пределы, к которому стремятся выборочные характеристики при бесконечном увеличении однородных повторностей отбираемых выборок (т.е. некая химера eek.gif ).
Термин "популяция" здесь совсем не то, что биологическая популяция, а то, что русские называют "генеральной совокупностью" (привычка, наследованная от Генерального комиссара Ежова и последующих генеральных секретарей). Это - очередная глупость, потому что генеральная совокупность по определению - это универсум или множество, содержащее все мыслимые объекты. В реальной жизни мы обследуем именно популяции (ареал экземпляров одного вида, имеющий естественные границы).

А что, популяция тракторов, результатов химического анализа, профессоров статистики и экологии, звучит. Или популяция ненужных книг? Популяция Орловых - вот насколько она велика?
  Форум: Медицинская статистика · Просмотр сообщения: #14093 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 1.09.2012 - 15:38





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


В книге на стр. 29 написано критерий Стьюдента-Крамера-Уэлча. Прошу авторов разъяснить, откуда взято это название критерия. О чем идет речь? В доступной мне статистической литературе я не нашел такого названия, кроме опусов профессора Орлова. Но когда я зашел на форум к Орлову и задал вопрос, то не только не получил внятного ответа, но мои вопросы и сообщения были удалены без всякого объяснения. Похоже, он это придумал и это его вклад в современную статистику. Более того, Орлов пишет, что этот критерий является непараметрическим. Поэтому я задаю вопрос вроде бы как нормальным авторам: откуда? Откуда дровишки? Ссылаясь на Орлова, авторы также вносят вклад в современную статистику. Если вы помните, ложкой дегтя можно испортить бочку меда. Советую исключить из списка литературы опусы Орлова. Хотя если авторы профессора и Орлов профессор, то как говорится ...
  Форум: Медицинская статистика · Просмотр сообщения: #14092 · Ответов: 37 · Просмотров: 53466

pifagor
Отправлено: 1.09.2012 - 12:12





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Для построения непараметрического толерантного 95% интервала нужен объем референтной группы не менее 94. См. Большев, Смирнов Таблицы математической статистики.
Непараметрический толерантный интервал не требует никаких вычислений. Нижняя и верхняя границы- это наименьшее и наибольшее значение в референтной группе. Между ними-95 % вариант популяции. Тип распределения не имеет значения.
  Форум: Медицинская статистика · Просмотр сообщения: #14089 · Ответов: 25 · Просмотров: 33952

pifagor
Отправлено: 1.09.2012 - 11:12





Группа: Пользователи
Сообщений: 33
Регистрация: 29.08.2012
Пользователь №: 24130


Цитата(yes_asp @ 27.08.2009 - 17:43) *
Уважаемые форумчане!
Во учебниках по биостатистике написано, что обязательными условиями для применения дисперсионного анализа являются нормальное распределение признака в генеральной совокупности и равенство дисперсий сравниваемых выборок. В то же время такие журналы, как Nature, Science и другие не менее солидные издания публикуют статьи, авторы которых используют различные варианты ANOVA для оценки значимости различий средних в группах из 4-6-8 наблюдений (мыши, крысы, культуры клеток и т.п.). Таких работ множество, они легко доступны, поэтому ссылки не привожу. Понятно, что проверить условия, позволяющие использовать дисперсионный анализ, на таких выборках нельзя. Однако редакторов это почему-то не смущает. Поверить в то, что редакторы столь уважаемых в научном мире журналов ничего не смыслят в биостатистике, не могу. Как тогда объяснить подобные допущения???

Критерий Фишера устойчив к отклонениям от нормальности. Это доказано. Проблема описана в книге Шеффе Дисперсионный анализ. Но критерий Фишера довольно чувствителен к неравенству дисперсий. Применять преобразование данных, логарифм.
  Форум: Медицинская статистика · Просмотр сообщения: #14088 · Ответов: 3 · Просмотров: 9196

2 страниц V   1 2 >

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена