Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V  < 1 2 3 >  
Добавить ответ в эту темуОткрыть тему
> Что использовать?, стат обработка в клинике
fattymouse
сообщение 25.12.2016 - 19:06
Сообщение #16





Группа: Пользователи
Сообщений: 14
Регистрация: 18.12.2016
Пользователь №: 29074



Цитата(leo_biostat @ 24.12.2016 - 10:06) *
Привет, коллега Александр!

Оверквотинг отрезан

Желаю успеха!


Спасибо, Leo_biostat
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 25.12.2016 - 19:16
Сообщение #17





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Цитата(leo_biostat @ 25.12.2016 - 19:03) *
То есть при анализе выборки из 55477 наблюдений, один критерий отвергает нормальное распределение, а 2 других критерия - поддерживают.

Дальнейший анализ разных деталей этого распределения, позволил обнаружить наличие двух следующих подгрупп:


Выделение подгрупп после проведения исследования на основании произвольных критериев, тоже придуманных после проведения исследования? Вы на полном серьезе считаете это наукой?

Еще раз: нельзя бомбить огромным количеством тестов одну выборку. Доказательный анализ - это анализ, проведенный по плану, составленному ДО НАЧАЛА сбора данных.

Цитата
Kolmogorov-Smirnov Pr > D <0.0100
Cramer-von Mises Pr > W-Sq 0.0504
Anderson-Darling Pr > A-Sq 0.0545


Вы когда-нибудь слышали о проблеме множественных сравнений? Или в вашем случае это не проблема, а приятная возможность показать что угодно в соответствии с пожеланиями заказчика?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.12.2016 - 20:13
Сообщение #18





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Лео, вы недооцениваете степень моего занудства.

Вот вы честно выписали из Кобзаревой книжки 21 критерий: там и критерии согласия, и критерии собственно нормальности распределения, и критерии проверки соотношений между моментами распределения - все до кучи. А поскольку, например, Кобзарь при критерий Эппса - Палли ничего не писал, то и вы не рискнули. Ну да ладно.
1. Однако я по-прежнему не понял вашу технологию осмысленного сужения данного множества (из 21 элемента) до подмножества из 4 элементов. Жду внятного ответа.
Попутно обращаю ваше внимание на то, что число различных комбинаций из 21 по 4 равно 5985.
2. Так какие же конкретные 4 самых-самых критерия проверки нормальности выкристаллизовались у вас за 35 лет? Жду внятного ответа.
3. так что же делать исследователю, у которого при "голосовании" 4 критериев "голоса" распределились как 50:50? Привлекать остальные 17 критериев? Жду внятного ответа.

P.S. Здесь много суровых собеседников, не любящих когда им задают пусть и самые безобидные, но недоуменные вопросы. Так что на всякий случай воззвал к вашей снисходительности.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 26.12.2016 - 11:22
Сообщение #19





Группа: Пользователи
Сообщений: 105
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(DrgLena @ 24.12.2016 - 00:30) *
Выбор статистических методов определяется прежде всего типом клинического исследования.

Полагаю что такое утверждение следует изменить, упоминанием опыта и знаний по статистике того специалиста, который будет производить статистический анализ клинического исследования. Например, сделать такое объяснение:
"Выбор статистических методов определяется типом клинического исследования, а также опытом и объёмом знаний по статистике того специалиста, который будет производить статистический анализ результатов этого клинического исследования".


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 26.12.2016 - 21:36
Сообщение #20





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Я так не полагаю, мое утверждение не нуждается в таком дополнении, да еще жирным шрифтом, не нуждается оно также и в удалении слов прежде всего. Обращены мои слова к автору обсуждаемого топика именно потому, что он пытается выделить под пунктами а и б две различные ситуации и хочет получить рекомендации для а и б.

Ваши рекомендации свелись к перечислению всех методов, реализованных в любой программе по статистическому анализу не зависимо от пунктов а и б. В программе Statistica реализованы только 4 метода проверки нормальности, отсюда , видимо, и рекомендации. Автор поста не назвал ни одной количественной переменной. Вы что согласились с тем, что вид осложнений или вид операций количественные переменные?
Я не против опыта и объема знаний, но эти понятия относительные. Можно даже наизусть выучить названия всех тестов проверки нормальности, накачивая объем знаний, а потом многократно тестировать выборки больших размеров (55477 наблюдений) приобретая свой большой опыт, но для чего? Неужели такой набор данных для проверки различия средних по стьюденту? Не проще ли было начать с построения гистограммы распределения, чтобы выявить бимодальность распределения, а не нормальность проверять многоми тестами.

Зря вы проигнорировали справедливые вопросы ogurtsova. Абсолютно согласна с ogurtsov - сначала планирование, а потом сбор данных. Но и при планировании могут быть ошибки. Конкретный пример из зарубежной публикации, условия включения в исследование не были четко обозначены и в результате в исследование вошли все больные диабетом имеющие макулярный отек, а эффект лечения оценивался по уменьшению показателей (ОКТ), которые, как нам известно, являются возраст- зависимыми. В работе не было доказано различие в эффективности двух методик лечения. Мы получили другие данные, поскольку при планировании разделили больных по типу диабета. Исследование гистограммы распределения больных по возрасту (без разделения по типам диабета) показал эту самую бимодальность, поскольку диабет 1 и 2 типа различается по возрасту в среднем на 20 лет.

Надеюсь, вы пришли на форум поделиться большим опытом и знаниями, поэтому интересно ваше мнение по поводу следующей ситуации, которую мне бы хотелось обсудить на форуме, поскольку существуют различные мнения на этот счет.
Известно, что количественный показатель, который контролируется при проведении лечения не подчиняется нормальному распределению. Есть много баз данных, в которых измеряли этот показатель и, правда только по трем критериям, нормальность отвергается. Но , если извлечь некоторые выборки из этих баз данных, например 4 наблюдения, 0,1; 0,01; 0,5;и 1,0 как минимум 3 теста покажут, что такая выборка нормальна smile.gif . А что другие тесты?
Как вы считаете, нужна ли вообще проверка на нормальность такой подгруппы, если она, например, является ячейкой дисперсионного комплекса и остатки после его проведения распределены также нормально. Заранее благодарна за разъяснения.

Сообщение отредактировал DrgLena - 26.12.2016 - 21:38
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 26.12.2016 - 22:50
Сообщение #21





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Ну наконец-то на форуме завязалась не чисто медицинская, а скорее математико-статистическая дискуссия rolleyes.gif . Попробую вставить свои "5 копеек".
На самом деле как "правильно" проверять КОНКРЕТНУЮ выборку на "нормальность" - вопрос не решенный и очевидно такой, который еще долго останется открытым. Правда, имеются попытки привнести в этот выбор некоторую строгость. На сколько мне известно, на просторах бывшего СССР этой задачей наиболее плотно занимается новосибирская школа под руководством Б.Ю. Лемешко. Вот несколько работ, в которых он попытался сравнить различные критерии определения "нормальности" выборок по мощности и сделать некоторые рекомендации по выбору:
http://www.ami.nstu.ru/~headrd/seminar/pub...v_Lemeshko).pdf
http://www.ami.nstu.ru/~headrd/seminar/pub...trol_2012_5.pdf
А вот только несколько работ, посвященных вопросу на "чужом" языке:
https://www.researchgate.net/publication/22...normality_tests
https://ncss-wpengine.netdna-ssl.com/wp-con...-Simulation.pdf
http://www.de.ufpb.br/~ulisses/disciplinas..._comparison.pdf
"Классикой жанра" в данном вопросе явряется книга Thode H.C. Testing for Normality, толстая и умная книга, но вопрос, какой или какие именно тесты применять и "кому верить" - все равно остается открытым.
Для тех (врачей smile.gif ), кто наивно думает, что приведенные на предыдущей странице 21 критерий - это исчерпывающий список, замечу, что в работе "Критерии проверки отклонения распределения от нормального закона": http://ami.nstu.ru/~headrd/seminar/publik_...normal_tets.pdf , являющегося учебным пособием всего-лишь для магистрантов, проведена еще куча всяких критериев проверки "нормальности", в частности Эппса-Пали, Ройстона, Купера, Крамера-Мизеса-Смирнова, Ватсона, Андерсона-Дарлинга, Шапиро-Франсиса, Жанга, Никулина-Рао-Робсона, модификация Лиллифорса,). А есть еще критерии Жарке-Бера, критерий Размах/Отклонение (в англоязычной литературе - WS-критерий, не путать с SW-критерием Шапиро-Уилкса). Ну и визуальный Q-Q-plots критерий никто не отменял. Так что с критериями все хорошо, как и с полем деятельности для ученых-статистиков. А вот что с этим "богатством" делать рядовым (и не очень) врачам? И это все в рамках даже не самой задачи его исследования, а только в рамках этапа предварительного анализа. Может помилуем их? smile.gif
Мы ведь понимаем, что для них разобраться во всем этом многообразии методов - задача абсолютно нереальная. Ну, это примерно так, как если бы при насморке пациента прежде чем он прыснет чего-нибудь себе в нос, заставляли бы изучать анатомию носоглотки, фрамакинетику лекарств, фармакологические свойства препарата, описывать клинические характеристики заболевания..... А потом самому выбирать - или даже подбирать последовательным перебором - себе лекарство. От этого всего насморк и сам пройдет rolleyes.gif . А мы хотим нагрузить врача (путь даже кандидата в кандидаты МЕДИЦИНСКИХ наук) задачей самостоятельно разобраться и выбрать метод, наиболее ему подходящий.
Мне кажется, что оставив научные споры себе, наша (математиков-статистиков-теоретиков....) задача дать врачу конкретные рекомендации по применению методов, а еще лучше сразу снабдить его определенным инструментом, применив который (или которые) он сможет не сильно вдаваясь в подробности получить готовое решение. Собственно, все базовые инструменты статанализа - от EXCEL до SPSS, от R до Python - и содержат такой набор, и иногда - даже слишком широкий для рядового исследователя. Поэтому далеко уходить от такого подхода - мне кажется не совсем разумным. Ведь мы не верим, что врач вдруг возьмет и будет самостоятельно разрабатывать программу расчета какого-нибудь экзотического, путь даже суперточного, но отсутствующего в доступном ему наборе критерия. (70% вопросов на форуме сводится к одному - "на какую кнопку нажимать в программе Х, что-бы получить сразу готовый ответ на все вопросы" weep.gif ) А вот если мы считаем, что какой-то из методов не достаточно эффективен и можем это обосновать - то это наша задача говорить об этом как можно "громче" и предложить четкую замену. Если-же исследователь обратился к нам за советом, то наша задача, выяснив предварительно особенности его набора данных, дать ему корректную рекомендацию о том методе или методах, которые следует в данном случае применить. Но ни в коем случае не оставлять выбор (подбор) метода анализа самому "пациенту" врачу-исследователю. В общем, как говорится, "кто на что учился".
Теперь к вопросу, а что делать, если из четырех методов два подтвердили, а два - отвергли гипотезу. И тут мы - при условии корректности применения всех методов - уходим в другую область анализа данных - в область многокритериального выбора. А там уж точно, даже теоретически не существует единственно возможного ответа, а все упирается в некоторые внешние, априорные и субъективные ограничения, которые задаются исследователем. Если он не умеет этого делать (а в нашем случае - это действительно так, ведь исследователь у нас врач, а не аналитик), то все что ему остается - это либо принять правило "большинства", либо вообще применить метод "случайного выбора". Есть конечно, более разумный метод - обратиться за советом к специалистам по анализу данных. Но увы, этим путем следуют единицы, остальные занимаются самолечением попыткой решить "не свою" задачу самостоятельно.
Правда один вопрос все равно остался за скобками. А надо-ли проводить проверку на нормальность? В том смысле, а будем-ли мы дальше проводить анализ методами, требующими "нормальности" наших данных или сразу будем ориентироваться на методы, которые этого не требуют. Но это уже тема другого обсуждения.
И наконец, раз уж и так получилось, что все равно "много букв", хочу поблагодарить автора топика. За более чем пол года моего нахождения на данном форуме - это один из редчайших случаев, когда автор действительно аккуратно и грамотно сформулировал свой вопрос. Такому автору действительно хочется помочь и главное, сообщество действительно может это сделать. Ну, а за одно - он дал повод к интересной дискуссии.

Сообщение отредактировал passant - 26.12.2016 - 23:23
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 27.12.2016 - 00:48
Сообщение #22





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(passant @ 26.12.2016 - 22:50) *
... в частности Эппса-Пали, Ройстона, Купера, Крамера-Мизеса-Смирнова, Ватсона, Андерсона-Дарлинга, Шапиро-Франсиса, Жанга, Никулина-Рао-Робсона, модификация Лиллифорса,).


Passant, вот только фразу Shapiro, S. S., and Francia, R. S. (1972), An approximate analysis of variance test for normality, J. Amer. Statist. Assoc. 67, 215-216
я бы не отважился так перевести.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 27.12.2016 - 01:01
Сообщение #23





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Да, виноват. Критерий Шапиро-Франчиа, разумеется.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 27.12.2016 - 01:28
Сообщение #24





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(passant @ 26.12.2016 - 23:50) *
(в англоязычной литературе - WS-критерий, не путать с SW-критерием Шапиро-Уилкса).

Shapiro, S. S. and Wilk, M. B. (1965). "Analysis of variance test for normality (complete samples)"
И кто ж их всех выучит, когда их так много, что во множественном числе переводятся smile.gif

Сообщение отредактировал DrgLena - 27.12.2016 - 01:33
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 27.12.2016 - 01:56
Сообщение #25





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DrgLena @ 27.12.2016 - 01:28) *
Shapiro, S. S. and Wilk, M. B. (1965). "Analysis of variance test for normality (complete samples)"
И кто ж их всех выучит, когда их так много, что во множественном числе переводятся smile.gif


Да, что-то Мартину Уилку хронически не везет
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
fattymouse
сообщение 27.12.2016 - 11:47
Сообщение #26





Группа: Пользователи
Сообщений: 14
Регистрация: 18.12.2016
Пользователь №: 29074



Цитата(passant @ 26.12.2016 - 22:50) *
... Мне кажется, что оставив научные споры себе, наша (математиков-статистиков-теоретиков....) задача дать врачу конкретные рекомендации по применению методов, а еще лучше сразу снабдить его определенным инструментом, применив который (или которые) он сможет не сильно вдаваясь в подробности получить готовое решение. ... Ведь мы не верим, что врач вдруг возьмет и будет самостоятельно разрабатывать программу расчета какого-нибудь экзотического, путь даже суперточного, но отсутствующего в доступном ему наборе критерия. (70% вопросов на форуме сводится к одному - "на какую кнопку нажимать в программе Х, что-бы получить сразу готовый ответ на все вопросы") .... Если-же исследователь обратился к нам за советом, то наша задача, выяснив предварительно особенности его набора данных, дать ему корректную рекомендацию о том методе или методах, которые следует в данном случае применить....


Спасибо, passant
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 27.12.2016 - 12:53
Сообщение #27





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(fattymouse @ 27.12.2016 - 12:47) *
Спасибо, passant

за то, что пополнили наш объем знаний о большом разнообразии тестов проверки нормальности 21+12? Кто больше? Очень конкретные рекомендации, мужайтесь хирурги, будет очень больно smile.gif

Сообщение отредактировал DrgLena - 27.12.2016 - 12:54
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 27.12.2016 - 14:34
Сообщение #28





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DrgLena @ 27.12.2016 - 12:53) *
за то, что пополнили наш объем знаний о большом разнообразии тестов проверки нормальности 21+12? Кто больше? Очень конкретные рекомендации, мужайтесь хирурги, будет очень больно smile.gif


Не ревнуйте ). Все равно "Медицина - самая точная наука после богословия"(с). "Медицина излечивает редко, облегчает часто, утешает всегда" (с)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Blaid
сообщение 28.12.2016 - 17:04
Сообщение #29





Группа: Пользователи
Сообщений: 36
Регистрация: 27.08.2012
Пользователь №: 24128



О! Василий Леонов появился на форуме!!! ЗАМЕЧАТЕЛЬНО!!!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 28.12.2016 - 17:22
Сообщение #30





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Blaid @ 28.12.2016 - 17:04) *
О! Василий Леонов появился на форуме!!! ЗАМЕЧАТЕЛЬНО!!!


Этот пост достоин отдельной темы. В этой я вашего оптимизма не разделяю...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

3 страниц V  < 1 2 3 >
Добавить ответ в эту темуОткрыть тему