Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V  < 1 2 3  
Добавить ответ в эту темуОткрыть тему
> Теория статистического анализа данных в вопросах, Разбираем вопросы по теории методов статистического анализа данных
Ancha
сообщение 26.12.2010 - 19:22
Сообщение #31





Группа: Пользователи
Сообщений: 13
Регистрация: 23.12.2010
Пользователь №: 23068



Почитайте журнал ?Гигиена и санитария?, бесчисленное количество статей по этой тематике. Журнал ?Микроэлементы в медицине?.

DrgLena, вы невнимательно просмотрели мои многочисленные сообщения, речь идет не только о маленьких, но и о больших выборках (до 1000 проб). Морковка росла не на грядке, а в тарелке ребенка, посещающего ДОУ. Мне не нужно проводить эксперименты на лабораторных животных, т.к. обследую живых детей. Продуктов много ? 82 наименования, если каждое в повторностях напишу ? превышу лимит даже докторской диссертации (и это будет только таблица).

Зуд имеется, жаль, что из всех ответивших мне Вы не предложили ничего существенного, чтобы его остудить, хотя наверно могли бы.
Я действительно очень плохо разбираюсь в статистике. Извините что зафлудила тему.

Спасибо всем за советы )))
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 26.12.2010 - 20:30
Сообщение #32





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Ancha @ 26.12.2010 - 17:32) *
100$, Вы же понимаете, надеюсь, что 2500 проб - это невозможно сделать (по одному объекту), даже 100 невозможно.
По примерным подсчетам это я только морковку за 5-6 лет обработаю, а еще где-то полторы сотни параметров... По вашему получается что вообще 20-30 проб статистически обрабатывать нельзя?

Пока вынужден относиться как к флуду не к Вашим сообщениям, а к сообщениям 100$ , поскольку в них нет дельных советов, а люди обращаются на форум именно в поисках советов, а не для того чтобы кто-то грузил не по делу. О проверки на нормальность распределения речь вообще не шла. Речь шла о способе представления описательной статистики в случае малых выборок неизвестного распределения. Но в посте #24 100$ сам поднимает вопрос об объёме выборки для проверки нормальности, а в посте #27 сам же на него отвечает, только как будто проверять нормальность на малых выборках собирались Вы. Короче, громко и сам с собою. Тем более не считаю его компетенцию сколь либо достаточной для критического обзора рекомендаций, выданных вам другими участниками обсуждения и мной в частности. И 2500 проб - тоже флуд. На выборках такого объёма можно скорее доказать, что ни один известный тип распределения не подходит к данным, чем подтвердить нормальность или логнормальность распределения. 20-З0 проб - уже может быть достаточно не только для характеристики центральной тенденции в данных, но и для попыток их многомерного обобщения в вариантах факторного анализа, а также для геостатистического анализа с последующим построением карт распределения загрязнённости. По личному опыту для металлов в воде воде этого может быть недостаточно, а вот для почв, рыбы и особенно донных отложений - вполне.

Цитата(DrgLena @ 26.12.2010 - 20:30) *
... Меня никак не убедила мысль, что на одной грядке растут нормальные по содержанию свинца объекты и монстры с превышением предельно допустимые концентрации. Нужно искать причину такой вариабельности, а не приводить кучу статистических обобщений для 5 объектов. Впрочем, могу ошибаться в предметной области, поэтому не помешала бы статья из надежного источника с описанием подобных исследований.

Я в предыдущем посте специально обратил внимание на иммунологические показатели, Игорь далее - на биохимические. Т.е. дело скорее не в предметной области, пожалуй в любой области находятся такие показатели. Скажем в гидрохимии также принято приводить усреднённый химический состав воды, хотя ни о какой нормальности речи не идёт, т.к. каждая часть и уровень водоёма имеют свою специфику - если в каждой делать по 30 измерений будет отчётливое полимодальное распределение. Если говорить о металлах, то главный источник изменчивости - мозаичный характер загрязнения и тренды загрязнения, т.е. также имеем полимодальность, поскольку одни участки территории подвергаются микроэлементной нагрузке от специфических источников загрязнения, другие - практически нет, или подвергаются, но от других источников. Я бы заострил вопрос именно на способе представления усреднённых характеристик гетерогенных выборок. Как, например, Вы представляете описательную статистику по иммунологическим, биохимическим и прочим сильно варьирующим показателям?

Сообщение отредактировал nokh - 26.12.2010 - 21:10
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 26.12.2010 - 23:33
Сообщение #33





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Nokh, первая часть поста #32 не удалась

И вааще не надо так ревниво реагировать на мое приятное общение с дамой

Сообщение отредактировал 100$ - 27.12.2010 - 18:56
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 27.12.2010 - 02:23
Сообщение #34





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Ancha @ 26.12.2010 - 20:22) *
DrgLena, вы невнимательно просмотрели мои многочисленные сообщения, .....т.к. обследую живых детей.

Да, действительно не внимательно, я поняла, что свинец вы анализируете в морковках, а не в живых детях.
Ancha, Вы прицепились к ветке, где .... чайник вскипел, а бабушка в больнице
И Ваше первое сообщение написано в том же духе, поэтому на него серьезно трудно ответить, вот 100$ и пошутил, раз программа выдает, значит, можно, но его серьезные люди не поняли.
Цитата(Ancha @ 23.12.2010 - 23:51) *
Для обработки данных использую непараметрическую статистику (поскольку распределение отличное от нормального). Необходимо найти среднее значение для признака

Ну раз необходимо найти, так найдите, при чем тут непараметрическая статистика?
Из ваших постов понятно, что ряды по размеру совершенно различные от 5 до 700, например. Различны они будут и по форме распределения исследуемой величины. Я обычно начинаю описательную часть с анализа гистограмм. Для меня это важнее, чем результат тестирования на нормальность. Вы можете задать любое число интервалов и посчитать долю каждого интервала в общем числе наблюдений. На такой гистограмме вы можете нарисовать диапазон нормы и посчитать долю не нормы. А дальше, получите описательные статистики для ряда включая и среднее и ошибку среднего и среднеквадратическое отклонение, 95% ДИ, а также медиану и квартили, как советовал плав. Для ваших 5 морковок будут следующие данные: среднее 0,2043 (95%ДИ =-0,1678; 0,5765), медана 0,0033 (0,0022;0,345)
Нижняя граница 95% ДИ отрицательная, среднее сильно отличается от медианы , а саму медиану и квартили трудно описать, поскольку из 5 морковок половина будет иметь значение меньше 0,0033, 25% меньше 0,0022 и еще 25% больше 0,345,т.е. в квартилях по одной морковке, т.к. ниже 0,0022 одно наблюдение и выше 0,345 тоже только одно наблюдение. Отсюда следует мое убеждение, что не все результаты наблюдений можно и нужно обобщать, гораздо больше информации будет в таблице, где будут представлены все 5 истинных значений содержания свинца в морковках. Из такой таблицы будет понятно, что из 5 значений 3 в диапазоне нормы, а 2 совершенно недопустимые. Мои рекомендации, которые вы сочли бесполезными, можете оставить без внимания, необходимо найти среднее, находите. Я руководствуюсь здравым смыслом и общими рекомендациями (к сожалению нет под рукой ссылки) для биомедицинских публикаций, если наблюдения немногочисленны, желательно привести все значения исследуемого количественного признака. Это касается в частности различных линеек онкомаркеров при различных типах опухолей.
Если данных достаточно, то конечно требуется статистическое описание. И его характер тоже будет зависеть от формы распределения. Удобно, когда работа написана в одном стиле, например, все ряды описаны средними и среднеквадратическими отклонениями, все довольны ? боксы с усами ДИ показывают. Но в результате может получиться то, что с 5 морковками.
У меня в недавней работе в группе больных исследованы 4 интерлейкина, два из них описаны средними и их динамика также, а два медианами. Так что общего рецепта, как описывать данные нет, трудность еще и в том, что кроме описания группы нужны еще и сравнения, вот тут уже могут быть ошибочные выводы из за неверных методов.

nokh, про полимодальность иммунологических показателей готова пообщаться, но в другой ветке
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Ancha
сообщение 27.12.2010 - 19:43
Сообщение #35





Группа: Пользователи
Сообщений: 13
Регистрация: 23.12.2010
Пользователь №: 23068



DrgLena, надеюсь, Вы не приняли за правду число морковок и те цифровые данные, что я написала, т.к. это просто случайные цифры, набранные для примера (Ох и любите Вы я смотрю этот овощ - это шутка). Гистограммами и т.п. я все проверяла, тоже с этого начала. Спасибо что прониклись моей проблемой.

Спасибо за комментарии, в любом случае они будут мне полезны.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 27.12.2010 - 19:59
Сообщение #36





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Ancha @ 27.12.2010 - 19:43) *
Ох и любите Вы я смотрю этот овощ ....

Мне понравились именно эти 5 морковок, потому, что они объясняют мою любовь к гистограммам, на рис. есть данные, что по одному из критериев их распределение не противоречит нормальному!!!
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 27.12.2010 - 22:43
Сообщение #37





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(DrgLena @ 27.12.2010 - 19:59) *
по одному из критериев их распределение не противоречит нормальному!!!
Вы некорректно провели сравнение эмпирической с нормальной функцией распределения. Морковки нужно исследовать отдельно, а не объединять несколько штук в один столбец гистограммы. Такое объединение (огрубление) измерений ведет к потере информации и снижению мощности статистических критериев. Если вы вернетесь к отдельным морковкам, то ВСЕ критерии покажут отличие эмпирического от нормального распределения.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 28.12.2010 - 00:00
Сообщение #38





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Не важно сколько нарисовано морковок, расчет Dmax проведен по всем.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

3 страниц V  < 1 2 3
Добавить ответ в эту темуОткрыть тему