![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 39 Регистрация: 12.11.2014 Пользователь №: 26808 ![]() |
Здравствуйте!
Я запутался в дисперсионном анализе, а именно в необходимости нормального распределения совокупности из которой сделана выборка ![]() На форуме упоминалось о том, что нормальность распределения не всегда обязательна при ДА, однако по всем источникам говорится о том, что распределение должно быть нормальным... У Гланца, так же необходимо нормальное распределение, он говорит, что оно может быть определено при помощи стандартного отклонения, то есть если стандартное отклонение умножить на два и вычесть из среднего, не должно получиться отрицательного значения. Однако потом приводит задачу для решения (3.8 стр. 80-81) где стандартное отклонение укладывается в не нормальное распределение и в ответах задача решена при помощи F критерия, то есть на сколько я понимаю, дисперсионного анализа... Как это можно понять? ![]() Я понимаю, что гипотетически (в задаче рассматривается вопрос про тромбоциты у здоровых людей) можно представить, применительно к данной задаче, присутствие нормального распределения, однако, как поступать при решении других задач, приведу свой пример: Длительность стояния дренажей после операции: 1 группа - 28 человек среднее 5,6 стандартное отклонение 2,7 дня, 2 группа 25 человек среднее 5 стандартное отклонение 3,1 день и 3 группа 38 человек среднее 7,4 стандартное отклонение 4,3 дня. При ДА р<0,05. Правильно ли применять здесь ДА? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
Доктор, вся прикладная статистика стоит на двух выносливых китах:
1. Необходимости внятно сформулировать вероятностно-статистическую модель происхождения данных; 2. Необходимости внятно сформулировать проверяемую гипотезу: нулевую против альтернативной. Первый пункт формулируется в вероятностно-статистических терминах, в виде уверенности, что наблюдаемые данные представляют собой набор статистически независимых, одинаково распределенных случайных величин. Чуть проще: если выборка формировалась с нарушением принципов отбора (т.е. данные изначально имели неодинаковую вероятность попадания в выборку), то тут и статистика не нужна. Второй пункт отвечает на вопрос: вы что хотите проверить? Все вместе отвечают на вопрос: а для чего вообще собирались данные? Резюме. Если вам надо показать, что три изучаемые группы отличаются друг от друга по длительности дренажей, то дисперсионный анализ подойдет. Сообщение отредактировал 100$ - 6.12.2014 - 22:52 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 39 Регистрация: 12.11.2014 Пользователь №: 26808 ![]() |
Доктор, вся прикладная статистика стоит на двух выносливых китах: 1. Необходимости внятно сформулировать вероятностно-статистическую модель происхождения данных; 2. Необходимости внятно сформулировать проверяемую гипотезу: нулевую против альтернативной. Первый пункт формулируется в вероятностно-статистических терминах, в виде уверенности, что наблюдаемые данные представляют собой набор статистически независимых, одинаково распределенных случайных величин. Чуть проще: если выборка формировалась с нарушением принципов отбора (т.е. данные изначально имели неодинаковую вероятность попадания в выборку), то тут и статистика не нужна. Второй пункт отвечает на вопрос: вы что хотите проверить? Все вместе отвечают на вопрос: а для чего вообще собирались данные? Резюме. Если вам надо показать, что три изучаемые группы отличаются друг от друга по длительности дренажей, то дисперсионный анализ подойдет. Отлично!! Это уже радует))) на данном этапе моего понимания о том "что мне нужно" этого наверное достаточно))) Так, в качестве уточнения, как можно объяснить на пальцах человеку о том, что ДА подходит в данном случае, ведь стандартное отклонение или вообще можно о нем не думать... Попытаюсь сформулировать: 1. В стационаре лечилось 150 человек разными операциями, из них отобрали группу пациентов по виду оперативного вмешательства, получилось 89 человек, их в свою очередь разбили на 3 группы относительно сроков оперативного вмешательства и сравнили по различным показателям (длительность операции, сроки стояния дренажей и прочее) 2. Ну в резюме Вы и так все сформулировали как я и думал ![]() И немного отвлеченно, насколько я понял на протяжении моего знакомства со статистикой, существует огромная куча методов, критериев и прочих показателей которые можно применять для обработки полученных данных, однако в медицине весь этот объем информации, методов вычисления и прочих, за частую не нужен! При проведении простого исследования, типа "как повлияет это на это" достаточно простых, стандартных способов. Наверное Гланц в книге и хотел это показать...но хочется еще большей простоты в выборе применения методов и критериев. Зачем говорить о нескольких вариантах получения одних и тех же цифр, когда достаточно одного наиболее простого. Для медицины, наиболее часто, требуется самая простая статистическая обработка. Что, зачастую, ведущие европейские журналы со своими статьями и доказывают, применяется один не сложный метод и все... В то же время сложный и многоуровневый стат анализ необходим при разработке рекомендаций, когда от этого зависит экономическая выгода, больше ничего в голову не пришло...так как все остальное (человеческая жизнь, эффективность лечения, качество жизни) проверяется на практике и при помощи многоцентрового исследования. Потому что понять при помощи статистики какая операция лучше можно (сравнив разные показатели), но непонятно зачем, важен результат выжил или нет, помогло или нет, а все остальное приходит на практике...при помощи статистики невозможно разработать новую операцию, можно только посмотреть на сколько она лучше предыдущей...а лучше она может быть только в экономическом плане и в качестве жизни, но качество жизни это тоже достаточно условное понятие, кому-то отрезают ногу и он продолжает жить, а кто-то умирает через неделю и к сожалению среднего здесь не вывести так как это же человек умер... Если сказать, что статистика позволяет на меньшем количестве людей понять эффективность метода, то это лукавство, со всеми мощностями исследований и прочими моментами это не поможет на 10 пациентах понять эффективность операции для 10000, а на уровне скорее всего поможет можно обойтись и без статистики... Хотя может я много еще не знаю...по моему так все это бюрократия и обнаружение финансовой эффективности. |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
1. В стационаре лечилось 150 человек разными операциями, из них отобрали группу пациентов по виду оперативного вмешательства, получилось 89 человек, их в свою очередь разбили на 3 группы относительно сроков оперативного вмешательства и сравнили по различным показателям (длительность операции, сроки стояния дренажей и прочее) 2. Ну в резюме Вы и так все сформулировали как я и думал ![]() Если вы одновременно изучаете два показателя: длительность операции и срок стояния дренажей (т.е. характеризуете |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 39 Регистрация: 12.11.2014 Пользователь №: 26808 ![]() |
Если вы одновременно изучаете два показателя: длительность операции и срок стояния дренажей (т.е. характеризуете Ага, но можно и простой "одномерный" для каждого параметра, просто вывод получается проще (для меня) типа: "Сроки выполнения операции не влияют на длительность оперативного вмешательства". |
|
![]() |
![]() |
![]() ![]() |