Достоверность исследования. Нужна помощь |
Здравствуйте, гость ( Вход | Регистрация )
Достоверность исследования. Нужна помощь |
15.10.2011 - 14:22
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 11.10.2011 Пользователь №: 23264 |
Двухфакторный дисперсионный анализ (two-way ANOVA) с факторами "группа" и "возраст". Метод параметрический - требует нормального распределения ошибки (остатки, Residuals). Скажите, а в этой ситуации категорически нельзя использовать просто критерий Стьюдента?? Например, тотже трпонин сравниваем в одинаковых возрастных интервалах у здоровых и больных. Как две независимые выборки. И проверяем достоверность различий между средними в группе здоровых и больных в данном возрастном диапазоне. (Не предполагается сравнение между собой разных возр.гр, а только здор. и больных одного возр. интервала). И такой еще момент: если взять некую выборку наблюдений, к примеру здоровых лиц. Разбить их на возрастные группы 30-40, 41-50 лет итд. И определять различия в уровне того же тропонина, но по отношению к начальному возрастному интервалу 30-40 лет. То какой тогда метод использовать? И возможно ли применение t-критерия Стьюдента? Замечу ещё что термина "достоверный" в статистическом оценивании лучше избегать - использовать термины "статистически значимый", "статистически незначимый".... Спасибо, обязательно учту. К сожалению, в вопросах статистики я полный осел, а времени на исправление ситуации практически нет... Извините, если достал с вопросами, но для меня это очень важно.
Сообщение отредактировал vovchik - 16.10.2011 - 15:02 |
|
18.10.2011 - 19:34
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Vovchik, а что вас смущает? Двухфакторный ANOVA в Ёкселе делается так же легко, как и критерий Стьюдента. Хошь-с повторениями, хошь-без.
|
|
18.10.2011 - 19:41
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 11.10.2011 Пользователь №: 23264 |
Vovchik, а что вас смущает? Двухфакторный ANOVA в Ёкселе делается так же легко, как и критерий Стьюдента. Хошь-с повторениями, хошь-без. Да с экселем, вроде, разобрался, доставил dll для статистики. Теперь работает. Просто не могу понять, нужон ли анова для тех случаев, что перечислил выше?? Если да, то почему?
Сообщение отредактировал vovchik - 18.10.2011 - 19:44 |
|
18.10.2011 - 20:44
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Да с экселем, вроде, разобрался, доставил dll для статистики. Теперь работает. Просто не могу понять, нужон ли анова для тех случаев, что перечислил выше?? Если да, то почему? Ежели только два столбца - тестируйте Стьюдентом, пока не надоест. Если столбцов несколько, т.е. имеется дисперсионный комплекс, то - анова. Словом, все для вас за ваши деньги. Кстати, а что это за dll? В смысле - обычная надстройка (Сервис->Надстройки->Пакет анализа) или нечто другое? |
|
18.10.2011 - 22:07
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 11.10.2011 Пользователь №: 23264 |
Ежели только два столбца - тестируйте Стьюдентом, пока не надоест. Если столбцов несколько, т.е. имеется дисперсионный комплекс, то - анова. Словом, все для вас за ваши деньги. Вот, мой последний пример: если взять некую выборку наблюдений, к примеру здоровых лиц. Разбить их на возрастные группы 30-40, 41-50 лет итд. И определять различия в уровне того же тропонина, но по отношению к начальному возрастному интервалу 30-40 лет. Что тут лучше? Анова или просто Стъюдент? Или пофиг, в принципе?Кстати, а что это за dll? В смысле - обычная надстройка (Сервис->Надстройки->Пакет анализа) или нечто другое? Ну, да. Подразумевал analys32.xll, которого у меня не было. Соответственно, в сервисе пакета анализа тож не было... Теперь работает. |
|
18.10.2011 - 23:08
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Вот, мой последний пример: если взять некую выборку наблюдений, к примеру здоровых лиц. Разбить их на возрастные группы 30-40, 41-50 лет итд. И определять различия в уровне того же тропонина, но по отношению к начальному возрастному интервалу 30-40 лет. Что тут лучше? Анова или просто Стъюдент? Или пофиг, в принципе? Тут многое зависит от целей исследования. Если вам надо просто сделать кучу попарных сравнений с контрольной группой-на здоровье тестируйте Стьюдентом. |
|
19.10.2011 - 06:44
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Стьюдент - только для двух групп: скажем, опыт - контроль. Все остальные ухищрения с ним - не корректны, если не вводить поправку на множественность сравнений типа Бонферрони. И наче можно наделать лжеоткрытий (ошибка I рода). С поправкой же чем больше сравнений, тем шансы найти хоть какие-то различия всё сильнее стремятся к нулю. Нужно делать дисперсионный анализ и сравнивать специальными критериями для апостериорных (post-hoc) сравнений коих много. Типа Fisher LSD (самый либеральный) или Tukey HSD (самый строгий). Если важно попарно - то попарно, но можно проверять и более сложные гипотезы.
Вне дисперсионного комплекса вы не сможете найти различия в динамике. То, что для каждого возрастного класса будут существовать значимые различия между группами не говорит о том, что есть различия в возрастной динамике. И наоборот. Различия в динамике, т.е. специфический, непараллельный характер изменений признака с возрастом в группах можно обнаружить только анализируя все данные вместе - в виде взаимодействия факторов - если не известна форма регрессионной зависимости, или другим способом, но опять-таки через ANOVA - если форма регрессионной зависимости известна. Читайте про дисперсионный анализ и взаимодействие факторов. И ещё. Если ваш научный руководитель требует, чтобы все расчёты выполнялись в Excel, то этим он дискредитирует и себя, и вас. Данный пакет не является статистическим пакетом и не проходит специальных тестов на правильность статистических вычислений (это про DLL и уже обсуждалось на форуме). Специалисты об этом знают и, хотя скорее всего для ваших задач всё будет посчитано нормально, люди которые будут читать вашу работу (статьи, автореферат) подумают - "лопух или неуч". "Лопух" потому что вместо того чтобы осваивать специальные инструменты для научного поиска в виде статистических пакетов работает в процессоре электронных таблиц, - т.е. копает огород топором. Можно, конечно, и топором, но непроизводительно и несолидно. К тому же где гарантии, что формулы введённые вручную правильны и вообще считают то, что нужно? Вы обладаете достаточной квалификацией для этого? И даже если правильны - где гарантии, что формулы в книгах, откуда они были взяты не содержат ошибок/опечаток (это- сплошь и рядом, тоже обсуждалось на форуме неоднократно). А "неуч", потому что за фразой "расчёты были выполнены общепринятыми статистическими методами в пакете MS Excel" стоит отсутствие вообще какого-либо понимания биостатистики, а зачастую и какой-либо статистической обработки кроме среднего +/- ошибка. Если повлиять на руководителя не получится, придётся терпеть до защиты , но примите к сведению на будущее. |
|
19.10.2011 - 11:37
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Стесняюсь спросить: а что, в природе еще остались научные рукамиразводители, которым не все равно, где это посчитано, и которые не только предпочитают Ёксель всем остальным пакетам, но еще и диссертанта способны в этом смысле об колено сломать? Мракобесие, однако.
|
|
19.10.2011 - 13:58
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Стесняюсь спросить: а что, в природе еще остались научные рукамиразводители, которым не все равно, где это посчитано, и которые не только предпочитают Ёксель всем остальным пакетам, но еще и диссертанта способны в этом смысле об колено сломать? Мракобесие, однако. Что остались - это точно. Но не те, которые в год по 15 кандидатов "выпускают", а те кто ещё сам бодается и использует аспирантов как бесплатную силу для работы на себя. А есть просто упёртые: "мой руководитель считал(а) Стьюдентом и хи-квадратом, я считал(а) Стьюдентом и хи-квадратом и ты не выделывайся, я лучше знаю что в нашем учёном совете нужно!" А мне видимо повезло особенно: в свое время чуть "об колено не сломали" за то что арксинус для фи-преобразования посчитал на калькуляторе, а не взял готовое преобразованные значения из таблицы авторитетной книжки. А если бы ещё и формулу сам в Quattro Pro (был такой экселя) вбил, да упаси боже в чём ошибся - не дожил бы до защиты. |
|
19.10.2011 - 16:34
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Если ваш научный руководитель требует, чтобы все расчёты выполнялись в Excel, то этим он дискредитирует и себя, и вас. Справедливости ради, Excel - всего лишь инструмент, и никого он не дискредитирует. Есть несколько статей (могу порекомендовать), посвященных правильности вычислений Excel. И они не доказывают, что Excel уж так плох. Во всяком случае для сходных статистических методов (которых в Excel, конечно, немного) он не хуже иных статистических пакетов, которые интенсивно рекламируются авторами (в том числе на данном форуме) для анализа именно биомедицинских данных. Если нужны более продвинутые в статистическом плане электронные таблицы (с Андерсоном-Дарлингом, Вилкоксоном, факторным анализом, Капланом-Мейером и т.д., и т.п.), к тому же бесплатные, можно взять Gnumeric. По-моему, есть версия и для Windows, хотя я имею в виду Linux (Ubuntu 11.04). Была мысль самостоятельно сделать открытую мультисистемную статистическую программу. Уже есть компоненты: 1. Статистическая библиотека на C из AtteStat, вполне продвинутая и отлаженная. 2. Полноценные электронные таблицы на основе библиотеки Qt. 3. Текстовый редактор для вывода протоколов анализа на основе библиотеки Qt. Работа, однако, затормозилась по двум причинам: отсутствие какой-либо финансовой поддержки (грант бы не помешал, чтобы нанять бригаду программистов) и отсутствие массового интереса пользователей. Поэтому, думаю, сейчас ориентироваться надо на R с его графическими оболочками. Сообщение отредактировал Игорь - 19.10.2011 - 18:27 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
19.10.2011 - 18:58
Сообщение
#26
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 11.10.2011 Пользователь №: 23264 |
Спасибо всем за советы и комментарии!
Насчет Ановы, понял, как только возрастная динамика, то лучше брать анализ дисперсий. Буду пробовать. Хотя раньше, считал, что поправка Бонферрони вводится только в том случае, если анализируются группы подряд (потому что накапливается ошибка), но ваши доводы о различиях в динамике меня убедили. Насчет екселя, ну .... у каждого свой пунктик. Чего я счас буду упираться? Со временем планирую освоить пакет statistica - тогда в нем и перепроверю. А пока попробую Анову в екселе. |
|
19.10.2011 - 20:13
Сообщение
#27
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
А почему нужно проводить дискретизацию непрерывной ковариаты ?возраст? до качественного предиктора (фактора) с несколькими градациями и использовать дисперсионный анализ с фактором вместо ковариаты? Сегодня ?adjusted for age? весьма распространенная процедура, а потому, ANCOVA. По этому поводу есть прекрасное пособие nokh, выложенное на этом форуме. Аборигены форума помнят сложную сладкую задачку, блестяще решенную nokh.
|
|
19.10.2011 - 20:47
Сообщение
#28
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 11.10.2011 Пользователь №: 23264 |
А почему нужно проводить дискретизацию непрерывной ковариаты ?возраст? до качественного предиктора (фактора) с несколькими градациями и использовать дисперсионный анализ с фактором вместо ковариаты? Сегодня ?adjusted for age? весьма распространенная процедура, а потому, ANCOVA. По этому поводу есть прекрасное пособие nokh, выложенное на этом форуме. Аборигены форума помнят сложную сладкую задачку, блестяще решенную nokh. А это счас вопрос к кому? Именно nokh и предлагает дисперсионный анализ (в частности, АНОВА). И мне его доводы кажутся вполне логичными... Граждане, мэтры статистики, объясните мне чайнику, чем все-таки считать? Если можно, то по каждому конкретному случаю. Оччень хочется разобраться окончательно и услышать конкретный практический вердикт. Вот, примерные ситуации: 1. Берем группу больных разных возрастных интервалов: 30-40, 41-50, 51-60 итд и определяем у них уровень чего-нибудь в крови (тропонина, глюкозы итп...). Потом сравниваем возрастную динамику по отношению к стартовому возрасту (30-40 лет). Какой стат. метод предпочтительнее для оценки различий? 2.Затем, тот же уровень тропонина, но берем уже больных и здоровых. Сравниваем их в сопоставимых возрастных интервалах: больные 30-40 и здоровые 30-40 лет, больные 41-50 и здоровые 41-50 итд, итп. Какой стат. метод предпочтительнее оценки достоверности различий? Сообщение отредактировал vovchik - 20.10.2011 - 19:09 |
|
25.10.2011 - 18:56
Сообщение
#29
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
А вы бы взяли да почитали и про анову и про анкову. Но в том виде как задача была сформулирована она решается ановой с последующими апостериорными (post-hoc) сравнениями в рамках дисперсионного комплекса.
Сообщение отредактировал nokh - 25.10.2011 - 18:56 |
|
26.10.2011 - 13:24
Сообщение
#30
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 11.10.2011 Пользователь №: 23264 |
А вы бы взяли да почитали и про анову и про анкову. Но в том виде как задача была сформулирована она решается ановой с последующими апостериорными (post-hoc) сравнениями в рамках дисперсионного комплекса. Это подойдет для приведенных выше ситуаций 1 и 2?Ох, читаю, я читаю... ну, не у всех такая базовая матподготовка, как у вас (говорю безо всякого подвоха). То, чему учили в универе, уже давно и прочно забыто, учебники написаны в рассчете на подкованного читателя, а времени работа совсем не оставляет на углубленные копания в материале. Грустно, но факт, поэтому и надоедаю с просьбами о конкретной практической помощи. |
|