Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V  < 1 2 3 4 >  
Добавить ответ в эту темуОткрыть тему
> Достоверность исследования. Нужна помощь
vovchik
сообщение 15.10.2011 - 14:22
Сообщение #16





Группа: Пользователи
Сообщений: 13
Регистрация: 11.10.2011
Пользователь №: 23264



Цитата(nokh @ 15.10.2011 - 13:12) *
Двухфакторный дисперсионный анализ (two-way ANOVA) с факторами "группа" и "возраст". Метод параметрический - требует нормального распределения ошибки (остатки, Residuals).
Скажите, а в этой ситуации категорически нельзя использовать просто критерий Стьюдента?? Например, тотже трпонин сравниваем в одинаковых возрастных интервалах у здоровых и больных. Как две независимые выборки. И проверяем достоверность различий между средними в группе здоровых и больных в данном возрастном диапазоне. (Не предполагается сравнение между собой разных возр.гр, а только здор. и больных одного возр. интервала).

И такой еще момент: если взять некую выборку наблюдений, к примеру здоровых лиц. Разбить их на возрастные группы 30-40, 41-50 лет итд. И определять различия в уровне того же тропонина, но по отношению к начальному возрастному интервалу 30-40 лет. То какой тогда метод использовать? И возможно ли применение t-критерия Стьюдента?

Цитата(nokh @ 15.10.2011 - 13:12) *
Замечу ещё что термина "достоверный" в статистическом оценивании лучше избегать - использовать термины "статистически значимый", "статистически незначимый"....
Спасибо, обязательно учту. К сожалению, в вопросах статистики я полный осел, а времени на исправление ситуации практически нет... Извините, если достал с вопросами, но для меня это очень важно.

Сообщение отредактировал vovchik - 16.10.2011 - 15:02
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 18.10.2011 - 19:34
Сообщение #17





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Vovchik, а что вас смущает? Двухфакторный ANOVA в Ёкселе делается так же легко, как и критерий Стьюдента. Хошь-с повторениями, хошь-без.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
vovchik
сообщение 18.10.2011 - 19:41
Сообщение #18





Группа: Пользователи
Сообщений: 13
Регистрация: 11.10.2011
Пользователь №: 23264



Цитата(100$ @ 18.10.2011 - 19:34) *
Vovchik, а что вас смущает? Двухфакторный ANOVA в Ёкселе делается так же легко, как и критерий Стьюдента. Хошь-с повторениями, хошь-без.
Да с экселем, вроде, разобрался, доставил dll для статистики. Теперь работает. Просто не могу понять, нужон ли анова для тех случаев, что перечислил выше?? Если да, то почему?

Сообщение отредактировал vovchik - 18.10.2011 - 19:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 18.10.2011 - 20:44
Сообщение #19





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(vovchik @ 18.10.2011 - 19:41) *
Да с экселем, вроде, разобрался, доставил dll для статистики. Теперь работает. Просто не могу понять, нужон ли анова для тех случаев, что перечислил выше?? Если да, то почему?


Ежели только два столбца - тестируйте Стьюдентом, пока не надоест. Если столбцов несколько, т.е. имеется дисперсионный комплекс, то - анова. Словом, все для вас за ваши деньги.

Кстати, а что это за dll? В смысле - обычная надстройка (Сервис->Надстройки->Пакет анализа) или нечто другое?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
vovchik
сообщение 18.10.2011 - 22:07
Сообщение #20





Группа: Пользователи
Сообщений: 13
Регистрация: 11.10.2011
Пользователь №: 23264



Цитата(100$ @ 18.10.2011 - 20:44) *
Ежели только два столбца - тестируйте Стьюдентом, пока не надоест. Если столбцов несколько, т.е. имеется дисперсионный комплекс, то - анова. Словом, все для вас за ваши деньги.
Вот, мой последний пример: если взять некую выборку наблюдений, к примеру здоровых лиц. Разбить их на возрастные группы 30-40, 41-50 лет итд. И определять различия в уровне того же тропонина, но по отношению к начальному возрастному интервалу 30-40 лет. Что тут лучше? Анова или просто Стъюдент? Или пофиг, в принципе?
Цитата(100$ @ 18.10.2011 - 20:44) *
Кстати, а что это за dll? В смысле - обычная надстройка (Сервис->Надстройки->Пакет анализа) или нечто другое?
Ну, да. Подразумевал analys32.xll, которого у меня не было. Соответственно, в сервисе пакета анализа тож не было... Теперь работает.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 18.10.2011 - 23:08
Сообщение #21





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(vovchik @ 18.10.2011 - 22:07) *
Вот, мой последний пример: если взять некую выборку наблюдений, к примеру здоровых лиц. Разбить их на возрастные группы 30-40, 41-50 лет итд. И определять различия в уровне того же тропонина, но по отношению к начальному возрастному интервалу 30-40 лет. Что тут лучше? Анова или просто Стъюдент? Или пофиг, в принципе?


Тут многое зависит от целей исследования. Если вам надо просто сделать кучу попарных сравнений с контрольной группой-на здоровье тестируйте Стьюдентом.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 19.10.2011 - 06:44
Сообщение #22





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Стьюдент - только для двух групп: скажем, опыт - контроль. Все остальные ухищрения с ним - не корректны, если не вводить поправку на множественность сравнений типа Бонферрони. И наче можно наделать лжеоткрытий (ошибка I рода). С поправкой же чем больше сравнений, тем шансы найти хоть какие-то различия всё сильнее стремятся к нулю. Нужно делать дисперсионный анализ и сравнивать специальными критериями для апостериорных (post-hoc) сравнений коих много. Типа Fisher LSD (самый либеральный) или Tukey HSD (самый строгий). Если важно попарно - то попарно, но можно проверять и более сложные гипотезы.

Вне дисперсионного комплекса вы не сможете найти различия в динамике. То, что для каждого возрастного класса будут существовать значимые различия между группами не говорит о том, что есть различия в возрастной динамике. И наоборот. Различия в динамике, т.е. специфический, непараллельный характер изменений признака с возрастом в группах можно обнаружить только анализируя все данные вместе - в виде взаимодействия факторов - если не известна форма регрессионной зависимости, или другим способом, но опять-таки через ANOVA - если форма регрессионной зависимости известна. Читайте про дисперсионный анализ и взаимодействие факторов.

И ещё. Если ваш научный руководитель требует, чтобы все расчёты выполнялись в Excel, то этим он дискредитирует и себя, и вас. Данный пакет не является статистическим пакетом и не проходит специальных тестов на правильность статистических вычислений (это про DLL и уже обсуждалось на форуме). Специалисты об этом знают и, хотя скорее всего для ваших задач всё будет посчитано нормально, люди которые будут читать вашу работу (статьи, автореферат) подумают - "лопух или неуч". "Лопух" потому что вместо того чтобы осваивать специальные инструменты для научного поиска в виде статистических пакетов работает в процессоре электронных таблиц, - т.е. копает огород топором. Можно, конечно, и топором, но непроизводительно и несолидно. К тому же где гарантии, что формулы введённые вручную правильны и вообще считают то, что нужно? Вы обладаете достаточной квалификацией для этого? И даже если правильны - где гарантии, что формулы в книгах, откуда они были взяты не содержат ошибок/опечаток (это- сплошь и рядом, тоже обсуждалось на форуме неоднократно). А "неуч", потому что за фразой "расчёты были выполнены общепринятыми статистическими методами в пакете MS Excel" стоит отсутствие вообще какого-либо понимания биостатистики, а зачастую и какой-либо статистической обработки кроме среднего +/- ошибка. Если повлиять на руководителя не получится, придётся терпеть до защиты frown.gif , но примите к сведению на будущее.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 19.10.2011 - 11:37
Сообщение #23





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Стесняюсь спросить: а что, в природе еще остались научные рукамиразводители, которым не все равно, где это посчитано, и которые не только предпочитают Ёксель всем остальным пакетам, но еще и диссертанта способны в этом смысле об колено сломать? Мракобесие, однако.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 19.10.2011 - 13:58
Сообщение #24





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(100$ @ 19.10.2011 - 14:37) *
Стесняюсь спросить: а что, в природе еще остались научные рукамиразводители, которым не все равно, где это посчитано, и которые не только предпочитают Ёксель всем остальным пакетам, но еще и диссертанта способны в этом смысле об колено сломать? Мракобесие, однако.

smile.gif Что остались - это точно. Но не те, которые в год по 15 кандидатов "выпускают", а те кто ещё сам бодается и использует аспирантов как бесплатную силу для работы на себя. А есть просто упёртые: "мой руководитель считал(а) Стьюдентом и хи-квадратом, я считал(а) Стьюдентом и хи-квадратом и ты не выделывайся, я лучше знаю что в нашем учёном совете нужно!" А мне видимо повезло особенно: в свое время чуть "об колено не сломали" за то что арксинус для фи-преобразования посчитал на калькуляторе, а не взял готовое преобразованные значения из таблицы авторитетной книжки. А если бы ещё и формулу сам в Quattro Pro (был такой экселя) вбил, да упаси боже в чём ошибся - не дожил бы до защиты.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 19.10.2011 - 16:34
Сообщение #25





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(nokh @ 19.10.2011 - 06:44) *
Если ваш научный руководитель требует, чтобы все расчёты выполнялись в Excel, то этим он дискредитирует и себя, и вас.

Справедливости ради, Excel - всего лишь инструмент, и никого он не дискредитирует. Есть несколько статей (могу порекомендовать), посвященных правильности вычислений Excel. И они не доказывают, что Excel уж так плох. Во всяком случае для сходных статистических методов (которых в Excel, конечно, немного) он не хуже иных статистических пакетов, которые интенсивно рекламируются авторами (в том числе на данном форуме) для анализа именно биомедицинских данных.

Если нужны более продвинутые в статистическом плане электронные таблицы (с Андерсоном-Дарлингом, Вилкоксоном, факторным анализом, Капланом-Мейером и т.д., и т.п.), к тому же бесплатные, можно взять Gnumeric. По-моему, есть версия и для Windows, хотя я имею в виду Linux (Ubuntu 11.04).

Была мысль самостоятельно сделать открытую мультисистемную статистическую программу. Уже есть компоненты:
1. Статистическая библиотека на C из AtteStat, вполне продвинутая и отлаженная.
2. Полноценные электронные таблицы на основе библиотеки Qt.
3. Текстовый редактор для вывода протоколов анализа на основе библиотеки Qt.
Работа, однако, затормозилась по двум причинам: отсутствие какой-либо финансовой поддержки (грант бы не помешал, чтобы нанять бригаду программистов) и отсутствие массового интереса пользователей. Поэтому, думаю, сейчас ориентироваться надо на R с его графическими оболочками.

Сообщение отредактировал Игорь - 19.10.2011 - 18:27


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
vovchik
сообщение 19.10.2011 - 18:58
Сообщение #26





Группа: Пользователи
Сообщений: 13
Регистрация: 11.10.2011
Пользователь №: 23264



Спасибо всем за советы и комментарии! super.gif
Насчет Ановы, понял, как только возрастная динамика, то лучше брать анализ дисперсий. Буду пробовать.
Хотя раньше, считал, что поправка Бонферрони вводится только в том случае, если анализируются группы подряд (потому что накапливается ошибка), но ваши доводы о различиях в динамике меня убедили.

Насчет екселя, ну .... у каждого свой пунктик. Чего я счас буду упираться? Со временем планирую освоить пакет statistica - тогда в нем и перепроверю.
А пока попробую Анову в екселе.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 19.10.2011 - 20:13
Сообщение #27





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



А почему нужно проводить дискретизацию непрерывной ковариаты ?возраст? до качественного предиктора (фактора) с несколькими градациями и использовать дисперсионный анализ с фактором вместо ковариаты? Сегодня ?adjusted for age? весьма распространенная процедура, а потому, ANCOVA. По этому поводу есть прекрасное пособие nokh, выложенное на этом форуме. Аборигены форума помнят сложную сладкую задачку, блестяще решенную nokh.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
vovchik
сообщение 19.10.2011 - 20:47
Сообщение #28





Группа: Пользователи
Сообщений: 13
Регистрация: 11.10.2011
Пользователь №: 23264



Цитата(DrgLena @ 19.10.2011 - 20:13) *
А почему нужно проводить дискретизацию непрерывной ковариаты ?возраст? до качественного предиктора (фактора) с несколькими градациями и использовать дисперсионный анализ с фактором вместо ковариаты? Сегодня ?adjusted for age? весьма распространенная процедура, а потому, ANCOVA. По этому поводу есть прекрасное пособие nokh, выложенное на этом форуме. Аборигены форума помнят сложную сладкую задачку, блестяще решенную nokh.
А это счас вопрос к кому? craz.gif Именно nokh и предлагает дисперсионный анализ (в частности, АНОВА). И мне его доводы кажутся вполне логичными...

Граждане, мэтры статистики, объясните мне чайнику, чем все-таки считать? Если можно, то по каждому конкретному случаю. Оччень хочется разобраться окончательно и услышать конкретный практический вердикт.
Вот, примерные ситуации:
1. Берем группу больных разных возрастных интервалов: 30-40, 41-50, 51-60 итд и определяем у них уровень чего-нибудь в крови (тропонина, глюкозы итп...). Потом сравниваем возрастную динамику по отношению к стартовому возрасту (30-40 лет). Какой стат. метод предпочтительнее для оценки различий?
2.Затем, тот же уровень тропонина, но берем уже больных и здоровых. Сравниваем их в сопоставимых возрастных интервалах: больные 30-40 и здоровые 30-40 лет, больные 41-50 и здоровые 41-50 итд, итп. Какой стат. метод предпочтительнее оценки достоверности различий?


Сообщение отредактировал vovchik - 20.10.2011 - 19:09
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 25.10.2011 - 18:56
Сообщение #29





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



А вы бы взяли да почитали и про анову и про анкову. Но в том виде как задача была сформулирована она решается ановой с последующими апостериорными (post-hoc) сравнениями в рамках дисперсионного комплекса.

Сообщение отредактировал nokh - 25.10.2011 - 18:56
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
vovchik
сообщение 26.10.2011 - 13:24
Сообщение #30





Группа: Пользователи
Сообщений: 13
Регистрация: 11.10.2011
Пользователь №: 23264



Цитата(nokh @ 25.10.2011 - 18:56) *
А вы бы взяли да почитали и про анову и про анкову. Но в том виде как задача была сформулирована она решается ановой с последующими апостериорными (post-hoc) сравнениями в рамках дисперсионного комплекса.
Это подойдет для приведенных выше ситуаций 1 и 2?

Ох, читаю, я читаю... weep.gif ну, не у всех такая базовая матподготовка, как у вас (говорю безо всякого подвоха). То, чему учили в универе, уже давно и прочно забыто, учебники написаны в рассчете на подкованного читателя, а времени работа совсем не оставляет на углубленные копания в материале. Грустно, но факт, поэтому и надоедаю с просьбами о конкретной практической помощи.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V  < 1 2 3 4 >
Добавить ответ в эту темуОткрыть тему