Сравнение по критериям в разных группах, Сравнение по критериям в разных группах |
Здравствуйте, гость ( Вход | Регистрация )
Сравнение по критериям в разных группах, Сравнение по критериям в разных группах |
25.03.2014 - 21:18
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 25.03.2014 Пользователь №: 26239 |
Здравствуйте, коллеги.
Я не врач-аспирант, а только студент 5 курса, но у меня есть к вам вопрос. Надеюсь вы мне сможете помочь, ибо времени совсем в обрез, а задание дали и сказали, чтобы "кровь износа" была в понедельник. Ситуация следующая. Есть база данных на 332 ребенка в которой описывается информация о их лечении и состоянии (проводилась ли кардиотоническая терапия, была ли у ребенка гипербилирубинемия, тромбоцитопения и так далее.) Эти 332 ребенка разбиваются на две группы. Первая группа (85 человек) это группа в которой развилось заболевание "Х", вторая группа (247 детей) это группа контроля, т.е. там заболевание не развилось. Нужно оценить каждую группу по критериям и определить долю частатоты встречаемости данного критерия в каждой из групп. И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание. Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить? Спасите бедного студента, пожалуйста) Заранее благодарю) |
|
25.03.2014 - 23:01
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Здравствуйте, коллеги. Я не врач-аспирант, а только студент 5 курса, но у меня есть к вам вопрос. Надеюсь вы мне сможете помочь, ибо времени совсем в обрез, а задание дали и сказали, чтобы "кровь износа" была в понедельник. Ситуация следующая. Есть база данных на 332 ребенка в которой описывается информация о их лечении и состоянии (проводилась ли кардиотоническая терапия, была ли у ребенка гипербилирубинемия, тромбоцитопения и так далее.) Эти 332 ребенка разбиваются на две группы. Первая группа (85 человек) это группа в которой развилось заболевание "Х", вторая группа (247 детей) это группа контроля, т.е. там заболевание не развилось. Нужно оценить каждую группу по критериям и определить долю частатоты встречаемости данного критерия в каждой из групп. И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание. Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить? Спасите бедного студента, пожалуйста) Заранее благодарю) Ну как не порадеть родному человечку (с) Грибоедов Тыц Сообщение отредактировал 100$ - 25.03.2014 - 23:01 |
|
26.03.2014 - 00:23
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
... Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить? Спасите бедного студента, пожалуйста) Заранее благодарю) Вполне корректно можно сравнить разными методами. Т.к. у вас достаточно большие выборки можно использовать аппроксимацию биномиального распределения нормальным, что предлагает вам 100$. Но я думаю быстрее и проще будет сравнить криетрием хи-квадрат. Пока почитайте про анализ таблиц сопряжённости. Завтра подумаем где обсчитать проще. |
|
27.03.2014 - 05:02
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
К сожалению, не нашёл ничего простого + бесплатного. Где всё максимально удобно - слишком урезанные версии пакетов. В любом случае нужно сначала подготовить данные к анализу. Удобно в Excel.
1) В перой строке вбейте названия колонок и показателей. 2) Сделайте колонку для кодов групп ("Группа")и проставьте там цифры 1 и 2 для первой и второй групп. 3) В колонках с признаками (которые вы назвали критериями) проставьте "0" если признак отсутствовал или "1" если имелся. Смысл теперь посчитать сколько "1" было в первой и второй группах и выразить это в % от чичла человек в группе. Можно скачать программу MedCalc, демо-версия проработает 15 дней, вам этого хватит: http://www.medcalc.org/download.php В неё скопируете подготовленную в Excel таблицу. Далее - анализ. 1) Путь: Statistics - Categorical Data - Frequency table... 2) В Codes X - выбираете признак, в Codes Y - Группа. ОК. Получаете окно результатов, их можно копировать и накидать в текстовый файл-черновик. 3) В таблице на % не обращайте внимания, смотрите сколько "1" в первой группе, сколько во второй и вручную считайте % от числа в каждой группе (строке). 4) Выпишите Chi-square, DF и Р. Как оформить напишу вечером. |
|
27.03.2014 - 15:41
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 25.03.2014 Пользователь №: 26239 |
К сожалению, не нашёл ничего простого + бесплатного. Где всё максимально удобно - слишком урезанные версии пакетов. В любом случае нужно сначала подготовить данные к анализу. Удобно в Excel. 1) В перой строке вбейте названия колонок и показателей. 2) Сделайте колонку для кодов групп ("Группа")и проставьте там цифры 1 и 2 для первой и второй групп. 3) В колонках с признаками (которые вы назвали критериями) проставьте "0" если признак отсутствовал или "1" если имелся. Смысл теперь посчитать сколько "1" было в первой и второй группах и выразить это в % от чичла человек в группе. Можно скачать программу MedCalc, демо-версия проработает 15 дней, вам этого хватит: http://www.medcalc.org/download.php В неё скопируете подготовленную в Excel таблицу. Далее - анализ. 1) Путь: Statistics - Categorical Data - Frequency table... 2) В Codes X - выбираете признак, в Codes Y - Группа. ОК. Получаете окно результатов, их можно копировать и накидать в текстовый файл-черновик. 3) В таблице на % не обращайте внимания, смотрите сколько "1" в первой группе, сколько во второй и вручную считайте % от числа в каждой группе (строке). 4) Выпишите Chi-square, DF и Р. Как оформить напишу вечером. Очень жду сообщения) Благодарю вас) |
|
27.03.2014 - 16:10
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание. Можно я немного пропиарюсь ? Для сравнения частот встречаемости признака в группах Вам нужно использовать точный критерий Фишера (он точнее, чем популярный критерий хи-квадрат). Критерий Фишера реализован в разных программах и, в частности в моей программе Электронная таблица (см.ссылку про мозги) тоже. Я забил ваши данные (наличие признака в каждой группе взял с потолка) в программу, а результат вывел на рисунок, из которого видно, что частоты признака А отличаются в группах на уровне значимости p-value=0,00305 . В какой группе частота больше придется посчитать ручками.
Сообщение отредактировал DoctorStat - 27.03.2014 - 16:13 Просто включи мозги => http://doctorstat.narod.ru
|
|
27.03.2014 - 16:50
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Нетленный образчик качественного пиара:
Цитата Критерий Фишера реализован в разных программах и, в частности в моей... Это называется "Все великие умерли, и мне что-то нездоровится" (с) Марк Твен. Доктор, вы с Марком делаете мне смешно. |
|
27.03.2014 - 17:05
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Нетленный образчик качественного пиара Год или больше назад я начал разработку алгоритмов и написание программы, применяющей точные методы статистики. Эти методы пригодны для расчетов групп малой численности. Если моей программой никто не будет пользоваться, то значит я потратил свое время напрасно.
Сообщение отредактировал DoctorStat - 27.03.2014 - 17:06 Просто включи мозги => http://doctorstat.narod.ru
|
|
27.03.2014 - 17:20
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Год или больше назад я начал разработку алгоритмов и написание программы, применяющей точные методы статистики. Эти методы пригодны для расчетов групп малой численности. Если моей программой никто не будет пользоваться, то значит я потратил свое время напрасно. Доктор, я не сомневаюсь в чистоте ваших помыслов, возвышенном образе мыслей, подкованности в статистике и программистском таланте. Просто куча всех этих точных критериев уже реализована, н-р, в АттеСтате. Лишь бы вы не клепали то, что клепают все. А пока что желаю вам всего самого доброго. |
|
27.03.2014 - 18:01
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Студенту 5 курса!
?кровь износа? должна быть у вас, чтобы успеть чему то научиться. Вам дали почти неделю времени, потратьте его с умом. Первое, посмотрите, что есть в доказательной медицине о типах клинических исследований. Ваш дизайн ? типичное case (85) - control (247) исследование. Неужели ничего не учили про методы количественной оценки факторов риска, никогда не слышали об отношении шансов, может быть, вы встречали OR или Odds Ratio, читая медицинские статьи на английском? Если никогда об этом не слышали, гугл вам в помощь или архив этого форума. Не нужно никакой специальной подготовки, чтобы самостоятельно посчитать руками OR, можно использовать для тренировки табличку, любезно предоставленную DoctorStat. Сложность только в расчете ДИ к отношению шансов, но и тут можно обойтись малой кровью, в сети очень много калькуляторов для расчета ДИ. Для примера DoctorStat Odds ratio OR =3.76 95% confidence interval from 1.4429 to 9.7979 http://www.hutchon.net/ConfidOR.htm Второе, вам детей лечить...... |
|
27.03.2014 - 18:37
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Очень жду сообщения) Образец оформления подшил. Это - вариант для "успеть к понедельнику". Если бы времени было больше, обсчитать можно было бы серьёзнее. В частности, неплохо было бы снабдить относительные частоты 95%-ными доверительными интервалами. Также, если мы считаем, что на принадлежность к группе заболевания влиял способ лечения или их сочетания - корректнее было бы использовать логистическую или множественную логистическую регрессию (именно в MedCalc данный метод реализован на 5+). При оформлении обращайте внимание на округление. Проценты - до десятых, а значит до десятых всегда: не 5, а 5,0. Хи-квадрат лучше до сотых, р - до тысячных. Если р=0,048 или р=0,001 так и пишите, если меньше - как у меня, т.е. не р=0,000035, а просто р<0,001 (всегда 3 знака). Буквы, обозначающие математические величины (n, хи, р) лучше - курсивом как у меня. Индекс в скобках после хи-квадрат - число степеней свободы (degree of freedom, DF). Если у вас все признаки бинарные (0 или 1), и 2 группы, df всегда будет 1. Тогда можно каждый раз хи и р не писать, а поделить последнюю колонку на 2 и написать только в шапке, а в колонках - только цифры. Читайте про критерий хи-квадрат, отношения шансов. Для сравнения частот встречаемости признака в группах Вам нужно использовать точный критерий Фишера (он точнее, чем популярный критерий хи-квадрат). Во-первых, его не нужно использовать. Я уже устал это писать. Что точно нужно, так это читать хорошие учебники, как Биометрию Сокала и Рольфа, где это написано. Во-вторых, он не точнее хи-квадрата, он - "про другое". А вот точные методы, которые вы планируете включить в пакет (ну или хотя бы Монте-Карло) - действительно что нужно! Успехов! PS. Пока писал появилось сообщение DrgLen'ы (что радует, значит и желание есть, и интернет работает )- тоже всё справедливо насчёт OR. Их легко посчитать по табличкам частот, в которые кросстабулирует исходные данные MedCalc и выдаёт над хи-квадратом. Например здесь: http://www.medcalc.org/calc/odds_ratio.php Можно эту статистику дать вместо хи-квадрата. Метод уступает хи-квадрату в известности, но с переходом на "доказательную медицину" стал очень популярен. Сообщение отредактировал nokh - 27.03.2014 - 20:05 |
|
28.03.2014 - 22:13
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 25.03.2014 Пользователь №: 26239 |
Я для эксперимента пересчитал данные вашей таблицы, и получил другие показания хи-квадрата. А именно, для кардиотонической терапии хи-квадрат равен 15,510 при P = 0,0001. В чем может быть проблема?
|
|
28.03.2014 - 22:20
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 25.03.2014 Пользователь №: 26239 |
Образец оформления подшил. Это - вариант для "успеть к понедельнику". Если бы времени было больше, обсчитать можно было бы серьёзнее. В частности, неплохо было бы снабдить относительные частоты 95%-ными доверительными интервалами. Также, если мы считаем, что на принадлежность к группе заболевания влиял способ лечения или их сочетания - корректнее было бы использовать логистическую или множественную логистическую регрессию (именно в MedCalc данный метод реализован на 5+). При оформлении обращайте внимание на округление. Проценты - до десятых, а значит до десятых всегда: не 5, а 5,0. Хи-квадрат лучше до сотых, р - до тысячных. Если р=0,048 или р=0,001 так и пишите, если меньше - как у меня, т.е. не р=0,000035, а просто р<0,001 (всегда 3 знака). Буквы, обозначающие математические величины (n, хи, р) лучше - курсивом как у меня. Индекс в скобках после хи-квадрат - число степеней свободы (degree of freedom, DF). Если у вас все признаки бинарные (0 или 1), и 2 группы, df всегда будет 1. Тогда можно каждый раз хи и р не писать, а поделить последнюю колонку на 2 и написать только в шапке, а в колонках - только цифры. Читайте про критерий хи-квадрат, отношения шансов. Во-первых, его не нужно использовать. Я уже устал это писать. Что точно нужно, так это читать хорошие учебники, как Биометрию Сокала и Рольфа, где это написано. Во-вторых, он не точнее хи-квадрата, он - "про другое". А вот точные методы, которые вы планируете включить в пакет (ну или хотя бы Монте-Карло) - действительно что нужно! Успехов! PS. Пока писал появилось сообщение DrgLen'ы (что радует, значит и желание есть, и интернет работает )- тоже всё справедливо насчёт OR. Их легко посчитать по табличкам частот, в которые кросстабулирует исходные данные MedCalc и выдаёт над хи-квадратом. Например здесь: http://www.medcalc.org/calc/odds_ratio.php Можно эту статистику дать вместо хи-квадрата. Метод уступает хи-квадрату в известности, но с переходом на "доказательную медицину" стал очень популярен. Вот скриншот моих расчетов. |
|
28.03.2014 - 23:05
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Вы посчитали Yates corrected Chi-square
|
|
28.03.2014 - 23:44
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 25.03.2014 Пользователь №: 26239 |
|
|