Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Сравнение по критериям в разных группах
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
neveroyatnoe
Здравствуйте, коллеги.

Я не врач-аспирант, а только студент 5 курса, но у меня есть к вам вопрос. Надеюсь вы мне сможете помочь, ибо времени совсем в обрез, а задание дали и сказали, чтобы "кровь износа" была в понедельник.
Ситуация следующая. Есть база данных на 332 ребенка в которой описывается информация о их лечении и состоянии (проводилась ли кардиотоническая терапия, была ли у ребенка гипербилирубинемия, тромбоцитопения и так далее.) Эти 332 ребенка разбиваются на две группы. Первая группа (85 человек) это группа в которой развилось заболевание "Х", вторая группа (247 детей) это группа контроля, т.е. там заболевание не развилось.
Нужно оценить каждую группу по критериям и определить долю частатоты встречаемости данного критерия в каждой из групп. И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание.

Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить?
Спасите бедного студента, пожалуйста)
Заранее благодарю)
100$
Цитата(neveroyatnoe @ 25.03.2014 - 22:18) *
Здравствуйте, коллеги.

Я не врач-аспирант, а только студент 5 курса, но у меня есть к вам вопрос. Надеюсь вы мне сможете помочь, ибо времени совсем в обрез, а задание дали и сказали, чтобы "кровь износа" была в понедельник.
Ситуация следующая. Есть база данных на 332 ребенка в которой описывается информация о их лечении и состоянии (проводилась ли кардиотоническая терапия, была ли у ребенка гипербилирубинемия, тромбоцитопения и так далее.) Эти 332 ребенка разбиваются на две группы. Первая группа (85 человек) это группа в которой развилось заболевание "Х", вторая группа (247 детей) это группа контроля, т.е. там заболевание не развилось.
Нужно оценить каждую группу по критериям и определить долю частатоты встречаемости данного критерия в каждой из групп. И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание.

Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить?
Спасите бедного студента, пожалуйста)
Заранее благодарю)


Ну как не порадеть родному человечку (с) Грибоедов

Тыц
nokh
Цитата(neveroyatnoe @ 26.03.2014 - 00:18) *
...
Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить?
Спасите бедного студента, пожалуйста)
Заранее благодарю)

Вполне корректно можно сравнить разными методами. Т.к. у вас достаточно большие выборки можно использовать аппроксимацию биномиального распределения нормальным, что предлагает вам 100$. Но я думаю быстрее и проще будет сравнить криетрием хи-квадрат. Пока почитайте про анализ таблиц сопряжённости. Завтра подумаем где обсчитать проще.
nokh
К сожалению, не нашёл ничего простого + бесплатного. Где всё максимально удобно - слишком урезанные версии пакетов. В любом случае нужно сначала подготовить данные к анализу. Удобно в Excel.
1) В перой строке вбейте названия колонок и показателей.
2) Сделайте колонку для кодов групп ("Группа")и проставьте там цифры 1 и 2 для первой и второй групп.
3) В колонках с признаками (которые вы назвали критериями) проставьте "0" если признак отсутствовал или "1" если имелся.
Смысл теперь посчитать сколько "1" было в первой и второй группах и выразить это в % от чичла человек в группе.
Можно скачать программу MedCalc, демо-версия проработает 15 дней, вам этого хватит: http://www.medcalc.org/download.php
В неё скопируете подготовленную в Excel таблицу. Далее - анализ.
1) Путь: Statistics - Categorical Data - Frequency table...
2) В Codes X - выбираете признак, в Codes Y - Группа. ОК. Получаете окно результатов, их можно копировать и накидать в текстовый файл-черновик.
3) В таблице на % не обращайте внимания, смотрите сколько "1" в первой группе, сколько во второй и вручную считайте % от числа в каждой группе (строке).
4) Выпишите Chi-square, DF и Р.
Как оформить напишу вечером.

neveroyatnoe
Цитата(nokh @ 27.03.2014 - 06:02) *
К сожалению, не нашёл ничего простого + бесплатного. Где всё максимально удобно - слишком урезанные версии пакетов. В любом случае нужно сначала подготовить данные к анализу. Удобно в Excel.
1) В перой строке вбейте названия колонок и показателей.
2) Сделайте колонку для кодов групп ("Группа")и проставьте там цифры 1 и 2 для первой и второй групп.
3) В колонках с признаками (которые вы назвали критериями) проставьте "0" если признак отсутствовал или "1" если имелся.
Смысл теперь посчитать сколько "1" было в первой и второй группах и выразить это в % от чичла человек в группе.
Можно скачать программу MedCalc, демо-версия проработает 15 дней, вам этого хватит: http://www.medcalc.org/download.php
В неё скопируете подготовленную в Excel таблицу. Далее - анализ.
1) Путь: Statistics - Categorical Data - Frequency table...
2) В Codes X - выбираете признак, в Codes Y - Группа. ОК. Получаете окно результатов, их можно копировать и накидать в текстовый файл-черновик.
3) В таблице на % не обращайте внимания, смотрите сколько "1" в первой группе, сколько во второй и вручную считайте % от числа в каждой группе (строке).
4) Выпишите Chi-square, DF и Р.
Как оформить напишу вечером.


Очень жду сообщения)
Благодарю вас)
DoctorStat
Цитата(neveroyatnoe @ 25.03.2014 - 22:18) *
И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание.
Можно я немного пропиарюсь ? Для сравнения частот встречаемости признака в группах Вам нужно использовать точный критерий Фишера (он точнее, чем популярный критерий хи-квадрат). Критерий Фишера реализован в разных программах и, в частности в моей программе Электронная таблица (см.ссылку про мозги) тоже. Я забил ваши данные (наличие признака в каждой группе взял с потолка) в программу, а результат вывел на рисунок, из которого видно, что частоты признака А отличаются в группах на уровне значимости p-value=0,00305 . В какой группе частота больше придется посчитать ручками.
100$
Нетленный образчик качественного пиара:

Цитата
Критерий Фишера реализован в разных программах и, в частности в моей...


Это называется "Все великие умерли, и мне что-то нездоровится" (с) Марк Твен.

Доктор, вы с Марком делаете мне смешно.
DoctorStat
Цитата(100$ @ 27.03.2014 - 17:50) *
Нетленный образчик качественного пиара
Год или больше назад я начал разработку алгоритмов и написание программы, применяющей точные методы статистики. Эти методы пригодны для расчетов групп малой численности. Если моей программой никто не будет пользоваться, то значит я потратил свое время напрасно.
100$
Цитата(DoctorStat @ 27.03.2014 - 18:05) *
Год или больше назад я начал разработку алгоритмов и написание программы, применяющей точные методы статистики. Эти методы пригодны для расчетов групп малой численности. Если моей программой никто не будет пользоваться, то значит я потратил свое время напрасно.


Доктор, я не сомневаюсь в чистоте ваших помыслов, возвышенном образе мыслей, подкованности в статистике и программистском таланте.
Просто куча всех этих точных критериев уже реализована, н-р, в АттеСтате.
Лишь бы вы не клепали то, что клепают все.
А пока что желаю вам всего самого доброго.
DrgLena
Студенту 5 курса!

?кровь износа? должна быть у вас, чтобы успеть чему то научиться.
Вам дали почти неделю времени, потратьте его с умом.

Первое, посмотрите, что есть в доказательной медицине о типах клинических исследований. Ваш дизайн ? типичное case (85) - control (247) исследование. Неужели ничего не учили про методы количественной оценки факторов риска, никогда не слышали об отношении шансов, может быть, вы встречали OR или Odds Ratio, читая медицинские статьи на английском?
Если никогда об этом не слышали, гугл вам в помощь или архив этого форума. Не нужно никакой специальной подготовки, чтобы самостоятельно посчитать руками OR, можно использовать для тренировки табличку, любезно предоставленную DoctorStat.
Сложность только в расчете ДИ к отношению шансов, но и тут можно обойтись малой кровью, в сети очень много калькуляторов для расчета ДИ.

Для примера DoctorStat Odds ratio OR =3.76
95% confidence interval from 1.4429 to 9.7979
http://www.hutchon.net/ConfidOR.htm

Второе, вам детей лечить......
nokh
Цитата(neveroyatnoe @ 27.03.2014 - 18:41) *
Очень жду сообщения)

Образец оформления подшил. Это - вариант для "успеть к понедельнику". Если бы времени было больше, обсчитать можно было бы серьёзнее. В частности, неплохо было бы снабдить относительные частоты 95%-ными доверительными интервалами. Также, если мы считаем, что на принадлежность к группе заболевания влиял способ лечения или их сочетания - корректнее было бы использовать логистическую или множественную логистическую регрессию (именно в MedCalc данный метод реализован на 5+).
При оформлении обращайте внимание на округление. Проценты - до десятых, а значит до десятых всегда: не 5, а 5,0. Хи-квадрат лучше до сотых, р - до тысячных. Если р=0,048 или р=0,001 так и пишите, если меньше - как у меня, т.е. не р=0,000035, а просто р<0,001 (всегда 3 знака). Буквы, обозначающие математические величины (n, хи, р) лучше - курсивом как у меня. Индекс в скобках после хи-квадрат - число степеней свободы (degree of freedom, DF). Если у вас все признаки бинарные (0 или 1), и 2 группы, df всегда будет 1. Тогда можно каждый раз хи и р не писать, а поделить последнюю колонку на 2 и написать только в шапке, а в колонках - только цифры. Читайте про критерий хи-квадрат, отношения шансов.
Цитата(DoctorStat @ 27.03.2014 - 19:10) *
Для сравнения частот встречаемости признака в группах Вам нужно использовать точный критерий Фишера (он точнее, чем популярный критерий хи-квадрат).

Во-первых, его не нужно использовать. Я уже устал это писать. Что точно нужно, так это читать хорошие учебники, как Биометрию Сокала и Рольфа, где это написано. Во-вторых, он не точнее хи-квадрата, он - "про другое". А вот точные методы, которые вы планируете включить в пакет (ну или хотя бы Монте-Карло) - действительно что нужно! Успехов!

PS. Пока писал появилось сообщение DrgLen'ы (что радует, значит и желание есть, и интернет работает smile.gif )- тоже всё справедливо насчёт OR. Их легко посчитать по табличкам частот, в которые кросстабулирует исходные данные MedCalc и выдаёт над хи-квадратом. Например здесь: http://www.medcalc.org/calc/odds_ratio.php Можно эту статистику дать вместо хи-квадрата. Метод уступает хи-квадрату в известности, но с переходом на "доказательную медицину" стал очень популярен.
neveroyatnoe
Я для эксперимента пересчитал данные вашей таблицы, и получил другие показания хи-квадрата. А именно, для кардиотонической терапии хи-квадрат равен 15,510 при P = 0,0001. В чем может быть проблема?
neveroyatnoe
Цитата(nokh @ 27.03.2014 - 19:37) *
Образец оформления подшил. Это - вариант для "успеть к понедельнику". Если бы времени было больше, обсчитать можно было бы серьёзнее. В частности, неплохо было бы снабдить относительные частоты 95%-ными доверительными интервалами. Также, если мы считаем, что на принадлежность к группе заболевания влиял способ лечения или их сочетания - корректнее было бы использовать логистическую или множественную логистическую регрессию (именно в MedCalc данный метод реализован на 5+).
При оформлении обращайте внимание на округление. Проценты - до десятых, а значит до десятых всегда: не 5, а 5,0. Хи-квадрат лучше до сотых, р - до тысячных. Если р=0,048 или р=0,001 так и пишите, если меньше - как у меня, т.е. не р=0,000035, а просто р<0,001 (всегда 3 знака). Буквы, обозначающие математические величины (n, хи, р) лучше - курсивом как у меня. Индекс в скобках после хи-квадрат - число степеней свободы (degree of freedom, DF). Если у вас все признаки бинарные (0 или 1), и 2 группы, df всегда будет 1. Тогда можно каждый раз хи и р не писать, а поделить последнюю колонку на 2 и написать только в шапке, а в колонках - только цифры. Читайте про критерий хи-квадрат, отношения шансов.

Во-первых, его не нужно использовать. Я уже устал это писать. Что точно нужно, так это читать хорошие учебники, как Биометрию Сокала и Рольфа, где это написано. Во-вторых, он не точнее хи-квадрата, он - "про другое". А вот точные методы, которые вы планируете включить в пакет (ну или хотя бы Монте-Карло) - действительно что нужно! Успехов!

PS. Пока писал появилось сообщение DrgLen'ы (что радует, значит и желание есть, и интернет работает smile.gif )- тоже всё справедливо насчёт OR. Их легко посчитать по табличкам частот, в которые кросстабулирует исходные данные MedCalc и выдаёт над хи-квадратом. Например здесь: http://www.medcalc.org/calc/odds_ratio.php Можно эту статистику дать вместо хи-квадрата. Метод уступает хи-квадрату в известности, но с переходом на "доказательную медицину" стал очень популярен.


Вот скриншот моих расчетов.

DrgLena
Вы посчитали Yates corrected Chi-square
neveroyatnoe
Цитата(DrgLena @ 29.03.2014 - 00:05) *
Вы посчитали Yates corrected Chi-square


А как в MedicalCalc рассчитать именно хи-квадрат? И в чем существенная разница между данными показателями?
nokh
Цитата(neveroyatnoe @ 29.03.2014 - 02:44) *
А как в MedicalCalc рассчитать именно хи-квадрат? И в чем существенная разница между данными показателями?

Пока не грейтесь по этому поводу. Наука - это во-многом когда всё описано так, что другие проделав ваши шаги придут к тому же результату. Поэтому главное укажите в "Материале и методах", что "расчёты выполнены в пакете MedCalc (version 13.1, MedCalc®)". Можете написать, выше, что "сравнение частот проводили с использованием критерия хи-квадрат с поправкой Йейтса". Как выполнить собственно кросстабуляцию из исходных данных в "0" и "1" я пошагово описывал выше в сообщении #4, подробнее не смогу. В присланной в личку таблице странные % - проверьте всё вручную. Например, 9/66=0,136 или 13,6%, а не 13,24 или 17/66=0,258 или 25,8%, а не 25.
neveroyatnoe
Цитата(nokh @ 29.03.2014 - 02:45) *
Пока не грейтесь по этому поводу. Наука - это во-многом когда всё описано так, что другие проделав ваши шаги придут к тому же результату. Поэтому главное укажите в "Материале и методах", что "расчёты выполнены в пакете MedCalc (version 13.1, MedCalc?)". Можете написать, выше, что "сравнение частот проводили с использованием критерия хи-квадрат с поправкой Йейтса". Как выполнить собственно кросстабуляцию из исходных данных в "0" и "1" я пошагово описывал выше в сообщении #4, подробнее не смогу. В присланной в личку таблице странные % - проверьте всё вручную. Например, 9/66=0,136 или 13,6%, а не 13,24 или 17/66=0,258 или 25,8%, а не 25.

Дадада. Спасибо. Заметил ошибку еще вчера, все перепроверил и исправил. Ваше сообщение очень помогло. Спасибо огромное.
А еще у меня вопрос. Мне в идеале нужно сравнить еще два количественных признака. Массу тела и гестационный возраст. Каким образом можно сравнить между собой эти два количественных признака между двумя группами? Например в основной группе средний ГВ 35 недель и масса тела 1610г, а в группе контроля ГВ 37 недель и масса тела 2100г.
Благодарю.
neveroyatnoe
Цитата(DrgLena @ 27.03.2014 - 19:01) *
Студенту 5 курса!

?кровь износа? должна быть у вас, чтобы успеть чему то научиться.
Вам дали почти неделю времени, потратьте его с умом.

Первое, посмотрите, что есть в доказательной медицине о типах клинических исследований. Ваш дизайн ? типичное case (85) - control (247) исследование. Неужели ничего не учили про методы количественной оценки факторов риска, никогда не слышали об отношении шансов, может быть, вы встречали OR или Odds Ratio, читая медицинские статьи на английском?
Если никогда об этом не слышали, гугл вам в помощь или архив этого форума. Не нужно никакой специальной подготовки, чтобы самостоятельно посчитать руками OR, можно использовать для тренировки табличку, любезно предоставленную DoctorStat.
Сложность только в расчете ДИ к отношению шансов, но и тут можно обойтись малой кровью, в сети очень много калькуляторов для расчета ДИ.

Для примера DoctorStat Odds ratio OR =3.76
95% confidence interval from 1.4429 to 9.7979
http://www.hutchon.net/ConfidOR.htm

Второе, вам детей лечить......



Благодарю и вас за помощь, но при изучении материалов по OR возник закономерный вопрос. Что на практике это означает. На этом форуме нашел парочку тем по этому поводу, все прочитал, но так ответа и не получил. Понимаю, что при OR > 1 шанс возрастает. Но если у меня OR 4,00 а ДИ 1,82 to 8,79. Что это означает? Что шанс возрастает в 4 раза? Как интерпритировать данное значение?
Благодарю)
DrgLena
Значит, нужно начать обучение не с форумов, а с учебников. Некоторые ссылки я представляю и даже с указанием страниц, поскольку у вас мало времени, а у меня они в бумажном виде на полке.
В исследованиях случай- контроль отношение шансов используется для оценки относительного риска.
1. Флетчер Р?. Клиническая эпидемиология. Основы доказательной медицины. Стр 264-266
2. Власов. В. Введение в доказательную медицину. С. 227
3. Реброва. О. Статистически анализ медицинских данных. С. 175
4. Тиша Гринхальх Основы доказательной медицины. С.235

По запросу в гугле на русском языке!
About 750,000 results (0.27 seconds)

http://donbas-socproject.blogspot.com/2009...og-post_25.html
http://m.umj.com.ua/wp-content/uploads/arc...pdf/352_rus.pdf
Это первые ссылки по моему запросу, надеюсь, для вас они тоже доступны smile.gif
neveroyatnoe
Цитата(DrgLena @ 29.03.2014 - 21:52) *
Значит, нужно начать обучение не с форумов, а с учебников. Некоторые ссылки я представляю и даже с указанием страниц, поскольку у вас мало времени, а у меня они в бумажном виде на полке.
В исследованиях случай- контроль отношение шансов используется для оценки относительного риска.
1. Флетчер Р?. Клиническая эпидемиология. Основы доказательной медицины. Стр 264-266
2. Власов. В. Введение в доказательную медицину. С. 227
3. Реброва. О. Статистически анализ медицинских данных. С. 175
4. Тиша Гринхальх Основы доказательной медицины. С.235

По запросу в гугле на русском языке!
About 750,000 results (0.27 seconds)

http://donbas-socproject.blogspot.com/2009...og-post_25.html
http://m.umj.com.ua/wp-content/uploads/arc...pdf/352_rus.pdf
Это первые ссылки по моему запросу, надеюсь, для вас они тоже доступны smile.gif

Благодарю. Буду изучать)
nokh
Цитата(neveroyatnoe @ 29.03.2014 - 11:57) *
... А еще у меня вопрос. Мне в идеале нужно сравнить еще два количественных признака. Массу тела и гестационный возраст. Каким образом можно сравнить между собой эти два количественных признака между двумя группами? Например в основной группе средний ГВ 35 недель и масса тела 1610г, а в группе контроля ГВ 37 недель и масса тела 2100г.
Благодарю.

Сравнивайте критерием Манна - Уитни. Две колонки с показателями - ГВ и масса, одна - с кодами принадлежности к группе (1 или 2). Есть во всех пакетах. Можно в той же МedCalc: Statistics - Rank sum test - Mann-Whitney test.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.