Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Сравнение по критериям в разных группах, Сравнение по критериям в разных группах
neveroyatnoe
сообщение 25.03.2014 - 21:18
Сообщение #1





Группа: Пользователи
Сообщений: 8
Регистрация: 25.03.2014
Пользователь №: 26239



Здравствуйте, коллеги.

Я не врач-аспирант, а только студент 5 курса, но у меня есть к вам вопрос. Надеюсь вы мне сможете помочь, ибо времени совсем в обрез, а задание дали и сказали, чтобы "кровь износа" была в понедельник.
Ситуация следующая. Есть база данных на 332 ребенка в которой описывается информация о их лечении и состоянии (проводилась ли кардиотоническая терапия, была ли у ребенка гипербилирубинемия, тромбоцитопения и так далее.) Эти 332 ребенка разбиваются на две группы. Первая группа (85 человек) это группа в которой развилось заболевание "Х", вторая группа (247 детей) это группа контроля, т.е. там заболевание не развилось.
Нужно оценить каждую группу по критериям и определить долю частатоты встречаемости данного критерия в каждой из групп. И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание.

Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить?
Спасите бедного студента, пожалуйста)
Заранее благодарю)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.03.2014 - 23:01
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(neveroyatnoe @ 25.03.2014 - 22:18) *
Здравствуйте, коллеги.

Я не врач-аспирант, а только студент 5 курса, но у меня есть к вам вопрос. Надеюсь вы мне сможете помочь, ибо времени совсем в обрез, а задание дали и сказали, чтобы "кровь износа" была в понедельник.
Ситуация следующая. Есть база данных на 332 ребенка в которой описывается информация о их лечении и состоянии (проводилась ли кардиотоническая терапия, была ли у ребенка гипербилирубинемия, тромбоцитопения и так далее.) Эти 332 ребенка разбиваются на две группы. Первая группа (85 человек) это группа в которой развилось заболевание "Х", вторая группа (247 детей) это группа контроля, т.е. там заболевание не развилось.
Нужно оценить каждую группу по критериям и определить долю частатоты встречаемости данного критерия в каждой из групп. И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание.

Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить?
Спасите бедного студента, пожалуйста)
Заранее благодарю)


Ну как не порадеть родному человечку (с) Грибоедов

Тыц

Сообщение отредактировал 100$ - 25.03.2014 - 23:01
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 26.03.2014 - 00:23
Сообщение #3





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(neveroyatnoe @ 26.03.2014 - 00:18) *
...
Объясните пожалуйста методику данного рассчета и в каких программах это можно осуществить?
Спасите бедного студента, пожалуйста)
Заранее благодарю)

Вполне корректно можно сравнить разными методами. Т.к. у вас достаточно большие выборки можно использовать аппроксимацию биномиального распределения нормальным, что предлагает вам 100$. Но я думаю быстрее и проще будет сравнить криетрием хи-квадрат. Пока почитайте про анализ таблиц сопряжённости. Завтра подумаем где обсчитать проще.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 27.03.2014 - 05:02
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



К сожалению, не нашёл ничего простого + бесплатного. Где всё максимально удобно - слишком урезанные версии пакетов. В любом случае нужно сначала подготовить данные к анализу. Удобно в Excel.
1) В перой строке вбейте названия колонок и показателей.
2) Сделайте колонку для кодов групп ("Группа")и проставьте там цифры 1 и 2 для первой и второй групп.
3) В колонках с признаками (которые вы назвали критериями) проставьте "0" если признак отсутствовал или "1" если имелся.
Смысл теперь посчитать сколько "1" было в первой и второй группах и выразить это в % от чичла человек в группе.
Можно скачать программу MedCalc, демо-версия проработает 15 дней, вам этого хватит: http://www.medcalc.org/download.php
В неё скопируете подготовленную в Excel таблицу. Далее - анализ.
1) Путь: Statistics - Categorical Data - Frequency table...
2) В Codes X - выбираете признак, в Codes Y - Группа. ОК. Получаете окно результатов, их можно копировать и накидать в текстовый файл-черновик.
3) В таблице на % не обращайте внимания, смотрите сколько "1" в первой группе, сколько во второй и вручную считайте % от числа в каждой группе (строке).
4) Выпишите Chi-square, DF и Р.
Как оформить напишу вечером.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
neveroyatnoe
сообщение 27.03.2014 - 15:41
Сообщение #5





Группа: Пользователи
Сообщений: 8
Регистрация: 25.03.2014
Пользователь №: 26239



Цитата(nokh @ 27.03.2014 - 06:02) *
К сожалению, не нашёл ничего простого + бесплатного. Где всё максимально удобно - слишком урезанные версии пакетов. В любом случае нужно сначала подготовить данные к анализу. Удобно в Excel.
1) В перой строке вбейте названия колонок и показателей.
2) Сделайте колонку для кодов групп ("Группа")и проставьте там цифры 1 и 2 для первой и второй групп.
3) В колонках с признаками (которые вы назвали критериями) проставьте "0" если признак отсутствовал или "1" если имелся.
Смысл теперь посчитать сколько "1" было в первой и второй группах и выразить это в % от чичла человек в группе.
Можно скачать программу MedCalc, демо-версия проработает 15 дней, вам этого хватит: http://www.medcalc.org/download.php
В неё скопируете подготовленную в Excel таблицу. Далее - анализ.
1) Путь: Statistics - Categorical Data - Frequency table...
2) В Codes X - выбираете признак, в Codes Y - Группа. ОК. Получаете окно результатов, их можно копировать и накидать в текстовый файл-черновик.
3) В таблице на % не обращайте внимания, смотрите сколько "1" в первой группе, сколько во второй и вручную считайте % от числа в каждой группе (строке).
4) Выпишите Chi-square, DF и Р.
Как оформить напишу вечером.


Очень жду сообщения)
Благодарю вас)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 27.03.2014 - 16:10
Сообщение #6





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(neveroyatnoe @ 25.03.2014 - 22:18) *
И затем сравнить их для того, чтобы удостовериться, что в группе контроля, встречаемость критерия меньше, чем в группе, где есть заболевание.
Можно я немного пропиарюсь ? Для сравнения частот встречаемости признака в группах Вам нужно использовать точный критерий Фишера (он точнее, чем популярный критерий хи-квадрат). Критерий Фишера реализован в разных программах и, в частности в моей программе Электронная таблица (см.ссылку про мозги) тоже. Я забил ваши данные (наличие признака в каждой группе взял с потолка) в программу, а результат вывел на рисунок, из которого видно, что частоты признака А отличаются в группах на уровне значимости p-value=0,00305 . В какой группе частота больше придется посчитать ручками.

Сообщение отредактировал DoctorStat - 27.03.2014 - 16:13
Эскизы прикрепленных изображений
Прикрепленное изображение
 


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 27.03.2014 - 16:50
Сообщение #7





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Нетленный образчик качественного пиара:

Цитата
Критерий Фишера реализован в разных программах и, в частности в моей...


Это называется "Все великие умерли, и мне что-то нездоровится" (с) Марк Твен.

Доктор, вы с Марком делаете мне смешно.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 27.03.2014 - 17:05
Сообщение #8





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(100$ @ 27.03.2014 - 17:50) *
Нетленный образчик качественного пиара
Год или больше назад я начал разработку алгоритмов и написание программы, применяющей точные методы статистики. Эти методы пригодны для расчетов групп малой численности. Если моей программой никто не будет пользоваться, то значит я потратил свое время напрасно.

Сообщение отредактировал DoctorStat - 27.03.2014 - 17:06


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 27.03.2014 - 17:20
Сообщение #9





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DoctorStat @ 27.03.2014 - 18:05) *
Год или больше назад я начал разработку алгоритмов и написание программы, применяющей точные методы статистики. Эти методы пригодны для расчетов групп малой численности. Если моей программой никто не будет пользоваться, то значит я потратил свое время напрасно.


Доктор, я не сомневаюсь в чистоте ваших помыслов, возвышенном образе мыслей, подкованности в статистике и программистском таланте.
Просто куча всех этих точных критериев уже реализована, н-р, в АттеСтате.
Лишь бы вы не клепали то, что клепают все.
А пока что желаю вам всего самого доброго.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 27.03.2014 - 18:01
Сообщение #10





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Студенту 5 курса!

?кровь износа? должна быть у вас, чтобы успеть чему то научиться.
Вам дали почти неделю времени, потратьте его с умом.

Первое, посмотрите, что есть в доказательной медицине о типах клинических исследований. Ваш дизайн ? типичное case (85) - control (247) исследование. Неужели ничего не учили про методы количественной оценки факторов риска, никогда не слышали об отношении шансов, может быть, вы встречали OR или Odds Ratio, читая медицинские статьи на английском?
Если никогда об этом не слышали, гугл вам в помощь или архив этого форума. Не нужно никакой специальной подготовки, чтобы самостоятельно посчитать руками OR, можно использовать для тренировки табличку, любезно предоставленную DoctorStat.
Сложность только в расчете ДИ к отношению шансов, но и тут можно обойтись малой кровью, в сети очень много калькуляторов для расчета ДИ.

Для примера DoctorStat Odds ratio OR =3.76
95% confidence interval from 1.4429 to 9.7979
http://www.hutchon.net/ConfidOR.htm

Второе, вам детей лечить......
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 27.03.2014 - 18:37
Сообщение #11





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(neveroyatnoe @ 27.03.2014 - 18:41) *
Очень жду сообщения)

Образец оформления подшил. Это - вариант для "успеть к понедельнику". Если бы времени было больше, обсчитать можно было бы серьёзнее. В частности, неплохо было бы снабдить относительные частоты 95%-ными доверительными интервалами. Также, если мы считаем, что на принадлежность к группе заболевания влиял способ лечения или их сочетания - корректнее было бы использовать логистическую или множественную логистическую регрессию (именно в MedCalc данный метод реализован на 5+).
При оформлении обращайте внимание на округление. Проценты - до десятых, а значит до десятых всегда: не 5, а 5,0. Хи-квадрат лучше до сотых, р - до тысячных. Если р=0,048 или р=0,001 так и пишите, если меньше - как у меня, т.е. не р=0,000035, а просто р<0,001 (всегда 3 знака). Буквы, обозначающие математические величины (n, хи, р) лучше - курсивом как у меня. Индекс в скобках после хи-квадрат - число степеней свободы (degree of freedom, DF). Если у вас все признаки бинарные (0 или 1), и 2 группы, df всегда будет 1. Тогда можно каждый раз хи и р не писать, а поделить последнюю колонку на 2 и написать только в шапке, а в колонках - только цифры. Читайте про критерий хи-квадрат, отношения шансов.
Цитата(DoctorStat @ 27.03.2014 - 19:10) *
Для сравнения частот встречаемости признака в группах Вам нужно использовать точный критерий Фишера (он точнее, чем популярный критерий хи-квадрат).

Во-первых, его не нужно использовать. Я уже устал это писать. Что точно нужно, так это читать хорошие учебники, как Биометрию Сокала и Рольфа, где это написано. Во-вторых, он не точнее хи-квадрата, он - "про другое". А вот точные методы, которые вы планируете включить в пакет (ну или хотя бы Монте-Карло) - действительно что нужно! Успехов!

PS. Пока писал появилось сообщение DrgLen'ы (что радует, значит и желание есть, и интернет работает smile.gif )- тоже всё справедливо насчёт OR. Их легко посчитать по табличкам частот, в которые кросстабулирует исходные данные MedCalc и выдаёт над хи-квадратом. Например здесь: http://www.medcalc.org/calc/odds_ratio.php Можно эту статистику дать вместо хи-квадрата. Метод уступает хи-квадрату в известности, но с переходом на "доказательную медицину" стал очень популярен.

Сообщение отредактировал nokh - 27.03.2014 - 20:05
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
neveroyatnoe
сообщение 28.03.2014 - 22:13
Сообщение #12





Группа: Пользователи
Сообщений: 8
Регистрация: 25.03.2014
Пользователь №: 26239



Я для эксперимента пересчитал данные вашей таблицы, и получил другие показания хи-квадрата. А именно, для кардиотонической терапии хи-квадрат равен 15,510 при P = 0,0001. В чем может быть проблема?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
neveroyatnoe
сообщение 28.03.2014 - 22:20
Сообщение #13





Группа: Пользователи
Сообщений: 8
Регистрация: 25.03.2014
Пользователь №: 26239



Цитата(nokh @ 27.03.2014 - 19:37) *
Образец оформления подшил. Это - вариант для "успеть к понедельнику". Если бы времени было больше, обсчитать можно было бы серьёзнее. В частности, неплохо было бы снабдить относительные частоты 95%-ными доверительными интервалами. Также, если мы считаем, что на принадлежность к группе заболевания влиял способ лечения или их сочетания - корректнее было бы использовать логистическую или множественную логистическую регрессию (именно в MedCalc данный метод реализован на 5+).
При оформлении обращайте внимание на округление. Проценты - до десятых, а значит до десятых всегда: не 5, а 5,0. Хи-квадрат лучше до сотых, р - до тысячных. Если р=0,048 или р=0,001 так и пишите, если меньше - как у меня, т.е. не р=0,000035, а просто р<0,001 (всегда 3 знака). Буквы, обозначающие математические величины (n, хи, р) лучше - курсивом как у меня. Индекс в скобках после хи-квадрат - число степеней свободы (degree of freedom, DF). Если у вас все признаки бинарные (0 или 1), и 2 группы, df всегда будет 1. Тогда можно каждый раз хи и р не писать, а поделить последнюю колонку на 2 и написать только в шапке, а в колонках - только цифры. Читайте про критерий хи-квадрат, отношения шансов.

Во-первых, его не нужно использовать. Я уже устал это писать. Что точно нужно, так это читать хорошие учебники, как Биометрию Сокала и Рольфа, где это написано. Во-вторых, он не точнее хи-квадрата, он - "про другое". А вот точные методы, которые вы планируете включить в пакет (ну или хотя бы Монте-Карло) - действительно что нужно! Успехов!

PS. Пока писал появилось сообщение DrgLen'ы (что радует, значит и желание есть, и интернет работает smile.gif )- тоже всё справедливо насчёт OR. Их легко посчитать по табличкам частот, в которые кросстабулирует исходные данные MedCalc и выдаёт над хи-квадратом. Например здесь: http://www.medcalc.org/calc/odds_ratio.php Можно эту статистику дать вместо хи-квадрата. Метод уступает хи-квадрату в известности, но с переходом на "доказательную медицину" стал очень популярен.


Вот скриншот моих расчетов.


Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 28.03.2014 - 23:05
Сообщение #14





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Вы посчитали Yates corrected Chi-square
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
neveroyatnoe
сообщение 28.03.2014 - 23:44
Сообщение #15





Группа: Пользователи
Сообщений: 8
Регистрация: 25.03.2014
Пользователь №: 26239



Цитата(DrgLena @ 29.03.2014 - 00:05) *
Вы посчитали Yates corrected Chi-square


А как в MedicalCalc рассчитать именно хи-квадрат? И в чем существенная разница между данными показателями?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему