Выбор метода сравнения групп |
Здравствуйте, гость ( Вход | Регистрация )
Выбор метода сравнения групп |
3.03.2016 - 07:59
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 20.07.2014 Пользователь №: 26530 |
Доброго времени суток!
У меня такой вопрос. Есть 3 группы больных, сгруппированные по возрасту. Оценивается общее состояние больного по 12-ти признакам. Указывается, сколько человек в той или иной группе имеют данный признак. Какими критериями можно сравнить группы по частотам, если каждый больной может иметь более одного признака (они частично пересекаются)? Например, больной может иметь 1-й, 7-й и 10-й признаки. Я так понимаю, что таблицы сопряженности здесь не проходят. |
|
3.03.2016 - 19:09
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Простейший вариант: анализируйте 12 дихотомических переменных "есть признак/нет признака", по каждой делайте независимые выводы.
Какой-то мощной науки из этого не получится (как и из любого исследования, которое проводилось без цели и четкого плана действий), но формально анализ будет выполнен. Сообщение отредактировал ogurtsov - 3.03.2016 - 19:11 |
|
3.03.2016 - 19:10
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Или же сконструируйте другие переменные на основе комбинаций признаков, таким образом можно привнести некоторую клиническую значимость.
Сообщение отредактировал ogurtsov - 3.03.2016 - 19:12 |
|
3.03.2016 - 20:15
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Подобная задача рассматривалась на этом форуме, необходимо было сравнить две группы по числу послеоперационных осложнений, на сколько я помню. Например, какие то осложнения очень редко отмечаются в какой то группе, но их много разных, а в какой то чаще несколько видов, но других вообще нет. Число и разнообразие анализируется с использованием индексов диверсификации. Задача сводится к расчету этих индексов, в данном случае для трех групп, и сравнение их посредством ДИ. В расчете SD были сложности, но на форуме мне помогли, есть решение, сейчас прошло уже много лет, уже есть пограммы, которые сравнивают эти индексы.
|
|
3.03.2016 - 20:21
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
|
|
3.03.2016 - 21:53
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Какими критериями можно сравнить группы по частотам, если каждый больной может иметь более одного признака (они частично пересекаются)? Например, больной может иметь 1-й, 7-й и 10-й признаки. Я, конечно, не большой знаток многомерного анализа. С одной стороны, это плохо, так как я не в курсе общепринятых подходов, которых медики в силу своей консервативности (чуть не сказал косности) должны придерживаться. С другой стороны - хорошо, т.к. не мешает генерации новых идей. Вот одна из них: скомбинировать все признаки (12 штук) в виде линейной функции, например: f(a1,..,an) = a1*p1+...+an*pn, где a1,...,an - неизвестные коэффициенты, p1,...,pn - наличие(=1)/отсутствие(=0) признака. Тогда можно проварьировать функцию f() по коэффициентам ai, так , чтобы хи-квадрат (или какая-либо другая дифференцирующая статистика ) дала максимальное отличие между группами. Тем самым мы найдем всего один (вместо 12) комбинированный признак. Величина коэффициентов ai покажет важность отдельных признаков. Если для каких-то i-ых признаков коэффициенты ai окажутся малы по сравнению с другими, то эти признаки не влияют на результат и, поэтому , их можно исключить.
Сообщение отредактировал DoctorStat - 3.03.2016 - 21:53 Просто включи мозги => http://doctorstat.narod.ru
|
|
3.03.2016 - 21:57
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Тогда можно проварьировать функцию f() по коэффициентам ai, так , чтобы хи-квадрат (или какая-либо другая дифференцирующая статистика ) дала максимальное отличие между группами. Это чистый, рафинированный образец фальсификации научного исследования получается. |
|
4.03.2016 - 05:01
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 20.07.2014 Пользователь №: 26530 |
Я, конечно, не большой знаток многомерного анализа. С одной стороны, это плохо, так как я не в курсе общепринятых подходов, которых медики в силу своей консервативности (чуть не сказал косности) должны придерживаться. С другой стороны - хорошо, т.к. не мешает генерации новых идей. Вот одна из них: скомбинировать все признаки (12 штук) в виде линейной функции, например: f(a1,..,an) = a1*p1+...+an*pn, где a1,...,an - неизвестные коэффициенты, p1,...,pn - наличие(=1)/отсутствие(=0) признака. Тогда можно проварьировать функцию f() по коэффициентам ai, так , чтобы хи-квадрат (или какая-либо другая дифференцирующая статистика ) дала максимальное отличие между группами. Тем самым мы найдем всего один (вместо 12) комбинированный признак. Величина коэффициентов ai покажет важность отдельных признаков. Если для каких-то i-ых признаков коэффициенты ai окажутся малы по сравнению с другими, то эти признаки не влияют на результат и, поэтому , их можно исключить. А что значит проварьировать функцию по коэффициентам? В математике понятие вариации функции строго определено, и вряд ли имеет отношение к статистике. |
|
4.03.2016 - 05:04
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 20.07.2014 Пользователь №: 26530 |
Простейший вариант: анализируйте 12 дихотомических переменных "есть признак/нет признака", по каждой делайте независимые выводы. К сожалению, у меня нет данных отдельно по больным, а есть уже общее число больных, указывающих на признак. Т.е. это не дихотомические переменные. |
|
4.03.2016 - 09:45
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Именно в таком виде и нужны данные, приведите их. Общее число больных в каждой группе и число больных, имеющих признак в каждой из групп, т.е. табличку 12х3. Будет сравнение суммарной оценки частот в 3-х группах.
|
|
4.03.2016 - 10:32
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
А что значит проварьировать функцию по коэффициентам? В математике понятие вариации функции строго определено, и вряд ли имеет отношение к статистике. Это значит выписать статистику, по которой проводится анализ, в виде функции от неизвестных коэффициентов: f(a1,...,an) . Проварьировать функцию - это значит найти ее экстремум с помощью частных производных по коэффициентам ai: df/d_ai=0.
Сообщение отредактировал DoctorStat - 4.03.2016 - 10:34 Просто включи мозги => http://doctorstat.narod.ru
|
|
4.03.2016 - 10:53
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 20.07.2014 Пользователь №: 26530 |
Это значит выписать статистику, по которой проводится анализ, в виде функции от неизвестных коэффициентов: f(a1,...,an) . Проварьировать функцию - это значит найти ее экстремум с помощью частных производных по коэффициентам ai: df/d_ai=0. Вы имеете в виду продифференциировать линейную функцию по переменным?! |
|
4.03.2016 - 11:44
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Вы имеете в виду продифференциировать линейную функцию по переменным?! Да, нужно продифференцировать функцию по каждой переменной ai и приравнять все частные производные нулю. После решения полученной системы уравнений (12 штук), найдем все коэффициенты ai.
Сообщение отредактировал DoctorStat - 4.03.2016 - 11:45 Просто включи мозги => http://doctorstat.narod.ru
|
|
5.03.2016 - 13:47
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|
5.03.2016 - 20:31
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 20.07.2014 Пользователь №: 26530 |
|
|