Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Сравнение качественных признаков двух зависимых группах

Автор: becas84 14.01.2013 - 16:31

Имеется набор качественных признаков внутри одной группы: 1-самопорезы, 2-самоповешания, 3-отравления. Необходимо оценить, насколько изменились соотношения при первой попытке и при последующей. Выборка 86 человек, повторно совершили суицид 50 человек. Какой стат метод выбрать и как оценить достоверность различия признаков???

Автор: nokh 14.01.2013 - 18:50

Цитата(becas84 @ 14.01.2013 - 19:31) *
Имеется набор качественных признаков внутри одной группы: 1-самопорезы, 2-самоповешания, 3-отравления. Необходимо оценить, насколько изменились соотношения при первой попытке и при последующей. Выборка 86 человек, повторно совершили суицид 50 человек. Какой стат метод выбрать и как оценить достоверность различия признаков???

В случае зависимых выборок анализ таблиц r х c проводится тестами на симметрию: Баукера (Bowker symmetry test, аналог критерия Мак-Немара для таблиц более чем 2 х 2), Стюарта - Максвелла (Stuart - Maxwell test) или Бхапкара (Bhapkar's test). Все три есть в программах AtteStat (http://attestatsoft.narod.ru/) и MH (http://www.john-uebersax.com/stat/mh.htm). При слабой насыщенности таблиц используют точный критерий Лидделла (Liddell's exact test); его в пакетах не встречал. Достоверность вы оценить не сможете, т.к. достоверных событий (с P=1), равно как и невозможных (с P=0) в статистическом оценивании нет: всегда 0<P<1. Но с помощью указанных критериев вы сможете оценить статистическую значимость.

Автор: becas84 14.01.2013 - 19:38

Большое спасибо! А есть аналоги в statistica 6.0? Потому как у меня все расчеты в этой программе, к сожалению, ограничен во времени для освоения новых пакетов frown.gif

Автор: DrgLena 14.01.2013 - 20:12

Поясните цели исследования. Первичные с. есть у всех и есть их соотношения для 1,2,3 вида у 86 случаев, но повторные не у всех и могут быть не такого же вида. Если цель ответить на вопрос, при каких первичных видах чаще бывают повторные с., то можно просто сравнить проценты повторных при каждом виде с. Или сравнить доли первичных и повторных с. в каждой из трех категорий. Полезно бы было данные выложить, возможны разные решения. Первая переменная принимает значения 1,2,3, вторая ? 0,1,2,3.

Автор: becas84 15.01.2013 - 04:11

Целью является определить, меняется ли суицидальное поведение при повторных попытках. Да, все верно. Первая переменная имеет значения 1, 2, 3. Вторая 0, 1, 2, 3.

Автор: DrgLena 15.01.2013 - 12:55

Так прицепите файл с этими двумя переменными

Автор: nokh 15.01.2013 - 15:48

Цитата(becas84 @ 15.01.2013 - 07:11) *
Целью является определить, меняется ли суицидальное поведение при повторных попытках. Да, все верно. Первая переменная имеет значения 1, 2, 3. Вторая 0, 1, 2, 3.

Раз цель такова, то исследовать нужно только людей с повторными попытками, т.е. только 50 чел. Следовательно в данной узкой задаче никакой переменной "0" нет, только 1,2, и 3. Если результаты тестов на симметрию не будут статистически значимыми, значит симметрия сохраняется: пациенты предпочитают использовать уже проверенные ими ранее способы суицида. Если симметрия нарушена - значит после неудавшейся первой попытки они предпочитают менять способ самоубийства. В последнем случае имеет смысл провести апостериорные сравнения и разобраться за счёт каких групп эта симметрия нарушается, т.е. задействовать уже другие методы, как и написала DrgLena. А ещё можно посмотреть кем сформирована группа "0" - может в ней значимо много пациентов только какой-то одной категории, а это уже позволит рассчитывать риски повторных попыток дифференциально для пациентов с разными типами, что ближе к практике. Данные действительно не помешают.

Путь "от пакета к методу" - тупиковый. Насколько я знаю, нет в Statistica этих тестов. И что вы будете дальше делать? Нужно всегда искать самый лучший метод для конкретной задачи, а уже потом искать пакет, где этот метод есть: бесплатный и/или удобный и/или надёжный или всё вместе. А наличие или отсутствие у исследователя времени не имеет отношения к грамотному анализу данных. И вообще, как мне быстро сварить борщ если есть только вода, картошка и ассорти экзотических фруктов?

Автор: becas84 15.01.2013 - 16:59

Спасибо большое, что хотите раскрыть секретный ингредиент вашего секретноингредиентного супа smile.gif (to nokh)
В арихиве excel файл с табличкой. Жду вашей помощи! Заранее спасибо за отзывчивость.

 Книга1.rar ( 4,57 килобайт ) : 264
 

Автор: DrgLena 15.01.2013 - 18:51

Цитата(becas84 @ 15.01.2013 - 16:59) *
Спасибо большое, что хотите раскрыть секретный ингредиент вашего секретноингредиентного супа smile.gif (to nokh)

Вы прицепили ингредиенты для другого супчика или для сложной каши. Тут не две, а три переменных, и явный перебор методов и первичных и повторных

Автор: becas84 15.01.2013 - 19:20

Мм... Ок, пусть будет в рамках одной группы, скажите, какой для этого анализа нужен метод, если ответ уже был дан, повторите пожалста, плохо понял

Автор: DrgLena 15.01.2013 - 20:00

Цитата(becas84 @ 15.01.2013 - 19:20) *
Мм... Ок, пусть будет в рамках одной группы, скажите, какой для этого анализа нужен метод, если ответ уже был дан, повторите пожалста, плохо понял

Да, полный ответ вам дал nokh и указал пакеты, в которых можно сделать нужный вам анализ. Но вы не можете выполнить это в программе Statistica и вряд ли сможете выпонить этот анализ в досовской программе МН. Я могла бы показать вам как это сделать на ВАШИХ данных. ПОВТОРЯЮ, нужны 86 значений первичных (1,2,3) и 86 значений повторных (0,1,2,3). Во второй переменной, судя по вашему первому посту, должно быть 36 нулей. Что же вы плохо поняли?

Автор: becas84 16.01.2013 - 04:47

Полная выборка 142 человека, все они совершили суицидальную попытку, повторно суицид попытку совершили не все. Я предоставил полную выборку - 142 человека, 0 там есть, только их количество несколько другое.
Попробую разобраться сам с программой attestat.
У меня еще вот какой вопрос: ведь повторное суициденты совершили не одну попытку и применяли не один способ, это можно как-то посчитать

Автор: DrgLena 16.01.2013 - 11:14

Вы и с первым вопросом не разобрались, но задаете второй. Решите сначала задачу первых повторных. 1,2,3, - это типы суицидов, а у вас в переменных и первичных и повторных есть и 4, 5,6 - это что тоже виды суицидов?

Автор: becas84 16.01.2013 - 16:04

Да, усл обозначения есть в комментарии во 2 строке таблицы. Всего 6 способов

Автор: nokh 16.01.2013 - 22:40

Во вложении - мой вариант решения для группы 1. Сделайте сами для группы 2 (там похожие результаты) и для объединённой выборки (не делал). В принципе, можно и обосновать возможность объединения статистически, но это уже лезть в дебри (типа перестановочного теста для двух матриц 6 х 6), проще - на глаз, по схожести результатов. С остальными вопросами пока нет возможности работать.

 Тест_на_симметрию.rar ( 162,49 килобайт ) : 290
 

Автор: becas84 17.01.2013 - 04:47

Огромное спасибо! Самое подробное и доступное объяснение! smile.gif

Автор: DrgLena 17.01.2013 - 13:38

При таких реальных данных можно не использовать предлагаемые nokh методы, поскольку 6 групп по типам первичного суицида очень скромно представлены. В группах по 2 или 4 случая. В основном представлены самопорезы, которые при первичных попытках составили 77,5% от всех случаев. При повторах, этот тип суицида сократился статистически значимо до 46,9%, т.е. на 30,6% (95% ДИ 18,2%-42,0% хи.кв. =22,5, р<0,0001). Это сокращение произошло за счет повышения двух других типов. А именно, 3 тип повысился с 14,1% до 25,51% , разница составила 11,5% (95% ДИ разницы 1,4-22,1%, хи кв =4,3, р=0,04). А также доля 5 типа в структуре суицидов повысилась с 2,8% до 16,3%, на 13,5% (95% ДИ 6,2-22,2; хи.кв.=12,5, р=0,0005).
Анализ таблиц в связанных выборках основан на том, что число наблюдений в них одинаково.

Добавляя 5 категорию, нужно добавить и нулевую у первичных.
Убирая нулевую колонку вы не только убираете не нужные нули в повторной переменной, но и теряете данные по первичным суицидам, тем самым вы ИЗМЕНЯЕТЕ первоначальную долю тех категорий, у которых не было повторных суицидов. Но если вы вставляете нулевую категорию, то анализ будет по всем категориям включая нулевую. Программа MH даст анализ долей первичных и повторных для каждой категории, но доли будут посчитаны на число первичных наблюдений.


McNemar Tests for Each Category
Proportion
Frequency (Base Rate)
Level ---------------- ---------------- Chi-
(k) Rater 1 Rater 2 Rater 1 Rater 2 squared(a) p
---------------------------------------------------------------------
1 42 33 0.656 0.516 2.613 0.1060
2 2 1 0.031 0.016 exact test 1.0000
3 14 15 0.219 0.234 0.043 0.8348
4 2 2 0.031 0.031 exact test 1.0000
5 0 11 0.000 0.172 11.000 0.0009*
6 4 2 0.063 0.031 exact test 0.6875
---------------------------------------------------------------------
(a) or exact test
* p < Bonferroni-adjusted significance criterion of 0.010.
Tests of Overall Marginal Homogeneity
------------------------------------------------------------
Bhapkar chi-squared = 16.214 df = 5 p = 0.0063
Stuart-Maxwell chi-squared = 12.937 df = 5 p = 0.0240 nohk

Автор: becas84 17.01.2013 - 18:19

smile.gif спасибо и вам!
А если число наблюдений не одинаковом эти выборки разные. Например в таблице есть цвета: синий, зеленый и желтый, что соответствует нозологиям: алкоголизм, наркомания и психическая патология. Если сравнивать, например, первичные суициды у этих групп (лица с наркологической патологией n=86 и лица, страдающие психическими расстройствами n=56), какой метод лучше?

Автор: DrgLena 17.01.2013 - 19:36

В том то и дело, что нужно решать конкретные задачи. Сейчас вы формулируете другую задачу, которая может звучать так: различается ли структура первичных суицидов в зависимости от диагноза. Это будет таблица сопряженности, но сложность остается - мало представлены 6 групп. В группах по два случая, а вы теперь хотите учесть и фактор первичного диагноза. Сколько их, два или три? У вас во всем неточность, три цвета, должно быть три группы, а 86 и 56 ? это без желтого. smile.gif

Автор: becas84 17.01.2013 - 19:45

smile.gif все точно... 86 - синие+зеленые - 1 группа; 56 - желтые - 2 группа

Автор: DrgLena 17.01.2013 - 20:40

Понятно, есть и номер группы, т.к большинство компьютеров дальтоники smile.gif. А значение в повторных 3;1 означает, что сначала хотел повесться, а потом решил порезаться. Наверное было две попытки, но комп этого не понимает, ему нужна еще одна переменная - третья неудачная попытка, и там все те же градации.


Автор: becas84 18.01.2013 - 04:09

Нет, испытуемые совершали повторно не одну попытку, а несколько, даже до 10. Во вложении я отразил только повторную попытку (сразу после первой). В одной строчке, видимо, не усмотрел.

Автор: DrgLena 18.01.2013 - 11:57

Извините, за неуместную шутку в столь тяжелой теме. Я оставила тройку в этой сомнительной ячейке, мои решения для этого значения

Автор: becas84 19.01.2013 - 20:16

smile.gif очевидно, тяжелой не для всех участников дискуссии... Как бы вы решили выше описанную задачу?

smile.gif очевидно, тяжелой не для всех участников дискуссии... Как бы вы решили выше описанную задачу?

Автор: DrgLena 19.01.2013 - 22:54

Сравнением долей в каждой категории первичных и повторных, как я показала вам для общей группы пациентов.

Автор: becas84 20.01.2013 - 14:41

Цитата
77,5% от всех случаев. При повторах, этот тип суицида сократился статистически значимо до 46,9%, т.е. на 30,6% (95% ДИ 18,2%-42,0% хи.кв. =22,5, р<0,0001).

Никак не соображу, как вы провели расчеты в скобках. Откуда взялись цифры 18,2 и 42% почему хи кв стал равен 22,5 и значение p ?

Автор: DrgLena 20.01.2013 - 20:32

В скобках приведен 95% ДИ к разности долей. Можете его не считать, если вам не нужна такая форма представления, а нужно стат гипотезы проверять. На форуме уже обсуждалась тема ДИ, приводились различные формулы для его расчета.
Я рассмотрела изменение только первого вида суицида в структуре первичной и повторной попытки (остальные категории не подлежат стат анализу, нечего и напрягать точный критерий Фишера)
Если вы рассмотрите таблицу 2х2 с двумя категориями, 1 и 2 (все кроме 1 в группе первичных) и также повторных, то получите a,b,c,d = 110,32,46,52. В таблице задайте процент по строке и хи кв, можно в данном случае и без поправки Йейтса, если вы используете программу Statistica, я использую другую программу и считаю ДИ.

Автор: becas84 31.01.2013 - 06:49

Доброго времени суток! Вот какой вопрос меня беспокоит. Экспериментально-психологический метод подразумевает проведение тестовых методик, количественные результат теста оценивается в сравнении опытной и контрольной группы. Как вы уже могли заметить, моя опытная группа представлена лицами с суицидальными попытками и сочетанной наркологической и психической патологией. В качестве контрольной группы могут использоваться лица условно здоровые? или имеющие как сочетанную наркологическую, так и психическую патологию? или имеющие раздельно (подгруппа контроля) только наркологическую и только психическую патологию?
Если то, что я понаписал совсем не понятно, тогда подскажите, какая характеристика должна быть у группы контроля в моем случае?

Автор: DrgLena 31.01.2013 - 14:43

Прежде всего, лично меня интересует, насколько понятно то, что я вам ответила по предыдущему вопросу или мое время было потрачено впустую. Никакой вашей реакции не последовало, но появился новый вопрос никак не связанный с предыдущим. Ответ на новый ваш вопрос гораздо сложнее.

Этот вопрос по методологии научного исследования, а вовсе не по статистике.

Эти вопросы должны были обсуждаться при планировании работы. Для чего вы проводите тестовые методики в основной группе?

Если основная группа пациентов набрана изначально с суицидами на фоне наркологической и психической патологии и ваша цель найти различия по известным или разработанным вами тестам с группой контроля, пациенты которой имеют также сочетание наркологической и психической патологии, то найденные вами различия могу быть использованы в диагностике или предсказании возможных суицидов именно среди пациентов, которых вы включили в это исследование. Но, в зависимости от условий формирования выборок, вы можете использовать психиатрические тесты и в группах имеющих только одну патологию наркологическую или психиатрическую, тогда основная и контрольная группа должны быть сформированы только из одной патологии. При этом вы можете использовать для диагностики как отдельные элементы шкалы, например элементы HCL32, используя OR, так и находить точку разделения для суммы по шкале при дифференциации двух состояний.

Если же дизайн вашего исследования иной и вы хотите найти факторы риска возникновения суицидов среди здоровых людей (контроль), то тестируйте здоровых, при этом фактор наличия наркозависимости или психическая патология будут анализироваться наряду с другими факторами риска и точка разделения, например по вышеупомянутой шкале будет совершенно иной. Но в качестве case вы должны будете включить все случаи суицидов независимо от того, были ли они наркомы или психи.
Почитайте про дизайн исследования, про типы клинических исследований и посмотрите в свой план диссертации, каковы ваши цели и задачи.

Автор: becas84 31.01.2013 - 19:40

Не-не-не, помощь с вашей стороны очень толковая и как нельзя кстати получилась! Пользуя ваши ингредиенты, я даже кое-чего пересчитал и получил хорошие результаты! Мой последний вопрос навеян одной диссертационной работой, где исследуются механизмы психологических защит в двух группах девочек: 1 - с наркологической патологией, 2 - аддиктивное поведение, причем автор работы сравнивает эти две группы с группой контроля, которая состоит из условно здоровых девочек. Вот я и пытаюсь разобраться, уместно ли взять, применительно к моим исследованиям, одну контрольную группу, которая будет состоят из лиц с наркологической и психической патологией, но без суицидальную попыток; или необходимо группу контроля разделить на контроль с нарк патологией и контроль с психически расстройствами?

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)