Сравнение зависимых выборок разного объема, обследование в 4х точках |
Здравствуйте, гость ( Вход | Регистрация )
Сравнение зависимых выборок разного объема, обследование в 4х точках |
4.01.2017 - 19:55
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Коллеги! Тема уже поднималась ранее, НО!!! все равно необходимо разъяснение
Первая госпитализация 100 человек, жалобы и АД смотрим до (точка А1) и после лечения (точка А2) и холестерин только до лечения (А1) Вторая госпитализация через 6 месяцев обследуем только 30 человек из 100, жалобы и АД смотрим до (точка А3) и после лечения (точка А4) и холестерин только до лечения (А3) ВОПРОС : 1) как сравнить жалобы и АД в точке А2 (n=100) и в точке А3 (n=30) 2) как сравнить холестерин в точке А1 (n=100) и А3 (n=30), если исследование холестерина в точке А2 и А4 не проводилось 3) как все это анализировать для нормального и ненормального распределения признака Использую программу SPSS моя почта september_e.yu@mail.ru |
|
7.01.2017 - 23:02
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Коллеги! Тема уже поднималась ранее, НО!!! все равно необходимо разъяснение Первая госпитализация 100 человек, жалобы и АД смотрим до (точка А1) и после лечения (точка А2) и холестерин только до лечения (А1) Вторая госпитализация через 6 месяцев обследуем только 30 человек из 100, жалобы и АД смотрим до (точка А3) и после лечения (точка А4) и холестерин только до лечения (А3) ВОПРОС : 1) как сравнить жалобы и АД в точке А2 (n=100) и в точке А3 (n=30) 2) как сравнить холестерин в точке А1 (n=100) и А3 (n=30), если исследование холестерина в точке А2 и А4 не проводилось 3) как все это анализировать для нормального и ненормального распределения признака Использую программу SPSS моя почта september_e.yu@mail.ru На этом форуме не любят халявщиков, поэтому пока вы не поясните своё "НО!!!" грамотной помощи можно и не дождаться. Под пояснением я имею в виду то, чем вас не устроили стандартные методы для сравнения зависимых выборок и/или какие именно, а также чем не устроили рекомендации в "уже поднимавшейся теме". Иначе можете подождать: 1) Либо какого-нибудь новичка, который знает один метод и искренне вам его и посоветует. 2) Либо какого-нибудь статистического хищника, который возьмётся решить вашу проблему на платной основе, впарив попутно ещё штук 20 ненужных тестов (ну типа для всестороннего изучения вопроса). |
|
10.01.2017 - 18:08
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
На этом форуме не любят халявщиков, поэтому пока вы не поясните своё "НО!!!" грамотной помощи можно и не дождаться. Под пояснением я имею в виду то, чем вас не устроили стандартные методы для сравнения зависимых выборок и/или какие именно, а также чем не устроили рекомендации в "уже поднимавшейся теме". Иначе можете подождать: 1) Либо какого-нибудь новичка, который знает один метод и искренне вам его и посоветует. 2) Либо какого-нибудь статистического хищника, который возьмётся решить вашу проблему на платной основе, впарив попутно ещё штук 20 ненужных тестов (ну типа для всестороннего изучения вопроса). У меня в работе катамнез (основная госпитализация и повторное обследование через 6 месяцев). Из 100 пациентов основной группы повторно обследовала только 50. Эти группы зависимые и в них имеются парные показатели. Как сравнивать показатели основной группы (n=100) до лечения и после лечения я знаю (Уилкоксон и стьюдент для парных- по распределению соответственно) А как мне сравнить 100 человек основной группы и 50 человек, обследованных в катамнезе. Ни уилкоксон, ни стьюдент для парных не подходят, т.к. сравнивают только пары значений (это основная преграда). Врать,что в катамнезе явились все 100 человек, невозможно. Т.е. 50 человек из катамнеза выпадают. ПОЭТОМУ: У меня задача сравнить 100 человек основной группы и 50 человек катамнеза при условии, что это зависимые группы, зависимые показатели качественные и коЛичественные. PS. сравнивать только по 50 человек в на протяжении всех госпитализаций я не могу, т.к. это обедняет всю клиническую картину. Сообщение отредактировал september_e.yu@mail.ru - 10.01.2017 - 18:23 |
|
10.01.2017 - 20:26
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
PS. сравнивать только по 50 человек в на протяжении всех госпитализаций я не могу, т.к. это обедняет всю клиническую картину. Простите, но мне, как не врачу непонятно, что значит "обедняет". 50 человек при двух госпитализациях - это и есть Ваша реальная "клиническая картина". Остальное - домыслы. Конечно, при условии, что вы хотите провести сравнение именно зависимых выборок. Если откажетесь от этого требования - можно сравнивать 100 с 50. Но это будет уже совсем другое исследование. Решайте. |
|
10.01.2017 - 22:54
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
У меня в работе катамнез (основная госпитализация и повторное обследование через 6 месяцев). Из 100 пациентов основной группы повторно обследовала только 50. Эти группы зависимые и в них имеются парные показатели. Как сравнивать показатели основной группы (n=100) до лечения и после лечения я знаю (Уилкоксон и стьюдент для парных- по распределению соответственно) А как мне сравнить 100 человек основной группы и 50 человек, обследованных в катамнезе. Ни уилкоксон, ни стьюдент для парных не подходят, т.к. сравнивают только пары значений (это основная преграда). Врать,что в катамнезе явились все 100 человек, невозможно. Т.е. 50 человек из катамнеза выпадают. ПОЭТОМУ: У меня задача сравнить 100 человек основной группы и 50 человек катамнеза при условии, что это зависимые группы, зависимые показатели качественные и коЛичественные. PS. сравнивать только по 50 человек в на протяжении всех госпитализаций я не могу, т.к. это обедняет всю клиническую картину. Начну с конца. По поводу "обеднения клинической картины" - заблуждение, как вам уже ответили выше. С точки зрения и клиники, и научного подхода в целом именно зависимые выборки - самое ценное в ваших данных. Даже если бы было 500 "до" и только 50 "после". У вас есть информация о 50 конкретных людях на двух сроках, т.е. каждый человек имеет как бы свой собственный контроль. Рассчитав разность между значениями через 6 месяцев "после" и в первом исследовании "до" вы получите оценку величины эффекта для КАЖДОГО человека! Далее с этой информацией можно работать. Например, рассчитать среднее значение или медиану этой разности, рассчитать доверительные интервалы или квартили, построить распределение разности и оценить его форму, проверить на выбросы если потребуется... Определить значимость различий до-после с помощью критериев или по доверительному интервалу разности (содержит он ноль или нет). Если есть внешние критерии успешности лечения - можно наложить эти критерии на наблюдаемую картину и оценить степень эффективности лечения в %. Привлекая дополнительные сведения о пациентах можно попытаться определить почему одни среагировали на лечение лучше чем другие. А может кто-то вообще не среагировал, а только хуже стало. И.т.д. Возможностей именно клинической интерпретации - масса. Теперь рассмотрим, какую информацию вы можете получить, сравнивая 100 "до" с 50 "после". Во-первых, здесь потребуется использовать неклассические методы сравнения. Либо (1) рандомизационные (перестановочные) критерии - не знаю есть ли такие в SPSS. Либо (2) косвенно - через оценку доверительных интервалов в этих выборках - перекрываются или нет. ДИ желательно построить бутстрепом - он есть в SPSS, в т.ч. метод ВСа. Например получится, что различия в средних статистически значимы. Вопрос: насколько эти различия обусловлены именно клиническим воздействием, а насколько - случайной изменчивостью ввиду различий в наборах пациентов? Вы не ответите на этот вопрос, как и в случае любых независимых выборок (если при планировании исследования изначально не ставилась задача разложить эту изменчивость на компоненты и данные не собирались специально под эту задачу). Пусть по какому-то важному показателю через 6 месяцев стало, в среднем, статистически значимо меньше. Что вы как врач, знакомый с основами доказательной медицины, сможете сказать КАЖДОМУ КОНКРЕТНОМУ своему пациенту? Пациенту, которого не очень-то заботят остальные 49 человек... Типа, "ребята у всех вас В СРЕДНЕМ стало статистически значимо лучше, а значит и ты как-то в эту картину вписался; живи-радуйся"? Чтобы не терять информацию, её нужно качественнее собирать. 50% цензурированных наблюдений за полгода - очень много. Заинтересованные в качестве исследования врачи обычно вызванивают и как-то находят большинство потерявшихся, но живых пациентов... Если работать с тем что есть, то я бы разбил описание исследования на 2 части. Первая часть - по 100 "до": кто такие, с чем пришли, возраст, пол, какие осложнения и т.д. как любят врачи: надо-не надо, но анамнез - святое. Дайте по этой группе только хорошую описательную статистику и инфографику. Не беда если скучно покажется - помните, что по крайней мере в России лучше цитируются самые примитивные работы или примитивные части работы, обычно представляющие лишь некие сведения: этот уровень понимания доступен всем, до него не нужно дорастать... Вторая часть - сравнение собственно зависимых выборок. Для колич. признаков - критерии которые вы назвали, для качественных - Макнемар. Ну или посовременнее подходы найти. Плюс описательная статистика и расклад по разности "до-после" с попыткой выхода на интерпретацию различий в величине эффекта: 50 человек не 15-20 - можно что-то и нащупать, объяснить... Сообщение отредактировал nokh - 10.01.2017 - 23:42 |
|
11.01.2017 - 18:13
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Простите, но мне, как не врачу непонятно, что значит "обедняет". 50 человек при двух госпитализациях - это и есть Ваша реальная "клиническая картина". Остальное - домыслы. Конечно, при условии, что вы хотите провести сравнение именно зависимых выборок. Если откажетесь от этого требования - можно сравнивать 100 с 50. Но это будет уже совсем другое исследование. Решайте. Ну Вы подошли к цели, сравнению 100 и 50. Что посоветуете? |
|
11.01.2017 - 18:23
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Ну Вы подошли к цели, сравнению 100 и 50. Что посоветуете? Возвращаемся к тому, с чего начинали: "чем вас не устроили стандартные методы". Другими словами - А чем вас не устраивает более чем подробное разъяснение уважаемого nokh приведенное в предыдущем развернутом сообщении? Сообщение отредактировал passant - 11.01.2017 - 18:24 |
|
11.01.2017 - 18:28
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Начну с конца. По поводу "обеднения клинической картины" - заблуждение, как вам уже ответили выше. С точки зрения и клиники, и научного подхода в целом именно зависимые выборки - самое ценное в ваших данных. Даже если бы было 500 "до" и только 50 "после". У вас есть информация о 50 конкретных людях на двух сроках, т.е. каждый человек имеет как бы свой собственный контроль. Рассчитав разность между значениями через 6 месяцев "после" и в первом исследовании "до" вы получите оценку величины эффекта для КАЖДОГО человека! Далее с этой информацией можно работать. Например, рассчитать среднее значение или медиану этой разности, рассчитать доверительные интервалы или квартили, построить распределение разности и оценить его форму, проверить на выбросы если потребуется... Определить значимость различий до-после с помощью критериев или по доверительному интервалу разности (содержит он ноль или нет). Если есть внешние критерии успешности лечения - можно наложить эти критерии на наблюдаемую картину и оценить степень эффективности лечения в %. Привлекая дополнительные сведения о пациентах можно попытаться определить почему одни среагировали на лечение лучше чем другие. А может кто-то вообще не среагировал, а только хуже стало. И.т.д. Возможностей именно клинической интерпретации - масса. Теперь рассмотрим, какую информацию вы можете получить, сравнивая 100 "до" с 50 "после". Во-первых, здесь потребуется использовать неклассические методы сравнения. Либо (1) рандомизационные (перестановочные) критерии - не знаю есть ли такие в SPSS. Либо (2) косвенно - через оценку доверительных интервалов в этих выборках - перекрываются или нет. ДИ желательно построить бутстрепом - он есть в SPSS, в т.ч. метод ВСа. Например получится, что различия в средних статистически значимы. Вопрос: насколько эти различия обусловлены именно клиническим воздействием, а насколько - случайной изменчивостью ввиду различий в наборах пациентов? Вы не ответите на этот вопрос, как и в случае любых независимых выборок (если при планировании исследования изначально не ставилась задача разложить эту изменчивость на компоненты и данные не собирались специально под эту задачу). Пусть по какому-то важному показателю через 6 месяцев стало, в среднем, статистически значимо меньше. Что вы как врач, знакомый с основами доказательной медицины, сможете сказать КАЖДОМУ КОНКРЕТНОМУ своему пациенту? Пациенту, которого не очень-то заботят остальные 49 человек... Типа, "ребята у всех вас В СРЕДНЕМ стало статистически значимо лучше, а значит и ты как-то в эту картину вписался; живи-радуйся"? Чтобы не терять информацию, её нужно качественнее собирать. 50% цензурированных наблюдений за полгода - очень много. Заинтересованные в качестве исследования врачи обычно вызванивают и как-то находят большинство потерявшихся, но живых пациентов... Если работать с тем что есть, то я бы разбил описание исследования на 2 части. Первая часть - по 100 "до": кто такие, с чем пришли, возраст, пол, какие осложнения и т.д. как любят врачи: надо-не надо, но анамнез - святое. Дайте по этой группе только хорошую описательную статистику и инфографику. Не беда если скучно покажется - помните, что по крайней мере в России лучше цитируются самые примитивные работы или примитивные части работы, обычно представляющие лишь некие сведения: этот уровень понимания доступен всем, до него не нужно дорастать... Вторая часть - сравнение собственно зависимых выборок. Для колич. признаков - критерии которые вы назвали, для качественных - Макнемар. Ну или посовременнее подходы найти. Плюс описательная статистика и расклад по разности "до-после" с попыткой выхода на интерпретацию различий в величине эффекта: 50 человек не 15-20 - можно что-то и нащупать, объяснить... Спасибо Вам за ответ!!! 1)В принципе я так и даю характеристику своим 100 человекам до лечения, затем оцениваю результат после. 2) По такому же принципу катамнез из 50 чел. 3)Потом пытаюсь найти особенности именно у этих 50, когда они были еще в составе 100 (Использую Манна-Уитни). 4)Был у меня вариант, когда прослеживала эти 50 человек в обеих госпитализациях (Четко использовала Уилкоксона) и мне это было понятно, четко парные зависимые значения. Но задание у меня сравнить именно 100 и 50. Это сравнение меня очень мучает (ведь по современным данным под таблицами нужно указывать используемый критерий А что написано пером, ..... то при неправильно выбранном показателе заклюют). Вроде Уилкоксон не подходит, пары "выпадают". М-уитни-не возьмешь - т.к. анализируем зависимые показатели 5)Еще я сравнивала жалобы 100 человек основной группы до лечения и 50 катамнеза до лечения- применяла М-уитни (на мой взгляд он подходит) О бутстрепе почитаю. ДУмаю, для меня это возможный выход. Поищу в своей программе, если будут вопросы, я, с Вашего позволения, напишу. Сообщение отредактировал september_e.yu@mail.ru - 11.01.2017 - 18:30 |
|
11.01.2017 - 18:33
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Возвращаемся к тому, с чего начинали: "чем вас не устроили стандартные методы". Другими словами - А чем вас не устраивает более чем подробное разъяснение уважаемого nokh приведенное в предыдущем развернутом сообщении? Меня, наоборот, устраивает. О бутстрепе я почитаю поищу в своей программе. Думаю, что для меня это возможный выход. |
|
11.01.2017 - 18:41
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Возвращаемся к тому, с чего начинали: "чем вас не устроили стандартные методы". Другими словами - А чем вас не устраивает более чем подробное разъяснение уважаемого nokh приведенное в предыдущем развернутом сообщении? Я как раз стараюсь использовать простые методы оценки, стьюдент, уилкокосон, манна-уитни, корреляцию Спирмена, четко представляя, как с этими критериями обращаться. Смущало лишь 100 и 50, при условии, что они зависимые. Ищу такой же простой и понятный критерий. А таблицы сопряженности с определнием точного критерия Фишера для этих 100 и 50 нельзя взять? |
|
11.01.2017 - 21:58
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Смущало лишь 100 и 50, при условии, что они зависимые. Да независимы они у Вас, независимы! Как только сказали, что обязаны рассматривать именно схему 100-50, - про зависимость срезу забываем! Есть группа из 100 человек и другая группа - из 50 человек. И сравниваем эти группы между собой - как НЕЗАВИСИМЫЕ выборки. Да, при этом много информации Вы потеряли - эта расплата за переход от схемы 50-50 зависимых измерений, к схеме 100-50 независимых. А раз выборки рассматриваются как независимые, то используются любые подходящие критерии. От Стьюдента (для независимых выборок - если вы уверены в нормальности распределения) до Maнна-Уитни, Вилкоксона для непарных выборок, Kolmogorov-Smirnov Z-test, Вальда-Вольфовитца, Мойзеса. Смотря что оцениваете. |
|
12.01.2017 - 15:20
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Да независимы они у Вас, независимы! Как только сказали, что обязаны рассматривать именно схему 100-50, - про зависимость срезу забываем! Есть группа из 100 человек и другая группа - из 50 человек. И сравниваем эти группы между собой - как НЕЗАВИСИМЫЕ выборки. Да, при этом много информации Вы потеряли - эта расплата за переход от схемы 50-50 зависимых измерений, к схеме 100-50 независимых. А раз выборки рассматриваются как независимые, то используются любые подходящие критерии. От Стьюдента (для независимых выборок - если вы уверены в нормальности распределения) до Maнна-Уитни, Вилкоксона для непарных выборок, Kolmogorov-Smirnov Z-test, Вальда-Вольфовитца, Мойзеса. Смотря что оцениваете. Passant, Вы уж меня простите, а как это "про зависимость сразу забываем" мне объяснить статистически грамотно, если спросят. А еще лучше, где это написано? |
|
12.01.2017 - 16:23
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Passant, Вы уж меня простите, а как это "про зависимость сразу забываем" мне объяснить статистически грамотно, если спросят. А еще лучше, где это написано? /Справочно/ Основой статистической обработки результатов эксперимента является грамотно спланированный эксперимент. Если в эксперименте наблюдается пара чисел, выборки считаются связанными. Если же все это время испытуемые выбывали из эксперимента по независящим от экспериментатора причинам, это называется не "эксперимент", а "факир был пьян, и фокус не удался". Поэтому в вашей ситуации разумно сделать вид, что полгода между двумя обследованиями - достаточно продолжительный период, позволяющий пренебречь возможной коррелированностью результатов, и изучать эти две выборки как независимые, н-р, критерием Манна - Уитни. Иначе единственный вопрос, который могут вам задать - "Какого черта"? Ну, вы поняли. |
|
12.01.2017 - 16:35
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
зависимых выборок разного объема не бывают, хоть какой то учебник нужно открыть, или в сети поискать, если занимаетесь научными исследованиями. https://ru.wikipedia.org/wiki/%D0%92%D1%8B%...%80%D0%BA%D0%B0 Если первые измерения сделаны у 100 больных, а через какое то время повторно явились только 30, то узнать как изменился показатель, например после лечения, можно только у этих 30. При этом данные должны быть организованы соответствующим образом,чтобы можно было учесть именно связанность наблюдений Прочтите, наконец, ОПРЕДЕЛЕНИЕ в ссылке, которую я вам предоставила с соседней ветке, что такое связаные выборки. Вы можете вообще не пользоваться этим незнакомым вам понятием. И про критерии тоже можете не заморачиваться, какой для связанных выборок, а какой не для связаных. Анализируйте просто доли больных. До лечения из 100 больных голова болела у 80 (% и 95%ДИ), а после лечения есть данные только у 50 и у 10 из них голова продолжала болеть( % и 95%ДИ). Просто сравните эти доли (рекомендация одноразовая, не рекомендуется тем, кто понимает, что такое связаные выборки) . Для тех кто понимает, рекомендую использовать для моего примера критерий Мак-Немара для СВЯЗАНЫХ выборок, что предусматривает анализ разности относительных частот наличия признака до и после лечения. |
|
12.01.2017 - 16:43
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
|
|