Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V   1 2 3 > »   
Добавить ответ в эту темуОткрыть тему
> Сравнение зависимых выборок разного объема, обследование в 4х точках
september_e.yu@m...
сообщение 4.01.2017 - 19:55
Сообщение #1





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Коллеги! Тема уже поднималась ранее, НО!!! все равно необходимо разъяснение

Первая госпитализация 100 человек, жалобы и АД смотрим до (точка А1) и после лечения (точка А2) и холестерин только до лечения (А1)

Вторая госпитализация через 6 месяцев обследуем только 30 человек из 100, жалобы и АД смотрим до (точка А3) и после лечения (точка А4) и холестерин только до лечения (А3)

ВОПРОС :
1) как сравнить жалобы и АД в точке А2 (n=100) и в точке А3 (n=30)

2) как сравнить холестерин в точке А1 (n=100) и А3 (n=30), если исследование холестерина в точке А2 и А4 не проводилось

3) как все это анализировать для нормального и ненормального распределения признака

Использую программу SPSS

моя почта september_e.yu@mail.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 7.01.2017 - 23:02
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(september_e.yu@mail.ru @ 4.01.2017 - 21:55) *
Коллеги! Тема уже поднималась ранее, НО!!! все равно необходимо разъяснение
Первая госпитализация 100 человек, жалобы и АД смотрим до (точка А1) и после лечения (точка А2) и холестерин только до лечения (А1)
Вторая госпитализация через 6 месяцев обследуем только 30 человек из 100, жалобы и АД смотрим до (точка А3) и после лечения (точка А4) и холестерин только до лечения (А3)
ВОПРОС :
1) как сравнить жалобы и АД в точке А2 (n=100) и в точке А3 (n=30)
2) как сравнить холестерин в точке А1 (n=100) и А3 (n=30), если исследование холестерина в точке А2 и А4 не проводилось
3) как все это анализировать для нормального и ненормального распределения признака
Использую программу SPSS
моя почта september_e.yu@mail.ru

На этом форуме не любят халявщиков, поэтому пока вы не поясните своё "НО!!!" грамотной помощи можно и не дождаться. Под пояснением я имею в виду то, чем вас не устроили стандартные методы для сравнения зависимых выборок и/или какие именно, а также чем не устроили рекомендации в "уже поднимавшейся теме". Иначе можете подождать:
1) Либо какого-нибудь новичка, который знает один метод и искренне вам его и посоветует.
2) Либо какого-нибудь статистического хищника, который возьмётся решить вашу проблему на платной основе, впарив попутно ещё штук 20 ненужных тестов (ну типа для всестороннего изучения вопроса).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 10.01.2017 - 18:08
Сообщение #3





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(nokh @ 8.01.2017 - 00:02) *
На этом форуме не любят халявщиков, поэтому пока вы не поясните своё "НО!!!" грамотной помощи можно и не дождаться. Под пояснением я имею в виду то, чем вас не устроили стандартные методы для сравнения зависимых выборок и/или какие именно, а также чем не устроили рекомендации в "уже поднимавшейся теме". Иначе можете подождать:
1) Либо какого-нибудь новичка, который знает один метод и искренне вам его и посоветует.
2) Либо какого-нибудь статистического хищника, который возьмётся решить вашу проблему на платной основе, впарив попутно ещё штук 20 ненужных тестов (ну типа для всестороннего изучения вопроса).




У меня в работе катамнез (основная госпитализация и повторное обследование через 6 месяцев). Из 100 пациентов основной группы повторно обследовала только 50. Эти группы зависимые и в них имеются парные показатели. Как сравнивать показатели основной группы (n=100) до лечения и после лечения я знаю (Уилкоксон и стьюдент для парных- по распределению соответственно)
А как мне сравнить 100 человек основной группы и 50 человек, обследованных в катамнезе. Ни уилкоксон, ни стьюдент для парных не подходят, т.к. сравнивают только пары значений (это основная преграда).
Врать,что в катамнезе явились все 100 человек, невозможно. Т.е. 50 человек из катамнеза выпадают.

ПОЭТОМУ:

У меня задача сравнить 100 человек основной группы и 50 человек катамнеза при условии, что это зависимые группы, зависимые показатели качественные и коЛичественные.


PS. сравнивать только по 50 человек в на протяжении всех госпитализаций я не могу, т.к. это обедняет всю клиническую картину.

Сообщение отредактировал september_e.yu@mail.ru - 10.01.2017 - 18:23
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 10.01.2017 - 20:26
Сообщение #4





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(september_e.yu@mail.ru @ 10.01.2017 - 17:08) *
PS. сравнивать только по 50 человек в на протяжении всех госпитализаций я не могу, т.к. это обедняет всю клиническую картину.

Простите, но мне, как не врачу непонятно, что значит "обедняет". 50 человек при двух госпитализациях - это и есть Ваша реальная "клиническая картина". Остальное - домыслы. Конечно, при условии, что вы хотите провести сравнение именно зависимых выборок. Если откажетесь от этого требования - можно сравнивать 100 с 50. Но это будет уже совсем другое исследование.
Решайте.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 10.01.2017 - 22:54
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(september_e.yu@mail.ru @ 10.01.2017 - 20:08) *
У меня в работе катамнез (основная госпитализация и повторное обследование через 6 месяцев). Из 100 пациентов основной группы повторно обследовала только 50. Эти группы зависимые и в них имеются парные показатели. Как сравнивать показатели основной группы (n=100) до лечения и после лечения я знаю (Уилкоксон и стьюдент для парных- по распределению соответственно)
А как мне сравнить 100 человек основной группы и 50 человек, обследованных в катамнезе. Ни уилкоксон, ни стьюдент для парных не подходят, т.к. сравнивают только пары значений (это основная преграда).
Врать,что в катамнезе явились все 100 человек, невозможно. Т.е. 50 человек из катамнеза выпадают.

ПОЭТОМУ:
У меня задача сравнить 100 человек основной группы и 50 человек катамнеза при условии, что это зависимые группы, зависимые показатели качественные и коЛичественные.
PS. сравнивать только по 50 человек в на протяжении всех госпитализаций я не могу, т.к. это обедняет всю клиническую картину.

Начну с конца. По поводу "обеднения клинической картины" - заблуждение, как вам уже ответили выше. С точки зрения и клиники, и научного подхода в целом именно зависимые выборки - самое ценное в ваших данных. Даже если бы было 500 "до" и только 50 "после". У вас есть информация о 50 конкретных людях на двух сроках, т.е. каждый человек имеет как бы свой собственный контроль. Рассчитав разность между значениями через 6 месяцев "после" и в первом исследовании "до" вы получите оценку величины эффекта для КАЖДОГО человека! Далее с этой информацией можно работать. Например, рассчитать среднее значение или медиану этой разности, рассчитать доверительные интервалы или квартили, построить распределение разности и оценить его форму, проверить на выбросы если потребуется... Определить значимость различий до-после с помощью критериев или по доверительному интервалу разности (содержит он ноль или нет). Если есть внешние критерии успешности лечения - можно наложить эти критерии на наблюдаемую картину и оценить степень эффективности лечения в %. Привлекая дополнительные сведения о пациентах можно попытаться определить почему одни среагировали на лечение лучше чем другие. А может кто-то вообще не среагировал, а только хуже стало. И.т.д. Возможностей именно клинической интерпретации - масса.

Теперь рассмотрим, какую информацию вы можете получить, сравнивая 100 "до" с 50 "после". Во-первых, здесь потребуется использовать неклассические методы сравнения. Либо (1) рандомизационные (перестановочные) критерии - не знаю есть ли такие в SPSS. Либо (2) косвенно - через оценку доверительных интервалов в этих выборках - перекрываются или нет. ДИ желательно построить бутстрепом - он есть в SPSS, в т.ч. метод ВСа. Например получится, что различия в средних статистически значимы. Вопрос: насколько эти различия обусловлены именно клиническим воздействием, а насколько - случайной изменчивостью ввиду различий в наборах пациентов? Вы не ответите на этот вопрос, как и в случае любых независимых выборок (если при планировании исследования изначально не ставилась задача разложить эту изменчивость на компоненты и данные не собирались специально под эту задачу). Пусть по какому-то важному показателю через 6 месяцев стало, в среднем, статистически значимо меньше. Что вы как врач, знакомый с основами доказательной медицины, сможете сказать КАЖДОМУ КОНКРЕТНОМУ своему пациенту? Пациенту, которого не очень-то заботят остальные 49 человек... Типа, "ребята у всех вас В СРЕДНЕМ стало статистически значимо лучше, а значит и ты как-то в эту картину вписался; живи-радуйся"?

Чтобы не терять информацию, её нужно качественнее собирать. 50% цензурированных наблюдений за полгода - очень много. Заинтересованные в качестве исследования врачи обычно вызванивают и как-то находят большинство потерявшихся, но живых пациентов... Если работать с тем что есть, то я бы разбил описание исследования на 2 части.
Первая часть - по 100 "до": кто такие, с чем пришли, возраст, пол, какие осложнения и т.д. как любят врачи: надо-не надо, но анамнез - святое. Дайте по этой группе только хорошую описательную статистику и инфографику. Не беда если скучно покажется - помните, что по крайней мере в России лучше цитируются самые примитивные работы или примитивные части работы, обычно представляющие лишь некие сведения: этот уровень понимания доступен всем, до него не нужно дорастать...
Вторая часть - сравнение собственно зависимых выборок. Для колич. признаков - критерии которые вы назвали, для качественных - Макнемар. Ну или посовременнее подходы найти. Плюс описательная статистика и расклад по разности "до-после" с попыткой выхода на интерпретацию различий в величине эффекта: 50 человек не 15-20 - можно что-то и нащупать, объяснить...

Сообщение отредактировал nokh - 10.01.2017 - 23:42
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 11.01.2017 - 18:13
Сообщение #6





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(passant @ 10.01.2017 - 21:26) *
Простите, но мне, как не врачу непонятно, что значит "обедняет". 50 человек при двух госпитализациях - это и есть Ваша реальная "клиническая картина". Остальное - домыслы. Конечно, при условии, что вы хотите провести сравнение именно зависимых выборок. Если откажетесь от этого требования - можно сравнивать 100 с 50. Но это будет уже совсем другое исследование.
Решайте.




Ну Вы подошли к цели, сравнению 100 и 50. Что посоветуете?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 11.01.2017 - 18:23
Сообщение #7





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(september_e.yu@mail.ru @ 11.01.2017 - 17:13) *
Ну Вы подошли к цели, сравнению 100 и 50. Что посоветуете?

Возвращаемся к тому, с чего начинали: "чем вас не устроили стандартные методы". Другими словами - А чем вас не устраивает более чем подробное разъяснение уважаемого nokh приведенное в предыдущем развернутом сообщении?

Сообщение отредактировал passant - 11.01.2017 - 18:24
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 11.01.2017 - 18:28
Сообщение #8





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(nokh @ 10.01.2017 - 23:54) *
Начну с конца. По поводу "обеднения клинической картины" - заблуждение, как вам уже ответили выше. С точки зрения и клиники, и научного подхода в целом именно зависимые выборки - самое ценное в ваших данных. Даже если бы было 500 "до" и только 50 "после". У вас есть информация о 50 конкретных людях на двух сроках, т.е. каждый человек имеет как бы свой собственный контроль. Рассчитав разность между значениями через 6 месяцев "после" и в первом исследовании "до" вы получите оценку величины эффекта для КАЖДОГО человека! Далее с этой информацией можно работать. Например, рассчитать среднее значение или медиану этой разности, рассчитать доверительные интервалы или квартили, построить распределение разности и оценить его форму, проверить на выбросы если потребуется... Определить значимость различий до-после с помощью критериев или по доверительному интервалу разности (содержит он ноль или нет). Если есть внешние критерии успешности лечения - можно наложить эти критерии на наблюдаемую картину и оценить степень эффективности лечения в %. Привлекая дополнительные сведения о пациентах можно попытаться определить почему одни среагировали на лечение лучше чем другие. А может кто-то вообще не среагировал, а только хуже стало. И.т.д. Возможностей именно клинической интерпретации - масса.

Теперь рассмотрим, какую информацию вы можете получить, сравнивая 100 "до" с 50 "после". Во-первых, здесь потребуется использовать неклассические методы сравнения. Либо (1) рандомизационные (перестановочные) критерии - не знаю есть ли такие в SPSS. Либо (2) косвенно - через оценку доверительных интервалов в этих выборках - перекрываются или нет. ДИ желательно построить бутстрепом - он есть в SPSS, в т.ч. метод ВСа. Например получится, что различия в средних статистически значимы. Вопрос: насколько эти различия обусловлены именно клиническим воздействием, а насколько - случайной изменчивостью ввиду различий в наборах пациентов? Вы не ответите на этот вопрос, как и в случае любых независимых выборок (если при планировании исследования изначально не ставилась задача разложить эту изменчивость на компоненты и данные не собирались специально под эту задачу). Пусть по какому-то важному показателю через 6 месяцев стало, в среднем, статистически значимо меньше. Что вы как врач, знакомый с основами доказательной медицины, сможете сказать КАЖДОМУ КОНКРЕТНОМУ своему пациенту? Пациенту, которого не очень-то заботят остальные 49 человек... Типа, "ребята у всех вас В СРЕДНЕМ стало статистически значимо лучше, а значит и ты как-то в эту картину вписался; живи-радуйся"?

Чтобы не терять информацию, её нужно качественнее собирать. 50% цензурированных наблюдений за полгода - очень много. Заинтересованные в качестве исследования врачи обычно вызванивают и как-то находят большинство потерявшихся, но живых пациентов... Если работать с тем что есть, то я бы разбил описание исследования на 2 части.
Первая часть - по 100 "до": кто такие, с чем пришли, возраст, пол, какие осложнения и т.д. как любят врачи: надо-не надо, но анамнез - святое. Дайте по этой группе только хорошую описательную статистику и инфографику. Не беда если скучно покажется - помните, что по крайней мере в России лучше цитируются самые примитивные работы или примитивные части работы, обычно представляющие лишь некие сведения: этот уровень понимания доступен всем, до него не нужно дорастать...
Вторая часть - сравнение собственно зависимых выборок. Для колич. признаков - критерии которые вы назвали, для качественных - Макнемар. Ну или посовременнее подходы найти. Плюс описательная статистика и расклад по разности "до-после" с попыткой выхода на интерпретацию различий в величине эффекта: 50 человек не 15-20 - можно что-то и нащупать, объяснить...



Спасибо Вам за ответ!!!
1)В принципе я так и даю характеристику своим 100 человекам до лечения, затем оцениваю результат после.
2) По такому же принципу катамнез из 50 чел.
3)Потом пытаюсь найти особенности именно у этих 50, когда они были еще в составе 100 (Использую Манна-Уитни).
4)Был у меня вариант, когда прослеживала эти 50 человек в обеих госпитализациях (Четко использовала Уилкоксона) и мне это было понятно, четко парные зависимые значения.
Но задание у меня сравнить именно 100 и 50. Это сравнение меня очень мучает (ведь по современным данным под таблицами нужно указывать используемый критерий А что написано пером, ..... то при неправильно выбранном показателе заклюют).
Вроде Уилкоксон не подходит, пары "выпадают". М-уитни-не возьмешь - т.к. анализируем зависимые показатели
5)Еще я сравнивала жалобы 100 человек основной группы до лечения и 50 катамнеза до лечения- применяла М-уитни (на мой взгляд он подходит)

О бутстрепе почитаю. ДУмаю, для меня это возможный выход. Поищу в своей программе, если будут вопросы, я, с Вашего позволения, напишу.

Сообщение отредактировал september_e.yu@mail.ru - 11.01.2017 - 18:30
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 11.01.2017 - 18:33
Сообщение #9





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(passant @ 11.01.2017 - 19:23) *
Возвращаемся к тому, с чего начинали: "чем вас не устроили стандартные методы". Другими словами - А чем вас не устраивает более чем подробное разъяснение уважаемого nokh приведенное в предыдущем развернутом сообщении?



Меня, наоборот, устраивает. О бутстрепе я почитаю поищу в своей программе. Думаю, что для меня это возможный выход.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 11.01.2017 - 18:41
Сообщение #10





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(passant @ 11.01.2017 - 19:23) *
Возвращаемся к тому, с чего начинали: "чем вас не устроили стандартные методы". Другими словами - А чем вас не устраивает более чем подробное разъяснение уважаемого nokh приведенное в предыдущем развернутом сообщении?



Я как раз стараюсь использовать простые методы оценки, стьюдент, уилкокосон, манна-уитни, корреляцию Спирмена, четко представляя, как с этими критериями обращаться. Смущало лишь 100 и 50, при условии, что они зависимые. Ищу такой же простой и понятный критерий. А таблицы сопряженности с определнием точного критерия Фишера для этих 100 и 50 нельзя взять?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 11.01.2017 - 21:58
Сообщение #11





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(september_e.yu@mail.ru @ 11.01.2017 - 17:41) *
Смущало лишь 100 и 50, при условии, что они зависимые.

Да независимы они у Вас, независимы! Как только сказали, что обязаны рассматривать именно схему 100-50, - про зависимость срезу забываем! Есть группа из 100 человек и другая группа - из 50 человек. И сравниваем эти группы между собой - как НЕЗАВИСИМЫЕ выборки. Да, при этом много информации Вы потеряли - эта расплата за переход от схемы 50-50 зависимых измерений, к схеме 100-50 независимых.
А раз выборки рассматриваются как независимые, то используются любые подходящие критерии. От Стьюдента (для независимых выборок - если вы уверены в нормальности распределения) до Maнна-Уитни, Вилкоксона для непарных выборок, Kolmogorov-Smirnov Z-test, Вальда-Вольфовитца, Мойзеса. Смотря что оцениваете.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 12.01.2017 - 15:20
Сообщение #12





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(passant @ 11.01.2017 - 22:58) *
Да независимы они у Вас, независимы! Как только сказали, что обязаны рассматривать именно схему 100-50, - про зависимость срезу забываем! Есть группа из 100 человек и другая группа - из 50 человек. И сравниваем эти группы между собой - как НЕЗАВИСИМЫЕ выборки. Да, при этом много информации Вы потеряли - эта расплата за переход от схемы 50-50 зависимых измерений, к схеме 100-50 независимых.
А раз выборки рассматриваются как независимые, то используются любые подходящие критерии. От Стьюдента (для независимых выборок - если вы уверены в нормальности распределения) до Maнна-Уитни, Вилкоксона для непарных выборок, Kolmogorov-Smirnov Z-test, Вальда-Вольфовитца, Мойзеса. Смотря что оцениваете.



Passant, Вы уж меня простите, а как это "про зависимость сразу забываем" мне объяснить статистически грамотно, если спросят. А еще лучше, где это написано?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 12.01.2017 - 16:23
Сообщение #13





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(september_e.yu@mail.ru @ 12.01.2017 - 15:20) *
Passant, Вы уж меня простите, а как это "про зависимость сразу забываем" мне объяснить статистически грамотно, если спросят. А еще лучше, где это написано?


/Справочно/

Основой статистической обработки результатов эксперимента является грамотно спланированный эксперимент. Если в эксперименте наблюдается пара чисел, выборки считаются связанными. Если же все это время испытуемые выбывали из эксперимента по независящим от экспериментатора причинам, это называется не "эксперимент", а "факир был пьян, и фокус не удался".

Поэтому в вашей ситуации разумно сделать вид, что полгода между двумя обследованиями - достаточно продолжительный период, позволяющий пренебречь возможной коррелированностью результатов, и изучать эти две выборки как независимые, н-р, критерием Манна - Уитни.

Иначе единственный вопрос, который могут вам задать - "Какого черта"? Ну, вы поняли.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 12.01.2017 - 16:35
Сообщение #14





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(DrgLena @ 8.01.2017 - 10:51) *
зависимых выборок разного объема не бывают, хоть какой то учебник нужно открыть, или в сети поискать, если занимаетесь научными исследованиями.

https://ru.wikipedia.org/wiki/%D0%92%D1%8B%...%80%D0%BA%D0%B0

Если первые измерения сделаны у 100 больных, а через какое то время повторно явились только 30, то узнать как изменился показатель, например после лечения, можно только у этих 30. При этом данные должны быть организованы соответствующим образом,чтобы можно было учесть именно связанность наблюдений

Прочтите, наконец, ОПРЕДЕЛЕНИЕ в ссылке, которую я вам предоставила с соседней ветке, что такое связаные выборки. Вы можете вообще не пользоваться этим незнакомым вам понятием. И про критерии тоже можете не заморачиваться, какой для связанных выборок, а какой не для связаных. Анализируйте просто доли больных. До лечения из 100 больных голова болела у 80 (% и 95%ДИ), а после лечения есть данные только у 50 и у 10 из них голова продолжала болеть( % и 95%ДИ). Просто сравните эти доли (рекомендация одноразовая, не рекомендуется тем, кто понимает, что такое связаные выборки) smile.gif. Для тех кто понимает, рекомендую использовать для моего примера критерий Мак-Немара для СВЯЗАНЫХ выборок, что предусматривает анализ разности относительных частот наличия признака до и после лечения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 12.01.2017 - 16:43
Сообщение #15





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(100$ @ 12.01.2017 - 16:23) *
/Справочно/
Если в эксперименте наблюдается пара чисел, выборки считаются связанными.

Вот, это точно должно помочь umnik.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V   1 2 3 > » 
Добавить ответ в эту темуОткрыть тему