Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V  < 1 2 3 4 >  
Добавить ответ в эту темуОткрыть тему
> Сравнение зависимых выборок разного объема, обследование в 4х точках
passant
сообщение 12.01.2017 - 17:18
Сообщение #16





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(september_e.yu@mail.ru @ 12.01.2017 - 14:20) *
Passant, Вы уж меня простите, а как это "про зависимость сразу забываем" мне объяснить статистически грамотно, если спросят. А еще лучше, где это написано?

Математическое определение:
"Если можно установить гомоморфную пару (то есть, когда каждому случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках, такие выборки называются зависимыми".
Другими словами и более просто: Для того, что бы выборки были зависимым - надо установить ВЗАИМНО-ОДНОЗНАЧНОЕ соответствие между всеми их элементами. При неравных количествах элементов в множествах установить такое соответствие невозможно. Значит, ваши выборки 100-50 не могут быть зависимыми ПО ОПРЕДЕЛЕНИЮ. И неважно, что в них фигурируют одни и те-же люди.
Кто не поймет - посылайте..... учить математику. Можно начинать с 8-го класса средней школы или когда там сейчас рассказывают, что такое множество. rolleyes.gif
Как раз спрашивать или думать, что выборки, подобные Вашей, зависимы - абсолютно "статистически НЕграмотно" (по Вашей терминологии).

Сообщение отредактировал passant - 12.01.2017 - 17:28
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 12.01.2017 - 17:33
Сообщение #17





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(100$ @ 12.01.2017 - 15:23) *
Поэтому в вашей ситуации разумно сделать вид, что полгода между двумя обследованиями - достаточно продолжительный период, позволяющий пренебречь возможной коррелированностью результатов, и изучать эти две выборки как независимые, н-р, критерием Манна - Уитни.

Все правильно, но хочу только чуть-чуть дополнить. Что-бы ни у кого из "аспирантов" не возникло иллюзий.
Даже если между двумя обследованиями прошли сутки, но на вторые сутки на осмотр явилось только 50 пациентов из 100 - эти выборки все равно будут независимыми. С статистической точки зрения, разумеется.

Сообщение отредактировал passant - 12.01.2017 - 17:34
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 12.01.2017 - 17:38
Сообщение #18





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(DrgLena @ 12.01.2017 - 17:35) *
Прочтите, наконец, ОПРЕДЕЛЕНИЕ в ссылке, которую я вам предоставила с соседней ветке, что такое связаные выборки. Вы можете вообще не пользоваться этим незнакомым вам понятием. И про критерии тоже можете не заморачиваться, какой для связанных выборок, а какой не для связаных. Анализируйте просто доли больных. До лечения из 100 больных голова болела у 80 (% и 95%ДИ), а после лечения есть данные только у 50 и у 10 из них голова продолжала болеть( % и 95%ДИ). Просто сравните эти доли (рекомендация одноразовая, не рекомендуется тем, кто понимает, что такое связаные выборки) smile.gif. Для тех кто понимает, рекомендую использовать для моего примера критерий Мак-Немара для СВЯЗАНЫХ выборок, что предусматривает анализ разности относительных частот наличия признака до и после лечения.


Товарищи, спасибо за объяснения (и о 8 классе тоже)))!!! Без грамотной помощи сложно. Сложно, когда некому подсказать.

Сообщение отредактировал september_e.yu@mail.ru - 12.01.2017 - 17:45
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 12.01.2017 - 20:48
Сообщение #19





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(passant @ 12.01.2017 - 19:18) *
Математическое определение:
"Если можно установить гомоморфную пару (то есть, когда каждому случаю из выборки X соответствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках, такие выборки называются зависимыми".
Другими словами и более просто: Для того, что бы выборки были зависимым - надо установить ВЗАИМНО-ОДНОЗНАЧНОЕ соответствие между всеми их элементами. При неравных количествах элементов в множествах установить такое соответствие невозможно. Значит, ваши выборки 100-50 не могут быть зависимыми ПО ОПРЕДЕЛЕНИЮ. И неважно, что в них фигурируют одни и те-же люди.

Сомневаюсь, что всё так просто. Критерии для независимых выборок требуют этой самой независимости, а в рассматриваемом случае "100-50" первая выборка содержит половину элементов второй. Т.е. выборки "частично зависимы".
В той же википедии, например, в качестве требования критерия Стьюдента сказано: "Тhe data used to carry out the test should be sampled independently from the two populations being compared. This is in general not testable from the data, but if the data are known to be dependently sampled (i.e., if they were sampled in clusters), then the classical t-tests discussed here may give misleading results". На мой взгляд в примере присутствует именно кластер одних и тех же пациентов. В качестве требования к критерию Манна-Уитни: "All the observations from both groups are independent of each other", а у нас совсем не "All"... Читал, что рандомизационные критерии лишены таких ограничений чисто в силу иной философии этого подхода. Также если рассматривать ДИ, то тогда, действительно, речь будет идти о множествах и выборках из них. Если 95% ДИ не перекроются, то можно говорить что выборки извлечены из разных генеральных совокупностей и, в принципе, не важно содержат ли эти выборки одинаковые объекты, т.к. ДИ строится для каждой выборки независимо от другой. Поэтому я рекомендовал для сравнения именно рандомизационные тесты и подход с ДИ (хотя само сравнение 100 против 50 не рекомендовал и не рекомендую). Обмен мнениями с участниками форума можно продолжить, в 8 классе меня мало интересовала математика, больше биология, генетика:)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 12.01.2017 - 21:51
Сообщение #20





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



В порядке обмена мнениями могу вспомнить, что у Холлендера и Вульфа в издании 1983 г. описан критерий двумерной симметрии Холлендера (специально для связанных выборок). При неотвержении нулевой гипотезы первую и вторую выборку можно смело поменять местами - они взаимно независимы. Беда заключается в том, что по своей идеологии это тоже рандомизационный критерий, и для его осуществления надо состряпать квадратную матрицу перестановок размера 2^n, где n - объем выборки. Мой не самый хилый компьютер впал в кому на размере 13. Что уж тут говорить о 50...

Кстати, мы так до сих пор и не знаем, что в этой истории есть "клиническая картина", которую ТС так панически боится обеднить...

Сообщение отредактировал 100$ - 12.01.2017 - 22:03
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 13.01.2017 - 10:57
Сообщение #21





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(nokh @ 12.01.2017 - 22:48) *
Сомневаюсь, что всё так просто. Критерии для независимых выборок требуют этой самой независимости, а в рассматриваемом случае "100-50" первая выборка содержит половину элементов второй. Т.е. выборки "частично зависимы".

Порылся немного, всё так и есть. Ниже прикрепил 2 статьи по сравнению частично зависимых выборок: одна по количественным показателям, другая - по качественным. Это не обзоры, а просто недавние статьи, но в них во введении есть и обзорная часть.

Прикрепленные файлы
Прикрепленный файл  Samawi_Н._2014_Notes_on_two_sample_tests_for_partially_correlated_paired_data___копия.pdf ( 187,74 килобайт ) Кол-во скачиваний: 210
Прикрепленный файл  Derrick_B._2015_Test_statistics_for_comparing_two_proportions_with_partially_overlapping_samples.pdf ( 436,13 килобайт ) Кол-во скачиваний: 246
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 13.01.2017 - 11:25
Сообщение #22





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(100$ @ 12.01.2017 - 22:51) *
В порядке обмена мнениями могу вспомнить, что у Холлендера и Вульфа в издании 1983 г. описан критерий двумерной симметрии Холлендера (специально для связанных выборок). При неотвержении нулевой гипотезы первую и вторую выборку можно смело поменять местами - они взаимно независимы. Беда заключается в том, что по своей идеологии это тоже рандомизационный критерий, и для его осуществления надо состряпать квадратную матрицу перестановок размера 2^n, где n - объем выборки. Мой не самый хилый компьютер впал в кому на размере 13. Что уж тут говорить о 50...

Кстати, мы так до сих пор и не знаем, что в этой истории есть "клиническая картина", которую ТС так панически боится обеднить...




Конечно клиническая картина есть)) Но в ней ничего сверъестественного. А вот лабораторные данные..... поинтереснее будут. И не все лаб данные проводились до и сразу после лечения, а только до лечения в первую госпитализацию и до повторного лечения в катамнезе (те самые 100 и 50)

Сообщение отредактировал september_e.yu@mail.ru - 13.01.2017 - 11:28
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 13.01.2017 - 12:57
Сообщение #23





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nokh @ 13.01.2017 - 10:57) *
Порылся немного, всё так и есть. Ниже прикрепил 2 статьи по сравнению частично зависимых выборок: одна по количественным показателям, другая - по качественным. Это не обзоры, а просто недавние статьи, но в них во введении есть и обзорная часть.


В первой статье (Samawi, Vogel, 2014) на стр. 111 пунктом (1) авторы подтверждают все то, что я предлагал в посте ?13 : считать что за полгода корреляция теряется и работать как с некоррелированными данными.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 13.01.2017 - 14:44
Сообщение #24





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(nokh @ 13.01.2017 - 09:57) *
Порылся немного, всё так и есть. Ниже прикрепил 2 статьи по сравнению частично зависимых выборок: одна по количественным показателям, другая - по качественным. Это не обзоры, а просто недавние статьи, но в них во введении есть и обзорная часть.

Большое спасибо за интересную информацию. Отложил в загашник :-), может когда пригодиться.
Что до информации, приведенной в них. В первой из статей (та, где речь идет о количественных признаках), все крутиться вокруг формулы (1) и ее модификаций. На самом деле эта формула предлагает - если ее проанализировать - взять коэффициент для совпадающей по объектам (зависимой) части выборок (вторая составляющая формулы) и немного его "подправить" с помощью первой составной части этой формулы. Все бы ничего, но в первой части формулы присутствует коэффициент, считаемый для двух независимых выборок - в терминах статьи выборок X и Y . А по условию, которое нам "задал" ТС, именно эту составную часть формулы мы вычислить и не можем - в терминах указанной работы, у нас есть выборка Х и нет выборки Y. Увы.
Правда возможно где-то в приведенном обзоре литературы и есть "наша" ситуация (в терминах самой статьи - есть выборки X, U, V, две последние - зависимы). Надо будет на досуге покопаться и посмотреть, что предлагается. Однако, почему-то мне кажется, что если наш ТС разберется (!) во всех этих тонкостях и попытается убедить в этом членов своего ученого совета, у последних может случиться маленький вынос мозга rolleyes.gif Может, не стоит рисковать?

Сообщение отредактировал passant - 13.01.2017 - 14:54
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 13.01.2017 - 19:45
Сообщение #25





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Есть еще вопросик, коллеги. Тухлыми помидорами,плиз, не кидать

Напоминаю, мои 100 человек основной группы, 50 из них- катамнез через 6 мес.

Мне бы найти отличия у этих 50 человек, когда они были еще в составе 100,от общей группы 100 человек. Манна-Уитни подойдет?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 13.01.2017 - 20:48
Сообщение #26





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(september_e.yu@mail.ru @ 13.01.2017 - 19:45) *
Есть еще вопросик, коллеги. Тухлыми помидорами,плиз, не кидать

Напоминаю, мои 100 человек основной группы, 50 из них- катамнез через 6 мес.

Мне бы найти отличия у этих 50 человек, когда они были еще в составе 100,от общей группы 100 человек. Манна-Уитни подойдет?


Ознакомьтесь
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 13.01.2017 - 21:29
Сообщение #27





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(september_e.yu@mail.ru @ 13.01.2017 - 18:45) *
Мне бы найти отличия у этих 50 человек, когда они были еще в составе 100,от общей группы 100 человек. Манна-Уитни подойдет?

Как мне кажется, Вам как раз необходимо (если уж очень хочется) показать ОТСУТСТВИЕ отличий между этими 50-ю и всей сотней. Разве что, если Вы уверены, что все непришедшие умерли.
Ведь подумайте, ну докажете вы вдруг, что эти две подвыборки отличаются чем-то в начальном анамнезе. И какие выводы?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 13.01.2017 - 22:11
Сообщение #28





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Умерли? А может вообще выздоровели и, потому у них нет повторной госпитализации. Нам ничего не известно, поскольку, нет медицинской постановки задачи. С какой целью собрались данные, можно только фантазировать. Мне бы сравнить что то с чем то каким то критерием ? это не постановка задачи.

Сформирована когорта больных с определенной патологией, для которой имеются первичные клинические и лабораторные данные установленные в стационаре (n=100). В течении 6 мес. наблюдения за этими больными у 50 из них случился рецидив (case), а у других 50 все в порядке (control). Определить возможность прогноза рецидива по первичным данным. Для решения такой задачи существуют вполне определенные методы.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 13.01.2017 - 22:23
Сообщение #29





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



ТС ->

Можно сделать несколько финтов ушами:

1. взять 50 чел из начальной сотни, (которые впоследствии явятся ч/з полгода) и сравнить их с оставшимися 100-50=50 чел (которые впоследствии не пришли) критерием Смирнова. Критерий Смирнова состоятельный - покажет любое отличие в функциях распределения. Если нулевая гипотеза не отвергается - выборки однородны, и их можно (задним числом smile.gif) объединить в одну, равную 100 чел.

2. По выборке объемом 50 чел из начальной сотни, (которые впоследствии явятся ч/з полгода), определить среднее и сигму, после чего проверить критерием Колмогорова принадлежность выборки в 100 чел к распределению (н-р, нормальному) с определенными таким образом параметрами. Вроде бы некогда асимпотическую корректность такой процедуры ( при проверке простой гипотезы) обосновал Дж. Дарбин (J. Durbin). Если нулевая гипотеза не отвергается, тоже можем считать выборки однородными и объединять в одну.

3. Проверить однородность выборок (50:50) из первой сотни Манном - Уитни. Н-р, гипотезу сдвига.

Иначе нет ответов на вопрос - а почему это выборка объемом 50 чел из генеральной совокупности в 100 чел должна отличаться от ген.совокупности? Она (выборка) что - нерепрезентативна? Каковы априорные основания считать, что в ней существует подвыборка, отличающаяся, н-р, параметрами сдвига и /или масштаба? Ведь вы не знали заранее, кто явится ч/з полгода, а кто нет? и т.д. Вы обязательно засыпетесь.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 14.01.2017 - 10:33
Сообщение #30





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(100$ @ 13.01.2017 - 23:23) *
ТС ->

Можно сделать несколько финтов ушами:

1. взять 50 чел из начальной сотни, (которые впоследствии явятся ч/з полгода) и сравнить их с оставшимися 100-50=50 чел (которые впоследствии не пришли) критерием Смирнова. Критерий Смирнова состоятельный - покажет любое отличие в функциях распределения. Если нулевая гипотеза не отвергается - выборки однородны, и их можно (задним числом smile.gif) объединить в одну, равную 100 чел.

2. По выборке объемом 50 чел из начальной сотни, (которые впоследствии явятся ч/з полгода), определить среднее и сигму, после чего проверить критерием Колмогорова принадлежность выборки в 100 чел к распределению (н-р, нормальному) с определенными таким образом параметрами. Вроде бы некогда асимпотическую корректность такой процедуры ( при проверке простой гипотезы) обосновал Дж. Дарбин (J. Durbin). Если нулевая гипотеза не отвергается, тоже можем считать выборки однородными и объединять в одну.

3. Проверить однородность выборок (50:50) из первой сотни Манном - Уитни. Н-р, гипотезу сдвига.

Иначе нет ответов на вопрос - а почему это выборка объемом 50 чел из генеральной совокупности в 100 чел должна отличаться от ген.совокупности? Она (выборка) что - нерепрезентативна? Каковы априорные основания считать, что в ней существует подвыборка, отличающаяся, н-р, параметрами сдвига и /или масштаба? Ведь вы не знали заранее, кто явится ч/з полгода, а кто нет? и т.д. Вы обязательно засыпетесь.




Думаю, что 1 пункт и 3 мне могут подойти. Ориентируясь на свою программу SPSS есть технические вопросы:

1 пункт " взять 50 человек из начальной сотни", критерий смирнова - это, я так понимаю, одновыборочный критерий колмогорова-смирнова?! Но в программе SPSS я могу задать параметры этого критерия или для 100 или для 50 из 100 и выбрать проверяемое распределение. Как же тогда сравнить 50 из 100 и 100 непосредственно? И это распределение будет только для количественных данных, а как же быть с качественными?

3 пункт -Если я Вас правильно поняла- критерием Манна-уитни я должна сравнить 50 человек из 100, которые затем явятся повторно, с 50 человеками из 100, кот потом не явятся? И выявить таким образом статистически значимые отличия.

Если 3 пункт действительно правильно мною понят, то тогда такой пример:

Например, средняя з/п по кафеде (от лаборантов до зав.каф) 20 т.р.
Нужно узнать, есть ли отличия з/п. лаборантов от средней з/п по кафедре. Если я буду сравнивать 50 лаборантов с 50-ю остальными членами кафедры, то это не будет сравнением со средней з/п (лаборанты автоматически туда просто не входят).
В этом случае, как я понимаю, нужно сравнить з/п. лаборантов (n=50) со средними показателями кафедры (n=100) (куда входят и сами лаборанты).


Мне кажется, мой случай наподобие. Есть те самые лаборанты( в моем случае 50чел, кот повторно приедут) и есть целая кафедра с лаборантами вместе (все 100 исходных человек).

Повторюсь, если я правильно понимаю 3 пункт, то у меня были 2 варианта подсчетов, когда я сравниваю 50 и 50, 50 и 100. И отличия по этим 50 от остальных 50 и от 100 получились практически одинаковыми. Но получаемые показатели м-уитни меня смущают ;) Ведь сравниваем абсолютные значения качественных признаков, а не %. Т.е. по абсолютным значениям все ок, а по этим же % .........возникает вопрос


С прогнозом рецидива Вы правы, действительно мне это нужно.

Сообщение отредактировал september_e.yu@mail.ru - 14.01.2017 - 11:13
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V  < 1 2 3 4 >
Добавить ответ в эту темуОткрыть тему