Сравнение зависимых выборок разного объема, обследование в 4х точках |
Здравствуйте, гость ( Вход | Регистрация )
Сравнение зависимых выборок разного объема, обследование в 4х точках |
4.01.2017 - 19:55
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Коллеги! Тема уже поднималась ранее, НО!!! все равно необходимо разъяснение
Первая госпитализация 100 человек, жалобы и АД смотрим до (точка А1) и после лечения (точка А2) и холестерин только до лечения (А1) Вторая госпитализация через 6 месяцев обследуем только 30 человек из 100, жалобы и АД смотрим до (точка А3) и после лечения (точка А4) и холестерин только до лечения (А3) ВОПРОС : 1) как сравнить жалобы и АД в точке А2 (n=100) и в точке А3 (n=30) 2) как сравнить холестерин в точке А1 (n=100) и А3 (n=30), если исследование холестерина в точке А2 и А4 не проводилось 3) как все это анализировать для нормального и ненормального распределения признака Использую программу SPSS моя почта september_e.yu@mail.ru |
|
13.01.2017 - 22:23
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
ТС ->
Можно сделать несколько финтов ушами: 1. взять 50 чел из начальной сотни, (которые впоследствии явятся ч/з полгода) и сравнить их с оставшимися 100-50=50 чел (которые впоследствии не пришли) критерием Смирнова. Критерий Смирнова состоятельный - покажет любое отличие в функциях распределения. Если нулевая гипотеза не отвергается - выборки однородны, и их можно (задним числом ) объединить в одну, равную 100 чел. 2. По выборке объемом 50 чел из начальной сотни, (которые впоследствии явятся ч/з полгода), определить среднее и сигму, после чего проверить критерием Колмогорова принадлежность выборки в 100 чел к распределению (н-р, нормальному) с определенными таким образом параметрами. Вроде бы некогда асимпотическую корректность такой процедуры ( при проверке простой гипотезы) обосновал Дж. Дарбин (J. Durbin). Если нулевая гипотеза не отвергается, тоже можем считать выборки однородными и объединять в одну. 3. Проверить однородность выборок (50:50) из первой сотни Манном - Уитни. Н-р, гипотезу сдвига. Иначе нет ответов на вопрос - а почему это выборка объемом 50 чел из генеральной совокупности в 100 чел должна отличаться от ген.совокупности? Она (выборка) что - нерепрезентативна? Каковы априорные основания считать, что в ней существует подвыборка, отличающаяся, н-р, параметрами сдвига и /или масштаба? Ведь вы не знали заранее, кто явится ч/з полгода, а кто нет? и т.д. Вы обязательно засыпетесь. |
|
14.01.2017 - 10:33
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
ТС -> Можно сделать несколько финтов ушами: 1. взять 50 чел из начальной сотни, (которые впоследствии явятся ч/з полгода) и сравнить их с оставшимися 100-50=50 чел (которые впоследствии не пришли) критерием Смирнова. Критерий Смирнова состоятельный - покажет любое отличие в функциях распределения. Если нулевая гипотеза не отвергается - выборки однородны, и их можно (задним числом ) объединить в одну, равную 100 чел. 2. По выборке объемом 50 чел из начальной сотни, (которые впоследствии явятся ч/з полгода), определить среднее и сигму, после чего проверить критерием Колмогорова принадлежность выборки в 100 чел к распределению (н-р, нормальному) с определенными таким образом параметрами. Вроде бы некогда асимпотическую корректность такой процедуры ( при проверке простой гипотезы) обосновал Дж. Дарбин (J. Durbin). Если нулевая гипотеза не отвергается, тоже можем считать выборки однородными и объединять в одну. 3. Проверить однородность выборок (50:50) из первой сотни Манном - Уитни. Н-р, гипотезу сдвига. Иначе нет ответов на вопрос - а почему это выборка объемом 50 чел из генеральной совокупности в 100 чел должна отличаться от ген.совокупности? Она (выборка) что - нерепрезентативна? Каковы априорные основания считать, что в ней существует подвыборка, отличающаяся, н-р, параметрами сдвига и /или масштаба? Ведь вы не знали заранее, кто явится ч/з полгода, а кто нет? и т.д. Вы обязательно засыпетесь. Думаю, что 1 пункт и 3 мне могут подойти. Ориентируясь на свою программу SPSS есть технические вопросы: 1 пункт " взять 50 человек из начальной сотни", критерий смирнова - это, я так понимаю, одновыборочный критерий колмогорова-смирнова?! Но в программе SPSS я могу задать параметры этого критерия или для 100 или для 50 из 100 и выбрать проверяемое распределение. Как же тогда сравнить 50 из 100 и 100 непосредственно? И это распределение будет только для количественных данных, а как же быть с качественными? 3 пункт -Если я Вас правильно поняла- критерием Манна-уитни я должна сравнить 50 человек из 100, которые затем явятся повторно, с 50 человеками из 100, кот потом не явятся? И выявить таким образом статистически значимые отличия. Если 3 пункт действительно правильно мною понят, то тогда такой пример: Например, средняя з/п по кафеде (от лаборантов до зав.каф) 20 т.р. Нужно узнать, есть ли отличия з/п. лаборантов от средней з/п по кафедре. Если я буду сравнивать 50 лаборантов с 50-ю остальными членами кафедры, то это не будет сравнением со средней з/п (лаборанты автоматически туда просто не входят). В этом случае, как я понимаю, нужно сравнить з/п. лаборантов (n=50) со средними показателями кафедры (n=100) (куда входят и сами лаборанты). Мне кажется, мой случай наподобие. Есть те самые лаборанты( в моем случае 50чел, кот повторно приедут) и есть целая кафедра с лаборантами вместе (все 100 исходных человек). Повторюсь, если я правильно понимаю 3 пункт, то у меня были 2 варианта подсчетов, когда я сравниваю 50 и 50, 50 и 100. И отличия по этим 50 от остальных 50 и от 100 получились практически одинаковыми. Но получаемые показатели м-уитни меня смущают ;) Ведь сравниваем абсолютные значения качественных признаков, а не %. Т.е. по абсолютным значениям все ок, а по этим же % .........возникает вопрос С прогнозом рецидива Вы правы, действительно мне это нужно. Сообщение отредактировал september_e.yu@mail.ru - 14.01.2017 - 11:13 |
|
14.01.2017 - 13:50
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата С прогнозом рецидива Вы правы, действительно мне это нужно. Посоветовавший это безусловно прав, но это был не я. Цитата 1 пункт " взять 50 человек из начальной сотни", критерий смирнова - это, я так понимаю, одновыборочный критерий колмогорова-смирнова?! Но в программе SPSS я могу задать параметры этого критерия или для 100 или для 50 из 100 и выбрать проверяемое распределение. Как же тогда сравнить 50 из 100 и 100 непосредственно? И это распределение будет только для количественных данных, а как же быть с качественными? Глупые басурмане под словосочетанием "критерий Колмогорова - Смирнова" понимают критерий согласия Колмогорова. Он действительно одновыборочный. Это пункт 2 из моего предыдущего сообщения. Критерий Смирнова в СПСС вроде бы (?) не реализован. В отношении качественных данных надо проверять гипотезыы о доле с помощью таблиц сопряженности. Вам один только Nokh прочитал такую лекцию, что вопросов уже остаться бы не должно. Цитата 3 пункт -Если я Вас правильно поняла- критерием Манна-уитни я должна сравнить 50 человек из 100, которые затем явятся повторно, с 50 человеками из 100, кот потом не явятся? И выявить таким образом статистически значимые отличия. Точно Цитата Например, средняя з/п по кафеде (от лаборантов до зав.каф) 20 т.р. Нужно узнать, есть ли отличия з/п. лаборантов от средней з/п по кафедре. Если я буду сравнивать 50 лаборантов с 50-ю остальными членами кафедры, то это не будет сравнением со средней з/п (лаборанты автоматически туда просто не входят). В этом случае, как я понимаю, нужно сравнить з/п. лаборантов (n=50) со средними показателями кафедры (n=100) (куда входят и сами лаборанты). То, что вы описали, называется "проверкой гипотезы о средней". В статистике гипотезы формируются до проведения исследования. В описываемом случае проверяется гипотеза о равенстве средней зарплаты лаборантов некоторой величине а (Н0: mu=a). Технически для этого не надо сравнивать две выборки. А средняя з/плата по кафедре - это то же, что и средняя температура по больнице. В статистике усреднять надо не механически, а с умом. Применительно к случаю с кафедрой ум обязывает понимать, что состав кафедры очень стратифицирован - отдельно профессора (причем одному из них доплачивают за заведование кафедрой), отдельно доценты, отдельно старшие преподы, ассистенты, лаборанты и т.д. Ни одна из этих страт не является выборкой. Сообщение отредактировал 100$ - 14.01.2017 - 14:14 |
|
14.01.2017 - 14:06
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Посоветовавший это безусловно прав, но это был не я. Глупые басурмане под словосочетанием "критерий Колмогорова - Смирнова" понимают критерий согласия Колмогорова. Он действительно одновыборочный. Это пункт 2 из моего предыдущего сообщения. Критерий Смирнова в СПСС вроде бы (?) не реализован. В отношении качественных данных надо проверять гипотезыы о доле с помощью таблиц сопряженности. Вам один только Nokh прочитали такую лекцию, что вопросов уже остаться бы не должно. Точно То, что вы описали, называется "проверкой гипотезы о средней". В статистике гипотезы формируются до проведения исследования. В описываемом случае проверяется гипотеза о равенстве средней зарплаты лаборантов некоторой величине а (Н0: mu=a). Для этого достаточно именно выборки лаборантов. Формулой Н0: mu=a ВЫ меня добили)). Я понимаю, что на сайте все СПЕЦЫ!!! Но давайте попроще, пожалуйста, для гуманитариев, для тех, кто лучше напишет сочинение, чем вычислит логарифм или интеграл !!!! Резюмирую всю нашу беседу: 1)Качественные признаки до и после лечения (да/нет) нужно сравнивать мак-немаром. УИлкоксон не подойдет?! 2) количественные признаки до и после лечения - Уилкоксон или стьюдент (от распределения) 2) Качественные признаки между 2 независимыми группами - табл. сопряженности с хи-квадратом(+ точный кр. ФИшера, если в некоторых ячейках ожидаемая частота меньше 5) 3) количественные признаки между 2 независимыми группами - берем Манна-Уитни 3) Частично-зависимые выборки не существуют. Либо делать их строго зависимыми (всё по 50) и тогда Уилкоксон или т-стьюд для парных. Либо в случае "частичной зависимости" использовать доверительный интервал или Манна-уитни 4) Для прогноза можно Манна-Уитни, но я так и не поняла 50 и 100 сравнивать или 50 и 50????? Сравнение 50и 50- проблема. проблема в том, что у меня, кроме 50 (через 6, мес) есть еще 18 человек, которые осматриваются через 1 год. Если я сравню 50 и 50, то туда войдут 18 человек, которые прибудут через 1 год. А мне это не выгодно, т.к. у этих 18 тоже придется искать прогноз, когда они были в составе 100. Пожалуйста, давайте обсудим все по этим пунктам, очень прошу!!! И все таки как быть с прогнозом, если кроме 50 человек ч/з 6 мес, есть еще 18 через 1 год. И у них нужно найти критерии прогноза (( P.S. Крит Колмогорова-смирнова есть в SPSS в разделе непараметрические критерии Сообщение отредактировал september_e.yu@mail.ru - 14.01.2017 - 15:02 |
|
14.01.2017 - 14:35
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата 1)Качественные признаки до и после лечения (да/нет) нужно сравнивать мак-немаром. Американский статистик Куинн МакНемар заслужил, чтобы его писали с большой буквы. Критерий МакНемара - это та же мамая таблица сопряженности для связанных выборок размера 2х2. Цитата 2) количественные признаки до и после лечения - Уилкоксон или стьюдент (от распределения) Схема "До-после" порождает связанные выборки. Для связанных выборок - парный критерий Стьюдента, критерий знаковых рангов Уилкоксона (Wilcoxon signed-rank (matched-paired) test) Цитата 2) Качественные признаки 2 независимых групп - табл. сопряженности. Да Цитата 3) количественные признаки 2 независимых групп - Манна-Уитни Да Цитата 3) Частично-зависимые выборки не существуют. Это не ко мне, это к DrgLene. Как говаривал Ньютон - "Это не ко мне, это - к де Муавру, он в этом понимает больше меня". Цитата Либо в случае "частичной зависимости" использовать доверительный интервал или Манна-уитни НЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕТ!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Цитата Пожалуйста, скажите, до прогноза я всё правильно поняла с выбором критериев!!! И все таки как быть с прогнозом (( Для прогноза надо строить модель, а не выбирать критерии. |
|
14.01.2017 - 16:10
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Американский статистик Куинн МакНемар заслужил, чтобы его писали с большой буквы. Критерий МакНемара - это та же мамая таблица сопряженности для связанных выборок размера 2х2. Схема "До-после" порождает связанные выборки. Для связанных выборок - парный критерий Стьюдента, критерий знаковых рангов Уилкоксона (Wilcoxon signed-rank (matched-paired) test) Да Да Это не ко мне, это к DrgLene. Как говаривал Ньютон - "Это не ко мне, это - к де Муавру, он в этом понимает больше меня". НЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕТ!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Для прогноза надо строить модель, а не выбирать критерии. Мне уже легче))) Спасибо!!! А теперь, что значит построить модель? |
|
14.01.2017 - 16:36
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Мне уже легче))) Спасибо!!! А теперь, что значит построить модель? Построить модель - это значить состряпать (читай: родить) математическую конструкцию, которая будет получать в качестве аргумента некоторые исходные данные (н-р, набор инструментальных исследований пациента), а выдавать нечто очень похожее на то, что наблюдали черед полгода, год и т. д. |
|
14.01.2017 - 16:54
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
Построить модель - это значить состряпать (читай: родить) математическую конструкцию, которая будет получать в качестве аргумента некоторые исходные данные (н-р, набор инструментальных исследований пациента), а выдавать нечто очень похожее на то, что наблюдали черед полгода, год и т. д. О, Боги статистики))) как мне эту конструкцию сделать??? Я вроде и стремлюсь найти некоторые исходные данные, которые и составят критерии прогноза . Давайте вернемся к этому |
|
14.01.2017 - 17:08
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
О, Боги статистики))) как мне эту конструкцию сделать??? Я вроде и стремлюсь найти некоторые исходные данные, которые и составят критерии прогноза . Давайте вернемся к этому "Тетенька, дайте водички напиться, а то так есть хочется, аж переночевать негде!" (с) народ. Модели бывают разные. Все зависит от того, что вы хотите получить на выходе: то ли вероятность того, что после визита к вам пациент выздоровеет/отдаст Богу душу (нужное подчеркнуть, ненужное - зачеркнуть), то ли спрогнозировать численное значение какого-то клинически значимого фактора, али ишшо чего... Поскольку вы нам пока еще ничего конкретного не сообщили, дальнейшее обсуждение будет с единичной вероятностью происходить по сценарию: - Петька, приборы? - Шестьдесят, Василь Иваныч! - Что шестьдесят? - А что приборы??? Сообщение отредактировал 100$ - 14.01.2017 - 17:10 |
|
14.01.2017 - 18:00
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
"Тетенька, дайте водички напиться, а то так есть хочется, аж переночевать негде!" (с) народ. Модели бывают разные. Все зависит от того, что вы хотите получить на выходе: то ли вероятность того, что после визита к вам пациент выздоровеет/отдаст Богу душу (нужное подчеркнуть, ненужное - зачеркнуть), то ли спрогнозировать численное значение какого-то клинически значимого фактора, али ишшо чего... Поскольку вы нам пока еще ничего конкретного не сообщили, дальнейшее обсуждение будет с единичной вероятностью происходить по сценарию: - Петька, приборы? - Шестьдесят, Василь Иваныч! - Что шестьдесят? - А что приборы??? практический выход: выяснить, что уровень, например, ФНО-альфа у лиц, которые были госпитализированы повторного через 6 месяцев (n=50), еще в их первую госпитализацию был выше, чем у всех 100 исходных человек. И определение именно концентрации ФНО-альфа является критерием возможного обострения заболевания через 6 месяцев. |
|
14.01.2017 - 18:08
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
практический выход: выяснить, что уровень, например, ФНО-альфа у лиц, которые были госпитализированы повторного через 6 месяцев (n=50), еще в их первую госпитализацию был выше, чем у всех 100 исходных человек. И определение именно концентрации ФНО-альфа является критерием возможного обострения заболевания через 6 месяцев. Цитата ...чем у всех 100 исходных человек Вы опять за свое? Имейте в виду, сравнить 50 и 100 чел я вам не позволю Цитата И определение именно концентрации ФНО-альфа является критерием возможного обострения заболевания через 6 месяцев Может быть. Тут уж вам виднее. Сообщение отредактировал 100$ - 14.01.2017 - 18:12 |
|
14.01.2017 - 18:35
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 26 Регистрация: 2.10.2010 Пользователь №: 22792 |
[quote name='100$' date='14.01.2017 - 19:08' post='20861']
Вы опять за свое? Имейте в виду, сравнить 50 и 100 чел я вам не позволю ))) значит 50 и 50, критерием -М-уитни. Но в катамнезе же есть и 18 человек ч/з 1 год Тогда 50 и 32 из исходных 100 И 18 кот, затем прибудут через 1 год и снова 32 из 100 исходных, так что ли? |
|