Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V  < 1 2 3 4 >  
Добавить ответ в эту темуОткрыть тему
> Сравнение зависимых выборок разного объема, обследование в 4х точках
september_e.yu@m...
сообщение 14.01.2017 - 10:45
Сообщение #31





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(100$ @ 13.01.2017 - 23:23) *
ТС ->


Иначе нет ответов на вопрос - а почему это выборка объемом 50 чел из генеральной совокупности в 100 чел должна отличаться от ген.совокупности? Она (выборка) что - нерепрезентативна? Каковы априорные основания считать, что в ней существует подвыборка, отличающаяся, н-р, параметрами сдвига и /или масштаба? Ведь вы не знали заранее, кто явится ч/з полгода, а кто нет? и т.д. Вы обязательно засыпетесь.



Т.е.. мне не выгодно искать отличия этих 50 от 100. нерепрезентативная выборка

Но ведь как-то нужно понять, что такого было у этих 50 еще в первую госпитализацию, что заставило их прийти во второй раз. Тот самый прогноз
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 14.01.2017 - 11:23
Сообщение #32





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



В меня можно кидать тухлыми помидорами, поскольку я не могу согласиться с уважаемым nokh , который считает, что существуют частично зависимые выборки. Существуют четкие определения зависимых и независимых выборок, которые тут уже были подробно обозначены, и никаких частично- зависимых в математической статистике не существуют (но в био- медицинской все возможно ). В соответствии с этими двумя вариантами формирования выборок и существуют соответствующие критерии. При этом нулевая гипотеза формируется различным образом. Например, нулевая гипотеза может заключаться в том, что различия средних в двух выборках равны нулю, а также, что средняя разница связанных ПАР наблюдений равна нулю. И это не философия, а чистая математика - другая формула для критерия Стьюдента.

Относительно работ, которые любезно предоставил nokh. В обеих - речь идет о связанных выборках (When we have partial data on a matched-pair or repeated measure), которые имеют пропуски (как до, таки после), и предлагаются техники, которые используют коррелированность данных. По первой passant высказался, но у нас есть информация по 50 парам и теоретически можно было бы использовать предлагаемые техники, если бы они не составляли только половину наблюдений.

Во второй статье также рассматриваются ... tests for comparing two sample proportions of a dichotomous dependent variable.
Ключевые слова Partially overlapping samples означают, что часть данных до и после совпадают. Мы используем, и часто обсуждали на этом форуме критерий Мак-Немара (2.2. в этой статье), в расчете которого используется только несовпадающие пары, остальная информация просто игнорируется (да-да и нет-нет до и после). Предлагаются несколько методов, обосновывается преимущество одного из них.

Никакого обеднения при анализе именно связанных выборок не происходит, напротив, использование соответствующих критериев предоставляет значительно больше возможностей обнаружить различия, чем критерии для независимых выборок (даже, если число наблюдений будет меньше). Незначительный, но однонаправленный сдвиг показателя после лечения может быть статистически значим при использовании критерия Стьюдента для связанных выборок и не быть таковым при использовании этого критерия для несвязанных выборок.

Сообщение отредактировал DrgLena - 14.01.2017 - 11:25
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 14.01.2017 - 13:50
Сообщение #33





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
С прогнозом рецидива Вы правы, действительно мне это нужно.


Посоветовавший это безусловно прав, но это был не я.

Цитата
1 пункт " взять 50 человек из начальной сотни", критерий смирнова - это, я так понимаю, одновыборочный критерий колмогорова-смирнова?! Но в программе SPSS я могу задать параметры этого критерия или для 100 или для 50 из 100 и выбрать проверяемое распределение. Как же тогда сравнить 50 из 100 и 100 непосредственно? И это распределение будет только для количественных данных, а как же быть с качественными?


Глупые басурмане под словосочетанием "критерий Колмогорова - Смирнова" понимают критерий согласия Колмогорова. Он действительно одновыборочный. Это пункт 2 из моего предыдущего сообщения. Критерий Смирнова в СПСС вроде бы (?) не реализован.

В отношении качественных данных надо проверять гипотезыы о доле с помощью таблиц сопряженности. Вам один только Nokh прочитал такую лекцию, что вопросов уже остаться бы не должно.

Цитата
3 пункт -Если я Вас правильно поняла- критерием Манна-уитни я должна сравнить 50 человек из 100, которые затем явятся повторно, с 50 человеками из 100, кот потом не явятся? И выявить таким образом статистически значимые отличия.


Точно

Цитата
Например, средняя з/п по кафеде (от лаборантов до зав.каф) 20 т.р.
Нужно узнать, есть ли отличия з/п. лаборантов от средней з/п по кафедре. Если я буду сравнивать 50 лаборантов с 50-ю остальными членами кафедры, то это не будет сравнением со средней з/п (лаборанты автоматически туда просто не входят).
В этом случае, как я понимаю, нужно сравнить з/п. лаборантов (n=50) со средними показателями кафедры (n=100) (куда входят и сами лаборанты).


То, что вы описали, называется "проверкой гипотезы о средней". В статистике гипотезы формируются до проведения исследования. В описываемом случае проверяется гипотеза о равенстве средней зарплаты лаборантов некоторой величине а (Н0: mu=a). Технически для этого не надо сравнивать две выборки.

А средняя з/плата по кафедре - это то же, что и средняя температура по больнице. В статистике усреднять надо не механически, а с умом. Применительно к случаю с кафедрой ум обязывает понимать, что состав кафедры очень стратифицирован - отдельно профессора (причем одному из них доплачивают за заведование кафедрой), отдельно доценты, отдельно старшие преподы, ассистенты, лаборанты и т.д. Ни одна из этих страт не является выборкой.

Сообщение отредактировал 100$ - 14.01.2017 - 14:14
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 14.01.2017 - 14:06
Сообщение #34





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(100$ @ 14.01.2017 - 14:50) *
Посоветовавший это безусловно прав, но это был не я.



Глупые басурмане под словосочетанием "критерий Колмогорова - Смирнова" понимают критерий согласия Колмогорова. Он действительно одновыборочный. Это пункт 2 из моего предыдущего сообщения. Критерий Смирнова в СПСС вроде бы (?) не реализован.

В отношении качественных данных надо проверять гипотезыы о доле с помощью таблиц сопряженности. Вам один только Nokh прочитали такую лекцию, что вопросов уже остаться бы не должно.



Точно



То, что вы описали, называется "проверкой гипотезы о средней". В статистике гипотезы формируются до проведения исследования. В описываемом случае проверяется гипотеза о равенстве средней зарплаты лаборантов некоторой величине а (Н0: mu=a). Для этого достаточно именно выборки лаборантов.




Формулой Н0: mu=a ВЫ меня добили)). Я понимаю, что на сайте все СПЕЦЫ!!! Но давайте попроще, пожалуйста, для гуманитариев, для тех, кто лучше напишет сочинение, чем вычислит логарифм или интеграл !!!!

Резюмирую всю нашу беседу:

1)Качественные признаки до и после лечения (да/нет) нужно сравнивать мак-немаром. УИлкоксон не подойдет?!

2) количественные признаки до и после лечения - Уилкоксон или стьюдент (от распределения)

2) Качественные признаки между 2 независимыми группами - табл. сопряженности с хи-квадратом(+ точный кр. ФИшера, если в некоторых ячейках ожидаемая частота меньше 5)

3) количественные признаки между 2 независимыми группами - берем Манна-Уитни

3) Частично-зависимые выборки не существуют. Либо делать их строго зависимыми (всё по 50) и тогда Уилкоксон или т-стьюд для парных. Либо в случае "частичной зависимости" использовать доверительный интервал или Манна-уитни

4) Для прогноза можно Манна-Уитни, но я так и не поняла 50 и 100 сравнивать или 50 и 50????? Сравнение 50и 50- проблема.

проблема в том, что у меня, кроме 50 (через 6, мес) есть еще 18 человек, которые осматриваются через 1 год. Если я сравню 50 и 50, то туда войдут 18 человек, которые прибудут через 1 год. А мне это не выгодно, т.к. у этих 18 тоже придется искать прогноз, когда они были в составе 100.

insane.gif Пожалуйста, давайте обсудим все по этим пунктам, очень прошу!!! И все таки как быть с прогнозом, если кроме 50 человек ч/з 6 мес, есть еще 18 через 1 год. И у них нужно найти критерии прогноза ((

P.S. Крит Колмогорова-смирнова есть в SPSS в разделе непараметрические критерии

Сообщение отредактировал september_e.yu@mail.ru - 14.01.2017 - 15:02
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 14.01.2017 - 14:35
Сообщение #35





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694





Цитата
1)Качественные признаки до и после лечения (да/нет) нужно сравнивать мак-немаром.


Американский статистик Куинн МакНемар заслужил, чтобы его писали с большой буквы. Критерий МакНемара - это та же мамая таблица сопряженности для связанных выборок размера 2х2.

Цитата
2) количественные признаки до и после лечения - Уилкоксон или стьюдент (от распределения)


Схема "До-после" порождает связанные выборки. Для связанных выборок - парный критерий Стьюдента, критерий знаковых рангов Уилкоксона (Wilcoxon signed-rank (matched-paired) test)

Цитата
2) Качественные признаки 2 независимых групп - табл. сопряженности.


Да

Цитата
3) количественные признаки 2 независимых групп - Манна-Уитни

Да

Цитата
3) Частично-зависимые выборки не существуют.


Это не ко мне, это к DrgLene. Как говаривал Ньютон - "Это не ко мне, это - к де Муавру, он в этом понимает больше меня".

Цитата
Либо в случае "частичной зависимости" использовать доверительный интервал или Манна-уитни


НЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕТ!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!


Цитата
Пожалуйста, скажите, до прогноза я всё правильно поняла с выбором критериев!!! И все таки как быть с прогнозом ((


Для прогноза надо строить модель, а не выбирать критерии.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 14.01.2017 - 15:42
Сообщение #36





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Дорогая Сентябрина!
Не редактируйте, пожалуйста, свои сообщения после того как на них ответили.

Сообщение отредактировал 100$ - 14.01.2017 - 15:57
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 14.01.2017 - 16:08
Сообщение #37





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(100$ @ 14.01.2017 - 16:42) *
Дорогая Сентябрина!
Не редактируйте, пожалуйста, свои сообщения после того как на них ответили.




я постфактум не редактирую. Только подправляю ошибки (прям тут же), если только что написала
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 14.01.2017 - 16:10
Сообщение #38





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(100$ @ 14.01.2017 - 15:35) *
Американский статистик Куинн МакНемар заслужил, чтобы его писали с большой буквы. Критерий МакНемара - это та же мамая таблица сопряженности для связанных выборок размера 2х2.



Схема "До-после" порождает связанные выборки. Для связанных выборок - парный критерий Стьюдента, критерий знаковых рангов Уилкоксона (Wilcoxon signed-rank (matched-paired) test)



Да


Да



Это не ко мне, это к DrgLene. Как говаривал Ньютон - "Это не ко мне, это - к де Муавру, он в этом понимает больше меня".



НЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕЕТ!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!




Для прогноза надо строить модель, а не выбирать критерии.


Мне уже легче))) Спасибо!!! А теперь, что значит построить модель?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 14.01.2017 - 16:36
Сообщение #39





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(september_e.yu@mail.ru @ 14.01.2017 - 16:10) *
Мне уже легче))) Спасибо!!! А теперь, что значит построить модель?


Построить модель - это значить состряпать (читай: родить) математическую конструкцию, которая будет получать в качестве аргумента некоторые исходные данные (н-р, набор инструментальных исследований пациента), а выдавать нечто очень похожее на то, что наблюдали черед полгода, год и т. д.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 14.01.2017 - 16:54
Сообщение #40





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(100$ @ 14.01.2017 - 17:36) *
Построить модель - это значить состряпать (читай: родить) математическую конструкцию, которая будет получать в качестве аргумента некоторые исходные данные (н-р, набор инструментальных исследований пациента), а выдавать нечто очень похожее на то, что наблюдали черед полгода, год и т. д.



О, Боги статистики))) как мне эту конструкцию сделать???
Я вроде и стремлюсь найти некоторые исходные данные, которые и составят критерии прогноза . Давайте вернемся к этому wt.gif

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 14.01.2017 - 17:08
Сообщение #41





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(september_e.yu@mail.ru @ 14.01.2017 - 16:54) *
О, Боги статистики))) как мне эту конструкцию сделать???
Я вроде и стремлюсь найти некоторые исходные данные, которые и составят критерии прогноза . Давайте вернемся к этому wt.gif


"Тетенька, дайте водички напиться, а то так есть хочется, аж переночевать негде!" (с) народ.

Модели бывают разные. Все зависит от того, что вы хотите получить на выходе: то ли вероятность того, что после визита к вам пациент выздоровеет/отдаст Богу душу (нужное подчеркнуть, ненужное - зачеркнуть), то ли спрогнозировать численное значение какого-то клинически значимого фактора, али ишшо чего...

Поскольку вы нам пока еще ничего конкретного не сообщили, дальнейшее обсуждение будет с единичной вероятностью происходить по сценарию:

- Петька, приборы?
- Шестьдесят, Василь Иваныч!
- Что шестьдесят?
- А что приборы???

Сообщение отредактировал 100$ - 14.01.2017 - 17:10
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 14.01.2017 - 17:50
Сообщение #42





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



[quote name='100$' date='14.01.2017 - 14:50' post='20845']



"В отношении качественных данных надо проверять гипотезыы о доле с помощью таблиц сопряженности. Вам один только Nokh прочитал такую лекцию, что вопросов уже остаться бы не должно".


В одной из дисс. есть такая табличка

I группа II группа
n=32 n=48

абс./ доля абс. /доля р
Анемия (до 3-х лет) 8 /0,25 10/ 0,21 χ2 =0,027 р=0,870
Перинатальное поражение ЦНС 18/ 0,56 29 /0,60 χ2 =0,019 р=0,889

и.т.д.

Это принципиально указывать в таком формате χ2 =0,027 р=0,870 или достаточно р=0,870.

χ2 -это в хи-квадрат Пирсона.
В моей таб сопряженности кроме хи-квадрата Пирсона есть есть еще поправка на непрерывность. В учебнике Ребровой написано, что применяется если абсолютная частота в клетках таблицы менее 10.
А точный критерий Фишера -если хотя бы в одной ячейке из ожидаемых частот меньше или равно 5.

Т.е. применение критерия Фишера в тексте я однозначно указываю, а нужно ли сам хи-квадрат и поправка на непрерывность, как в приведенном примере

Сообщение отредактировал september_e.yu@mail.ru - 14.01.2017 - 17:52
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
september_e.yu@m...
сообщение 14.01.2017 - 18:00
Сообщение #43





Группа: Пользователи
Сообщений: 26
Регистрация: 2.10.2010
Пользователь №: 22792



Цитата(100$ @ 14.01.2017 - 18:08) *
"Тетенька, дайте водички напиться, а то так есть хочется, аж переночевать негде!" (с) народ.

Модели бывают разные. Все зависит от того, что вы хотите получить на выходе: то ли вероятность того, что после визита к вам пациент выздоровеет/отдаст Богу душу (нужное подчеркнуть, ненужное - зачеркнуть), то ли спрогнозировать численное значение какого-то клинически значимого фактора, али ишшо чего...

Поскольку вы нам пока еще ничего конкретного не сообщили, дальнейшее обсуждение будет с единичной вероятностью происходить по сценарию:

- Петька, приборы?
- Шестьдесят, Василь Иваныч!
- Что шестьдесят?
- А что приборы???


практический выход:
выяснить, что уровень, например, ФНО-альфа у лиц, которые были госпитализированы повторного через 6 месяцев (n=50), еще в их первую госпитализацию был выше, чем у всех 100 исходных человек. И определение именно концентрации ФНО-альфа является критерием возможного обострения заболевания через 6 месяцев.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 14.01.2017 - 18:05
Сообщение #44





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694




Цитата(100$ @ 14.01.2017 - 14:50) *
"В отношении качественных данных надо проверять гипотезыы о доле с помощью таблиц сопряженности. Вам один только Nokh прочитал такую лекцию, что вопросов уже остаться бы не должно".


В одной из дисс. есть такая табличка

I группа II группа
n=32 n=48

абс./ доля абс. /доля р
Анемия (до 3-х лет) 8 /0,25 10/ 0,21 χ2 =0,027 р=0,870
Перинатальное поражение ЦНС 18/ 0,56 29 /0,60 χ2 =0,019 р=0,889

и.т.д.

Это принципиально указывать в таком формате χ2 =0,027 р=0,870 или достаточно р=0,870.

χ2 -это в хи-квадрат Пирсона.
В моей таб сопряженности кроме хи-квадрата Пирсона есть есть еще поправка на непрерывность. В учебнике Ребровой написано, что применяется если абсолютная частота в клетках таблицы менее 10.
А точный критерий Фишера -е

Т.е. применение критерия Фишера в тексте я однозначно указываю, а нужно ли сам хи-квадрат и поправка на непрерывность, как в приведенном примере


Если вы все таблицы сопряженности обрабатываете одинаковым образом, можно где-то ("Материалы и методы исследования") раз и навсегда написать, что "... гипотезу однородности таблиц сопряженности проверяли критерием Хи-квадрат (Пирсона) с поправкой Йейтса, если хотя бы в одной ячейке из ожидаемых частот меньше или равно 5- ТМФ" и тогда достаточно указать только достигаемый уровень значимости критерия. Если же критериев много, тогда следует для конкретной таблицы по тексту указывать применяемый критерий + численное значение + достигаемый уровень значимости. Но это рекомендации нестрогие, просто дьявол кроется в деталях, и по деталям можно понять, человек соображает или его навыки ограничиваются связкой "Ctrl+C" - "Ctrl+V"
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 14.01.2017 - 18:08
Сообщение #45





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(september_e.yu@mail.ru @ 14.01.2017 - 18:00) *
практический выход:
выяснить, что уровень, например, ФНО-альфа у лиц, которые были госпитализированы повторного через 6 месяцев (n=50), еще в их первую госпитализацию был выше, чем у всех 100 исходных человек. И определение именно концентрации ФНО-альфа является критерием возможного обострения заболевания через 6 месяцев.


Цитата
...чем у всех 100 исходных человек


Вы опять за свое? Имейте в виду, сравнить 50 и 100 чел я вам не позволю smile.gif

Цитата
И определение именно концентрации ФНО-альфа является критерием возможного обострения заболевания через 6 месяцев


Может быть. Тут уж вам виднее.

Сообщение отредактировал 100$ - 14.01.2017 - 18:12
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V  < 1 2 3 4 >
Добавить ответ в эту темуОткрыть тему