Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

52 страниц V   1 2 3 > » 

DrgLena
Отправлено: 7.04.2018 - 22:33


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


smile.gif
Прикрепленные файлы
Прикрепленный файл  berry_johnston_mielke.pdf ( 8,12 мегабайт ) Кол-во скачиваний: 12
 
  Форум: Медицинская статистика · Просмотр сообщения: #22894 · Ответов: 17 · Просмотров: 1606

DrgLena
Отправлено: 7.04.2018 - 11:17


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(Cules2013 @ 6.04.2018 - 00:18) *
В процессе работы возник вот такой вот вопрос ?.

А какой работой вы занимаетесь? Вы хотите посчитать свои (не свои) три группы, для статьи, диссертации, причем, судя по вашим вопросам, вы не очень представляете себе, что и зачем вам нужно посчитать, т.е. одноразовая работа. Другой вариант работы ? у вас есть программа (поделитесь, какая, поскольку мне понравились графики разностей с ДИ) и, вы хотите узнать, нажимая на все кнопки, что же она вам выдает. Хотелось бы получить привычные столбики. Или, еще вариант работы ? вы решили изучить статистику и стать статистицианом или уже подвязались на эту работу.
Цитата(Cules2013 @ 7.04.2018 - 08:53) *
DrgLena, если я правильно понял, то я должен обращать внимание на то, пересекают ли ДИ (усы) центральную нулевую отметку или нет. Если не пересекают, то различия достоверны. Если да - то нет. А есть ли какой-то смысл в том, совпадают ли визуально расположение ДИ для каждого сравнения на графике? Т.е., проще говоря, пара А-В лежит слева от нуля, а В-С справа. А если бы они обе лежали бы в левой или правой полуплоскости? Это вообще что-то значит важное?

В курсе арифметики для младших классов это было важно, почему отнимая от меньшего числа большее, появляется знак минус и разница будет слева от нуля.
Цитата(Cules2013 @ 7.04.2018 - 08:53) *
Плав написал, что преимущество графика с ДИ по различиям, а не ДИ для средних/медианы по группам, в том, что даёт избежать ошибки первого рода, т.е. ложнопозитивных результатов там, где различий на самом деле нет. Ладно. Тогда возникает такой вопрос - а что бывает так, что пост-хок тест говорит о достоверности, а на графике видно, что ДИ перекрывает нулевую отметку? Мне кажется, что такое возможно только, если брать пост-хок, что изначально не считает ДИ, типа Ньюмана-Кеулса. А если брать Тьюки, то разве не очевидно, что график, будет идентичен числовым результатам? Я это к вопросу о том, почему такой график считается крутым, если по числовым результатам анализа и так всё ясно? Почему выбирают такой тип визуализации, хотя привычнее и понятнее будут классические "столбики" или "Бокса-Вискера", на результат анализа это же никак не влияет.

Стиль изложения тяжел для восприятия, много слов не по существу. И справьте "Бокса-Вискера".
Есть много критериев и много методов для расчета ДИ и к среднему и к разности средних. Плав на этом форуме приводил свою программку в экселе для расчета ДИ средних различными методами. Достаточно выбрать конкретный стиль работы и ограничиться доказательством либо с помощью критериев, либо приводя ДИ. И то и другое ? я считаю перебором (чтобы толще была работа).
Относительно анализа разностей средних путем сравнения ДИ к этим разностям ? это весьма полезный метод, если нужно сравнить несколько групп по величине различий. Например, один и другой препарат или различные дозировки одного статистически значимо снижают какой- то показатель, но один на 50 единиц, а другой на 30 относительно контроля. Сравнить эффекты нескольких групп посредством сравнения ДИ очень просто и наглядно.
  Форум: Медицинская статистика · Просмотр сообщения: #22888 · Ответов: 12 · Просмотров: 880

DrgLena
Отправлено: 7.04.2018 - 03:10


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(Cules2013 @ 6.04.2018 - 22:20) *
.
В классическом варианте всё понятно - группа А отличается от группы В, В от С, А не отличается от С. Но как сравнивать различия по парам А-В и А-С? Это сравнивать сравнения. Опять тавтология.
Прилагаю сам график. Вот help.gif мне понять на конкретном примере, какие выводы можно сделать из этого графика?

Это значит сравнить не сравнения, а разницу. Средние значения в группе В больше чем в группе А и в группе С на 50 каких то единиц. А между группами А и С нулевая разница. ДИ на рисунке относятся к этой самой разнице. Если ДИ разницы не пересекает нуль, то разница между группами статистически значима.
  Форум: Медицинская статистика · Просмотр сообщения: #22884 · Ответов: 12 · Просмотров: 880

DrgLena
Отправлено: 7.04.2018 - 00:50


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(nokh @ 6.04.2018 - 15:06) *
Такие ДИ получаются одинаковыми по величине, поскольку ошибка комплекса данных едина для всего комплекса.

Не совсем.Чтобы из MS (error), которую выдают программы, получить среднеквадратическую ошибку, нужно извлечь корень, получив SD, а потом разделить на корень из n. Так что ДИ будут одинаковы только в том случае, если число наблюдений на каждом уровне фактора будет одинаковым.
  Форум: Медицинская статистика · Просмотр сообщения: #22883 · Ответов: 12 · Просмотров: 880

DrgLena
Отправлено: 6.04.2018 - 23:56


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(passant @ 6.04.2018 - 11:44) *
А можно пердварительно попросить Вас прояснить, что в? имеете ввиду, .....
Вот сижу и думаю, что-же вы ввиду-то имели? wink.gif

Оказывается, вы имели ввиду ДИ разности smile.gif
А вам тут рассказывают про ДИ средних
  Форум: Медицинская статистика · Просмотр сообщения: #22882 · Ответов: 12 · Просмотров: 880

DrgLena
Отправлено: 21.03.2018 - 11:49


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Вы не поняли. Я разделила на 2 не потому, что у вас было две группы, а чтобы показать, что между двумя числами имеется середина. Любое расчетное число для нового объекта вы сравниваете с этой срединой. Если вы получили расчетное число большее чем 0,423, то объект классифицируется во вторую группу, потому, что оно будет ближе к центроиду второго класса, чем первого.
Если у вас 3 группы, все для вас будет еще сложнее. Центроиды у вас расположены не на линии, а на плоскости и имеют по две координаты (первые две канонические функции), реже больше. Вы можете получить график всех объектов выборки и нанести значения центроидов трех ваших групп. Расстояние между центроидами будут выражаться разностью координат.
Стандартизация - это базовое понятие и стандартная процедура в любом стат пакете.
  Форум: Медицинская статистика · Просмотр сообщения: #22790 · Ответов: 7 · Просмотров: 1026

DrgLena
Отправлено: 14.03.2018 - 00:47


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Именно логика в подаче данных с единых позиций (в данном случае - с позиций порядковой статистики) и должна преобладать над соблазном приводить средние, и не важно, каким образом они получены они остаются параметрами распределения.

Для медицины есть руководство именно о том, как описывать результаты статистического анализа, оно так и называется. Долгое время я использовала первоисточник на английском ( в сети был свободно). How to Report Statistics in Medicine: Annotated Guidelines for Authors, Editors, and Reviewers. Thomas A. Lang and Michelle Secic
Сейчас книга переведена leo_biostat https://www.ozon.ru/context/detail/id/5633322/

Аналогичные рекомендации описания результатов в зависимости от использования методов статистики имеются в книге Наглядная статистика в медицине - Петри А., Сэбин К. - 2003 год .

Оба источника рекомендуют при использовании непараметрических (ранговых критериев) приводить медианы, ДИ медианы и ДИразности медиан. И это вполне логично. Интерпретация медиан не представляет никакой трудности для медиков, гораздо труднее получить и оценить разность медиан (для несвязанных выборок) или медиану разности парных выборок посредством ДИ.
Если нет возможности посчитать ДИ разности медиан можно привести медианы и ДИ к ним в каждой из двух групп (Петри).

SPSS начиная с 18 версии рассчитывает доверительный интервал Ходжеса-Лемана для медианы разности парных выборок и разности медиан двух независимых выборок. Но у меня только 17.

При ассиметричных выборках среднее не характеризует выборку, а потому, медиана и квартили дают представление о данных, а разность медиан или медиана разности характеризует различия.
На форуме уже обсуждался вопрос разности медиан и предлагалась программа Довинт, но там были какие то проблемы. Проблемы были и в понимании или в переводе, они и сейчас есть. Но, за эти 4 года R уверенно рулит.
Предлагаю обсудить, кто что использует для удовлетворения ?руководства?. Особенно интересует мнение leo_biostat и продвинутых в R.
Чтобы не было проблем с переводом, вопрос такой, как получить CI for the difference in medians, а также CI for the median of the differences.

  Форум: Медицинская статистика · Просмотр сообщения: #22763 · Ответов: 2 · Просмотров: 765

DrgLena
Отправлено: 7.03.2018 - 23:51


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(Rebecca @ 7.03.2018 - 11:20) *
ого как много интересного. а зачем эти 5 групп нужны? я новичок-любитель и не всегда понимаю, что к чему)

А, действительно, зачем эти 5 групп нужны?. Какая исследовательская задача стояла при создании этих 5 групп. Нет ли упорядоченности в категории 1 - 5. Например, студенты 1 курса - 5 курса соответствуют 1 - 5 группам. Например, ответ "не знаю" чаще отмечается у первокурсников, а более уверенно отвечают 5- курсники. Если между ответом "да" и "нет" поставить "не знаю", то этот ответ также можно рассматривать как упорядоченную категорию (о, nokh уже добавил эту мысль).

Sanabat, вы задаете вопрос, нужны ли вам попарные сравнения. Но это вопрос к вам. Если вас интересует, чаще ли ответ "не знаю" у первокурсников, чем у пятикурсников, то вы должны провести такое сравнение.

Nokh советует начать с анализа соответствий (Correspondence analysis), с чем я полностью согласна. Метод дает наглядную картину сопряженности признаков, которая хорошо иллюстрируется графически.
Вместо выборочных подтверждений с помощью статистических тестов, я бы рекомендовала посчитать 95% ДИ к долям ( % ) и изобразить их графически.
  Форум: Медицинская статистика · Просмотр сообщения: #22738 · Ответов: 17 · Просмотров: 1606

DrgLena
Отправлено: 1.03.2018 - 00:42


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(tvsova80 @ 27.02.2018 - 18:34) *
Каким образом можно определить порог, от которого отталкиваться?

В каноническом дискриминантном анализе:
Центроид - среднее значение дискримирующей функции в исследуемых группах.
По вашим данным, если вы верно нашли:
Центроид 1 группы -0,547
Центроид 2 группы 1,393
Объект классифицируется в ту группу, к которой ближе расчетное значение функции.
(-0,547+1,393)/2=0,423
Это число и есть граница раздела.

Полезно получить значения центроидов самостоятельно, сохранив значения дискриминирующих функций для каждого объекта выборки и сравнить их средние значения. Не забудьте только о стандартизации исходных переменных и использовании для расчета функций соответствующих коэффициентов. Качество дискриминации ( % ) посмотрите в таблице. Тогда поймете, что не всегда расчетная и реальная принадлежность к группе совпадает.

Но, если вы психолог и работаете с различными тестами, шкалами оценок, то при классификации в два класса, лучше использовать логистическую регрессию. В этом случае вы получите вероятность принадлежности к конкретной группе и можете выделять промежуточные состояния, которые могут представлять интерес в плане коррекции этих состояний.
Эта расчетная вероятность принадлежности к определенной группе может быть полезна также при оценке динамики изменения результатов тестирования (ваш вопрос в другой ветке). Например, вероятность быть успешным спасателем при заключении контракта была 95%, через 5 лет только 65%.
  Форум: Медицинская статистика · Просмотр сообщения: #22707 · Ответов: 7 · Просмотров: 1026

DrgLena
Отправлено: 26.02.2018 - 01:47


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(passant @ 26.02.2018 - 01:49) *
Начнем с представления данных. Если я правильно понял, и ДЛЯ КАЖДОГО БОЛЬНОГО у вас есть информация по состоянию до и после операции, то на самом деле ваши данные немного другие. А именно, представьте, что у вас есть таблица со следующими столбцами:
Пациент (id), Баллы по шкале до операции (БДО), Время ожидания операции (ВО), Баллы по шкале после операции (БПО).

Я думаю, что вы не правильно поняли. Баллов после операции нет. Обе оценки сделаны до операции. Вторая оценка характеризует больного после какого то времени ОЖИДАНИЯ операции. И это написано ясно. Не ясно другое, на каком основании Daria уже делает вывод о том, что ?чем больше ждем, тем хуже состояние пациента?. Это как раз и есть медицинская гипотеза, которую нужно проверить. Скорее всего, это верное утверждение и его требуется, как то статистически подтвердить. Второе утверждение, что ?ухудшение состояния, связанное с длительностью ожидания операции наблюдается независимо от исходного количества баллов?, вряд ли верно с медицинской точки зрения. Какие то исходные состояния медленно прогрессируют, можно откладывать операцию на какое то время, но для исходно более тяжелых больных откладывание операции может приводить к быстрому прогрессированию. Нарастание тяжести состояния вряд ли равномерный прямолинейный процесс. Более полезной было бы решение задачи оценки допустимого времени ожидания, как раз в зависимости от исходного состояния.
  Форум: Медицинская статистика · Просмотр сообщения: #22680 · Ответов: 12 · Просмотров: 894

DrgLena
Отправлено: 19.02.2018 - 09:28


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(ЛенвГо ошко @ 18.02.2018 - 15:09) *
Вы имели в виду, что я сама должна выбрать, какой группе проставить TR, а какой RT?

На сколько я знаю, в программе Statistica, нужно сделать именно так.
В специализированном пакете, о котором я писала выше, рандомизация и присвоение имени группы делается одновременно.

Прикрепленные файлы
Прикрепленный файл  mylist2.xlsx ( 9,55 килобайт ) Кол-во скачиваний: 28
 
  Форум: Медицинская статистика · Просмотр сообщения: #22656 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 18.02.2018 - 04:00


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(ЛенвГо ошко @ 17.02.2018 - 14:20) *
А можно ли еще как-то увязать рандомизацию с последовательностями приема лекарств RT и TR (речь идет об исследовании биоэквивалентности), то есть чтобы программа сразу выдавала, что такой-то номер будет получать лекарства в последовательности TR, а такой-то - в последовательности RT?

Это, конечно можно сделать, но тогда, проводящий рандомизацию будет знать, кто какое лечение получает, т.е. в какой последовательности. Обычно, если медицинское учреждение участвует, как часть, в каком то рандомизированном клиническом исследовании, то его задача ? сбор нужной по протоколу информации по больным и их рандомизация (каждый больной имеет номер). Какое лечение будет в каждой группе ? у вас никто не должен знать, его назначают в центре для одной и другой группы. Ваша задача ? передать результаты в центр, который их и анализирует. Обычно такой центр указывает, какой тип рандомизации и в какой программе вы должны провести.
Но, если это должны сделать вы, и именно в программе Statistica, то создайте переменную вид лечения в обоих файлах и внесите всем пациентам одного файла значения RT, а другого TR. После чего объедините файлы: data/merge/case/?..
Если не справитесь, объедините вручную и также проставьте вид лечения.
Цитата(ЛенвГо ошко @ 17.02.2018 - 14:20) *
Можно ли еще у Вас уточнить: стоит ли ставить во вкладке Options галочку напротив Use Diehard-certified random number generator?

Нет вам точно не надо.
Use Diehard-certified random number generator. Это очень крутой генератор, полная альтернатива шапке smile.gif
В документации к программе указано, когда этот выбор нужно сделать. Этот вид рандомизации обеспечивает ее по стандарту так называемого DIEHARD test (Marsaglia, 1998) для оценки качества набора случайный чисел, там на самом деле целый набор тестов, они описаны.

  Форум: Медицинская статистика · Просмотр сообщения: #22652 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 16.02.2018 - 23:56


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(100$ @ 16.02.2018 - 12:15) *
Как дочитаете дайте знать, я удалю посты.

С трудом дочитала, словарем даже пришлось воспользоваться, поскольку никогда не жила в России и пермским диалектам не обучена, а в моем окружении не используется слово хабалить пришлось посмотреть, что оно означает. Хабалить, гл. значение: поведение мужчины словно он скандальная женщина, часто используется гомосексуалистами для подчеркивания своей ориентации http://teenslang.su/id/18996

Не соглашусь, что это очень тонкий юмор.

Но соглашусь, "неумный", точнее, чем в цитате, а то можно было бы подумать "не очень умный".

Tau'a ore, 100$!
  Форум: Медицинская статистика · Просмотр сообщения: #22650 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 16.02.2018 - 01:18


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Del
  Форум: Медицинская статистика · Просмотр сообщения: #22639 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 15.02.2018 - 00:00


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Del
  Форум: Медицинская статистика · Просмотр сообщения: #22633 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 14.02.2018 - 21:28


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Del
  Форум: Медицинская статистика · Просмотр сообщения: #22631 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 14.02.2018 - 14:45


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


[attachment=1649:comparison_example.pdf]
Цитата(100$ @ 14.02.2018 - 14:10) *
А теперь-внимание!-вопрос: и что же надо отвечать? Что величина эффекта - Коэновская?

Да, Коэн вполне устроил
Цитата(100$ @ 14.02.2018 - 14:10) *
Дьявол-то ведь кроется в деталях.

И еще в процедурах.
Прикрепленные файлы
Прикрепленный файл  comparison_example.pdf ( 149,68 килобайт ) Кол-во скачиваний: 23
 
  Форум: Медицинская статистика · Просмотр сообщения: #22629 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 14.02.2018 - 03:08


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Для nokh и других, которые хотят учиться, а не отписываться фразой группы были рандомизированы. Имею собственный опыт ответа рецензенту европейского журнала на два вопросы, укажите метод рандомизации и величину эффекта.

Методы рандомизации разные, повторюсь, в программе randomR их 15. Используя самую простую simpe random, получают как раз разные по величине группы (по причине орла и орешка). И чем меньше число наблюдений, тем чаще наблюдается imbalance. В ссылке, таблица 1 и объяснение к ней. Там же утверждается, что при N =>200 вероятность значимого дисбаланса незначительна. Если наблюдений мало, то нужно использовать другие методы рандомизации, среди перечисленных тот самый RAR, который я провела первый раз и выложила код.

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3427961/
  Форум: Медицинская статистика · Просмотр сообщения: #22626 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 13.02.2018 - 23:16


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


В программе Statistica тоже есть функция random sampling, data/random sampling

Это как раз путь к нужному месту нужной программы.

В верхнем меню ищите data, нажимаете на эту кнопочку, появляется выбор, сделайте его, random sampling. Сделайте выбор, в появившимся окне. У вас должен быть создан файл с вашими 24 больными, в котором существует номер по порядку, в программе Statistica это можно сделать через функцию V0. По умолчанию программа предлагает выбрать все переменные, согласитесь. Следующий выбор, который вам нужно сделать появится, если вы нажмете кнопочку option. Поменяйте выбор на сalculate ... N. Вернитесь опять в simple sampling , выберите split ... и проставьте N=12. Наконец, можно нажать OK! Но вы получите результат не обязательно такой, какой я вам прицепила, поскольку орлы и орешки только приблизительно выпадают 50:50.

Так вот этот путь вам совершенно не подходит ввиду малочисленности группы. Если бы в моем файле была переменная, например, возраст, можно было бы посмотреть, как он различается в группах сравнения. А потому в программе Statistica заготовлена еще одна кнопочка stratified. Советую освоить этот путь, хотя бы для возраста.

Если занимаетесь научной работой, то нужно именно вникать, как в само понятие рандомизация, так и в различные варианты ее реализации. Если нет времени вникать в нюансы программы, то просто напишите в своем отчете, рандомизация проводилась с использованием программы Statistica, но результат вашего исследования будет для внутреннего употребления.
Эскизы прикрепленных изображений
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #22622 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 13.02.2018 - 07:46


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


http://forum.disser.ru/?showtopic=1215 плав о блочной рандомизации 10 лет назад, а также о том как раньше генерировались случайные числа.
Тут частично объясняется различие в величине групп.

Полная рандомизация (СR), если это математическое понятие, а не какая то фишка для придания авторитета своей публикации в угоду моде, подразумевает разделение на группы подобное подбрасыванию монеты. Давайте подбросим 24 раза, не факт, что будет 12 орлов. Благо есть R и уже рекомендованный современный (2017) пакет randomizeR, в котором реализована и CR (complete randоmization)

> N <-24
> groups <-c("A", "B")
> params <-crPar(N)
> (R <- genSeq(params))
Object of class "rCrSeq"
design = CR
seed = 931821603
N = 24
groups = A B
The sequence M:
1 B A B B B A A A A A ...
> getRandList®
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
[1,] "B" "A" "B" "B" "B" "A" "A" "A" "A" "A" "A" "A" "B" "B"
[,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24]
[1,] "B" "A" "A" "B" "B" "B" "A" "B" "A" "A"
Вот и результат 11:13, в отличие от предыдущей процедуры RAR(random allocation rule), которая выдает равные группы.
Nokh, я опять на родине R, среда располагает к сильному крену в сторону R.
  Форум: Медицинская статистика · Просмотр сообщения: #22617 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 12.02.2018 - 15:07


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Задвоение таки да, проблема, не позволяющая использовать on line ресурсы типа:
https://www.randomizer.org/
https://www.random.org/integers/
Программа Statistica из списка 24 объектов отбирает 12 без задвоений, но после этого нужно руками проставлять этим номерам первую группу, а не попавшим в этот список - вторую группу, не удобно, а если групп 3 все еще труднее. Вариант , описанный nokh также без задвоений, но с элементами ручной работы.
А потому, стоит согласиться с ogurtsov, лучше использовать специальные пакеты, тем более, что редакции некоторых научных журналов задают вопросы о методах радомизации, а в специальных пакетах их реализовано очень много, в randomizeR - 15. Я выполнила RAR (Random Allocation Rule) для этой задачке.
https://cran.r-project.org/web/packages/ran...izeR/index.html

> library (randomizeR)
> N <-24
> K <-2
> groups <-c("A", "B")
> rarPar(N, K, groups=groups)
Object of class "rarPar"
design = RAR
N = 24
groups = A B
> groups <-c("A", "B")
> par <-rarPar(N ,K, groups=groups)
> R <-genSeq(par)
> getRandList®
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
[1,] "A" "A" "B" "A" "A" "B" "A" "B" "A" "A" "B" "A" "B" "B"
[,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24]
[1,] "A" "B" "B" "A" "B" "A" "B" "B" "A" "B"
> saveRand(R, file="D:/R/mylist.doc.csv")

Или просто отчет, там понятней, какому номеру какое лечение.
> This document was generated on Вт фев 13 2018 at 0:03:20 .
The randomizeR package of version 1.4 was used for generating the randomization list with the R version 3.4.3 (2017-11-30) .
Randomization Method: RAR
seed: 967519
N: 24
K: 2
ratio: 1, 1
groups: A, B

Legend:
N := number of included patients
K := number of treatment groups
ratio := allocation ratio of the trial
groups := names for the investigated groups
For specific randomization parameters see the help of the randomizeR package.

"Allocation" "Treatment"
1 "A"
2 "A"
3 "B"
4 "A"
5 "A"
6 "B"
7 "A"
8 "B"
9 "A"
10 "A"
11 "B"
12 "A"
13 "B"
14 "B"
15 "A"
16 "B"
17 "B"
18 "A"
19 "B"
20 "A"
21 "B"
22 "B"
23 "A"
24 "B"
  Форум: Медицинская статистика · Просмотр сообщения: #22611 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 12.02.2018 - 01:19


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Вряд ли рандомизация 24 больных может гарантировать однородность групп из 12 пациентов по всем признакам, которые могут влиять на результат клинического исследования.

В программе Statistica тоже есть функция random sampling, data/random sampling

а также https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3942596/
  Форум: Медицинская статистика · Просмотр сообщения: #22609 · Ответов: 35 · Просмотров: 4712

DrgLena
Отправлено: 11.02.2018 - 02:24


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(scholar @ 9.02.2018 - 19:18) *
Прошу простить, что вопрос немного не медицинский.

Да, похоже на продажи. Сильная зависимости от дня недели, это нужно учесть. Это можно делать различными путями. Для суббот и воскресений - совершенно различные линии регрессии. Можно учесть ранг дня недели, например Rang=1,2,3,4,5,6,7 cоответствует дням недели от мин до мах, а именно 7,1,3,4,4,2,5,6 (дни недели с понедельника 1 до 7 ?воскресенье.
Тогда будет:
b Std.Err. - of b t(27) p-value
Intercept -19,6908 21,15699 -0,93070 0,360258
rang 59,6602 3,65482 16,32370 0,000000
Var3 1,9956 0,87900 2,27033 0,031381


R2=0,91

Удалить pdf не могу, он вставляется какой то обрезанный sad.gif
Эскизы прикрепленных изображений
Прикрепленное изображение
 

Прикрепленные файлы
Прикрепленный файл  Graph.pdf ( 44,2 килобайт ) Кол-во скачиваний: 18
 
  Форум: Медицинская статистика · Просмотр сообщения: #22596 · Ответов: 22 · Просмотров: 1662

DrgLena
Отправлено: 9.02.2018 - 10:57


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


Цитата(leo_biostat @ 9.02.2018 - 09:36) *
И такие вопросы возникают по одной простой причине: недостаточное владение теорией обсуждаемого классического метода анализа.

Да, дисперсионный анализ ? старый классический метод и условия его применимости указаны в учебниках. 4 года назад, в дискуссии на этом форуме, которую упоминает leo_biostat, действительно, были представлены некоторые источники, отражающие обе точки зрения. Но ни в той дискуссии, ни в этой ветке, нет мнения leo_biostat (профессионального статистика, коим я не являюсь). Соглашусь, что полезно и очень увлекательно на стадии обучения руками считать простые примерчики и сравнивать с работой программ. Сама когда то считала пример по ДА из Афифи и Эйзен руками и в программе Statgraphics под dos.

Но жизнь продолжается и, сегодня я активно использую ANOVA , реже MANOVA и при этом заморачиваюсь только анализом остатков. Документация к пакетам SAS, SPSS и R для меня достаточно надежные источники.
Дисперсионный анализ представляет собой частный случай обобщенной линейной модели, как и регрессионный анализ. Оба входят в модуль GLM и даже в программе Statistica дается возможность анализа residuals. Ну, а для MANOVA ? в SPSS.

Приведу некоторые источники, которые кому то станут полезными, а кто то продолжит проверять нормальность в группах из трех мышек множеством критериев.
http://data.library.virginia.edu/normality-assumption/
http://r-analytics.blogspot.co.nz/2013/05/...ml#.Wnz3V3aYPDd
https://onlinecourses.science.psu.edu/stat461/node/49
https://www.theanalysisfactor.com/checking-...ty-anova-model/
http://www.itl.nist.gov/div898/handbook/pr...tion2/pri24.htm

  Форум: Медицинская статистика · Просмотр сообщения: #22583 · Ответов: 22 · Просмотров: 2775

DrgLena
Отправлено: 9.02.2018 - 10:44


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573


cules2013, я не просто из любопытства, спросила, что вы изучаете и есть ли повторные измерения, поскольку вы в динамике изучаете и саму депрессию и ее на фоне препаратов. Так что не все так просто, зря вы отмахнулись от MANOVA с повторными измерениями. Тест, который вы используете, дает несколько переменных (разные модификации) в основе которых измерение времени в секундах. Все составляющие тест переменные, скорее всего коррелируют между собой, если они про одно и то же, а может про разное, я не знаток. Наверное, все хотят эти самые секунды увидеть, чтобы можно было сопоставлять результаты различных исследований. MANOVA как раз и ответит на вопрос, как каждый препарат влияет на динамику каждого элемента вашего теста.

Любопытный тест, однако https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4401172/

  Форум: Медицинская статистика · Просмотр сообщения: #22582 · Ответов: 22 · Просмотров: 2775

52 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена