Рандомизация в программе Statistica - Форум врачей-аспирантов

Рандомизация в программе Statistica

ЛенвГо ошко Просмотр профиля	13.02.2018 - 15:20 Сообщение #16
Группа: Пользователи Сообщений: 5 Регистрация: 10.02.2018 Пользователь №: 30973	Добрый день. Всем спасибо за мнение по вопросу. По-прежнему хочу получить четкий ответ на свой изначальный вопрос. Пожалуйста, кто осведомлен, поделить со мной подробным алгоритмом. Это разовая манипуляция, которую мне нужно совершить в Statistica. Нет времени вникать в нюансы программы.

DoctorStat Просмотр профиля	13.02.2018 - 20:23 Сообщение #17
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(ЛенвГо ошко @ 13.02.2018 - 15:20) По-прежнему хочу получить четкий ответ на свой изначальный вопрос. Если у вас все подопытные кролики одинаковые (возраст, пол и т.д.) и не близкие родственники, то 100% дал правильный совет: все четные номера в списке (упорядоченном по фамилии, имени, отчеству) в одну группу, нечетные - в другую. Просто включи мозги => http://doctorstat.narod.ru

DrgLena

13.02.2018 - 23:16

Сообщение #18

Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573

В программе Statistica тоже есть функция random sampling, data/random sampling

Это как раз путь к нужному месту нужной программы.

В верхнем меню ищите data, нажимаете на эту кнопочку, появляется выбор, сделайте его, random sampling. Сделайте выбор, в появившимся окне. У вас должен быть создан файл с вашими 24 больными, в котором существует номер по порядку, в программе Statistica это можно сделать через функцию V0. По умолчанию программа предлагает выбрать все переменные, согласитесь. Следующий выбор, который вам нужно сделать появится, если вы нажмете кнопочку option. Поменяйте выбор на сalculate ... N. Вернитесь опять в simple sampling , выберите split ... и проставьте N=12. Наконец, можно нажать OK! Но вы получите результат не обязательно такой, какой я вам прицепила, поскольку орлы и орешки только приблизительно выпадают 50:50.

Так вот этот путь вам совершенно не подходит ввиду малочисленности группы. Если бы в моем файле была переменная, например, возраст, можно было бы посмотреть, как он различается в группах сравнения. А потому в программе Statistica заготовлена еще одна кнопочка stratified. Советую освоить этот путь, хотя бы для возраста.

Если занимаетесь научной работой, то нужно именно вникать, как в само понятие рандомизация, так и в различные варианты ее реализации. Если нет времени вникать в нюансы программы, то просто напишите в своем отчете, рандомизация проводилась с использованием программы Statistica, но результат вашего исследования будет для внутреннего употребления.

Эскизы прикрепленных изображений

Ответить с цитированием данного сообщения

DrgLena Просмотр профиля	14.02.2018 - 03:08 Сообщение #19
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Для nokh и других, которые хотят учиться, а не отписываться фразой группы были рандомизированы. Имею собственный опыт ответа рецензенту европейского журнала на два вопросы, укажите метод рандомизации и величину эффекта. Методы рандомизации разные, повторюсь, в программе randomR их 15. Используя самую простую simpe random, получают как раз разные по величине группы (по причине орла и орешка). И чем меньше число наблюдений, тем чаще наблюдается imbalance. В ссылке, таблица 1 и объяснение к ней. Там же утверждается, что при N =>200 вероятность значимого дисбаланса незначительна. Если наблюдений мало, то нужно использовать другие методы рандомизации, среди перечисленных тот самый RAR, который я провела первый раз и выложила код. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3427961/

100$ Просмотр профиля	14.02.2018 - 13:10 Сообщение #20
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Del Сообщение отредактировал 100$ - 16.02.2018 - 14:18

DrgLena Просмотр профиля	14.02.2018 - 14:45 Сообщение #21
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	[attachment=1649:comparison_example.pdf] Цитата(100$ @ 14.02.2018 - 14:10) А теперь-внимание!-вопрос: и что же надо отвечать? Что величина эффекта - Коэновская? Да, Коэн вполне устроил Цитата(100$ @ 14.02.2018 - 14:10) Дьявол-то ведь кроется в деталях. И еще в процедурах. Сообщение отредактировал DrgLena - 17.02.2018 - 21:18 Прикрепленные файлы comparison_example.pdf ( 149,68 килобайт ) Кол-во скачиваний: 349

100$ Просмотр профиля	14.02.2018 - 16:31 Сообщение #22
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Del Сообщение отредактировал 100$ - 16.02.2018 - 14:18

DrgLena Просмотр профиля	14.02.2018 - 21:28 Сообщение #23
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Del Сообщение отредактировал DrgLena - 17.02.2018 - 21:19

100$ Просмотр профиля	14.02.2018 - 23:26 Сообщение #24
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Del Сообщение отредактировал 100$ - 16.02.2018 - 14:18

DrgLena Просмотр профиля	15.02.2018 - 00:00 Сообщение #25
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Del Сообщение отредактировал DrgLena - 17.02.2018 - 21:20

passant Просмотр профиля	15.02.2018 - 13:00 Сообщение #26
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223	Цитата(DrgLena @ 15.02.2018 - 00:00) Предлагаю окончить столь содержательную дискуссию о рандомизации, меланхолия ваша, видимо, заразная. Пересмотрел еще раз тему. Имеем: 24 СЛУЧАЙНО ОТОБРАННЫХ пациентов требуется разбить на две группы СЛУЧАЙНЫМ образом. Всего-то!. И уж сюда и Statistica, и R, и EXCEL в ход пошли. И строго наукообразные методы рандомизаци. Не хватает только Hadoop, Watson и Blockchain. . А делов-то - на 24 бумажках написать фамилии (или номера),перемешать и вытянуть из шапки случайным образом. Между прочим, теоретически - действительно, самое "случайное" из возможных решений. Но нет, ~~свирепый~~ высоконаучный совет-редакция не пропустит. Сообщение отредактировал passant - 15.02.2018 - 14:29

100$ Просмотр профиля	15.02.2018 - 14:40 Сообщение #27
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Del Сообщение отредактировал 100$ - 16.02.2018 - 14:19

nokh Просмотр профиля	15.02.2018 - 14:52 Сообщение #28
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(passant @ 15.02.2018 - 15:00) .... А делов-то - на 24 бумажках написать фамилии (или номера),перемешать и вытянуть из шапки случайным образом. Между прочим, теоретически - действительно, самое "случайное" из возможных решений. Но нет, высоконаучный совет-редакция не пропустит. Раньше вместо всех этих сложных схем обходились одной таблицей случайных чисел, хотя действительно можно и шапкой с бумажками обойтись: Вариант 1. Кладём в шапку 24 фамилии и вытягиваем 12 случайных назначенцев в первую группу, а те что останутся - вторая группа. Это - тот вариант рандомизации (Р), который предложил я и который топикстартер так и не осилил. Вариант 2. Берём 2 шапки (группа 1 и 2) с 24 фамилиями каждая. Достаём сначала фамилию из шапки1 - быть ему в группе 1. Затем достаём из шапки 2 - быть ему в группе 2. Если на очередном шаге оказывается фамилия, по которой решение уже принято - просто пропускаем её и тянем следующую. Получаем вариант с "задвоениями", который тем не менее тоже делит выборку на 2 части случайным образом. Вариант 3. Берём 2 шапки: в одной 24 фамилии, в другой две бумажки: группа 1 и группа 2. Достаём из первой шапки фамилию, а из второй - решение по ней. Получаем вариант "полной" Р, где "случайное назначение" применяется к каждому испытуемому и который сопровождается дисбалансом объёмов выборок. Полагаю, за множеством подходов к Р важно не потерять суть: для чего она нужна. Р нужна, чтобы неконтролируемую исследователем изменчивость случайным образом "размазать" по группам, чтобы вдруг не принять за лечебный или иной эффект совсем другой неконтролиролирумый эффект. Пусть в фаворе вариант 3, но если у нас в выборке есть скрытый больной, то при всех трёх вариантах он имеет равные шансы оказаться в одной из 2х групп, аналогично по другим "вмешивающимся" показателям. И пока я решительно не понимаю, чем вариант 1 или 2 хуже 3. Более того, полная рандомизация с неравным числом участников в группах приведёт к более сильным смещениям интересующих и иных харакеристик. Предположим мы сработали по варианту 3 и получили 20 фамилий в одной группе и 4 - в другой. Если больной окажется в группе из четырёх - он будет в состоянии сильно сместить результат. Если же его "замешать" в большую группу - его эффект будет не столь сильным. Т.е. оптимальным является равное число участников в группах, из теории планирования исследования это давно известно, но вот "теория рандомизации" против. Про латинские и греко-латинские квадраты тогда вообще забыть нужно как "неполиткорректные" антагонисты рандомизации... То, что "полная" и какие-то ещё рандомизации - не панацея, тоже известно. DrgLena предложила наложить на такую Р ограничение - стратификацию по полу. Исходя из биологии это - логично. Но тогда мы будем иметь не случайную в узком смысле слова выборку, а вероятностную стратифицированную выборку. А раз мы уходим от чисто случайных, то почему бы не взять другой вариант вероятностной выборки - ту же механическую, которую выше тоже рекомендовали. Короче, здравый смысл иногда допускает, а иногда просто заставляет накладывать на полную рандомизацию ограничения, но рецензенты будут требовать "рандомизации и мощности" - ну да, этакий модный тренд (своё мнение о рецензентах озвучивал в соседней теме). Но! Учиться хотим и будем ! Поэтому благодарен DrgLen'е за все экзерсисы и ссылки. PS. Перечитал... Шапки, конечно, это по нашему, но контрастирует с дегустирующими чай ледями, омнибусными критериями, сломанными тростями и шнурками от ботфорт... Поэтому автохтонный и аутентичный способ рандомизации - мешать бумажки в циллиндрах там или котелках... Сообщение отредактировал nokh - 15.02.2018 - 16:27

100$ Просмотр профиля	15.02.2018 - 16:44 Сообщение #29
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Del Сообщение отредактировал 100$ - 15.02.2018 - 18:20

DrgLena Просмотр профиля	16.02.2018 - 01:18 Сообщение #30
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Del Сообщение отредактировал DrgLena - 17.02.2018 - 21:20

« Предыдущая тема · Медицинская статистика · Следующая тема »