Рандомизация в программе Statistica |
Здравствуйте, гость ( Вход | Регистрация )
Рандомизация в программе Statistica |
13.02.2018 - 15:20
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 10.02.2018 Пользователь №: 30973 |
Добрый день. Всем спасибо за мнение по вопросу. По-прежнему хочу получить четкий ответ на свой изначальный вопрос. Пожалуйста, кто осведомлен, поделить со мной подробным алгоритмом. Это разовая манипуляция, которую мне нужно совершить в Statistica. Нет времени вникать в нюансы программы.
|
|
13.02.2018 - 20:23
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
По-прежнему хочу получить четкий ответ на свой изначальный вопрос. Если у вас все подопытные кролики одинаковые (возраст, пол и т.д.) и не близкие родственники, то 100% дал правильный совет: все четные номера в списке (упорядоченном по фамилии, имени, отчеству) в одну группу, нечетные - в другую. Просто включи мозги => http://doctorstat.narod.ru
|
|
13.02.2018 - 23:16
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
В программе Statistica тоже есть функция random sampling, data/random sampling
Это как раз путь к нужному месту нужной программы. В верхнем меню ищите data, нажимаете на эту кнопочку, появляется выбор, сделайте его, random sampling. Сделайте выбор, в появившимся окне. У вас должен быть создан файл с вашими 24 больными, в котором существует номер по порядку, в программе Statistica это можно сделать через функцию V0. По умолчанию программа предлагает выбрать все переменные, согласитесь. Следующий выбор, который вам нужно сделать появится, если вы нажмете кнопочку option. Поменяйте выбор на сalculate ... N. Вернитесь опять в simple sampling , выберите split ... и проставьте N=12. Наконец, можно нажать OK! Но вы получите результат не обязательно такой, какой я вам прицепила, поскольку орлы и орешки только приблизительно выпадают 50:50. Так вот этот путь вам совершенно не подходит ввиду малочисленности группы. Если бы в моем файле была переменная, например, возраст, можно было бы посмотреть, как он различается в группах сравнения. А потому в программе Statistica заготовлена еще одна кнопочка stratified. Советую освоить этот путь, хотя бы для возраста. Если занимаетесь научной работой, то нужно именно вникать, как в само понятие рандомизация, так и в различные варианты ее реализации. Если нет времени вникать в нюансы программы, то просто напишите в своем отчете, рандомизация проводилась с использованием программы Statistica, но результат вашего исследования будет для внутреннего употребления. |
|
14.02.2018 - 03:08
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Для nokh и других, которые хотят учиться, а не отписываться фразой группы были рандомизированы. Имею собственный опыт ответа рецензенту европейского журнала на два вопросы, укажите метод рандомизации и величину эффекта.
Методы рандомизации разные, повторюсь, в программе randomR их 15. Используя самую простую simpe random, получают как раз разные по величине группы (по причине орла и орешка). И чем меньше число наблюдений, тем чаще наблюдается imbalance. В ссылке, таблица 1 и объяснение к ней. Там же утверждается, что при N =>200 вероятность значимого дисбаланса незначительна. Если наблюдений мало, то нужно использовать другие методы рандомизации, среди перечисленных тот самый RAR, который я провела первый раз и выложила код. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3427961/ |
|
14.02.2018 - 13:10
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Del
Сообщение отредактировал 100$ - 16.02.2018 - 14:18 |
|
14.02.2018 - 14:45
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
[attachment=1649:comparison_example.pdf]
А теперь-внимание!-вопрос: и что же надо отвечать? Что величина эффекта - Коэновская? Да, Коэн вполне устроил Дьявол-то ведь кроется в деталях. И еще в процедурах. Сообщение отредактировал DrgLena - 17.02.2018 - 21:18
Прикрепленные файлы
|
|
14.02.2018 - 16:31
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Del
Сообщение отредактировал 100$ - 16.02.2018 - 14:18 |
|
14.02.2018 - 21:28
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Del
Сообщение отредактировал DrgLena - 17.02.2018 - 21:19 |
|
14.02.2018 - 23:26
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Del
Сообщение отредактировал 100$ - 16.02.2018 - 14:18 |
|
15.02.2018 - 00:00
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Del
Сообщение отредактировал DrgLena - 17.02.2018 - 21:20 |
|
15.02.2018 - 13:00
Сообщение
#26
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Предлагаю окончить столь содержательную дискуссию о рандомизации, меланхолия ваша, видимо, заразная. Пересмотрел еще раз тему. Имеем: 24 СЛУЧАЙНО ОТОБРАННЫХ пациентов требуется разбить на две группы СЛУЧАЙНЫМ образом. Всего-то!. И уж сюда и Statistica, и R, и EXCEL в ход пошли. И строго наукообразные методы рандомизаци. Не хватает только Hadoop, Watson и Blockchain. . А делов-то - на 24 бумажках написать фамилии (или номера),перемешать и вытянуть из шапки случайным образом. Между прочим, теоретически - действительно, самое "случайное" из возможных решений. Но нет, Сообщение отредактировал passant - 15.02.2018 - 14:29 |
|
15.02.2018 - 14:40
Сообщение
#27
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Del
Сообщение отредактировал 100$ - 16.02.2018 - 14:19 |
|
15.02.2018 - 14:52
Сообщение
#28
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
.... А делов-то - на 24 бумажках написать фамилии (или номера),перемешать и вытянуть из шапки случайным образом. Между прочим, теоретически - действительно, самое "случайное" из возможных решений. Но нет, высоконаучный совет-редакция не пропустит. Раньше вместо всех этих сложных схем обходились одной таблицей случайных чисел, хотя действительно можно и шапкой с бумажками обойтись: Вариант 1. Кладём в шапку 24 фамилии и вытягиваем 12 случайных назначенцев в первую группу, а те что останутся - вторая группа. Это - тот вариант рандомизации (Р), который предложил я и который топикстартер так и не осилил. Вариант 2. Берём 2 шапки (группа 1 и 2) с 24 фамилиями каждая. Достаём сначала фамилию из шапки1 - быть ему в группе 1. Затем достаём из шапки 2 - быть ему в группе 2. Если на очередном шаге оказывается фамилия, по которой решение уже принято - просто пропускаем её и тянем следующую. Получаем вариант с "задвоениями", который тем не менее тоже делит выборку на 2 части случайным образом. Вариант 3. Берём 2 шапки: в одной 24 фамилии, в другой две бумажки: группа 1 и группа 2. Достаём из первой шапки фамилию, а из второй - решение по ней. Получаем вариант "полной" Р, где "случайное назначение" применяется к каждому испытуемому и который сопровождается дисбалансом объёмов выборок. Полагаю, за множеством подходов к Р важно не потерять суть: для чего она нужна. Р нужна, чтобы неконтролируемую исследователем изменчивость случайным образом "размазать" по группам, чтобы вдруг не принять за лечебный или иной эффект совсем другой неконтролиролирумый эффект. Пусть в фаворе вариант 3, но если у нас в выборке есть скрытый больной, то при всех трёх вариантах он имеет равные шансы оказаться в одной из 2х групп, аналогично по другим "вмешивающимся" показателям. И пока я решительно не понимаю, чем вариант 1 или 2 хуже 3. Более того, полная рандомизация с неравным числом участников в группах приведёт к более сильным смещениям интересующих и иных харакеристик. Предположим мы сработали по варианту 3 и получили 20 фамилий в одной группе и 4 - в другой. Если больной окажется в группе из четырёх - он будет в состоянии сильно сместить результат. Если же его "замешать" в большую группу - его эффект будет не столь сильным. Т.е. оптимальным является равное число участников в группах, из теории планирования исследования это давно известно, но вот "теория рандомизации" против. Про латинские и греко-латинские квадраты тогда вообще забыть нужно как "неполиткорректные" антагонисты рандомизации... То, что "полная" и какие-то ещё рандомизации - не панацея, тоже известно. DrgLena предложила наложить на такую Р ограничение - стратификацию по полу. Исходя из биологии это - логично. Но тогда мы будем иметь не случайную в узком смысле слова выборку, а вероятностную стратифицированную выборку. А раз мы уходим от чисто случайных, то почему бы не взять другой вариант вероятностной выборки - ту же механическую, которую выше тоже рекомендовали. Короче, здравый смысл иногда допускает, а иногда просто заставляет накладывать на полную рандомизацию ограничения, но рецензенты будут требовать "рандомизации и мощности" - ну да, этакий модный тренд (своё мнение о рецензентах озвучивал в соседней теме). Но! Учиться хотим и будем ! Поэтому благодарен DrgLen'е за все экзерсисы и ссылки. PS. Перечитал... Шапки, конечно, это по нашему, но контрастирует с дегустирующими чай ледями, омнибусными критериями, сломанными тростями и шнурками от ботфорт... Поэтому автохтонный и аутентичный способ рандомизации - мешать бумажки в циллиндрах там или котелках... Сообщение отредактировал nokh - 15.02.2018 - 16:27 |
|
15.02.2018 - 16:44
Сообщение
#29
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Del
Сообщение отредактировал 100$ - 15.02.2018 - 18:20 |
|
16.02.2018 - 01:18
Сообщение
#30
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Del
Сообщение отредактировал DrgLena - 17.02.2018 - 21:20 |
|