Доклиника, распределение не нормально. Выборка? - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Доклиника, распределение не нормально. Выборка?, _помогите посчитать выборку_

himik Просмотр профиля	29.04.2014 - 18:29 Сообщение #1
Группа: Пользователи Сообщений: 15 Регистрация: 29.04.2014 Пользователь №: 26382	День добрый. Планируем делать доклинику. Пилот не делали, но из литературы знаем, что распределение ненормально. Подскажите, пожалуйста, как рассчитать выборку для сравнения препаратов. Нулевых гипотез 2 вида: а) препарат А лучше препарата Б, б) препарат А не хуже препарата В. Буду благодарен за помощь.

Открыть тему

Ответов

himik Просмотр профиля	1.05.2014 - 03:29 Сообщение #2
Группа: Пользователи Сообщений: 15 Регистрация: 29.04.2014 Пользователь №: 26382	1) "Лучше" в нашем случае означает, что вещество статистически значимо (p<0,05) увеличивает латентное время в одном из физиологических тестов. 2) В литературе конкретно не приводятся экспериментальные точки, а только медианы и стандартные отклонения. Однако учитывая, что расчёт статистики идёт по Краскелу-Уоллису, а также то, что коэффициент вариации немаленький, сделано соответствующее предположение о распределении, отличном от нормального. Речь идёт о распределении латентных времён. Сообщение отредактировал himik - 1.05.2014 - 03:49

nokh Просмотр профиля	1.05.2014 - 12:25 Сообщение #3
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(himik @ 1.05.2014 - 06:29) 1) "Лучше" в нашем случае означает, что вещество статистически значимо (p<0,05) увеличивает латентное время в одном из физиологических тестов. 2) В литературе конкретно не приводятся экспериментальные точки, а только медианы и стандартные отклонения. Однако учитывая, что расчёт статистики идёт по Краскелу-Уоллису, а также то, что коэффициент вариации немаленький, сделано соответствующее предположение о распределении, отличном от нормального. Речь идёт о распределении латентных времён. Очень похвально, что вы пытаетесь грамотно подойти к планированию эксперимента, а не как обычно у нас... И в случае приблизительно нормального распределения данных всё было бы замечательно: есть и онлайновые калькуляторы, и программы, и коды для среды R. В случае пилотных данных - ещё лучше: могли бы считать по предварительно преобразованным (например, логарифмированием) данным. Но вот погуглил я на предмет чисто теоретического планирования для ненормально распределённых данных и остался недоволен. По-сути, все что предлагается - это использование величины относительной асимптотической эффективности критериев (asymptotic relative efficiency, ARE) для коррекции результатов, вычисленных в предположении нормального распределения данных. Например, для ранговых критериев Манна-Уитни и Краскела-Уоллиса эта величина составляет около 3/пи=0,955, но не меньше 0,864 и объём выборки нужно соответственно увеличить в 1/0,955 или 1/0,864 раза, по сравнению с тем, что требовалось бы для t-критерия Стьюдента при нормальном распределении показателей. Т.о. это просто некий штраф за отклонение распределения от нормального. Скачал даже бесплатную программку для подобных расчётов: http://www.gpower.hhu.de/ . Но и там, для критерия Уилкоксона-Манна-Уитни: во-первых, аппроксимация самой статистики U-критерия t-распределением, а во-вторых - ARE. Чем это плохо? Распределение любых показателей, как-то связанных со временем скорее логарифмически нормальное, чем нормальное. Такие распределения поджаты слева, но имеют хвосты в правой части, т.е. демонстрируют положительную асимметрию. В результате среднее значение, как мера центральной тенденции, по стабильности заметно уступает медиане: добавление даже одного значения в хвост распределения сильно сдвигает среднее вправо. Стандартное же отклонение теряет свою геометрическую интерпретацию и становится просто абстрактной расчётной величиной. Когда мы работаем с такими данными на практике, то используем либо преобразование из семейства степенных (например, логарифмическое, квадратного корня, Бокса-Кокса) и считаем параметрикой, либо используем преобразование к рангам и считаем ранговой непараметрикой. Оба способа поджимают длинные хвосты справа делают распределения симметричнее + уменьшают меру рассеяния данных относительно центра. Однако закладывая стандартное отклонение асимметричного распределения в расчёт объема выборки, мы никак не учитываем такую процедуру "поджатия хвоста" В результате, чем сильнее данные отклоняются от нормального распределения по асимметрии, тем более завышенным получится рассчитанный объём выборки. За неимением лучшего, я бы всё-таки посчитал что предлагают калькуляторы, но относился бы к полученной величине как к сильно завышенной границе разумности (возможно в разы!!! ); ARE не учитывал бы (ARE=1). Можете посчитать в G*Power или попробуйте онлайновые калькуляторы в разделе Power, Sample Size and Experimental Design Calculations этого ресурса: http://statpages.org/ По ссылкам оттуда можно выйти, например, на такой: http://powerandsamplesize.com/Calculators/Compare-2-Means/2-Sample-Non-Inferiority-or-Superiority (замечательный ресурс с формулами, ссылками и даже кодом на R).

himik Просмотр профиля	1.05.2014 - 13:11 Сообщение #4
Группа: Пользователи Сообщений: 15 Регистрация: 29.04.2014 Пользователь №: 26382	2 nokh Спасибо на добром слове. Просто если не подойти статистически грамотно, гипотезы доказать будет очень сложно :-). А нам это очень важно. Мы тоже озабочены проблемой не очень хорошо разработанных для не нормальных распределений расчётов. Как действовать в случае нормальных распределений, нам понятно :-). Увы, не наш случай. Что касается сведения к нормальному (путём логарифмирования), то этот вариант нами тоже просматривался. Спасибо за помощь! Если всё сложится, попробую не забыть рассказать, что получилось. Сообщение отредактировал himik - 1.05.2014 - 13:11

p2004r Просмотр профиля	1.05.2014 - 13:20 Сообщение #5
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(himik @ 1.05.2014 - 13:11) 2 nokh Спасибо на добром слове. Просто если не подойти статистически грамотно, гипотезы доказать будет очень сложно :-). А нам это очень важно. Мы тоже озабочены проблемой не очень хорошо разработанных для не нормальных распределений расчётов. Как действовать в случае нормальных распределений, нам понятно :-). Увы, не наш случай. Что касается сведения к нормальному (путём логарифмирования), то этот вариант нами тоже просматривался. Спасибо за помощь! Если всё сложится, попробую не забыть рассказать, что получилось. А что не понравилось в моем способе? http://r-statistics.livejournal.com/

himik Просмотр профиля	1.05.2014 - 13:26 Сообщение #6
Группа: Пользователи Сообщений: 15 Регистрация: 29.04.2014 Пользователь №: 26382	Цитата(p2004r @ 1.05.2014 - 14:20) А что не понравилось в моем способе? Ничего не не понравилось.

p2004r Просмотр профиля	1.05.2014 - 13:30 Сообщение #7
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(himik @ 1.05.2014 - 13:26) Ничего не не понравилось. Тогда давайте точное значение из статьи медианы, среднеквадратичного, к.в. и "что там еще есть" Подставим и зафитим (если не этим распределением, так придуманным другим подходящим)? http://r-statistics.livejournal.com/

Сообщений в этой теме

himik Доклиника, распределение не нормально. Выборка? 29.04.2014 - 18:29

p2004r Цитата(himik @ 29.04.2014 - 18:29) Д... 30.04.2014 - 22:50

himik 1) "Лучше" в нашем случае означает, что ... 1.05.2014 - 03:29

nokh Цитата(himik @ 1.05.2014 - 06:29) 1)... 1.05.2014 - 12:25

himik 2 nokh Спасибо на добром слове. Просто если не по... 1.05.2014 - 13:11

p2004r Цитата(himik @ 1.05.2014 - 13:11) 2 ... 1.05.2014 - 13:20

himik Цитата(p2004r @ 1.05.2014 - 14:20) А... 1.05.2014 - 13:26

p2004r Цитата(himik @ 1.05.2014 - 13:26) Ни... 1.05.2014 - 13:30

himik Цитата(p2004r @ 1.05.2014 - 14:30) Т... 1.05.2014 - 13:51

p2004r Цитата(himik @ 1.05.2014 - 13:51) Не... 1.05.2014 - 14:07

p2004r Цитата(himik @ 1.05.2014 - 03:29) 1)... 1.05.2014 - 12:33

himik 2 p2004r Спасибо! Будем пробовать. P.S. Нарыл... 1.05.2014 - 13:25

p2004r Цитата(himik @ 1.05.2014 - 13:25) 2 ... 1.05.2014 - 13:36

himik Цитата(p2004r @ 1.05.2014 - 14:36) Т... 1.05.2014 - 13:55

himik Хотелось бы продолжить получение консультации, есл... 16.05.2014 - 18:52

p2004r Цитата(himik @ 16.05.2014 - 18:52) Х... 16.05.2014 - 21:30

himik Ок. Спасибо за поддержку. В архиве: 1) лист с исхо... 17.05.2014 - 03:22

p2004r Цитата(himik @ 17.05.2014 - 03:22) О... 19.05.2014 - 17:43

himik Цитата(p2004r @ 19.05.2014 - 18:43) ... 19.05.2014 - 18:16

p2004r Цитата(himik @ 19.05.2014 - 18:16) Т... 19.05.2014 - 19:34

himik Цитата(p2004r @ 19.05.2014 - 20:34) ... 19.05.2014 - 19:53

p2004r Цитата(himik @ 19.05.2014 - 19:53) С... 19.05.2014 - 21:12

himik А почему вы выбрали именно это распределение? 19.05.2014 - 18:26

p2004r Цитата(himik @ 19.05.2014 - 18:26) А... 19.05.2014 - 19:36

himik Цитата(p2004r @ 19.05.2014 - 20:36) ... 19.05.2014 - 19:54

p2004r Цитата(himik @ 19.05.2014 - 19:54) Н... 19.05.2014 - 20:17

himik Здравствуйте, это снова я. Хотелось бы спросить в... 17.06.2014 - 04:27

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2026 IPS, Inc.