Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Доклиника, распределение не нормально. Выборка?, _помогите посчитать выборку_
himik
сообщение 29.04.2014 - 18:29
Сообщение #1





Группа: Пользователи
Сообщений: 15
Регистрация: 29.04.2014
Пользователь №: 26382



День добрый.

Планируем делать доклинику. Пилот не делали, но из литературы знаем, что распределение ненормально. Подскажите, пожалуйста, как рассчитать выборку для сравнения препаратов. Нулевых гипотез 2 вида: а) препарат А лучше препарата Б, б) препарат А не хуже препарата В.

Буду благодарен за помощь.


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
himik
сообщение 1.05.2014 - 03:29
Сообщение #2





Группа: Пользователи
Сообщений: 15
Регистрация: 29.04.2014
Пользователь №: 26382



1) "Лучше" в нашем случае означает, что вещество статистически значимо (p<0,05) увеличивает латентное время в одном из физиологических тестов.
2) В литературе конкретно не приводятся экспериментальные точки, а только медианы и стандартные отклонения. Однако учитывая, что расчёт статистики идёт по Краскелу-Уоллису, а также то, что коэффициент вариации немаленький, сделано соответствующее предположение о распределении, отличном от нормального. Речь идёт о распределении латентных времён.

Сообщение отредактировал himik - 1.05.2014 - 03:49
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 1.05.2014 - 12:25
Сообщение #3





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(himik @ 1.05.2014 - 06:29) *
1) "Лучше" в нашем случае означает, что вещество статистически значимо (p<0,05) увеличивает латентное время в одном из физиологических тестов.
2) В литературе конкретно не приводятся экспериментальные точки, а только медианы и стандартные отклонения. Однако учитывая, что расчёт статистики идёт по Краскелу-Уоллису, а также то, что коэффициент вариации немаленький, сделано соответствующее предположение о распределении, отличном от нормального. Речь идёт о распределении латентных времён.

Очень похвально, что вы пытаетесь грамотно подойти к планированию эксперимента, а не как обычно у нас... И в случае приблизительно нормального распределения данных всё было бы замечательно: есть и онлайновые калькуляторы, и программы, и коды для среды R. В случае пилотных данных - ещё лучше: могли бы считать по предварительно преобразованным (например, логарифмированием) данным. Но вот погуглил я на предмет чисто теоретического планирования для ненормально распределённых данных и остался недоволен. По-сути, все что предлагается - это использование величины относительной асимптотической эффективности критериев (asymptotic relative efficiency, ARE) для коррекции результатов, вычисленных в предположении нормального распределения данных. Например, для ранговых критериев Манна-Уитни и Краскела-Уоллиса эта величина составляет около 3/пи=0,955, но не меньше 0,864 и объём выборки нужно соответственно увеличить в 1/0,955 или 1/0,864 раза, по сравнению с тем, что требовалось бы для t-критерия Стьюдента при нормальном распределении показателей. Т.о. это просто некий штраф за отклонение распределения от нормального. Скачал даже бесплатную программку для подобных расчётов: http://www.gpower.hhu.de/ . Но и там, для критерия Уилкоксона-Манна-Уитни: во-первых, аппроксимация самой статистики U-критерия t-распределением, а во-вторых - ARE.
Чем это плохо?

Распределение любых показателей, как-то связанных со временем скорее логарифмически нормальное, чем нормальное. Такие распределения поджаты слева, но имеют хвосты в правой части, т.е. демонстрируют положительную асимметрию. В результате среднее значение, как мера центральной тенденции, по стабильности заметно уступает медиане: добавление даже одного значения в хвост распределения сильно сдвигает среднее вправо. Стандартное же отклонение теряет свою геометрическую интерпретацию и становится просто абстрактной расчётной величиной. Когда мы работаем с такими данными на практике, то используем либо преобразование из семейства степенных (например, логарифмическое, квадратного корня, Бокса-Кокса) и считаем параметрикой, либо используем преобразование к рангам и считаем ранговой непараметрикой. Оба способа поджимают длинные хвосты справа делают распределения симметричнее + уменьшают меру рассеяния данных относительно центра. Однако закладывая стандартное отклонение асимметричного распределения в расчёт объема выборки, мы никак не учитываем такую процедуру "поджатия хвоста" smile.gif В результате, чем сильнее данные отклоняются от нормального распределения по асимметрии, тем более завышенным получится рассчитанный объём выборки.

За неимением лучшего, я бы всё-таки посчитал что предлагают калькуляторы, но относился бы к полученной величине как к сильно завышенной границе разумности (возможно в разы!!! eek.gif ); ARE не учитывал бы (ARE=1). Можете посчитать в G*Power или попробуйте онлайновые калькуляторы в разделе Power, Sample Size and Experimental Design Calculations этого ресурса: http://statpages.org/ По ссылкам оттуда можно выйти, например, на такой: http://powerandsamplesize.com/Calculators/Compare-2-Means/2-Sample-Non-Inferiority-or-Superiority (замечательный ресурс с формулами, ссылками и даже кодом на R).



Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
himik
сообщение 1.05.2014 - 13:11
Сообщение #4





Группа: Пользователи
Сообщений: 15
Регистрация: 29.04.2014
Пользователь №: 26382



2 nokh

Спасибо на добром слове. Просто если не подойти статистически грамотно, гипотезы доказать будет очень сложно :-). А нам это очень важно.
Мы тоже озабочены проблемой не очень хорошо разработанных для не нормальных распределений расчётов. Как действовать в случае нормальных распределений, нам понятно :-). Увы, не наш случай.

Что касается сведения к нормальному (путём логарифмирования), то этот вариант нами тоже просматривался.

Спасибо за помощь! Если всё сложится, попробую не забыть рассказать, что получилось.

Сообщение отредактировал himik - 1.05.2014 - 13:11
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 1.05.2014 - 13:20
Сообщение #5





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(himik @ 1.05.2014 - 13:11) *
2 nokh

Спасибо на добром слове. Просто если не подойти статистически грамотно, гипотезы доказать будет очень сложно :-). А нам это очень важно.
Мы тоже озабочены проблемой не очень хорошо разработанных для не нормальных распределений расчётов. Как действовать в случае нормальных распределений, нам понятно :-). Увы, не наш случай.

Что касается сведения к нормальному (путём логарифмирования), то этот вариант нами тоже просматривался.

Спасибо за помощь! Если всё сложится, попробую не забыть рассказать, что получилось.


А что не понравилось в моем способе?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
himik
сообщение 1.05.2014 - 13:26
Сообщение #6





Группа: Пользователи
Сообщений: 15
Регистрация: 29.04.2014
Пользователь №: 26382



Цитата(p2004r @ 1.05.2014 - 14:20) *
А что не понравилось в моем способе?


Ничего не не понравилось. smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 1.05.2014 - 13:30
Сообщение #7





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(himik @ 1.05.2014 - 13:26) *
Ничего не не понравилось. smile.gif


Тогда давайте точное значение из статьи медианы, среднеквадратичного, к.в. и "что там еще есть" smile.gif

Подставим и зафитим (если не этим распределением, так придуманным другим подходящим)?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- himik   Доклиника, распределение не нормально. Выборка?   29.04.2014 - 18:29
- - p2004r   Цитата(himik @ 29.04.2014 - 18:29) Д...   30.04.2014 - 22:50
- - himik   1) "Лучше" в нашем случае означает, что ...   1.05.2014 - 03:29
|- - nokh   Цитата(himik @ 1.05.2014 - 06:29) 1)...   1.05.2014 - 12:25
||- - himik   2 nokh Спасибо на добром слове. Просто если не по...   1.05.2014 - 13:11
||- - p2004r   Цитата(himik @ 1.05.2014 - 13:11) 2 ...   1.05.2014 - 13:20
||- - himik   Цитата(p2004r @ 1.05.2014 - 14:20) А...   1.05.2014 - 13:26
||- - p2004r   Цитата(himik @ 1.05.2014 - 13:26) Ни...   1.05.2014 - 13:30
||- - himik   Цитата(p2004r @ 1.05.2014 - 14:30) Т...   1.05.2014 - 13:51
||- - p2004r   Цитата(himik @ 1.05.2014 - 13:51) Не...   1.05.2014 - 14:07
|- - p2004r   Цитата(himik @ 1.05.2014 - 03:29) 1)...   1.05.2014 - 12:33
- - himik   2 p2004r Спасибо! Будем пробовать. P.S. Нарыл...   1.05.2014 - 13:25
|- - p2004r   Цитата(himik @ 1.05.2014 - 13:25) 2 ...   1.05.2014 - 13:36
|- - himik   Цитата(p2004r @ 1.05.2014 - 14:36) Т...   1.05.2014 - 13:55
- - himik   Хотелось бы продолжить получение консультации, есл...   16.05.2014 - 18:52
|- - p2004r   Цитата(himik @ 16.05.2014 - 18:52) Х...   16.05.2014 - 21:30
- - himik   Ок. Спасибо за поддержку. В архиве: 1) лист с исхо...   17.05.2014 - 03:22
|- - p2004r   Цитата(himik @ 17.05.2014 - 03:22) О...   19.05.2014 - 17:43
|- - himik   Цитата(p2004r @ 19.05.2014 - 18:43) ...   19.05.2014 - 18:16
|- - p2004r   Цитата(himik @ 19.05.2014 - 18:16) Т...   19.05.2014 - 19:34
|- - himik   Цитата(p2004r @ 19.05.2014 - 20:34) ...   19.05.2014 - 19:53
|- - p2004r   Цитата(himik @ 19.05.2014 - 19:53) С...   19.05.2014 - 21:12
- - himik   А почему вы выбрали именно это распределение?   19.05.2014 - 18:26
|- - p2004r   Цитата(himik @ 19.05.2014 - 18:26) А...   19.05.2014 - 19:36
|- - himik   Цитата(p2004r @ 19.05.2014 - 20:36) ...   19.05.2014 - 19:54
|- - p2004r   Цитата(himik @ 19.05.2014 - 19:54) Н...   19.05.2014 - 20:17
- - himik   Здравствуйте, это снова я. Хотелось бы спросить в...   17.06.2014 - 04:27


Добавить ответ в эту темуОткрыть тему