Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Доклиника, распределение не нормально. Выборка?, _помогите посчитать выборку_
himik
сообщение 29.04.2014 - 18:29
Сообщение #1





Группа: Пользователи
Сообщений: 15
Регистрация: 29.04.2014
Пользователь №: 26382



День добрый.

Планируем делать доклинику. Пилот не делали, но из литературы знаем, что распределение ненормально. Подскажите, пожалуйста, как рассчитать выборку для сравнения препаратов. Нулевых гипотез 2 вида: а) препарат А лучше препарата Б, б) препарат А не хуже препарата В.

Буду благодарен за помощь.


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
himik
сообщение 1.05.2014 - 03:29
Сообщение #2





Группа: Пользователи
Сообщений: 15
Регистрация: 29.04.2014
Пользователь №: 26382



1) "Лучше" в нашем случае означает, что вещество статистически значимо (p<0,05) увеличивает латентное время в одном из физиологических тестов.
2) В литературе конкретно не приводятся экспериментальные точки, а только медианы и стандартные отклонения. Однако учитывая, что расчёт статистики идёт по Краскелу-Уоллису, а также то, что коэффициент вариации немаленький, сделано соответствующее предположение о распределении, отличном от нормального. Речь идёт о распределении латентных времён.

Сообщение отредактировал himik - 1.05.2014 - 03:49
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 1.05.2014 - 12:33
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(himik @ 1.05.2014 - 03:29) *
1) "Лучше" в нашем случае означает, что вещество статистически значимо (p<0,05) увеличивает латентное время в одном из физиологических тестов.
2) В литературе конкретно не приводятся экспериментальные точки, а только медианы и стандартные отклонения. Однако учитывая, что расчёт статистики идёт по Краскелу-Уоллису, а также то, что коэффициент вариации немаленький, сделано соответствующее предположение о распределении, отличном от нормального. Речь идёт о распределении латентных времён.


1) Набрав 1000 экспериментальных точек Вы получите свои заветные 0.05 для сколь угодно малого эффекта (если он конечно есть) . Цель может быть сформулирована только одним образом --- получить доверительный интервал для оценки величины "прироста латентного времени".

2) Зафиксируем --- речь именно о самих латентных временах, а не их "приростах". Имеется медиана, стандартное отклонение и кв. Значит у нас есть косвенно и среднее. Очевидно есть максимальное и минимальное значение.

Возьмем подходящее теоретически распределение (например Weibull distribution) и зафитим его парметры

Код
### Получаю модельные данные
> data <- rweibull(20000, shape=1, scale = 1)
> mean(data)
[1] 0.9946463
> median(data)
[1] 0.6907863
> sd(data)
[1] 0.9952487

### Восстанавливаю параметры имея только генерацию распределения

> optim(c(2,2),
             function(x) {x1<-x[1];
                                x2<-x[2];
                                (mean(data) - mean(rweibull(20000, shape=x1, scale = x2)))^2  +  (median(data) - median(rweibull(20000, shape=x1, scale = x2)))^2
             },  
             method = "BFGS")
$par
[1] 1.006755 1.008493

$value
[1] 6.970689e-06

$counts
function gradient
     136       21

$convergence
[1] 0

$message
NULL

Было 22 предупреждений (введите warnings() чтобы их просмотреть)


Повторим для других исходных

Код
> data <- rweibull(20000, shape=1, scale = 3)
> optim(c(2,2),
             function(x) {x1<-x[1];
                                 x2<-x[2];
                                 (mean(data) - mean(rweibull(20000, shape=x1, scale = x2)))^2 + (median(data) - median(rweibull(20000, shape=x1, scale = x2)))^2
             },  
             method = "BFGS")
$par
[1] 0.9168395 2.9314810

$value
[1] 0.004491055

$counts
function gradient
     112       12

$convergence
[1] 0

$message
NULL

Было 16 предупреждений (введите warnings() чтобы их просмотреть)

> data <- rweibull(20000, shape=1.5, scale = 4)
> optim(c(2,2),
             function(x) {x1<-x[1];
                                x2<-x[2];
                                (mean(data) - mean(rweibull(20000, shape=x1, scale = x2)))^2 + (median(data) - median(rweibull(20000, shape=x1, scale = x2)))^2
             },  
             method = "BFGS")
$par
[1] 1.600342 3.981985

$value
[1] 5.3779e-05

$counts
function gradient
     302       26

$convergence
[1] 0

$message
NULL

Было 50 или более предупреждений (введите warnings() чтобы просмотреть первые 50)



Теперь мы можем планировать.

Задаем "размер экспериментальной выборки" и получив множество реализаций случайных выборок считаем нужные нам статистики. "Перебирая размеры выборки" находим оптимальный объем эксперимента который позволит получить удовлетворяющий нас доверительный интервал.

Если лень подгонять самому (или очень много параметров) можно опять заставить поработать optim(). smile.gif

Сообщение отредактировал p2004r - 1.05.2014 - 12:39


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- himik   Доклиника, распределение не нормально. Выборка?   29.04.2014 - 18:29
- - p2004r   Цитата(himik @ 29.04.2014 - 18:29) Д...   30.04.2014 - 22:50
- - himik   1) "Лучше" в нашем случае означает, что ...   1.05.2014 - 03:29
|- - nokh   Цитата(himik @ 1.05.2014 - 06:29) 1)...   1.05.2014 - 12:25
||- - himik   2 nokh Спасибо на добром слове. Просто если не по...   1.05.2014 - 13:11
||- - p2004r   Цитата(himik @ 1.05.2014 - 13:11) 2 ...   1.05.2014 - 13:20
||- - himik   Цитата(p2004r @ 1.05.2014 - 14:20) А...   1.05.2014 - 13:26
||- - p2004r   Цитата(himik @ 1.05.2014 - 13:26) Ни...   1.05.2014 - 13:30
||- - himik   Цитата(p2004r @ 1.05.2014 - 14:30) Т...   1.05.2014 - 13:51
||- - p2004r   Цитата(himik @ 1.05.2014 - 13:51) Не...   1.05.2014 - 14:07
|- - p2004r   Цитата(himik @ 1.05.2014 - 03:29) 1)...   1.05.2014 - 12:33
- - himik   2 p2004r Спасибо! Будем пробовать. P.S. Нарыл...   1.05.2014 - 13:25
|- - p2004r   Цитата(himik @ 1.05.2014 - 13:25) 2 ...   1.05.2014 - 13:36
|- - himik   Цитата(p2004r @ 1.05.2014 - 14:36) Т...   1.05.2014 - 13:55
- - himik   Хотелось бы продолжить получение консультации, есл...   16.05.2014 - 18:52
|- - p2004r   Цитата(himik @ 16.05.2014 - 18:52) Х...   16.05.2014 - 21:30
- - himik   Ок. Спасибо за поддержку. В архиве: 1) лист с исхо...   17.05.2014 - 03:22
|- - p2004r   Цитата(himik @ 17.05.2014 - 03:22) О...   19.05.2014 - 17:43
|- - himik   Цитата(p2004r @ 19.05.2014 - 18:43) ...   19.05.2014 - 18:16
|- - p2004r   Цитата(himik @ 19.05.2014 - 18:16) Т...   19.05.2014 - 19:34
|- - himik   Цитата(p2004r @ 19.05.2014 - 20:34) ...   19.05.2014 - 19:53
|- - p2004r   Цитата(himik @ 19.05.2014 - 19:53) С...   19.05.2014 - 21:12
- - himik   А почему вы выбрали именно это распределение?   19.05.2014 - 18:26
|- - p2004r   Цитата(himik @ 19.05.2014 - 18:26) А...   19.05.2014 - 19:36
|- - himik   Цитата(p2004r @ 19.05.2014 - 20:36) ...   19.05.2014 - 19:54
|- - p2004r   Цитата(himik @ 19.05.2014 - 19:54) Н...   19.05.2014 - 20:17
- - himik   Здравствуйте, это снова я. Хотелось бы спросить в...   17.06.2014 - 04:27


Добавить ответ в эту темуОткрыть тему