Версия для печати темы
Форум врачей-аспирантов _ Медицинская статистика _ Регрессионный анализ?
Автор: grergi 23.09.2015 - 14:41
Уважаемые коллеги, пожалуйста подскажите! Изучаются изменения фармакокинетических показателей препарата А (Cmax А) после введения препарата Б. При этом препарат Б способен изменять уровень эндогенных веществ С и Д, которые в свою очередь также способны влиять на Cmax A (С вызывает увеличение Cmax A, Д - снижение Cmax A). После введения препарата Б наблюдалось снижение уровня вещества С, а уровень Д статистически достоверно не изменился (ожидается что в следующих сериях он может возрасти, но он точно не может снизиться), при этом возросла Cmax A. Правильно ли будет сделать вывод о том, что причина изменений Cmax A - препарат Б, без регрессионного анализа? Я бы хотел его провести, но не знаю как. Препарат Б вводился в одной дозе, уровень его в крови не измерялся, следовательно уравнение регрессии может включать 0 или 1 (до введения и после введения препарата Б)? Также хотелось бы отразить силу связи самого факта введения препарата Б и изменений фармакокинетических параметров препарата А (корреляционный анализ?).
Автор: p2004r 23.09.2015 - 15:19
Цитата(grergi @ 23.09.2015 - 14:41)
Уважаемые коллеги, пожалуйста подскажите! Изучаются изменения фармакокинетических показателей препарата А (Cmax А) после введения препарата Б. При этом препарат Б способен изменять уровень эндогенных веществ С и Д, которые в свою очередь также способны влиять на Cmax A (С вызывает увеличение Cmax A, Д - снижение Cmax A). После введения препарата Б наблюдалось снижение уровня вещества С, а уровень Д статистически достоверно не изменился (ожидается что в следующих сериях он может возрасти, но он точно не может снизиться), при этом возросла Cmax A. Правильно ли будет сделать вывод о том, что причина изменений Cmax A - препарат Б, без регрессионного анализа? Я бы хотел его провести, но не знаю как. Препарат Б вводился в одной дозе, уровень его в крови не измерялся, следовательно уравнение регрессии может включать 0 или 1 (до введения и после введения препарата Б)? Также хотелось бы отразить силу связи самого факта введения препарата Б и изменений фармакокинетических параметров препарата А (корреляционный анализ?).
Для построения и доказательства значимости причинно-следственных связей и их направленности есть специальные тесты например можно посмотреть сайт, книгу и пакет для R bnlearn http://www.bnlearn.com/ http://www.jstatsoft.org/article/view/v035i03
Это случай как раз когда причинно следственные связи восстанавливаются в группе показателей.
Автор: grergi 23.09.2015 - 20:04
p2004r, спасибо за ответ, буду разбираться. Но нельзя ли посчитать это в Statistica или SPSS?
Автор: anserovtv 23.09.2015 - 22:27
grergi
Существует обобщение корреляционного и регрессионного анализов . которое в данном случае может (как я понял) быть применимо:
модель путей (анализ путей) с эндогенными и экзогенными переменными и др. Можно оценивать прямые и косвенные эффекты влияния , учитывать медиаторы и модераторы и др. Но существуют жесткие требования к объему и качеству данных.
Автор: p2004r 23.09.2015 - 22:31
Цитата(grergi @ 23.09.2015 - 20:04)
p2004r, спасибо за ответ, буду разбираться. Но нельзя ли посчитать это в Statistica или SPSS?
Eсли не ошибаюсь последние версии этих пакетов включают в себя R. Но если хотите мы можем здесь рассмотреть данные (их можно просто "анонимизировать" например нормализацией).
Автор: grergi 25.09.2015 - 21:25
Цитата(p2004r @ 23.09.2015 - 22:31)
Eсли не ошибаюсь последние версии этих пакетов включают в себя R. Но если хотите мы можем здесь публично рассмотреть данные (их можно просто "анонимизировать" например нормализацией).
p2004r, предложенный вами пакет для R пока мне никак "не поддается", если возможно провести расчеты в SPSS или Statistica, объясните, пожалуйста, для них.
Автор: p2004r 26.09.2015 - 10:19
Цитата(grergi @ 25.09.2015 - 21:25)
p2004r, предложенный вами пакет для R пока мне никак "не поддается", если возможно провести расчеты в SPSS или Statistica, объясните, пожалуйста, для них.
Если я правильно понял и No это номер подопытного
Код
> data <- read.table("data.txt", dec=",", header=TRUE)
> data.new$Б <- factor(data$Б)
> data.new$No <- factor(data$No)
> str(data.new)
'data.frame': 16 obs. of 5 variables:
$ No : Factor w/ 8 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 1 2 ...
$ CmaxА: num 18.4 15.4 42.5 31.8 39.8 ...
$ С : num 13.42 9.1 10.3 7.42 8.91 ...
$ Д : num 4.01 5.37 7.01 4.55 10.36 ...
$ Б : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 2 2 ...
> data.new
No CmaxА С Д Б
1 1 18.43 13.42 4.01 0
2 2 15.37 9.10 5.37 0
3 3 42.55 10.30 7.01 0
4 4 31.80 7.42 4.55 0
5 5 39.76 8.91 10.36 0
6 6 45.69 13.31 3.77 0
7 7 112.01 12.92 16.43 0
8 8 21.60 15.36 9.36 0
9 1 112.90 9.47 9.75 1
10 2 145.01 5.01 4.01 1
11 3 99.43 7.32 6.78 1
12 4 132.67 8.00 8.35 1
13 5 112.34 7.34 9.01 1
14 6 89.44 10.45 11.23 1
15 7 257.87 11.42 20.34 1
16 8 157.71 11.37 10.02 1
> (hc(data.new, optimized=F))
Bayesian network learned via Score-based methods
model:
[No][Б][С|No][Д|No][CmaxА|Д:Б]
nodes: 5
arcs: 4
undirected arcs: 0
directed arcs: 4
average markov blanket size: 2.00
average neighbourhood size: 1.60
average branching factor: 0.80
learning algorithm: Hill-Climbing
score: BIC (cond. Gauss.)
penalization coefficient: 1.386294
tests used in the learning procedure: 100
optimized: FALSE
Как видим уровень факторов индивидуален, препарат влияет на целевой показатель, но влияет и один из факторов.
Автор: grergi 27.09.2015 - 19:46
Цитата(p2004r @ 26.09.2015 - 10:19)
Если я правильно понял и No это номер подопытного
Код
> data <- read.table("data.txt", dec=",", header=TRUE)
> data.new$Б <- factor(data$Б)
> data.new$No <- factor(data$No)
> str(data.new)
'data.frame': 16 obs. of 5 variables:
$ No : Factor w/ 8 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 1 2 ...
$ CmaxА: num 18.4 15.4 42.5 31.8 39.8 ...
$ С : num 13.42 9.1 10.3 7.42 8.91 ...
$ Д : num 4.01 5.37 7.01 4.55 10.36 ...
$ Б : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 2 2 ...
> data.new
No CmaxА С Д Б
1 1 18.43 13.42 4.01 0
2 2 15.37 9.10 5.37 0
3 3 42.55 10.30 7.01 0
4 4 31.80 7.42 4.55 0
5 5 39.76 8.91 10.36 0
6 6 45.69 13.31 3.77 0
7 7 112.01 12.92 16.43 0
8 8 21.60 15.36 9.36 0
9 1 112.90 9.47 9.75 1
10 2 145.01 5.01 4.01 1
11 3 99.43 7.32 6.78 1
12 4 132.67 8.00 8.35 1
13 5 112.34 7.34 9.01 1
14 6 89.44 10.45 11.23 1
15 7 257.87 11.42 20.34 1
16 8 157.71 11.37 10.02 1
> (hc(data.new, optimized=F))
Bayesian network learned via Score-based methods
model:
[No][Б][С|No][Д|No][CmaxА|Д:Б]
nodes: 5
arcs: 4
undirected arcs: 0
directed arcs: 4
average markov blanket size: 2.00
average neighbourhood size: 1.60
average branching factor: 0.80
learning algorithm: Hill-Climbing
score: BIC (cond. Gauss.)
penalization coefficient: 1.386294
tests used in the learning procedure: 100
optimized: FALSE
Как видим уровень факторов индивидуален, препарат влияет на целевой показатель, но влияет и один из факторов.
p2004r, спасибо, буду разбираться
Автор: p2004r 27.09.2015 - 22:18
Цитата(grergi @ 27.09.2015 - 19:46)
p2004r, спасибо, буду разбираться
Вот ещё бутстреп оценка
Код
> strength.plot(res, boot.strength(data.new, algorithm="hc", R=1000))
> boot.strength(data.new, algorithm="hc", R=1000)
from to strength direction
1 No CmaxА 0.000 0.0000000
2 No С 0.000 0.0000000
3 No Д 0.001 0.5000000
4 No Б 0.002 0.5000000
5 CmaxА No 0.000 0.0000000
6 CmaxА С 0.431 0.3979118
7 CmaxА Д 0.920 0.4364130
8 CmaxА Б 0.998 0.3562124
9 С No 0.000 0.0000000
10 С CmaxА 0.431 0.6020882
11 С Д 0.842 0.4881235
12 С Б 0.756 0.3835979
13 Д No 0.001 0.5000000
14 Д CmaxА 0.920 0.5635870
15 Д С 0.842 0.5118765
16 Д Б 0.559 0.4821109
17 Б No 0.002 0.5000000
18 Б CmaxА 0.998 0.6437876
19 Б С 0.756 0.6164021
20 Б Д 0.559 0.5178891
>
и подгонка модели
Код
> bn.fit(res, data.new)
Bayesian network parameters
Parameters of node No (multinomial distribution)
Conditional probability table:
1 2 3 4 5 6 7 8
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125
Parameters of node CmaxА (conditional Gaussian distribution)
Conditional density: CmaxА | Д + Б
Coefficients:
0 1
(Intercept) -1.932269 56.689805
Д 5.630433 8.225583
Standard deviation of the residuals:
0 1
20.60321 39.26309
Discrete parents' configurations:
Б
0 0
1 1
Parameters of node С (conditional Gaussian distribution)
Conditional density: С | No
Coefficients:
0 1 2 3 4 5 6 7
(Intercept) 11.445 7.055 8.810 7.710 8.125 11.880 12.170 13.365
Standard deviation of the residuals:
0 1 2 3 4 5 6
2.7930718 2.8920667 2.1071782 0.4101219 1.1101576 2.0223254 1.0606602
7
2.8213561
Discrete parents' configurations:
No
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
Parameters of node Д (conditional Gaussian distribution)
Conditional density: Д | No
Coefficients:
0 1 2 3 4 5 6 7
(Intercept) 6.880 4.690 6.895 6.450 9.685 7.500 18.385 9.690
Standard deviation of the residuals:
0 1 2 3 4 5 6
4.0587929 0.9616652 0.1626346 2.6870058 0.9545942 5.2750166 2.7647875
7
0.4666905
Discrete parents' configurations:
No
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
Parameters of node Б (multinomial distribution)
Conditional probability table:
0 1
0.5 0.5
Автор: grergi 7.10.2015 - 09:51
p2004r, если я правильно понял, Вы провели корреляционный анализ? Используя коэффициент Пирсона я получил прямую зависимость Cmax от Д и от Б, обратную зависимость ? от С и Д не обнаружил (да и характер связи между этими показателями мне не очень интересен),но насколько я понимаю, коэффициент Пирсона здесь не применим т.к. непараметрические данные. Коэффициент Спирмена обнаружил прямую зависимость только Cмах от Б. Однако нужно ли проводить корреляционный анализ если данные статистически достоверно не изменились??? Или это был не корреляционный анализ???
Автор: p2004r 7.10.2015 - 15:44
Цитата(grergi @ 7.10.2015 - 09:51)
p2004r, если я правильно понял, Вы провели корреляционный анализ? Используя коэффициент Пирсона я получил прямую зависимость Cmax от Д и от Б, обратную зависимость ? от С и Д не обнаружил (да и характер связи между этими показателями мне не очень интересен),но насколько я понимаю, коэффициент Пирсона здесь не применим т.к. непараметрические данные. Коэффициент Спирмена обнаружил прямую зависимость только Cмах от Б. Однако нужно ли проводить корреляционный анализ если данные статистически достоверно не изменились??? Или это был не корреляционный анализ???
Вот сайт проекта и книги которая объясняет применяемую методику восстановления причинности http://www.bnlearn.com/
вот короткая статья http://www.jstatsoft.org/v35/i03/paper
PS В пределе (при наличии достаточного объема данных) направление связи сейчас можно довольно уверенно определить и для
пары показателей.
Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)