Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Регрессионный анализ?

Автор: grergi 23.09.2015 - 14:41

Уважаемые коллеги, пожалуйста подскажите! Изучаются изменения фармакокинетических показателей препарата А (Cmax А) после введения препарата Б. При этом препарат Б способен изменять уровень эндогенных веществ С и Д, которые в свою очередь также способны влиять на Cmax A (С вызывает увеличение Cmax A, Д - снижение Cmax A). После введения препарата Б наблюдалось снижение уровня вещества С, а уровень Д статистически достоверно не изменился (ожидается что в следующих сериях он может возрасти, но он точно не может снизиться), при этом возросла Cmax A. Правильно ли будет сделать вывод о том, что причина изменений Cmax A - препарат Б, без регрессионного анализа? Я бы хотел его провести, но не знаю как. Препарат Б вводился в одной дозе, уровень его в крови не измерялся, следовательно уравнение регрессии может включать 0 или 1 (до введения и после введения препарата Б)? Также хотелось бы отразить силу связи самого факта введения препарата Б и изменений фармакокинетических параметров препарата А (корреляционный анализ?).

Автор: p2004r 23.09.2015 - 15:19

Цитата(grergi @ 23.09.2015 - 14:41) *
Уважаемые коллеги, пожалуйста подскажите! Изучаются изменения фармакокинетических показателей препарата А (Cmax А) после введения препарата Б. При этом препарат Б способен изменять уровень эндогенных веществ С и Д, которые в свою очередь также способны влиять на Cmax A (С вызывает увеличение Cmax A, Д - снижение Cmax A). После введения препарата Б наблюдалось снижение уровня вещества С, а уровень Д статистически достоверно не изменился (ожидается что в следующих сериях он может возрасти, но он точно не может снизиться), при этом возросла Cmax A. Правильно ли будет сделать вывод о том, что причина изменений Cmax A - препарат Б, без регрессионного анализа? Я бы хотел его провести, но не знаю как. Препарат Б вводился в одной дозе, уровень его в крови не измерялся, следовательно уравнение регрессии может включать 0 или 1 (до введения и после введения препарата Б)? Также хотелось бы отразить силу связи самого факта введения препарата Б и изменений фармакокинетических параметров препарата А (корреляционный анализ?).


Для построения и доказательства значимости причинно-следственных связей и их направленности есть специальные тесты например можно посмотреть сайт, книгу и пакет для R bnlearn http://www.bnlearn.com/ http://www.jstatsoft.org/article/view/v035i03

Это случай как раз когда причинно следственные связи восстанавливаются в группе показателей.

Автор: grergi 23.09.2015 - 20:04

p2004r, спасибо за ответ, буду разбираться. Но нельзя ли посчитать это в Statistica или SPSS?

Автор: anserovtv 23.09.2015 - 22:27

grergi
Существует обобщение корреляционного и регрессионного анализов . которое в данном случае может (как я понял) быть применимо:
модель путей (анализ путей) с эндогенными и экзогенными переменными и др. Можно оценивать прямые и косвенные эффекты влияния , учитывать медиаторы и модераторы и др. Но существуют жесткие требования к объему и качеству данных.

Автор: p2004r 23.09.2015 - 22:31

Цитата(grergi @ 23.09.2015 - 20:04) *
p2004r, спасибо за ответ, буду разбираться. Но нельзя ли посчитать это в Statistica или SPSS?


Eсли не ошибаюсь последние версии этих пакетов включают в себя R. Но если хотите мы можем здесь рассмотреть данные (их можно просто "анонимизировать" например нормализацией).

Автор: grergi 25.09.2015 - 21:25

Цитата(p2004r @ 23.09.2015 - 22:31) *
Eсли не ошибаюсь последние версии этих пакетов включают в себя R. Но если хотите мы можем здесь публично рассмотреть данные (их можно просто "анонимизировать" например нормализацией).

p2004r, предложенный вами пакет для R пока мне никак "не поддается", если возможно провести расчеты в SPSS или Statistica, объясните, пожалуйста, для них.

 Данные.pdf ( 92,66 килобайт ) : 402
 

Автор: p2004r 26.09.2015 - 10:19

Цитата(grergi @ 25.09.2015 - 21:25) *
p2004r, предложенный вами пакет для R пока мне никак "не поддается", если возможно провести расчеты в SPSS или Statistica, объясните, пожалуйста, для них.



Если я правильно понял и No это номер подопытного

Код
> data <- read.table("data.txt", dec=",", header=TRUE)
> data.new$Б <- factor(data$Б)
> data.new$No <- factor(data$No)
> str(data.new)
'data.frame':    16 obs. of  5 variables:
$ No   : Factor w/ 8 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 1 2 ...
$ CmaxА: num  18.4 15.4 42.5 31.8 39.8 ...
$ С    : num  13.42 9.1 10.3 7.42 8.91 ...
$ Д    : num  4.01 5.37 7.01 4.55 10.36 ...
$ Б    : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 2 2 ...
> data.new
   No  CmaxА     С     Д Б
1   1  18.43 13.42  4.01 0
2   2  15.37  9.10  5.37 0
3   3  42.55 10.30  7.01 0
4   4  31.80  7.42  4.55 0
5   5  39.76  8.91 10.36 0
6   6  45.69 13.31  3.77 0
7   7 112.01 12.92 16.43 0
8   8  21.60 15.36  9.36 0
9   1 112.90  9.47  9.75 1
10  2 145.01  5.01  4.01 1
11  3  99.43  7.32  6.78 1
12  4 132.67  8.00  8.35 1
13  5 112.34  7.34  9.01 1
14  6  89.44 10.45 11.23 1
15  7 257.87 11.42 20.34 1
16  8 157.71 11.37 10.02 1
> (hc(data.new, optimized=F))

  Bayesian network learned via Score-based methods

  model:
   [No][Б][С|No][Д|No][CmaxА|Д:Б]
  nodes:                                 5
  arcs:                                  4
    undirected arcs:                     0
    directed arcs:                       4
  average markov blanket size:           2.00
  average neighbourhood size:            1.60
  average branching factor:              0.80

  learning algorithm:                    Hill-Climbing
  score:                                 BIC (cond. Gauss.)
  penalization coefficient:              1.386294
  tests used in the learning procedure:  100
  optimized:                             FALSE


Как видим уровень факторов индивидуален, препарат влияет на целевой показатель, но влияет и один из факторов.

 

Автор: grergi 27.09.2015 - 19:46

Цитата(p2004r @ 26.09.2015 - 10:19) *
Если я правильно понял и No это номер подопытного

Код
> data <- read.table("data.txt", dec=",", header=TRUE)
> data.new$Б <- factor(data$Б)
> data.new$No <- factor(data$No)
> str(data.new)
'data.frame':    16 obs. of  5 variables:
$ No   : Factor w/ 8 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 1 2 ...
$ CmaxА: num  18.4 15.4 42.5 31.8 39.8 ...
$ С    : num  13.42 9.1 10.3 7.42 8.91 ...
$ Д    : num  4.01 5.37 7.01 4.55 10.36 ...
$ Б    : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 2 2 ...
> data.new
   No  CmaxА     С     Д Б
1   1  18.43 13.42  4.01 0
2   2  15.37  9.10  5.37 0
3   3  42.55 10.30  7.01 0
4   4  31.80  7.42  4.55 0
5   5  39.76  8.91 10.36 0
6   6  45.69 13.31  3.77 0
7   7 112.01 12.92 16.43 0
8   8  21.60 15.36  9.36 0
9   1 112.90  9.47  9.75 1
10  2 145.01  5.01  4.01 1
11  3  99.43  7.32  6.78 1
12  4 132.67  8.00  8.35 1
13  5 112.34  7.34  9.01 1
14  6  89.44 10.45 11.23 1
15  7 257.87 11.42 20.34 1
16  8 157.71 11.37 10.02 1
> (hc(data.new, optimized=F))

  Bayesian network learned via Score-based methods

  model:
   [No][Б][С|No][Д|No][CmaxА|Д:Б]
  nodes:                                 5
  arcs:                                  4
    undirected arcs:                     0
    directed arcs:                       4
  average markov blanket size:           2.00
  average neighbourhood size:            1.60
  average branching factor:              0.80

  learning algorithm:                    Hill-Climbing
  score:                                 BIC (cond. Gauss.)
  penalization coefficient:              1.386294
  tests used in the learning procedure:  100
  optimized:                             FALSE


Как видим уровень факторов индивидуален, препарат влияет на целевой показатель, но влияет и один из факторов.


p2004r, спасибо, буду разбираться

Автор: p2004r 27.09.2015 - 22:18

Цитата(grergi @ 27.09.2015 - 19:46) *
p2004r, спасибо, буду разбираться


Вот ещё бутстреп оценка

Код
> strength.plot(res, boot.strength(data.new, algorithm="hc", R=1000))
> boot.strength(data.new, algorithm="hc", R=1000)
    from    to strength direction
1     No CmaxА    0.000 0.0000000
2     No     С    0.000 0.0000000
3     No     Д    0.001 0.5000000
4     No     Б    0.002 0.5000000
5  CmaxА    No    0.000 0.0000000
6  CmaxА     С    0.431 0.3979118
7  CmaxА     Д    0.920 0.4364130
8  CmaxА     Б    0.998 0.3562124
9      С    No    0.000 0.0000000
10     С CmaxА    0.431 0.6020882
11     С     Д    0.842 0.4881235
12     С     Б    0.756 0.3835979
13     Д    No    0.001 0.5000000
14     Д CmaxА    0.920 0.5635870
15     Д     С    0.842 0.5118765
16     Д     Б    0.559 0.4821109
17     Б    No    0.002 0.5000000
18     Б CmaxА    0.998 0.6437876
19     Б     С    0.756 0.6164021
20     Б     Д    0.559 0.5178891
>


и подгонка модели

Код
> bn.fit(res, data.new)

  Bayesian network parameters

  Parameters of node No (multinomial distribution)

Conditional probability table:

    1     2     3     4     5     6     7     8
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125

  Parameters of node CmaxА (conditional Gaussian distribution)

Conditional density: CmaxА | Д + Б
Coefficients:
                     0          1
(Intercept)  -1.932269  56.689805
Д             5.630433   8.225583
Standard deviation of the residuals:
       0         1  
20.60321  39.26309  
Discrete parents' configurations:
   Б
0  0
1  1

  Parameters of node С (conditional Gaussian distribution)

Conditional density: С | No
Coefficients:
                  0       1       2       3       4       5       6       7
(Intercept)  11.445   7.055   8.810   7.710   8.125  11.880  12.170  13.365
Standard deviation of the residuals:
        0          1          2          3          4          5          6  
2.7930718  2.8920667  2.1071782  0.4101219  1.1101576  2.0223254  1.0606602  
        7  
2.8213561  
Discrete parents' configurations:
   No
0   1
1   2
2   3
3   4
4   5
5   6
6   7
7   8

  Parameters of node Д (conditional Gaussian distribution)

Conditional density: Д | No
Coefficients:
                  0       1       2       3       4       5       6       7
(Intercept)   6.880   4.690   6.895   6.450   9.685   7.500  18.385   9.690
Standard deviation of the residuals:
        0          1          2          3          4          5          6  
4.0587929  0.9616652  0.1626346  2.6870058  0.9545942  5.2750166  2.7647875  
        7  
0.4666905  
Discrete parents' configurations:
   No
0   1
1   2
2   3
3   4
4   5
5   6
6   7
7   8

  Parameters of node Б (multinomial distribution)

Conditional probability table:

  0   1
0.5 0.5




 

Автор: grergi 7.10.2015 - 09:51

p2004r, если я правильно понял, Вы провели корреляционный анализ? Используя коэффициент Пирсона я получил прямую зависимость Cmax от Д и от Б, обратную зависимость ? от С и Д не обнаружил (да и характер связи между этими показателями мне не очень интересен),но насколько я понимаю, коэффициент Пирсона здесь не применим т.к. непараметрические данные. Коэффициент Спирмена обнаружил прямую зависимость только Cмах от Б. Однако нужно ли проводить корреляционный анализ если данные статистически достоверно не изменились??? Или это был не корреляционный анализ???

Автор: p2004r 7.10.2015 - 15:44

Цитата(grergi @ 7.10.2015 - 09:51) *
p2004r, если я правильно понял, Вы провели корреляционный анализ? Используя коэффициент Пирсона я получил прямую зависимость Cmax от Д и от Б, обратную зависимость ? от С и Д не обнаружил (да и характер связи между этими показателями мне не очень интересен),но насколько я понимаю, коэффициент Пирсона здесь не применим т.к. непараметрические данные. Коэффициент Спирмена обнаружил прямую зависимость только Cмах от Б. Однако нужно ли проводить корреляционный анализ если данные статистически достоверно не изменились??? Или это был не корреляционный анализ???


Вот сайт проекта и книги которая объясняет применяемую методику восстановления причинности http://www.bnlearn.com/

вот короткая статья http://www.jstatsoft.org/v35/i03/paper

PS В пределе (при наличии достаточного объема данных) направление связи сейчас можно довольно уверенно определить и для пары показателей.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)