Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Регрессионный анализ?, статистика
grergi
сообщение 23.09.2015 - 14:41
Сообщение #1





Группа: Пользователи
Сообщений: 43
Регистрация: 12.04.2014
Пользователь №: 26319



Уважаемые коллеги, пожалуйста подскажите! Изучаются изменения фармакокинетических показателей препарата А (Cmax А) после введения препарата Б. При этом препарат Б способен изменять уровень эндогенных веществ С и Д, которые в свою очередь также способны влиять на Cmax A (С вызывает увеличение Cmax A, Д - снижение Cmax A). После введения препарата Б наблюдалось снижение уровня вещества С, а уровень Д статистически достоверно не изменился (ожидается что в следующих сериях он может возрасти, но он точно не может снизиться), при этом возросла Cmax A. Правильно ли будет сделать вывод о том, что причина изменений Cmax A - препарат Б, без регрессионного анализа? Я бы хотел его провести, но не знаю как. Препарат Б вводился в одной дозе, уровень его в крови не измерялся, следовательно уравнение регрессии может включать 0 или 1 (до введения и после введения препарата Б)? Также хотелось бы отразить силу связи самого факта введения препарата Б и изменений фармакокинетических параметров препарата А (корреляционный анализ?).

Сообщение отредактировал grergi - 23.09.2015 - 14:48
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 23.09.2015 - 15:19
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(grergi @ 23.09.2015 - 14:41) *
Уважаемые коллеги, пожалуйста подскажите! Изучаются изменения фармакокинетических показателей препарата А (Cmax А) после введения препарата Б. При этом препарат Б способен изменять уровень эндогенных веществ С и Д, которые в свою очередь также способны влиять на Cmax A (С вызывает увеличение Cmax A, Д - снижение Cmax A). После введения препарата Б наблюдалось снижение уровня вещества С, а уровень Д статистически достоверно не изменился (ожидается что в следующих сериях он может возрасти, но он точно не может снизиться), при этом возросла Cmax A. Правильно ли будет сделать вывод о том, что причина изменений Cmax A - препарат Б, без регрессионного анализа? Я бы хотел его провести, но не знаю как. Препарат Б вводился в одной дозе, уровень его в крови не измерялся, следовательно уравнение регрессии может включать 0 или 1 (до введения и после введения препарата Б)? Также хотелось бы отразить силу связи самого факта введения препарата Б и изменений фармакокинетических параметров препарата А (корреляционный анализ?).


Для построения и доказательства значимости причинно-следственных связей и их направленности есть специальные тесты например можно посмотреть сайт, книгу и пакет для R bnlearn http://www.bnlearn.com/ http://www.jstatsoft.org/article/view/v035i03

Это случай как раз когда причинно следственные связи восстанавливаются в группе показателей.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
grergi
сообщение 23.09.2015 - 20:04
Сообщение #3





Группа: Пользователи
Сообщений: 43
Регистрация: 12.04.2014
Пользователь №: 26319



p2004r, спасибо за ответ, буду разбираться. Но нельзя ли посчитать это в Statistica или SPSS?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 23.09.2015 - 22:27
Сообщение #4





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



grergi
Существует обобщение корреляционного и регрессионного анализов . которое в данном случае может (как я понял) быть применимо:
модель путей (анализ путей) с эндогенными и экзогенными переменными и др. Можно оценивать прямые и косвенные эффекты влияния , учитывать медиаторы и модераторы и др. Но существуют жесткие требования к объему и качеству данных.

Сообщение отредактировал anserovtv - 25.09.2015 - 21:46
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 23.09.2015 - 22:31
Сообщение #5





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(grergi @ 23.09.2015 - 20:04) *
p2004r, спасибо за ответ, буду разбираться. Но нельзя ли посчитать это в Statistica или SPSS?


Eсли не ошибаюсь последние версии этих пакетов включают в себя R. Но если хотите мы можем здесь рассмотреть данные (их можно просто "анонимизировать" например нормализацией).

Сообщение отредактировал p2004r - 27.09.2015 - 11:11


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
grergi
сообщение 25.09.2015 - 21:25
Сообщение #6





Группа: Пользователи
Сообщений: 43
Регистрация: 12.04.2014
Пользователь №: 26319



Цитата(p2004r @ 23.09.2015 - 22:31) *
Eсли не ошибаюсь последние версии этих пакетов включают в себя R. Но если хотите мы можем здесь публично рассмотреть данные (их можно просто "анонимизировать" например нормализацией).

p2004r, предложенный вами пакет для R пока мне никак "не поддается", если возможно провести расчеты в SPSS или Statistica, объясните, пожалуйста, для них.

Сообщение отредактировал grergi - 25.09.2015 - 21:27
Прикрепленные файлы
Прикрепленный файл  Данные.pdf ( 92,66 килобайт ) Кол-во скачиваний: 401
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 26.09.2015 - 10:19
Сообщение #7





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(grergi @ 25.09.2015 - 21:25) *
p2004r, предложенный вами пакет для R пока мне никак "не поддается", если возможно провести расчеты в SPSS или Statistica, объясните, пожалуйста, для них.



Если я правильно понял и No это номер подопытного

Код
> data <- read.table("data.txt", dec=",", header=TRUE)
> data.new$Б <- factor(data$Б)
> data.new$No <- factor(data$No)
> str(data.new)
'data.frame':    16 obs. of  5 variables:
$ No   : Factor w/ 8 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 1 2 ...
$ CmaxА: num  18.4 15.4 42.5 31.8 39.8 ...
$ С    : num  13.42 9.1 10.3 7.42 8.91 ...
$ Д    : num  4.01 5.37 7.01 4.55 10.36 ...
$ Б    : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 2 2 ...
> data.new
   No  CmaxА     С     Д Б
1   1  18.43 13.42  4.01 0
2   2  15.37  9.10  5.37 0
3   3  42.55 10.30  7.01 0
4   4  31.80  7.42  4.55 0
5   5  39.76  8.91 10.36 0
6   6  45.69 13.31  3.77 0
7   7 112.01 12.92 16.43 0
8   8  21.60 15.36  9.36 0
9   1 112.90  9.47  9.75 1
10  2 145.01  5.01  4.01 1
11  3  99.43  7.32  6.78 1
12  4 132.67  8.00  8.35 1
13  5 112.34  7.34  9.01 1
14  6  89.44 10.45 11.23 1
15  7 257.87 11.42 20.34 1
16  8 157.71 11.37 10.02 1
> (hc(data.new, optimized=F))

  Bayesian network learned via Score-based methods

  model:
   [No][Б][С|No][Д|No][CmaxА|Д:Б]
  nodes:                                 5
  arcs:                                  4
    undirected arcs:                     0
    directed arcs:                       4
  average markov blanket size:           2.00
  average neighbourhood size:            1.60
  average branching factor:              0.80

  learning algorithm:                    Hill-Climbing
  score:                                 BIC (cond. Gauss.)
  penalization coefficient:              1.386294
  tests used in the learning procedure:  100
  optimized:                             FALSE


Как видим уровень факторов индивидуален, препарат влияет на целевой показатель, но влияет и один из факторов.

Сообщение отредактировал p2004r - 27.09.2015 - 11:10
Эскизы прикрепленных изображений
Прикрепленное изображение
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
grergi
сообщение 27.09.2015 - 19:46
Сообщение #8





Группа: Пользователи
Сообщений: 43
Регистрация: 12.04.2014
Пользователь №: 26319



Цитата(p2004r @ 26.09.2015 - 10:19) *
Если я правильно понял и No это номер подопытного

Код
> data <- read.table("data.txt", dec=",", header=TRUE)
> data.new$Б <- factor(data$Б)
> data.new$No <- factor(data$No)
> str(data.new)
'data.frame':    16 obs. of  5 variables:
$ No   : Factor w/ 8 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 1 2 ...
$ CmaxА: num  18.4 15.4 42.5 31.8 39.8 ...
$ С    : num  13.42 9.1 10.3 7.42 8.91 ...
$ Д    : num  4.01 5.37 7.01 4.55 10.36 ...
$ Б    : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 2 2 ...
> data.new
   No  CmaxА     С     Д Б
1   1  18.43 13.42  4.01 0
2   2  15.37  9.10  5.37 0
3   3  42.55 10.30  7.01 0
4   4  31.80  7.42  4.55 0
5   5  39.76  8.91 10.36 0
6   6  45.69 13.31  3.77 0
7   7 112.01 12.92 16.43 0
8   8  21.60 15.36  9.36 0
9   1 112.90  9.47  9.75 1
10  2 145.01  5.01  4.01 1
11  3  99.43  7.32  6.78 1
12  4 132.67  8.00  8.35 1
13  5 112.34  7.34  9.01 1
14  6  89.44 10.45 11.23 1
15  7 257.87 11.42 20.34 1
16  8 157.71 11.37 10.02 1
> (hc(data.new, optimized=F))

  Bayesian network learned via Score-based methods

  model:
   [No][Б][С|No][Д|No][CmaxА|Д:Б]
  nodes:                                 5
  arcs:                                  4
    undirected arcs:                     0
    directed arcs:                       4
  average markov blanket size:           2.00
  average neighbourhood size:            1.60
  average branching factor:              0.80

  learning algorithm:                    Hill-Climbing
  score:                                 BIC (cond. Gauss.)
  penalization coefficient:              1.386294
  tests used in the learning procedure:  100
  optimized:                             FALSE


Как видим уровень факторов индивидуален, препарат влияет на целевой показатель, но влияет и один из факторов.


p2004r, спасибо, буду разбираться

Сообщение отредактировал grergi - 27.09.2015 - 19:46
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.09.2015 - 22:18
Сообщение #9





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(grergi @ 27.09.2015 - 19:46) *
p2004r, спасибо, буду разбираться


Вот ещё бутстреп оценка

Код
> strength.plot(res, boot.strength(data.new, algorithm="hc", R=1000))
> boot.strength(data.new, algorithm="hc", R=1000)
    from    to strength direction
1     No CmaxА    0.000 0.0000000
2     No     С    0.000 0.0000000
3     No     Д    0.001 0.5000000
4     No     Б    0.002 0.5000000
5  CmaxА    No    0.000 0.0000000
6  CmaxА     С    0.431 0.3979118
7  CmaxА     Д    0.920 0.4364130
8  CmaxА     Б    0.998 0.3562124
9      С    No    0.000 0.0000000
10     С CmaxА    0.431 0.6020882
11     С     Д    0.842 0.4881235
12     С     Б    0.756 0.3835979
13     Д    No    0.001 0.5000000
14     Д CmaxА    0.920 0.5635870
15     Д     С    0.842 0.5118765
16     Д     Б    0.559 0.4821109
17     Б    No    0.002 0.5000000
18     Б CmaxА    0.998 0.6437876
19     Б     С    0.756 0.6164021
20     Б     Д    0.559 0.5178891
>


и подгонка модели

Код
> bn.fit(res, data.new)

  Bayesian network parameters

  Parameters of node No (multinomial distribution)

Conditional probability table:

    1     2     3     4     5     6     7     8
0.125 0.125 0.125 0.125 0.125 0.125 0.125 0.125

  Parameters of node CmaxА (conditional Gaussian distribution)

Conditional density: CmaxА | Д + Б
Coefficients:
                     0          1
(Intercept)  -1.932269  56.689805
Д             5.630433   8.225583
Standard deviation of the residuals:
       0         1  
20.60321  39.26309  
Discrete parents' configurations:
   Б
0  0
1  1

  Parameters of node С (conditional Gaussian distribution)

Conditional density: С | No
Coefficients:
                  0       1       2       3       4       5       6       7
(Intercept)  11.445   7.055   8.810   7.710   8.125  11.880  12.170  13.365
Standard deviation of the residuals:
        0          1          2          3          4          5          6  
2.7930718  2.8920667  2.1071782  0.4101219  1.1101576  2.0223254  1.0606602  
        7  
2.8213561  
Discrete parents' configurations:
   No
0   1
1   2
2   3
3   4
4   5
5   6
6   7
7   8

  Parameters of node Д (conditional Gaussian distribution)

Conditional density: Д | No
Coefficients:
                  0       1       2       3       4       5       6       7
(Intercept)   6.880   4.690   6.895   6.450   9.685   7.500  18.385   9.690
Standard deviation of the residuals:
        0          1          2          3          4          5          6  
4.0587929  0.9616652  0.1626346  2.6870058  0.9545942  5.2750166  2.7647875  
        7  
0.4666905  
Discrete parents' configurations:
   No
0   1
1   2
2   3
3   4
4   5
5   6
6   7
7   8

  Parameters of node Б (multinomial distribution)

Conditional probability table:

  0   1
0.5 0.5



Эскизы прикрепленных изображений
Прикрепленное изображение
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
grergi
сообщение 7.10.2015 - 09:51
Сообщение #10





Группа: Пользователи
Сообщений: 43
Регистрация: 12.04.2014
Пользователь №: 26319



p2004r, если я правильно понял, Вы провели корреляционный анализ? Используя коэффициент Пирсона я получил прямую зависимость Cmax от Д и от Б, обратную зависимость ? от С и Д не обнаружил (да и характер связи между этими показателями мне не очень интересен),но насколько я понимаю, коэффициент Пирсона здесь не применим т.к. непараметрические данные. Коэффициент Спирмена обнаружил прямую зависимость только Cмах от Б. Однако нужно ли проводить корреляционный анализ если данные статистически достоверно не изменились??? Или это был не корреляционный анализ???
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 7.10.2015 - 15:44
Сообщение #11





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(grergi @ 7.10.2015 - 09:51) *
p2004r, если я правильно понял, Вы провели корреляционный анализ? Используя коэффициент Пирсона я получил прямую зависимость Cmax от Д и от Б, обратную зависимость ? от С и Д не обнаружил (да и характер связи между этими показателями мне не очень интересен),но насколько я понимаю, коэффициент Пирсона здесь не применим т.к. непараметрические данные. Коэффициент Спирмена обнаружил прямую зависимость только Cмах от Б. Однако нужно ли проводить корреляционный анализ если данные статистически достоверно не изменились??? Или это был не корреляционный анализ???


Вот сайт проекта и книги которая объясняет применяемую методику восстановления причинности http://www.bnlearn.com/

вот короткая статья http://www.jstatsoft.org/v35/i03/paper

PS В пределе (при наличии достаточного объема данных) направление связи сейчас можно довольно уверенно определить и для пары показателей.

Сообщение отредактировал p2004r - 8.10.2015 - 08:41


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему