Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Корреляция зависимых переменных
Daria
сообщение 25.02.2018 - 23:31
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Здравствуйте.
Суть задачи. Есть 4 признака: пациент (id), наблюдение (этап - 1 или 2), баллы по шкале (шкала), время ожидания операции (срок).
Нужно оценить линейную зависимость количества баллов на этапе 2 и время ожидания операции (т.е. чем больше ждем, тем хуже состояние пациента) с коррекцией на исходное количества баллов по шкале (т.е. ухудшение состояния, связанное с длительностью ожидания операции наблюдается независимо от исходного количества баллов).

Как я вижу решение:
а) применить частную корреляцию. Можно ли это делать в случае повторных наблюдений?
б) построить регрессионную модель. Зависимая ШКАЛА на этапе 2, предикторы - шкала на этапе 1, срок. Потом строим линейную кривую. Насколько я читала, в случае повторных наблюдений нужно использовать смешанную регресионную модель с фиксированными и случайными эффектами.

Оба этих подхода можно реализовать и в SPSS, и в Stata. Какой подход будет более правильным?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 26.02.2018 - 00:49
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 140
Регистрация: 27.04.2016
Пользователь №: 28223



Начнем с представления данных. Если я правильно понял, и ДЛЯ КАЖДОГО БОЛЬНОГО у вас есть информация по состоянию до и после операции, то на самом деле ваши данные немного другие. А именно, представьте, что у вас есть таблица со следующими столбцами:
Пациент (id), Баллы по шкале до операции (БДО), Время ожидания операции (ВО), Баллы по шкале после операции (БПО).
Вот теперь можно и корреляцией заняться, например выяснить, коррелированы-ли БПО и БДО. БПО и ВО. И да, нужно применять двухвыборочные методы для зависимых выборок. Можно попытаться применить и множественную корреляцию. Главное помните, что БПО и БДО у вас измерены в ранговых шкалах, а ВО - в количественной, и методы надо выбирать соответствующие.
Дальше можно попробовать построить модель зависимости БПО от БДО и ВО. Правада, что такое "линейная кривая" rolleyes.gif и как вы ее себе представляете - это загадка. А поскольку Ваши БПО и БДО представлены в ранговых шкалах (это насколько я понял), то строго говоря вы должны строить не регрессионную, а классификационную модель. Каким методом - тут конечно надо немного подумать, но ваша задача вполне классическая и описана почти дословно во многих книгах по мед.статистике.
"Регрессионная модель с фиксированными и случайными эффектами" - с моей точки зрения, это вас уже занесло как-то очень далеко не туда.
"можно реализовать и в SPSS, и в Stata", - Можно. Можно и в R, и в Python, и даже в EXCEL. Реализовывайте в том, что вы лично лучше знаете.

Сообщение отредактировал passant - 26.02.2018 - 00:59
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 26.02.2018 - 01:47
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 1324
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(passant @ 26.02.2018 - 01:49) *
Начнем с представления данных. Если я правильно понял, и ДЛЯ КАЖДОГО БОЛЬНОГО у вас есть информация по состоянию до и после операции, то на самом деле ваши данные немного другие. А именно, представьте, что у вас есть таблица со следующими столбцами:
Пациент (id), Баллы по шкале до операции (БДО), Время ожидания операции (ВО), Баллы по шкале после операции (БПО).

Я думаю, что вы не правильно поняли. Баллов после операции нет. Обе оценки сделаны до операции. Вторая оценка характеризует больного после какого то времени ОЖИДАНИЯ операции. И это написано ясно. Не ясно другое, на каком основании Daria уже делает вывод о том, что ?чем больше ждем, тем хуже состояние пациента?. Это как раз и есть медицинская гипотеза, которую нужно проверить. Скорее всего, это верное утверждение и его требуется, как то статистически подтвердить. Второе утверждение, что ?ухудшение состояния, связанное с длительностью ожидания операции наблюдается независимо от исходного количества баллов?, вряд ли верно с медицинской точки зрения. Какие то исходные состояния медленно прогрессируют, можно откладывать операцию на какое то время, но для исходно более тяжелых больных откладывание операции может приводить к быстрому прогрессированию. Нарастание тяжести состояния вряд ли равномерный прямолинейный процесс. Более полезной было бы решение задачи оценки допустимого времени ожидания, как раз в зависимости от исходного состояния.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 26.02.2018 - 10:28
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Благодарю за внимание к моей задачи.

Дело в том, что на первом этапе все больные имеют небольшой разброс значений баллов относительно центральной тенденции. Корреляция (смотрела критерием Спирмана) времени ожидания и баллов на первом этапе очень слабая - не более 0.15-0.2. Через определенное время количество баллов меняется. Причем за исключением двух больных, количество баллов увеличивается (состояние ухудшается). Это вполне объяснимо и закономерно. Я даже сначала думала оценивать односторонний уровень значимости. Чем больше ждем операции, тем больше количество баллов на второй точке: зависимость времени ожидания от баллов втором этапе значительно сильнее - ро примерно 0.7, корреляция с дельтой количества баллов также сильная и значима (сейчас просто нет данных под рукой).
Все эти расчеты я делала просто чтоб примерно прикинуть, насколько верна моя гипотеза. Теперь встал вопрос о том, как это сделать правильно.

Отдельно хочу остановиться на "ухудшение состояния, связанное с длительностью ожидания операции наблюдается независимо от исходного количества баллов?, вряд ли верно с медицинской точки зрения". С первого взгляда да. Однако этот вывод я сделала по двум причинам: состояние пациентов на первой точке примерно одинаковое (собственно - лучшее на протяжении анализируемого периода у 99% больных). Это практически сводит на нет эффект того, что "Какие то исходные состояния медленно прогрессируют, можно откладывать операцию на какое то время, но для исходно более тяжелых больных откладывание операции может приводить к быстрому прогрессированию". Если я Вас правильно поняла. Поэтому и корреляция с временем ожидания очень слабая. Однако, безусловно, такой эффект присутствует и мне и необходимо исключить влияние количества баллов 1 (на первом этапе для краткости) на время ожидания (в рамках поставленной задачи).

Я как раз и смотрела в сторону модели во случайными эффектами, т.к. там можно рассматривать индивидуальную изменчивость, как случайный эффект (насколько я поняла).
Но чем больше читаю, тем больше у меня вопросов по решению, как мне кажется, достаточно несложной задачи (когда очень хочется решить ее правильно).


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 26.02.2018 - 10:31
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



"..."линейная кривая" и как вы ее себе представляете - это загадка"
Да, я неверно выразилась. Но смысл, думаю, понятен. Графическое преставление линейной зависимости, наверное, так.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 26.02.2018 - 14:23
Сообщение #6


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Daria @ 26.02.2018 - 10:28) *
...корреляция с дельтой количества баллов также сильная и значима (сейчас просто нет данных под рукой).


Вот это - самая драгоценная часть вашего исследования. Я бы еще из озорства проверил гипотезу Ho:P{(X-Y)>0}=1/2 (т.е. о том, что медиана этих разностей равна 0). Критерием Манна - Уитни. Да-да, несмотря на то, что формально он вроде бы здесь и неприменим. При отвержении нулевой гипотезы восстанавливал бы зависимость: Дельта=Константа + Бета*Временной_интервал+ Ашипка.

И все это только для того, чтобы "доказать" ученому миру, что чем грубее шкала, тем больше приходится ждать, чтобы зафиксировать с ее помощью различия в состоянии пациента...

Сообщение отредактировал 100$ - 26.02.2018 - 14:32
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 26.02.2018 - 16:55
Сообщение #7


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Как приеду домой попробую, спасибо. Сразу могу сказать, что медиана разности будет значимо больше нуля.
Я думала о том, чтобы взять дельту. В моем случае (в этом конкретно, а также в некоторых других) это самый простой способ уйти от повторных наблюдений. Не знаю только, насколько такой подход будет правильным.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 26.02.2018 - 17:20
Сообщение #8


Дух форума
*

Группа: Пользователи
Сообщений: 140
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(Daria @ 26.02.2018 - 09:31) *
"..."линейная кривая" и как вы ее себе представляете - это загадка"
Да, я неверно выразилась. Но смысл, думаю, понятен. Графическое преставление линейной зависимости, наверное, так.

"линейная кривая"=="Графическое преставление линейной зависимости" == (самое сложнонаучное и математикозаумное название) "прямая" lol.gif (ну,
или "плоскость" в многомерном случае).

Сообщение отредактировал passant - 26.02.2018 - 17:23
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 26.02.2018 - 17:26
Сообщение #9


Дух форума
*

Группа: Пользователи
Сообщений: 140
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(DrgLena @ 26.02.2018 - 00:47) *
Я думаю, что вы не правильно поняли. Баллов после операции нет. Обе оценки сделаны до операции. Вторая оценка характеризует больного после какого то времени ОЖИДАНИЯ операции. И это написано ясно.

Да, Вы правы. Перечитал еще раз - именно так. Просто мне, как "не врачу", сложно было представить, что можно откладывать необходимую операцию просто для того, что-бы доказать гипотезу, что "чем больше ждем, тем хуже становиться больному".

Сообщение отредактировал passant - 26.02.2018 - 17:31
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 26.02.2018 - 17:38
Сообщение #10


Дух форума
*

Группа: Пользователи
Сообщений: 715
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Daria @ 26.02.2018 - 16:55) *
Не знаю только, насколько такой подход будет правильным.


Схему "До-После" по-другому и не обработаешь. Даже критерий Стьюдента для парных выборок "работает" именно так.

Сообщение отредактировал 100$ - 26.02.2018 - 17:39
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 26.02.2018 - 17:54
Сообщение #11


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Конечно нет. Операция откладывается по множеству объективных медицинских и не медицинских проблем.
Самый простой способ, который мне видится - посчитать дельту, определить корреляцию дельты и срока ожидания.
Просто, как мне казалось, правильнее было бы определить зависимость срока ожидания и количества баллов на сроке 2, взяв некую поправку на исходное состояние пациентов.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 26.02.2018 - 17:59
Сообщение #12


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Цитата(100$ @ 26.02.2018 - 17:38) *
Схему "До-После" по-другому и не обработаешь. Даже критерий Стьюдента для парных выборок "работает" именно так.


Спасибо, буду знать.

Сообщение отредактировал Daria - 26.02.2018 - 18:02
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Daria
сообщение 26.02.2018 - 18:03
Сообщение #13


Дух форума
*

Группа: Пользователи
Сообщений: 19
Регистрация: 25.02.2018
Пользователь №: 31032



Также хочу сказать, что в данном случае я скорее пытаюсь определить, как мне правильнее считать, а не решить конкретную научную задачу. Необходимость взять поправку на исходное состояние встречается достаточно часто.
Мой пример (хоть он и реальный) несколько абстрактный и максимально упрощенный. Безусловно, на время ожидания и тяжесть состояния больных оказывают влияние множество факторов. Тем не менее, я хочу лишь определить, как связаны параметр (баллы по шкале на втором этапе) и второй параметр (время ожидания) с поправкой на третий параметр (баллы на первом этапе). Если бы первый и третий параметр не были повторными наблюдениями, было бы значительно проще.

Сообщение отредактировал Daria - 26.02.2018 - 22:50
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему