Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Сравнение связанных выборок с missing values
Cules2013
сообщение 5.07.2019 - 09:54
Сообщение #1





Группа: Пользователи
Сообщений: 27
Регистрация: 5.02.2018
Пользователь №: 30938



Добрый день!
Я в первый раз провёл эксперимент по новой для меня схеме, поэтому несколько затрудняюсь, как теперь правильно обработать данные. У меня 3 группы крыс по 15 шт в каждой. Эксперимент длится 21 день, и на 3, 10 и 21-й дни я забиваю по 5 животных на биохимию мозга. Таким образом у меня получается, что 5 крыс у меня прошли весь эксперимент, а 5 только 3 дня, и ещё 5 только 10 дней. По факту у меня получается, что на 10-й и 21-й день у меня часть данных от тех же животных, что на 3-й и 10-й дни, а часть -нет, т.е. у меня выходит смешанная выборка - она и не связанная, и не несвязанная одновременно, 50/50 + кол-во чисел уменьшается с уменьшением кол-ва животных, т.е у меня ещё и missing values присутствуют. Как вообще такое считать статистически?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
ogurtsov
сообщение 5.07.2019 - 10:48
Сообщение #2





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Цитата(Cules2013 @ 5.07.2019 - 09:54) *
Добрый день!
Я в первый раз провёл эксперимент по новой для меня схеме, поэтому несколько затрудняюсь, как теперь правильно обработать данные. У меня 3 группы крыс по 15 шт в каждой. Эксперимент длится 21 день, и на 3, 10 и 21-й дни я забиваю по 5 животных на биохимию мозга. Таким образом у меня получается, что 5 крыс у меня прошли весь эксперимент, а 5 только 3 дня, и ещё 5 только 10 дней. По факту у меня получается, что на 10-й и 21-й день у меня часть данных от тех же животных, что на 3-й и 10-й дни, а часть -нет, т.е. у меня выходит смешанная выборка - она и не связанная, и не несвязанная одновременно, 50/50 + кол-во чисел уменьшается с уменьшением кол-ва животных, т.е у меня ещё и missing values присутствуют. Как вообще такое считать статистически?

Сформулируйте цели исследования. Не существует никакого способа взять кучу цифр, "посчитать статистически" и получить на выходе что-то осмысленное.
Выборки, кстати, несвязанные, поскольку каждое животное гуманно умерщвлялось всего один раз.

Сообщение отредактировал ogurtsov - 5.07.2019 - 11:01


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Cules2013
сообщение 5.07.2019 - 11:13
Сообщение #3





Группа: Пользователи
Сообщений: 27
Регистрация: 5.02.2018
Пользователь №: 30938



Цитата(ogurtsov @ 5.07.2019 - 10:48) *
Сформулируйте цели исследования. Не существует никакого способа взять кучу цифр, "посчитать статистически" и получить на выходе что-то осмысленное.
Выборки, кстати, несвязанные, поскольку каждое животное гуманно умерщвлялось всего один раз.

Может я нечётко объяснил. Попробую ещё раз. Я имел ввиду попарные сравнения "до-после" в пределах одной группы. Ясное дело, что межгрупповые отличия пойдут как несвязанные выборки. Итак, у меня есть 15 крыс, я у них зафиксировал допустим что уровень предпочтения сахарозы, чтобы оценить их уровень депрессивности. Это у нас фоновая запись. Затем, на 3-й день стресс-воздействия, перед забоем, я повторил эксперимент. Здесь проблем нет, кол-во животных одинаковое, и получаются типичные связанные выборки. Но на 10-й день у меня уже 10 крыс, т.к. после 3-го дня я забил 5 шт. Так вот, сравнивая результаты 3 дня допустим с 10-м, я сравниваю 15 чисел с 10 числами (-5 крыс забой), и получается, что 10 крыс = 10 чисел, у меня идут как связанные выборки, но 5 чисел из 3-го дня - их не с чем сравнивать, ведь на 10-й день этих крыс уже нет, они мертвы. Вот и получается какой-то суррогат - одни данные имеют пару для сравнения, другие нет. И если я беру АNOVA или Данна и ставлю сравнения связанных выборок, то он мне разумно заявляет, что нельзя посчитать статистику на связанных выборках с отсутствующими значениями.
Ну а цель исследования проста - проверить, вызывает ли моё стресс-воздействие депрессию у крыс или нет. Поэтому и беру тест на сахарозу и биохимию мозга. Ну а внутригрупповые сравнения должны показать, изменяется ли картина со временем, или нет.
Про связь "гуманное умерщвление" и "несвязанные выборки" вообще не въехал. При чём тут это?

Сообщение отредактировал Cules2013 - 5.07.2019 - 11:14
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 9.07.2019 - 05:42
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Cules2013 @ 5.07.2019 - 13:13) *
Может я нечётко объяснил. Попробую ещё раз. Я имел ввиду попарные сравнения "до-после" в пределах одной группы. Ясное дело, что межгрупповые отличия пойдут как несвязанные выборки. Итак, у меня есть 15 крыс, я у них зафиксировал допустим что уровень предпочтения сахарозы, чтобы оценить их уровень депрессивности. Это у нас фоновая запись. Затем, на 3-й день стресс-воздействия, перед забоем, я повторил эксперимент. Здесь проблем нет, кол-во животных одинаковое, и получаются типичные связанные выборки. Но на 10-й день у меня уже 10 крыс, т.к. после 3-го дня я забил 5 шт. Так вот, сравнивая результаты 3 дня допустим с 10-м, я сравниваю 15 чисел с 10 числами (-5 крыс забой), и получается, что 10 крыс = 10 чисел, у меня идут как связанные выборки, но 5 чисел из 3-го дня - их не с чем сравнивать, ведь на 10-й день этих крыс уже нет, они мертвы. Вот и получается какой-то суррогат - одни данные имеют пару для сравнения, другие нет. И если я беру АNOVA или Данна и ставлю сравнения связанных выборок, то он мне разумно заявляет, что нельзя посчитать статистику на связанных выборках с отсутствующими значениями.
Ну а цель исследования проста - проверить, вызывает ли моё стресс-воздействие депрессию у крыс или нет. Поэтому и беру тест на сахарозу и биохимию мозга. Ну а внутригрупповые сравнения должны показать, изменяется ли картина со временем, или нет.
Про связь "гуманное умерщвление" и "несвязанные выборки" вообще не въехал. При чём тут это?

В части доказательства эффекта можно пойти двумя путями: простым и более сложным, но показатели, задействованные в первом способе могут быть полезны и во втором.

1) Через величину эффекта с доверительными интервалами (ДИ). Считаете для каждой из трёх пятёрок "До-После" разность (После-До) с 95% ДИ. Если ДИ не включает ноль, значит можно интерпретировать величину эффекта как статистически значимо отличающуюся от нуля на уровне значимости альфа=0,05. Провести сравнение трёх групп по величине эффекта можно в простом ANOVA, исключив данные "До". Группы очень маленькие, поэтому лучше использовать параметрику, чем ранговые методы; возможно потребуются предварительные преобразования данных типа логарифмирования или Бокса - Кокса.

2) Смешанная модель ANOVA через общие линейные модели. Факторов два: (1) Индивид (случайный) - всех пронумеровать и использовать эти метки в анализа в качестве градаций фактора. (2) Время (фиксированный) - 4 точки: 1 до и 3 после. Если вы измеряли показатели у каждого животного однократно, то главные эффекты будут тестироваться (делиться на соответствующий средний квадрат) относительно взаимодействия факторов "Индивид х Время", а само это взаимодействия протестировать будет нельзя. Для таких маленьких экспериментов желательно проводить измерения дважды. Тогда из указанного взаимодействия, представляющего собой сумму эффектов взаимодействия и ошибку измерения можно будет выразить и вычесть последнюю. Таким образом величина взаимодействия немного уменьшится, что сделает возможным обнаруживать более слабые эффекты главных факторов, включая интересующий вас фактор "Время". Также могут потребоваться преобразования, а апостериорные сравнения в рамках модели - любыми из из приглянувшихся методов. Этот подход можно использовать для доказательства наличия эффекта, ну а для оценки величины эффекта все равно придётся считать разности с 95% ДИ как в первом подходе, только здесь они будут выполнять роль сродни описательной статистики, сами ДИ не интерпретируются, не сравниваются ни с нолём, ни между собой.

3) Для визуализации эффекта изменения показателя при стрессе можно использовать что-то типа локальных регрессий или полиномиального сглаживания. Мне понравились обобщённые аддитивные модели GAM, которые адаптивны по форме к данным + позволяют строить 95%-ные доверительные границы для регрессии. По поводу возможности использования частично зависимых выборок не знаю, нужно читать про GAM-регрессию больше, но может требования независимости и не будет: просто проводим линию через некие средние значения.

Сообщение отредактировал nokh - 9.07.2019 - 05:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Cules2013
сообщение 9.07.2019 - 17:48
Сообщение #5





Группа: Пользователи
Сообщений: 27
Регистрация: 5.02.2018
Пользователь №: 30938



Цитата(nokh @ 9.07.2019 - 05:42) *
В части доказательства эффекта можно пойти двумя путями: простым и более сложным, но показатели, задействованные в первом способе могут быть полезны и во втором.

1) Через величину эффекта с доверительными интервалами (ДИ). Считаете для каждой из трёх пятёрок "До-После" разность (После-До) с 95% ДИ

А если разница "после-до" отрицательная? Нужно брать по модулю для расчёта ДИ?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 10.07.2019 - 07:53
Сообщение #6





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Cules2013 @ 9.07.2019 - 19:48) *
А если разница "после-до" отрицательная? Нужно брать по модулю для расчёта ДИ?

Я просто почему-то решил, что показатель увеличивается:) Если показатель в большинстве случаев уменьшается - берите разность (До-После). Но только для всех одинаково, т.е. если вдруг где-то будут положительные разности, а где-то отрицательные - так и нужно обрабатывать. Например если одна разность 4, а вторая (-2), то значит в среднем показатель изменился на (4+(-2))/2=1.
В любом случае по модулю брать нельзя, но можно для удобства интерпретации умножить ВЕСЬ набор данных на (-1).

Сообщение отредактировал nokh - 10.07.2019 - 07:54
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему