Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Тема закрытаОткрыть тему
> Как оценивать значимости при динамических процессах, выбор метода оценки
Anet
сообщение 29.05.2008 - 15:54
Сообщение #1





Группа: Пользователи
Сообщений: 2
Регистрация: 29.05.2008
Пользователь №: 5065



Добрый день! Подскажите пожалуйста каким критерием можно оценить статистическую значимость полученных результатов при сравнении динамических процессов. В эксперименте мы рассчитывали период выведения радионуклидов у мышей (выборка 15 мышей). Кроме того мы сравнили выведения у 8 самцов и 7 самок, в соответствии с полученными результатами выведение у самцов происходит быстрее (99 % радионуклида у самок выводиться с периодом 2,23 суток, а у самцов 2,14 суток). Применим ли здесь для оценки значимости t-критерий или нет? К сожалению, в публикациях по схожим темам стат. анализ вообще не проводиться, что бы сравнить что используют другие.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 29.05.2008 - 20:26
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Скорее всего потребуется дисперсионный анализ, но пока из вашего описания ничего не понятно. Ключевым здесь является многократное измерение одних и тех же животных. При планировании таких экспериментов необходимо индивидуально метить или отсаживать каждого зверя и далее собирать индивидуальные динамики. Было ли это сделано? Также напишите: (1) что в эксперименте является откликом, т.е. что измеряли и в каких единицах, (2) распишите как можно подробнее экспериментальную схему: как измеряли, сколько раз измеряли на протяжении эксперимента и сколько раз на одну временную точку, есть ли пропуски.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 29.05.2008 - 20:43
Сообщение #3





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Anet @ 29.05.2008 - 16:54) *
Добрый день! Подскажите пожалуйста каким критерием можно оценить статистическую значимость полученных результатов при сравнении динамических процессов. В эксперименте мы рассчитывали период выведения радионуклидов у мышей (выборка 15 мышей). Кроме того мы сравнили выведения у 8 самцов и 7 самок, в соответствии с полученными результатами выведение у самцов происходит быстрее (99 % радионуклида у самок выводиться с периодом 2,23 суток, а у самцов 2,14 суток). Применим ли здесь для оценки значимости t-критерий или нет? К сожалению, в публикациях по схожим темам стат. анализ вообще не проводиться, что бы сравнить что используют другие.

Стандартный подход заключается в определение того, какое распределение описывает динамическую кривую (для периодов полувыведения это чаще всего экспотенциальная) и затем сравнении параметров этого распределения друг с другом. Проблема в том, что период полувыведения является величиной, обратной к параметру экспоненциального распределения и, соответственно, для него t-тест не будет самым эффективным тестом даже если параметр варьирует случаным (нормальным) образом. Т.е. для анализа надо брать величину, обратную периоду полувывеления (1/t(1/2)) и ее уже можно сравнивать при помощи t-теста
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Anet
сообщение 30.05.2008 - 14:56
Сообщение #4





Группа: Пользователи
Сообщений: 2
Регистрация: 29.05.2008
Пользователь №: 5065



Большое спасибо за ответ. Графически все у нас получается красиво, да в значениях хорошо видно отличие. Попробуем использовать величину, обратную периоду полувыведения (1/t(1/2)).
Оценку общего содержания радионуклидов в теле каждого животного производили в первые 12 сут ежедневно, а в последующем - один раз в 3-12 сут. На каждое животное 23 измерения. Измерение содержания радионуклидов осуществляли прижизненно с помощью с β-спектрометра - 90Sr и 137Cs γ-спектрометра. Измеряли активность радионуклида в Бк, далее расчитывали удельную активность в Бк/г. Динамику выведения радионуклидов, исходя из природы этого процесса, можно описать уравнением экспоненциального снижения первого, второго и более порядков. В данном случае, в связи с относительно небольшой продолжительностью наблюдений, уменьшение содержания радионуклида лучше всего описывается уравнением второго порядка:

Сt= C0[a1e-0.693t/T1 + a2]
, где
Ct - содержание радионуклида в теле животного на t-е сут от начала эксперимента; C0 - исходное содержание радионуклида; a1 и a2 - соответственно, доли выводящейся и условно не выводящейся фракции радионуклида; T1 - эффективный период полувыведения выводящейся фракции радионуклида.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 30.05.2008 - 18:28
Сообщение #5





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Динамический процесс = временной ряд (time series)? По поводу сравнения процессов, наверное, надо поискать в Интернете работы по ключевым словам типа "comparing time series". На русском вряд ли что есть. Впрочем, как и в остальных более или менее новых разделах анализа данных.

Сделал беглый поиск. Действительно, есть несколько интересных работ, но платно. Не имея бесплатного доступа к академическим ресурсам и к нормальным библиотекам, ознакомиться не смог. Вам, может быть, успех будет способствовать.

Из того, что есть на русском. При сравнении двух временных рядов часто пользуются коэффициентом корреляции Пирсона. Можно использовать данный коэффициент в качестве критерия коррелированности, вычислив его p-значение.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 30.05.2008 - 19:56
Сообщение #6





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Anet @ 30.05.2008 - 15:56) *
Большое спасибо за ответ. Графически все у нас получается красиво, да в значениях хорошо видно отличие. Попробуем использовать величину, обратную периоду полувыведения (1/t(1/2)).
Оценку общего содержания радионуклидов в теле каждого животного производили в первые 12 сут ежедневно, а в последующем ? один раз в 3?12 сут. На каждое животное 23 измерения. Измерение содержания радионуклидов осуществляли прижизненно с помощью с β-спектрометра - 90Sr и 137Cs γ-спектрометра. Измеряли активность радионуклида в Бк, далее расчитывали удельную активность в Бк/г. Динамику выведения радионуклидов, исходя из природы этого процесса, можно описать уравнением экспоненциального снижения первого, второго и более порядков. В данном случае, в связи с относительно небольшой продолжительностью наблюдений, уменьшение содержания радионуклида лучше всего описывается уравнением второго порядка:

Сt= C0[a1e-0.693t/T1 + a2]
, где
Ct ? содержание радионуклида в теле животного на t-е сут от начала эксперимента; C0 ? исходное содержание радионуклида; a1 и a2 ? соответственно, доли выводящейся и условно
не выводящейся фракции радионуклида; T1 ? эффективный период полувыведения выводящейся фракции радионуклида.

Вопрос в том, что Вы хотите сравнить. невыводящиеся доли, выводящиеся доли, скорость выведения. Простейший (с точки зрения обработки) вариант заключается в том, что Вы делаете нелинейный регресионный анализ для каждого животного по приведенной выше формуле (только не e-0.693t/T1, а e-k*t) с зависимой переменной Сt/C0
Получаете, соответственно, оценки a1, a2 и к. Рассматриваете их как случайные величины и сравниваете у всех животных (по группам).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 1.06.2008 - 07:42
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Предложенный Плавом подход с индивидуальными регрессиями хорош тем, что позволяет обобщить данные и получить вместо множества точек во времени всего 3 параметра уравнения, имеющие четкий биологический смысл. Но так бывает не всегда. Например, при приближении сложной функции полиномами параметры уравнения не будут иметь никакого смысла. Говоря о дисперсионном анализе, я имел в виду подход, который подойдет для сравнения рядов любой сложности. В вашем случае он позволит ответить на вопрос: отличаются ли 2 (самцы и самки) или более рядов друг от друга. Минус этого подхода - его результаты нельзя описать в терминах долей выводящихся фракций и периодов.

В дисперсионном анализе нужно задать 3 фактора: Особь «внутри» Пола, Пол и Время. Введение фактора Особь позволит учесть зависимый характер данных. Он помещен внутрь фактора Пол, т.к. пол особи в ходе эксперимента не меняется. В ходе анализа такого комплекса будут выражены следующие эффекты:
1. Особь «внутри» Пола. Случайный фактор. Оценивает индивидуальные различия животных в удельной активности радионуклида (при усреднении данных по времени).
2. Пол. Фиксированный фактор. Оценивает половые различия (при усреднении данных по особям и времени).
3. Время. Фиксированный фактор. Оценивает различия между временными точками (при усреднении данных по особям и полу). Грубо говоря - есть ли динамика вообще.
3. Взаимодействие факторов: Особь «внутри» Пола х Время. Случайное. Выражает изменчивость индивидуальных динамик животных внутри пола, но оценить его значимость в вашем случае нельзя - см. ниже.
4. Взаимодействие факторов: Пол х Время. Фиксированное. Оценивает отличались ли динамики для полов (при усреднении по особям внутри пола).
Взаимодействия факторов Особь «внутри» Пола х Пол быть не может, тройного взаимодействия - тоже. Также невозможно выразить ошибку всего анализа (случайный эффект), поскольку в каждой временной точке вы измеряли животное однократно. Раз нельзя выразить ошибку - невозможно и оценить взаимодействие факторов Особь «внутри» Пола х Время (для расчета F-критерия средний квадрат этого эффекта нужно делить на средний квадрат ошибки).

Т.о. вся изменчивость показателя «удельная активность радионуклида» полностью раскладывается на составляющие части. Для вас наиболее важно взаимодействие факторов: Пол х Время. Если оно окажется значимым, интерпретировать его можно путем графического сравнения динамик у самцов и самок. Распределение концентраций в широком диапазоне и активностей близко к логарифмически нормальному, поэтому исходные данные для описанного анализа лучше прологарифмировать. Если будете его делать - могу подсказать по программам Statistica и SPSS.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 2.06.2008 - 10:09
Сообщение #8





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(плав @ 30.05.2008 - 19:56) *
Вопрос в том, что Вы хотите сравнить. невыводящиеся доли, выводящиеся доли, скорость выведения. Простейший (с точки зрения обработки) вариант заключается в том, что Вы делаете нелинейный регресионный анализ для каждого животного по приведенной выше формуле (только не e-0.693t/T1, а e-k*t) с зависимой переменной Сt/C0
Получаете, соответственно, оценки a1, a2 и к. Рассматриваете их как случайные величины и сравниваете у всех животных (по группам).

Не могу согласиться с уважаемыми собеседниками.

Что по сути мы здесь делаем? Строим математическую модель в виде нелинейной регрессии (при этом, естественно, мы, как минимум, допускаем, что именно такая модель верно описывает исследуемый процесс). Уравнение модели определено с точностью до неизвестных коэффициентов, которые мы одним из методов оптимизации (например, МНК) находим на основании данных эксперимента. Здесь вроде бы все строго о и обоснованно.

Что мы делаем дальше? Сравниваем статистически коэффициенты моделей двух процессов. Вот тут есть риск ошибиться. Дел в том, что величина изменения выхода математической модели зависит не только от вычисленных коэффициентов, но и от чувствительности модели к этим коэффициентам. Поясню. Предположим, модель сильно чувствительна к коэффициенту. Это ведет к тому, что малые (статистические незначимые?) изменения коэффициента ведут к большим (статистически значимым?) изменениям выхода модели.

Попытался пояснить порочность предложенной схемы. Может, и ошибаюсь.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 3.06.2008 - 22:41
Сообщение #9





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Это только в том случае, если мы имеем с нелинейными нестабильными моделями (типа тех, что приняты в теории хаоса). В обсуждаемых моделях (логлинейных) небольшие изменения исходных параметров не ведут к значительным изменениям предсказываемых величин. Основным является теоретическая зависимость, которая в данном случае базируется на экспоненциальном распределении времен выведения. Эта модель теоретически достаточно обоснованная. Для нее мы находим коэффициенты, которые являются наилучшими несмещенными (кстати, скорее надо использовать MLE, а не OLS оценки). Поэтому мне не свосем понятны опасения в отношении предложенного подхода
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 4.06.2008 - 06:19
Сообщение #10





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(плав @ 3.06.2008 - 22:41) *
Это только в том случае, если мы имеем с нелинейными нестабильными моделями (типа тех, что приняты в теории хаоса). В обсуждаемых моделях (логлинейных) небольшие изменения исходных параметров не ведут к значительным изменениям предсказываемых величин. Основным является теоретическая зависимость, которая в данном случае базируется на экспоненциальном распределении времен выведения. Эта модель теоретически достаточно обоснованная. Для нее мы находим коэффициенты, которые являются наилучшими несмещенными (кстати, скорее надо использовать MLE, а не OLS оценки). Поэтому мне не свосем понятны опасения в отношении предложенного подхода

В данном случае предложенный подход, возможно, и сработает. Только нужно обосновать теоретически, что проверка значимости различий (всех?) коэффициентов двух моделей эквивалентна проверке значимости выходов моделей.

Но очевидно, что подход не универсален. Предположим, модель составляется в виде некоторого ряда путем отбрасывания членов ряда высших порядков малости. Так вот, коэффициенты при членах высших порядков могут в моделях отличаться (утрирую) хоть на порядки. Значимость их различий не имеет никакого значения. Они могут быть как значимыми, так и нет. Они не влияют на выход модели. Поэтому делать вывод о значимости на основании сравнения всех соответствующих коэффициентов модели - занятие сомнительное.

Тут проблема видится глубже. Дело в том, что статистику не интересует структура математической модели, отражающая внутренние взаимосвязи и физику явления. Это - задачи математического моделирования. Думаю, смешивать математическое моделирование и статистику все-таки не стоит. Либо - теоретическое обоснование.

А может, просто сравнить два временных ряда каким-либо парным критерием - Стьюдента или Вилкоксона?

Только представьте себе! Сейчас все исследователи начнут аппроксимировать наборы экспериментальных точек полиномами и проверять значимость различий двух процессов путем выявления значимости различий коэффициентов этих полиномов. О, господи.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 4.06.2008 - 21:11
Сообщение #11





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Игорь @ 4.06.2008 - 07:19) *
Тут проблема видится глубже. Дело в том, что статистику не интересует структура математической модели, отражающая внутренние взаимосвязи и физику явления. Это - задачи математического моделирования. Думаю, смешивать математическое моделирование и статистику все-таки не стоит. Либо - теоретическое обоснование.

А может, просто сравнить два временных ряда каким-либо парным критерием - Стьюдента или Вилкоксона?

А вот тут, как раз и появятся проблемы. Представьте себе, что у нас два временных ряда (например, две кривые радиоактивного распада). Если мы начинаем сравнивать их друг с другом, то нам надо вообще учитывать ауторегрессию и мы, самое главное, сравниваем всегда две точки. Если же мы используем модель, то весь набор данных используется для расчета пары коэффициентов.
Теоретическое обсуждение выглядит немного путано, но легко становится очевидным, например при анализе заболеваемости инфекциями методами обратного рассчета, когда использование не модельных данных означает, что есть n переменных и надо n уравнений, а модельное приближение начинает "работать" в случае наличия лишь данных за два-три года...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
vah1
сообщение 5.06.2008 - 17:44
Сообщение #12





Группа: Пользователи
Сообщений: 25
Регистрация: 3.06.2008
Пользователь №: 5077



вообщето в медицине устраивать моделирование временных рядов это большая возможность поводить себя за нос. чуть коэффициентики изменил и вот желаемый результат а уж про медицинский смысл так вообще иной раз говорить не приходится... а применительно к конкретному случаю соглашусь с мнением о том что достаточно простой статистики стьюдетна или вилкоксона. тем более что дискретизация при оценке параетров низки и мы не можем быть застрахованы от скрытых выбросов
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 5.06.2008 - 20:32
Сообщение #13





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(vah1 @ 5.06.2008 - 18:44) *
вообщето в медицине устраивать моделирование временных рядов это большая возможность поводить себя за нос. чуть коэффициентики изменил и вот желаемый результат а уж про медицинский смысл так вообще иной раз говорить не приходится... а применительно к конкретному случаю соглашусь с мнением о том что достаточно простой статистики стьюдетна или вилкоксона. тем более что дискретизация при оценке параетров низки и мы не можем быть застрахованы от скрытых выбросов

Какие коэффициенты изменили? Их как раз и оценивают. Какая дискретизация при оценке по Стьюденту? Что такое скрытые выбросы? Кто кого куда выбросил и откуда, что может быть спасено при сравнении точек друг с другом.
Я чрезвычайно рад, что "Вы соглашаетесь с мнением", тут в топике могут еще полтора миллиона человек высказать свою точку зрения, не важно на чем она основывается. Настоятельно рекомендую вначале переписать учебники и монографии по фармакологии, где сравниваются времена полувыведения (это модельный подход, на случай, если неизвестно и лень было читать предшествующее обсуждение) и заменить там все на сравнение при помощи "простой статистики стьюдетна или вилкоксона". До этого момента рекомендую либо придерживаться принятых подходов, либо обосновывать (логически выводить) причины использования других подходов.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 5.06.2008 - 22:30
Сообщение #14





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(vah1 @ 5.06.2008 - 20:44) *
вообщето в медицине устраивать моделирование временных рядов это большая возможность поводить себя за нос...

Построение качественной модели любого процесса невозможно без глубокого понимания этого процесса, а никто не оспорит, что к этому мы и стремимся. И зачем устраивать из медицины некую особую область? Такая же как и все, со своими особенностями и сложностями, причем главным образом в плане социальном, а не техническом. А потому и простые регрессионные модели, и полученные из решения дифференциальных уравнений, а если нужно - то и сингулярный спектральный анализ, и вейвлеты, и т.д. столь же уместны и полезны здесь как в других областях науки. Иначе можно вообще отказаться от попыток познания и использовать чисто утилитарный подход - например, свалить все данные в черный ящик нейронных сетей и пускай там все само утрясается, главное чтобы правильно советовало combats_friday.gif .

Возвращаясь к данной задаче наиболее общие рассуждения таковы: (1) есть количественный показатель - нужно пробовать параметрические методы, возможно после предварительного преобразования данных, (2) есть зависимость - нужно использовать регрессию, (3) есть вложенные (nested) эффекты (Особи внутри Пола) - нужно использовать иерархический дисперсионный анализ. В итоге приходим к сложному анализу, в котором сочетаются регрессионная и дисперсионная техники и который должно быть возможно описать в терминах общих линейных моделей (GLM). Получается нечто типа нелинейного ковариационного анализа с иерархическим эффектом (возможно, это вариант конфлюэнтного анализа, но я не уверен. Буду признателен за хорошую ссылку по конфлюэнтному анализу). В попытке упрощения задачи Плав предложил оттолкнуться от регрессионного анализа, я - от дисперсионного. Единственное что меня смущает в регрессионном подходе с последующим сравнением параметров - зависимый характер этих параметров. Раз они получены по одной линии регрессии, то ошибка «размазана» по всем трем параметрам и сравнивать выборки правильнее не по одному, а по всем параметрам одновременно. Но как это сделать технически? Дисперсионный анализ - более универсальный, т.к. подойдет для сравнения рядов любой сколь угодно сложной динамики - в т.ч. для которой, в отличие от нашего случая, еще нет внятной модели. Но в этом подходе мне не нравится полный отказ от попытки обобщить изменчивость по оси времени регрессией. Остается «нечто типа нелинейного ковариационного анализа с иерархическим эффектом». Полагаю, что вычленить различие линий нелинейной регрессии в нем можно через расчет отклонений от общей регрессии - сходно с тем, как в ковариационном анализе устанавливается неоднородность наклонов прямых. Но в моей практике еще не было прецедента, чтобы разобраться в этом frown.gif .
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 6.06.2008 - 06:21
Сообщение #15





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Если позволите, кратко резюмирую.

1. Коэффициенты регрессионных моделей можно сравнивать, если они допускают прямую физическую интерпретацию. В этом случае сравниваются уже не коэффициенты регрессии, а именно вычисленные (пусть даже идентифицированные в результате оптимизации математической модели) параметры физического процесса. И это гораздо лучше, чем сравнивать линии регрессии, для которых влияние и интерпретация параметров неизвестны. Правда, это уже область математического моделирования, а не прикладной статистики.

2. Коэффициенты регрессионных моделей нельзя сравнивать, если регрессионная модель подобрана эмпирически, на основании лишь похожего вида графика процесса и графика модели, т.к. в этом случае коэффициенты модели не допускают физической интерпретации, а чувствительность модели к данным коэффициентам недостаточно исследована. На каком-то участке процесса совершенно различные модели могут давать похожий внешне выход. Более того, совершенно неадекватные модели могут давать лучшее приближение к выходу эксперимента, чем модели, более обоснованные физически.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Тема закрытаОткрыть тему