Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Как оценивать значимости при динамических процессах
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Anet
Добрый день! Подскажите пожалуйста каким критерием можно оценить статистическую значимость полученных результатов при сравнении динамических процессов. В эксперименте мы рассчитывали период выведения радионуклидов у мышей (выборка 15 мышей). Кроме того мы сравнили выведения у 8 самцов и 7 самок, в соответствии с полученными результатами выведение у самцов происходит быстрее (99 % радионуклида у самок выводиться с периодом 2,23 суток, а у самцов 2,14 суток). Применим ли здесь для оценки значимости t-критерий или нет? К сожалению, в публикациях по схожим темам стат. анализ вообще не проводиться, что бы сравнить что используют другие.
nokh
Скорее всего потребуется дисперсионный анализ, но пока из вашего описания ничего не понятно. Ключевым здесь является многократное измерение одних и тех же животных. При планировании таких экспериментов необходимо индивидуально метить или отсаживать каждого зверя и далее собирать индивидуальные динамики. Было ли это сделано? Также напишите: (1) что в эксперименте является откликом, т.е. что измеряли и в каких единицах, (2) распишите как можно подробнее экспериментальную схему: как измеряли, сколько раз измеряли на протяжении эксперимента и сколько раз на одну временную точку, есть ли пропуски.
плав
Цитата(Anet @ 29.05.2008 - 16:54) *
Добрый день! Подскажите пожалуйста каким критерием можно оценить статистическую значимость полученных результатов при сравнении динамических процессов. В эксперименте мы рассчитывали период выведения радионуклидов у мышей (выборка 15 мышей). Кроме того мы сравнили выведения у 8 самцов и 7 самок, в соответствии с полученными результатами выведение у самцов происходит быстрее (99 % радионуклида у самок выводиться с периодом 2,23 суток, а у самцов 2,14 суток). Применим ли здесь для оценки значимости t-критерий или нет? К сожалению, в публикациях по схожим темам стат. анализ вообще не проводиться, что бы сравнить что используют другие.

Стандартный подход заключается в определение того, какое распределение описывает динамическую кривую (для периодов полувыведения это чаще всего экспотенциальная) и затем сравнении параметров этого распределения друг с другом. Проблема в том, что период полувыведения является величиной, обратной к параметру экспоненциального распределения и, соответственно, для него t-тест не будет самым эффективным тестом даже если параметр варьирует случаным (нормальным) образом. Т.е. для анализа надо брать величину, обратную периоду полувывеления (1/t(1/2)) и ее уже можно сравнивать при помощи t-теста
Anet
Большое спасибо за ответ. Графически все у нас получается красиво, да в значениях хорошо видно отличие. Попробуем использовать величину, обратную периоду полувыведения (1/t(1/2)).
Оценку общего содержания радионуклидов в теле каждого животного производили в первые 12 сут ежедневно, а в последующем - один раз в 3-12 сут. На каждое животное 23 измерения. Измерение содержания радионуклидов осуществляли прижизненно с помощью с β-спектрометра - 90Sr и 137Cs γ-спектрометра. Измеряли активность радионуклида в Бк, далее расчитывали удельную активность в Бк/г. Динамику выведения радионуклидов, исходя из природы этого процесса, можно описать уравнением экспоненциального снижения первого, второго и более порядков. В данном случае, в связи с относительно небольшой продолжительностью наблюдений, уменьшение содержания радионуклида лучше всего описывается уравнением второго порядка:

Сt= C0[a1e-0.693t/T1 + a2]
, где
Ct - содержание радионуклида в теле животного на t-е сут от начала эксперимента; C0 - исходное содержание радионуклида; a1 и a2 - соответственно, доли выводящейся и условно не выводящейся фракции радионуклида; T1 - эффективный период полувыведения выводящейся фракции радионуклида.
Игорь
Динамический процесс = временной ряд (time series)? По поводу сравнения процессов, наверное, надо поискать в Интернете работы по ключевым словам типа "comparing time series". На русском вряд ли что есть. Впрочем, как и в остальных более или менее новых разделах анализа данных.

Сделал беглый поиск. Действительно, есть несколько интересных работ, но платно. Не имея бесплатного доступа к академическим ресурсам и к нормальным библиотекам, ознакомиться не смог. Вам, может быть, успех будет способствовать.

Из того, что есть на русском. При сравнении двух временных рядов часто пользуются коэффициентом корреляции Пирсона. Можно использовать данный коэффициент в качестве критерия коррелированности, вычислив его p-значение.
плав
Цитата(Anet @ 30.05.2008 - 15:56) *
Большое спасибо за ответ. Графически все у нас получается красиво, да в значениях хорошо видно отличие. Попробуем использовать величину, обратную периоду полувыведения (1/t(1/2)).
Оценку общего содержания радионуклидов в теле каждого животного производили в первые 12 сут ежедневно, а в последующем ? один раз в 3?12 сут. На каждое животное 23 измерения. Измерение содержания радионуклидов осуществляли прижизненно с помощью с β-спектрометра - 90Sr и 137Cs γ-спектрометра. Измеряли активность радионуклида в Бк, далее расчитывали удельную активность в Бк/г. Динамику выведения радионуклидов, исходя из природы этого процесса, можно описать уравнением экспоненциального снижения первого, второго и более порядков. В данном случае, в связи с относительно небольшой продолжительностью наблюдений, уменьшение содержания радионуклида лучше всего описывается уравнением второго порядка:

Сt= C0[a1e-0.693t/T1 + a2]
, где
Ct ? содержание радионуклида в теле животного на t-е сут от начала эксперимента; C0 ? исходное содержание радионуклида; a1 и a2 ? соответственно, доли выводящейся и условно
не выводящейся фракции радионуклида; T1 ? эффективный период полувыведения выводящейся фракции радионуклида.

Вопрос в том, что Вы хотите сравнить. невыводящиеся доли, выводящиеся доли, скорость выведения. Простейший (с точки зрения обработки) вариант заключается в том, что Вы делаете нелинейный регресионный анализ для каждого животного по приведенной выше формуле (только не e-0.693t/T1, а e-k*t) с зависимой переменной Сt/C0
Получаете, соответственно, оценки a1, a2 и к. Рассматриваете их как случайные величины и сравниваете у всех животных (по группам).
nokh
Предложенный Плавом подход с индивидуальными регрессиями хорош тем, что позволяет обобщить данные и получить вместо множества точек во времени всего 3 параметра уравнения, имеющие четкий биологический смысл. Но так бывает не всегда. Например, при приближении сложной функции полиномами параметры уравнения не будут иметь никакого смысла. Говоря о дисперсионном анализе, я имел в виду подход, который подойдет для сравнения рядов любой сложности. В вашем случае он позволит ответить на вопрос: отличаются ли 2 (самцы и самки) или более рядов друг от друга. Минус этого подхода - его результаты нельзя описать в терминах долей выводящихся фракций и периодов.

В дисперсионном анализе нужно задать 3 фактора: Особь «внутри» Пола, Пол и Время. Введение фактора Особь позволит учесть зависимый характер данных. Он помещен внутрь фактора Пол, т.к. пол особи в ходе эксперимента не меняется. В ходе анализа такого комплекса будут выражены следующие эффекты:
1. Особь «внутри» Пола. Случайный фактор. Оценивает индивидуальные различия животных в удельной активности радионуклида (при усреднении данных по времени).
2. Пол. Фиксированный фактор. Оценивает половые различия (при усреднении данных по особям и времени).
3. Время. Фиксированный фактор. Оценивает различия между временными точками (при усреднении данных по особям и полу). Грубо говоря - есть ли динамика вообще.
3. Взаимодействие факторов: Особь «внутри» Пола х Время. Случайное. Выражает изменчивость индивидуальных динамик животных внутри пола, но оценить его значимость в вашем случае нельзя - см. ниже.
4. Взаимодействие факторов: Пол х Время. Фиксированное. Оценивает отличались ли динамики для полов (при усреднении по особям внутри пола).
Взаимодействия факторов Особь «внутри» Пола х Пол быть не может, тройного взаимодействия - тоже. Также невозможно выразить ошибку всего анализа (случайный эффект), поскольку в каждой временной точке вы измеряли животное однократно. Раз нельзя выразить ошибку - невозможно и оценить взаимодействие факторов Особь «внутри» Пола х Время (для расчета F-критерия средний квадрат этого эффекта нужно делить на средний квадрат ошибки).

Т.о. вся изменчивость показателя «удельная активность радионуклида» полностью раскладывается на составляющие части. Для вас наиболее важно взаимодействие факторов: Пол х Время. Если оно окажется значимым, интерпретировать его можно путем графического сравнения динамик у самцов и самок. Распределение концентраций в широком диапазоне и активностей близко к логарифмически нормальному, поэтому исходные данные для описанного анализа лучше прологарифмировать. Если будете его делать - могу подсказать по программам Statistica и SPSS.
Игорь
Цитата(плав @ 30.05.2008 - 19:56) *
Вопрос в том, что Вы хотите сравнить. невыводящиеся доли, выводящиеся доли, скорость выведения. Простейший (с точки зрения обработки) вариант заключается в том, что Вы делаете нелинейный регресионный анализ для каждого животного по приведенной выше формуле (только не e-0.693t/T1, а e-k*t) с зависимой переменной Сt/C0
Получаете, соответственно, оценки a1, a2 и к. Рассматриваете их как случайные величины и сравниваете у всех животных (по группам).

Не могу согласиться с уважаемыми собеседниками.

Что по сути мы здесь делаем? Строим математическую модель в виде нелинейной регрессии (при этом, естественно, мы, как минимум, допускаем, что именно такая модель верно описывает исследуемый процесс). Уравнение модели определено с точностью до неизвестных коэффициентов, которые мы одним из методов оптимизации (например, МНК) находим на основании данных эксперимента. Здесь вроде бы все строго о и обоснованно.

Что мы делаем дальше? Сравниваем статистически коэффициенты моделей двух процессов. Вот тут есть риск ошибиться. Дел в том, что величина изменения выхода математической модели зависит не только от вычисленных коэффициентов, но и от чувствительности модели к этим коэффициентам. Поясню. Предположим, модель сильно чувствительна к коэффициенту. Это ведет к тому, что малые (статистические незначимые?) изменения коэффициента ведут к большим (статистически значимым?) изменениям выхода модели.

Попытался пояснить порочность предложенной схемы. Может, и ошибаюсь.
плав
Это только в том случае, если мы имеем с нелинейными нестабильными моделями (типа тех, что приняты в теории хаоса). В обсуждаемых моделях (логлинейных) небольшие изменения исходных параметров не ведут к значительным изменениям предсказываемых величин. Основным является теоретическая зависимость, которая в данном случае базируется на экспоненциальном распределении времен выведения. Эта модель теоретически достаточно обоснованная. Для нее мы находим коэффициенты, которые являются наилучшими несмещенными (кстати, скорее надо использовать MLE, а не OLS оценки). Поэтому мне не свосем понятны опасения в отношении предложенного подхода
Игорь
Цитата(плав @ 3.06.2008 - 22:41) *
Это только в том случае, если мы имеем с нелинейными нестабильными моделями (типа тех, что приняты в теории хаоса). В обсуждаемых моделях (логлинейных) небольшие изменения исходных параметров не ведут к значительным изменениям предсказываемых величин. Основным является теоретическая зависимость, которая в данном случае базируется на экспоненциальном распределении времен выведения. Эта модель теоретически достаточно обоснованная. Для нее мы находим коэффициенты, которые являются наилучшими несмещенными (кстати, скорее надо использовать MLE, а не OLS оценки). Поэтому мне не свосем понятны опасения в отношении предложенного подхода

В данном случае предложенный подход, возможно, и сработает. Только нужно обосновать теоретически, что проверка значимости различий (всех?) коэффициентов двух моделей эквивалентна проверке значимости выходов моделей.

Но очевидно, что подход не универсален. Предположим, модель составляется в виде некоторого ряда путем отбрасывания членов ряда высших порядков малости. Так вот, коэффициенты при членах высших порядков могут в моделях отличаться (утрирую) хоть на порядки. Значимость их различий не имеет никакого значения. Они могут быть как значимыми, так и нет. Они не влияют на выход модели. Поэтому делать вывод о значимости на основании сравнения всех соответствующих коэффициентов модели - занятие сомнительное.

Тут проблема видится глубже. Дело в том, что статистику не интересует структура математической модели, отражающая внутренние взаимосвязи и физику явления. Это - задачи математического моделирования. Думаю, смешивать математическое моделирование и статистику все-таки не стоит. Либо - теоретическое обоснование.

А может, просто сравнить два временных ряда каким-либо парным критерием - Стьюдента или Вилкоксона?

Только представьте себе! Сейчас все исследователи начнут аппроксимировать наборы экспериментальных точек полиномами и проверять значимость различий двух процессов путем выявления значимости различий коэффициентов этих полиномов. О, господи.
плав
Цитата(Игорь @ 4.06.2008 - 07:19) *
Тут проблема видится глубже. Дело в том, что статистику не интересует структура математической модели, отражающая внутренние взаимосвязи и физику явления. Это - задачи математического моделирования. Думаю, смешивать математическое моделирование и статистику все-таки не стоит. Либо - теоретическое обоснование.

А может, просто сравнить два временных ряда каким-либо парным критерием - Стьюдента или Вилкоксона?

А вот тут, как раз и появятся проблемы. Представьте себе, что у нас два временных ряда (например, две кривые радиоактивного распада). Если мы начинаем сравнивать их друг с другом, то нам надо вообще учитывать ауторегрессию и мы, самое главное, сравниваем всегда две точки. Если же мы используем модель, то весь набор данных используется для расчета пары коэффициентов.
Теоретическое обсуждение выглядит немного путано, но легко становится очевидным, например при анализе заболеваемости инфекциями методами обратного рассчета, когда использование не модельных данных означает, что есть n переменных и надо n уравнений, а модельное приближение начинает "работать" в случае наличия лишь данных за два-три года...
vah1
вообщето в медицине устраивать моделирование временных рядов это большая возможность поводить себя за нос. чуть коэффициентики изменил и вот желаемый результат а уж про медицинский смысл так вообще иной раз говорить не приходится... а применительно к конкретному случаю соглашусь с мнением о том что достаточно простой статистики стьюдетна или вилкоксона. тем более что дискретизация при оценке параетров низки и мы не можем быть застрахованы от скрытых выбросов
плав
Цитата(vah1 @ 5.06.2008 - 18:44) *
вообщето в медицине устраивать моделирование временных рядов это большая возможность поводить себя за нос. чуть коэффициентики изменил и вот желаемый результат а уж про медицинский смысл так вообще иной раз говорить не приходится... а применительно к конкретному случаю соглашусь с мнением о том что достаточно простой статистики стьюдетна или вилкоксона. тем более что дискретизация при оценке параетров низки и мы не можем быть застрахованы от скрытых выбросов

Какие коэффициенты изменили? Их как раз и оценивают. Какая дискретизация при оценке по Стьюденту? Что такое скрытые выбросы? Кто кого куда выбросил и откуда, что может быть спасено при сравнении точек друг с другом.
Я чрезвычайно рад, что "Вы соглашаетесь с мнением", тут в топике могут еще полтора миллиона человек высказать свою точку зрения, не важно на чем она основывается. Настоятельно рекомендую вначале переписать учебники и монографии по фармакологии, где сравниваются времена полувыведения (это модельный подход, на случай, если неизвестно и лень было читать предшествующее обсуждение) и заменить там все на сравнение при помощи "простой статистики стьюдетна или вилкоксона". До этого момента рекомендую либо придерживаться принятых подходов, либо обосновывать (логически выводить) причины использования других подходов.
nokh
Цитата(vah1 @ 5.06.2008 - 20:44) *
вообщето в медицине устраивать моделирование временных рядов это большая возможность поводить себя за нос...

Построение качественной модели любого процесса невозможно без глубокого понимания этого процесса, а никто не оспорит, что к этому мы и стремимся. И зачем устраивать из медицины некую особую область? Такая же как и все, со своими особенностями и сложностями, причем главным образом в плане социальном, а не техническом. А потому и простые регрессионные модели, и полученные из решения дифференциальных уравнений, а если нужно - то и сингулярный спектральный анализ, и вейвлеты, и т.д. столь же уместны и полезны здесь как в других областях науки. Иначе можно вообще отказаться от попыток познания и использовать чисто утилитарный подход - например, свалить все данные в черный ящик нейронных сетей и пускай там все само утрясается, главное чтобы правильно советовало combats_friday.gif .

Возвращаясь к данной задаче наиболее общие рассуждения таковы: (1) есть количественный показатель - нужно пробовать параметрические методы, возможно после предварительного преобразования данных, (2) есть зависимость - нужно использовать регрессию, (3) есть вложенные (nested) эффекты (Особи внутри Пола) - нужно использовать иерархический дисперсионный анализ. В итоге приходим к сложному анализу, в котором сочетаются регрессионная и дисперсионная техники и который должно быть возможно описать в терминах общих линейных моделей (GLM). Получается нечто типа нелинейного ковариационного анализа с иерархическим эффектом (возможно, это вариант конфлюэнтного анализа, но я не уверен. Буду признателен за хорошую ссылку по конфлюэнтному анализу). В попытке упрощения задачи Плав предложил оттолкнуться от регрессионного анализа, я - от дисперсионного. Единственное что меня смущает в регрессионном подходе с последующим сравнением параметров - зависимый характер этих параметров. Раз они получены по одной линии регрессии, то ошибка «размазана» по всем трем параметрам и сравнивать выборки правильнее не по одному, а по всем параметрам одновременно. Но как это сделать технически? Дисперсионный анализ - более универсальный, т.к. подойдет для сравнения рядов любой сколь угодно сложной динамики - в т.ч. для которой, в отличие от нашего случая, еще нет внятной модели. Но в этом подходе мне не нравится полный отказ от попытки обобщить изменчивость по оси времени регрессией. Остается «нечто типа нелинейного ковариационного анализа с иерархическим эффектом». Полагаю, что вычленить различие линий нелинейной регрессии в нем можно через расчет отклонений от общей регрессии - сходно с тем, как в ковариационном анализе устанавливается неоднородность наклонов прямых. Но в моей практике еще не было прецедента, чтобы разобраться в этом frown.gif .
Игорь
Если позволите, кратко резюмирую.

1. Коэффициенты регрессионных моделей можно сравнивать, если они допускают прямую физическую интерпретацию. В этом случае сравниваются уже не коэффициенты регрессии, а именно вычисленные (пусть даже идентифицированные в результате оптимизации математической модели) параметры физического процесса. И это гораздо лучше, чем сравнивать линии регрессии, для которых влияние и интерпретация параметров неизвестны. Правда, это уже область математического моделирования, а не прикладной статистики.

2. Коэффициенты регрессионных моделей нельзя сравнивать, если регрессионная модель подобрана эмпирически, на основании лишь похожего вида графика процесса и графика модели, т.к. в этом случае коэффициенты модели не допускают физической интерпретации, а чувствительность модели к данным коэффициентам недостаточно исследована. На каком-то участке процесса совершенно различные модели могут давать похожий внешне выход. Более того, совершенно неадекватные модели могут давать лучшее приближение к выходу эксперимента, чем модели, более обоснованные физически.
vah1
не могу не ответить плаву любезностью на любезность. а именно настоятельно рекомендую отяготится плаву размышлением над следующими вопросами которые почемуто прошли мимо его внимания.
1). один и тот же процесс может быть легко описан разными мат моделями, что однако не говорит о том что это разный процесс. следовательно возникает вполне осознанное требование поиска медицинского обоснования именно этого подхода, равно как и коэффициентов модели с точки зрения их интерпретации иначе получится влияние мочи на солнечные лучи
2). применительно к нашему случаю очевидно, что первые 12 дней данные регистрировались только раз в день и после и того реже следовательно на нашем временном ряду могут возникнуть выбросы (отклоняющиеся точки) как в конце времени эксперимента, так и вначале причём эти точки мы можем просто не заметить в силу того, что они пришлись между измерениями. Между тем модель плава зиждется на весьма сомнительно с точки зрения доказанности уверенности что этих выбросов нет. испльзуя стьюдент или МУ или вилкоксосна мы скромно утверждаем, что на такойто день различия либо есть либо нет.
3). Не равномерная дискретизация процесса естественным образом приведет к тому, что удельный вес начальных данных в постороении модели будет большим чем данных после 12 дня следовательно надо либо добавить точки или веса в конец(опять вопрос по какой модели) либо проредить в начале, а тогда кроме экспоненты появится возможность достоточно хорошо аппраксимировать сигнал и другими функциями т.е. см п 1

в завершении хотелосьбы отметить, что ИМХО конечно можно занятся спалйновыми аппроксимациями, фильтами из вейвлетов на компактном носителе, или нестабильными моделями (кстати как в хаосе определяется нестабильность) однаков начале надо посчитать простыми методами и если результат отличен от ожидаемого разобраться и подумать а не хвататься минуя первую стадию за какой-нибудь критерий Иванова-Рабиновича-фон Ниеша- де Плюсси
плав
Цитата(vah1 @ 6.06.2008 - 17:28) *
1). один и тот же процесс может быть легко описан разными мат моделями, что однако не говорит о том что это разный процесс. следовательно возникает вполне осознанное требование поиска медицинского обоснования именно этого подхода, равно как и коэффициентов модели с точки зрения их интерпретации иначе получится влияние мочи на солнечные лучи

Попробуйте, а потом пишите. Разными моделями? Какими? Нести ахинею может каждый

Цитата(vah1 @ 6.06.2008 - 17:28) *
2). применительно к нашему случаю очевидно, что первые 12 дней данные регистрировались только раз в день и после и того реже следовательно на нашем временном ряду могут возникнуть выбросы (отклоняющиеся точки) как в конце времени эксперимента, так и вначале причём эти точки мы можем просто не заметить в силу того, что они пришлись между измерениями. Между тем модель плава зиждется на весьма сомнительно с точки зрения доказанности уверенности что этих выбросов нет. испльзуя стьюдент или МУ или вилкоксосна мы скромно утверждаем, что на такойто день различия либо есть либо нет.

Вопрос остался без ответа, каким образом критерии Стьюдента могут убрать "вылетающие" точки из чего следует, что автор поста не очень разбирается в статистических методах, игнорирует проблему множественных сравнений (о которых знает любой мало-мальски знакомый со статистической теорией человек), но хочет всем продемонстрировать, какой он знающий и упоминает что-то про доказательность (видимо считая себя специалистом по доказательной медицине, но не потрудившимся почитать на эту тему)

Цитата(vah1 @ 6.06.2008 - 17:28) *
в завершении хотелосьбы отметить, что ИМХО конечно можно занятся спалйновыми аппроксимациями, фильтами из вейвлетов на компактном носителе, или нестабильными моделями (кстати как в хаосе определяется нестабильность) однаков начале надо посчитать простыми методами и если результат отличен от ожидаемого разобраться и подумать а не хвататься минуя первую стадию за какой-нибудь критерий Иванова-Рабиновича-фон Ниеша- де Плюсси

Вообще-то если человек начинает конструировать неологизмы и у него появляется тяга к бессмысленным, но звучащим технически терминам... Мдаа...

Для тех, кто пытается что-то понять в этой ветке просто сообщу, что методика использования индивидуальных коэффициентов регрессии является принятой, желающие могут посмотреть Armitage и Berry, и ряд других серьезных пособий по статистике для медиков. Вообще иногда рекомендуется даже вместо дисперсионного анализа с повторными измерениями вначале сделать регрессию, а затем ДА на коэффициентах регрессии. К сожалению, любителей пофлудить тоже много...

плав
Цитата(Игорь @ 11.06.2008 - 20:57) *
Сам ссылки на программы не проверял и не собираюсь, т.к. меня они не интересуют - предпочитаю составлять программы самостоятельно на языке Си. А вот алгоритмы посмотреть интересно.

А вот это зря. Если давать ссылки, то надо проверять, открываются ли они. Если проверять не хочется, то давайте ссылку на страницу, которая открывается и откуда Вы взяли информацию
Игорь
Цитата(плав @ 13.06.2008 - 14:12) *
А вот это зря. Если давать ссылки, то надо проверять, открываются ли они. Если проверять не хочется, то жавайте ссылку на страницу, которая открывается и откуда Вы взяли информацию

Все ссылки, которые я даю (даже взятые из своих архивов), всегда проверяю перед тем, как предложить их собеседникам. В чем можно легко убедиться прямо сейчас. И со статьями по данным ссылкам хотя бы по диагонали ознакомился.

А не открывается (точнее не "не открывается", а неправильно исполняется) ссылка (на апплет Java) со ссылки. Ну тут уж, извините - обращайтесь к авторам публикации, проявившим небрежность при составлении или размещении кода своей программы. Именно данный код меня не интересует.

Причин неверного исполнения кода java может быть множество. Вот некоторые:
1. Не обеспечен доступ сервлета или апплета к необходимым фрагментам кода на стороне сервера или на машине клиента.
2. Несоответствие версии машина апплета и машины на компьютере пользователя.
3. Банальные ошибки в самом апплете.
4. Отстутствие (или принудительная блокировка) установленной машины java на компьютере пользователя.

Например, на всех моих компьютерах машины java заблокированы по двум причинам:
1. Не терплю java.
2. Соображения безопасности.
vah1
читая предыдущие посты у меня сложилось весьма приятное впечатление: спокойная атмосфера, деловое общение и вдруг такая истерика плава с приёмами достойными больше политических форумов. Например меня сильно удивило что плав применил такой приём как обвинение собеседника в незнании. Вывод делается на основе.. (чего?) а бог его знает. Следуя этой логике можно утверждать что плав игнорирует любую проблему о которой он не говорил. Как видно такой подход порочен. Будем надеятся что в научной работе плав всё же придерживается других подходов нежели бездоказательные утверждения.
Теперь о сути вопроса. Итак у нас есть временной ряд и надо как-то его обработать. тут надобно напомнить что ряд может быть как дискретным (ВСР), так и непрерывным.
1.Если с дискретного ряда мы можем записать все точки то это просто замечательно если нет то переходим к п.2
2. Если ряд непрерывный или мы регистрируем не все точки дискретного ряда, то тут появляется проблема о которой я писал на форуме (жаль что плав умудрился выбрать самую неправильную интерпретацию). итак если мы видим не все точки процесса то вполне естестевнно, что в тот момент времени когда регистрация не проходила ряд точек или только одна могут сушественно отклонится (а могут и нет).
3. Следовательно при применении любой аппроксимации ключевым является вопрос о том насколько качественно мы провели регистрацию точек и допускает или не допускает процесс наличие "выбросов". Если мы не можеи доказать, что выбросов нет, то применение любой аппроксимации наталкивается на существенные проблемы, ибо коэффициенты которые предлагает сравнивать плав весьма чувстительны к подобного рода изменениям тем более на коротком временном ряду. Возможно, плава посещают какие-то откровения, касаемые наличия/отсутствия выбросов в исследуемом ряду, однако в миру, без достаточно обоснованных частот снятия показателей это сделать не представляется возможным.
4. Ещё одна проблема (которую плав решил заболтать) это равномерность/неравномерность дискретизации при регистрации временного процесса. В примере с которого всё началось ближе к завершению серии процесс регистрации перестал быть равномерным, следовательно принципиальным является вопрос о востановлении пропущенных точек а это в свою очередь делает ещё более актуальным п.2
5. Данную проблему снимает простое сравнение наблюдений например на какой-то день. Поскольку, для корректности выводов, нам абсолютно не важно как вёл себя процесс до и после изменения и следовательно доказательства отсутсвия этих самых точек не являются необходимыми что существенно облегчает решение задачи.

Т.о. посроение мат модели процесса по варианту предложенному плавом возможно только в том случае если четко доказано отсутствие выпадающих точек и имеется равномерная дискретизация в регистрации процесса. Ни того не другого доказано не было следовательно предложенный подход ошибочен.

Отдельную тему являет собой медицинское осмысление предложенных моделей, жаль что плав не озаботился например подсчётом кол-ва моделей для описания например таких процесслв как ВСР или ЭЭГ, как видно моделей много, а вот интерпретация их с точки зрения медицины не всегда значима. таким образом один и тот же процесс может быть описан разными моделями о чём я и говорил. Где тут плав усмотрел ахинею?
ну и отмечу что плав дал характеристику приводимым им "нестабильными моделями"

"Вообще-то если человек начинает конструировать неологизмы и у него появляется тяга к бессмысленным, но звучащим технически терминам... Мдаа..."


П.С. ПРедлагаю прекратить подколы и серьёзно обсудить проблему анализа временных рядов. Если со статистикой хоть как-то медики разбираются то по временным рядам у большинства завал.


Игорь
Цитата(vah1 @ 13.06.2008 - 17:23) *
П.С. ПРедлагаю прекратить подколы и серьёзно обсудить проблему анализа временных рядов. Если со статистикой хоть как-то медики разбираются то по временным рядам у большинства завал.

Уважаемый vah1!

Проблема анализа временных рядов разбирается в сотнях источников. Можно сказать, что это уже и не проблема smile.gif. Проблема - статистическое сравнение двух (и более) временных рядов. В этой связи, если собеседники решат прекратить распри, и вернуться к реальному обсуждению проблемы, предлагаю остановиться на решении следующих вопросов.
1. Какие методы для этого применяются с учетом того, что дополнительные предположения о модели процесса, порождающего данные временные ряды, не вводятся?
2. Имеют ли особенности данные типа временных рядов относительно обычных выборок?

Может, это утверждение покажется слишком смелым, но отсчеты любых временных процессов производятся дискретно. Следовательно, непрерывных временных рядов (как отображений реальных процессов) не существует. Кстати, рассуждая аналогично - все измерения производятся с конечной точностью. Следовательно, не существует ни непрерывных данных, ни непрерывных распределений.
плав
Я коротко отвечу, почему надо либо (а) внимательно читать посты, либо (б) внимательно читать книги.
Итак, пост был посвящен анализу времени полувыведения радионуклидов у мышей. Это не временной ряд в том смысле, в котором его обычно понимают, потому как те процессы, которые изучаются в time series обладают иными свойствами и, чаще всего, они не имеют начала и конца. Соответственно, основные проблемы, наличие автокорреляции, устранение сезонных колебаний и т.п.
В данном посту речь шла о процессе с нулевым временем начала (введения) и, соответственно, временем окончания процесса (полным выведением радионуклида.
1) Соответственно, задача такого типа скорее имеет связь с анализом выживаемости. В любом случае, распределение времен выведения не подчиняется нормальному закону и, соответственно, то, что vah пишет про критерий Стьюдента уже демонстрирует его незнание проблемы.
2) Наличие "выбросов" хорошая идея, однако на статистическом форуме непонятная. Если автор действительно знает статистику, то он знает, что выброс (outlier), это величина, которая является крайне маловероятной при принятом распределении величины. Соответственно, надо вначале определиться с распределением случайной величины.
3) Решить проблему учета случайных колебаний относительно (теоретического) распределения времени выведения можно предположив форму этого теоретического времени выведения и считая колебания вокруг предсказанных теоретически значений случайными и распределенными по какому-то закону. Можно, например, предположить нормальное распределение ошибок и использовать OLS регрессию для получения параметров этого теоретического уравнения. Можно проанализировать семейство теоретических кривых и посмотреть, какая из них будет наилучшим образом описывать имеющиеся данные, т.е. минимизировать дисперсию ошибки. Так что, искуственно менять коэффициенты в модели будет сложновато. Если же предполагается, что можно подбирать модели разной степени сложности (например, полиномы разной степени), то на этот вопрос уже тоже известен ответ - модель должна быть минимально сложной, после которой наблюдается незначительное снижение дисперсии ошибки.
4) Временной ряд (любой и тот, который изучается обычно, и представленный в посте) интересен тем, что там имеется достаточно большое количество коррелирующих друг с другом точек (т.е. значение во время t+1 зависит от значения во время t). Соответственно, сравнение точек попарно является ошибочным, поскольку нарушает базовое допущение всех статистических тестов - независимость наблюдений в выборке. Если же предполагается провести n сравнений (разные объекты в момент времени t, затем t+1 и т.д. до n), то исследователь столкнется с проблемой мноественных сравнений, поскольку в каждый момент времени "значимое" отклонение может произойти в 5% случаев, а при 20 временных точках вероятность хотя бы одного "значимого отклонения составляет уже 64%. Это vah также проигнорировал, хотя речь идет о базовых понятиях статистики.
5) Вопрос равномерности/неравномерности дискретизации бессмысленнен, если используется относительно простая форма описания модели, поскольку здесь речь не идет о процессе, который внезапно начинает идти в обратном направлении
Соответственно:

[quote name='vah1' date='13.06.2008 - 18:23' post='4835']
Т.о. посроение мат модели процесса по варианту предложенному плавом возможно только в том случае если четко доказано отсутствие выпадающих точек и имеется равномерная дискретизация в регистрации процесса. Ни того не другого доказано не было следовательно предложенный подход ошибочен. [\quote]

является утверждением человека, который слабо знаком со статистической теорией, не читает литературы, но считает своим правом отстаивать свои (ошибочные) убеждения (причем игнорирование моих замечаний ранее этому хорошее подтверждением). Поскольку кроме постов в других ветках с предположениями об откатах (также весьма спекулятивные замечания) автор ничем другим замечен не был, соответственно, его безосновательная критика получила более жесткие комментарии, чем если бы он пытался уяснить суть проблемы.

И последнее:
6) "жаль что плав не озаботился например подсчётом кол-ва моделей для описания например таких процесслв как ВСР или ЭЭГ". А еще меня не заботит вопрос описания траектории полета листа дерева, колебаний размеров Эйфелевой башни и много других процессов, которые описываются другими закономерностями. Если есть желание пообсуждать описание ЭЭГ, то можно создать ветку и там это обсуждать.
В данной ветке обсуждалась конкретная задача. Повторюсь, если есть желание обсуждать тему, не имеющую отношение к данной ветке - создавайте новую ветку. Попытки писать о наболевшем в теме, не имеющей к этому отношению являются флудом и будут пресекаться.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.