Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

13 страниц V  « < 9 10 11 12 13 >  
Добавить ответ в эту темуОткрыть тему
> Непараметрическая статистика, различия в результатах анализа по Фридмену и теста Уилкоксона
DrgLena
сообщение 11.01.2010 - 18:45
Сообщение #151





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Можно и так. Я сделала логистическую регрессию с тремя количественными предикторами. ПО расчетному значению "р" - выделила 4 группы риска по сочетанию этих предикторов.
Через час поезд в Карпаты, потому времени нет увидеть продолжение ...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Green
сообщение 13.01.2010 - 16:12
Сообщение #152





Группа: Пользователи
Сообщений: 120
Регистрация: 27.08.2009
Пользователь №: 6284



Я ее тоже делала frown.gif

F=b1*x1+b2*x2+b3*y+b4

У меня получились такие значимые коэффициенты

b1=-0,086887
b2=-0,032111
b3=0,721294



Тогда сделалa full fraction
dur - это длительность x1
age - это возраст x2

Приведены значения p

dur 0,251336
age 0,573126
y 0,175546
dur*age 0,623894
dur*y 0,607620
age*y 0,141068
dur*age*y 0,942329



Убрала часть эффектов
в результате получилось при значимом р



dur -0,247173
y 2,657539
dur*age 0,003044
age*y -0,037909




Вопросы: Отсюда как группу риска достать?
Вы же ищите прогностические факторы? или все-таки факторы риска?

--------
Если на отдых, то приятного:)

Сообщение отредактировал Green - 13.01.2010 - 18:06


Signature
Это не кованализ :)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 21.01.2010 - 23:33
Сообщение #153





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Green @ 10.01.2010 - 14:08) *
nokh,
У Pinus на представленных данных есть все возраста. Правда, в группе z1 есть есть 50-55 лет,которые не представлены в z2.
Но выборка достаточно большая, поэтому ничего особенного.
Теперь, предположим маргинальный случай.
из z1 возьмем данные 40-55 лет,
из z2 - от 15 до 19. ...
... Поэтому прошу подкорректировать Ваше мнение о рандомизации.

Отношение к рандомизации у меня прежнее: ставишь эксперимент - рандомизируй что не можешь/хочешь контролировать (сейчас в зависимости от дизайна исследования разработаны типовые процедуры рандомизации). Если собираешь данные в природе - контролируй потенциальные мешающие факторы. Рандомизация возможна и в случае Pinus для сведения к минимуму различий в почве, освещённости, влажности и т.п. экологическим факторам. Как вариант - определить направления в посадках и исследовать только деревья по таблице случайных чисел. Но я боюсь, что для увеличения объёма выборки исследовались все объекты, а тогда и простенькая рандомизация невозможна.

Идею, которую Вы доносили в рисунках понял. Полностью согласен. Выходит, что действительно ковариационный анализ нужно начинать именно с проверки сопоставимости выборок по величине ковариаты. И как раз здесь, врачи обычно очень педантичны: проверка сопоставимости выборок по полу, возрасту и др. важным в исследовании показателям в ретроспективных исследованиях является необходимым условием последующих сравнений по исследуемым факторам.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 22.01.2010 - 00:55
Сообщение #154





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(nokh @ 22.01.2010 - 06:33) *
Но я боюсь, что для увеличения объёма выборки исследовались все объекты...
Так и есть. Просто сначала не было гарантии, что вообще можно будет приемлемые выборки набрать. Так же было мнение, что в разных типах посадок параметры роста будут отличаться, что тоже толкало на увеличение массива наблюдений. Выборка не совсем сплошная. На территориях военных ведомств не удалось померить.

Цитата(nokh @ 22.01.2010 - 06:33) *
Выходит, что действительно ковариационный анализ нужно начинать именно с проверки сопоставимости выборок по величине ковариаты.

Если зависимость прямолинейная (не спрямленная, а изначально прямая), как можно выйти из положения? Если обрезать длинный хвост (со значениями ковариаты, отсутствующими для других зависимостей) и сравнить значимость различий регрессий по таким усеченным выборкам. А потом сделать сравнение регрессий с первоначальными выборками и посмотреть различаются ли результаты?
Какие существуют обоснованные подходы для преодоления разбалансированности? Есть ли какие-либо придержки для оценки степени разбалансированности? Ведь одинаковые по ковариате выборки получаются только при контролируемом эксперименте. В случае наблюдений часто сначала даже нельзя предположить, какой будет размах той или иной переменной в разных сравниваемых группах. По идее должны существовать какие-то стандартные подходы для преодоления этой проблемы. Вообще насколько значительны нарушения при несоответствии по величине ковариаты?
Где об это можно почитать (вопрос в т.ч. и к Green)?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 22.01.2010 - 02:24
Сообщение #155





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Попутно возникла идея. Когда разбирали тему выбросов и влияющих наблюдений, там была мера DFBETAS для оценки степени влияния i-го наблюдения на параметры регрессии. Посмотрел формулы, что нам мешает применить эту меру для оценки степени влияния не одного, а одновременно нескольких наблюдений? Тогда подход такой (для линейной регрессии): усекаем выборку до пределов значения ковариаты, соответствующих другим сравниваемым регрессиям. Проверяем мерой DFBETAS значимость изменения параметров регрессии. Если влияние несильное, делаем ANCOVA (можно и по усеченной выборке, и по первоначальной для сравнения). Как думаете?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Green
сообщение 5.02.2010 - 21:34
Сообщение #156





Группа: Пользователи
Сообщений: 120
Регистрация: 27.08.2009
Пользователь №: 6284



Доброго времени суток. Прошу прощения за долгое отсутствие.
Попробую ответить сразу для nokh и Pinus.

>какие-то стандартные подходы для преодоления этой проблемы
>ставишь эксперимент - рандомизируй что не можешь/хочешь контролировать (сейчас в зависимости от дизайна исследования разработаны типовые процедуры рандомизации)

Pinus, Ваш вопрос больше адресуется к постановке эксперимента. Т.е. должен быть продуман дизайн эксперимента.
Есть типовые дизайны экспериментов (не только процедуры рандомизации).

>Ведь одинаковые по ковариате выборки получаются только при контролируемом эксперименте.
"Одинаковые" - немного не то слово. Взяты из одной генеральной совокупности, принадлежащие одной популяции, скорее так правильнее.

> . В случае наблюдений часто сначала даже нельзя предположить, какой будет размах той или иной переменной в разных сравниваемых группах
Не путайте зависимые и независимые переменные.
Опять же, начнем "от печки".
В случае регрессии: есть независимые переменные ( которые контролирует исследователь и даже может задавать) и зависимая переменная ( которую он не контролирует, а только измеряет при некоторых значениях X). Пусть независимая переменная одна. Для регрессии - это ось Х. Поставьте эксперимент таким образом, чтобы данные по оси Х - принадлежали одной выборке. В случае с ирисками - Х это было время рассасывания контрольной ириски неким субъектом.

Но если бы ставили эксперимент с ирисками, где часть субъектов были обычные люди, а часть... ну, к примеру с нарушением слюноотделения... и их свалили в одну кучу, имхо, это было бы неверным экспериментом для сравнения скорости рассасывания различных ирисок. Но для изучения нарушения слюноотделения по скорости рассасывания одного типа ирисок - возможно, только - это не кованализ:)

------
Ковариационный анализ был в первую очередь разработан для устранения конфаундеров. Идея удалять регрессию с помощью кованализа мне не принадлежит. В Вашем случае с деревьями... я писала, что возраст ( ось X) у вас рандомный в обеих группах. В средних нет различия. Там мне не нравилась другая идея, о параллельности. Ведь эффект способа посадки должен накапливаться во времени. А это и значит, что не могут они быть параллельными... как-то так...
--------
Я придерживаюсь идеи, которую сама себе назвала "follow the data".
Мне на анализ иногда попадают данные из не очень продуманных экспериментов. И, тогда я думаю, какие методы анализа тут можно использовать, что можно вытянуть из данных. Что допустимо, что нет, что имеет смысл, объяснение, а что нет.

Например, мысль о том, что фактор "накапливается" во времени приводил к мысли, что параллельность линий регрессии - это неправильная посылка, т.е. кованализ туда не пойдет. Потом пролистала книги, нигде в кованализе по оси Х не идет возраст.
В эпидемиологических исследованиях возраст стратифицируется, например.
Время - вообще "отдельная" категория, есть спецметоды для исследования изменений во времени.

Т.е. если понять данные, то найдется адекватный способ анализа. Нельзя использовать методы, видя перед собой только цифры.

> Попутно возникла идея.

Я уже писала для nokh, повторю.

Идея кованализа в том, что отрезок (кусочек прямой линии, линии регрессии) заменяется точками (средними) с координатами по оси Х и Y, и при одинаковых х начинают различаться y ( или не различаются).
"х одинаковы" это условно одинаковы, точнее неразличимы, ибо данные для расчета x взяты рандомно из одной генсовокупности.
Замена линии (у которой уравнение) точкой (у которой координата x,y).
Надеюсь, что понятно написала.
Это грубое изложение, но я постаралась передать суть. Посмотрите рисунки выше.

Если Вы рассчитали средние по одним данным, потом заменяете их другими? Подумайте, что получится?


Signature
Это не кованализ :)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 6.02.2010 - 01:20
Сообщение #157





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Green, Ваша идея про то, что в сравниваемых регрессиях должны быть примерно равны размахи предиктора, мне понятна, и я с ней тоже согласен. Что касается планируемого эксперимента, то в моем случае это организовать вряд ли возможно. Приходится довольствоваться выборочными методами пассивного наблюдения (измерения) и соответственно получать то, что есть, а не то, чего бы хотелось.
Нашел еще один источник на русском с главой по ANCOVA: Джонстон Дж. Эконометрические методы / Пер. с англ. ? М.: Статистика, 1980. ? 444 с. (есть в сети)
Для обсуждения вопросов сравнения нелинейных регрессий приглашаю в тему ?Нелинейная регрессия?.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 6.02.2010 - 13:36
Сообщение #158





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Pinus @ 6.02.2010 - 02:20) *
... вопросов сравнения нелинейных регрессий ...

Для этой задачи можно применить ковариационный анализ.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 6.02.2010 - 13:42
Сообщение #159





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(Игорь @ 6.02.2010 - 20:36) *
Для этой задачи можно применить ковариационный анализ.

Для нелинеаризуемых? Как?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 6.02.2010 - 20:13
Сообщение #160





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Pinus @ 6.02.2010 - 13:42) *
Для нелинеаризуемых? Как?

Примерно так:

Dette H., Neumeyer N. Nonparametric analysis of covariance // The Annals of Statistics, 2001, vol. 29, no. 5, pp. 1361-1400. Есть в Интернете. http://projecteuclid.org/euclid.aos/1013203458

Olejnik S.F., Algina J. A Review of Nonparametric Alternatives To Analysis of Covariance // Evaluation Review, 1985, vol. 9, no. 1, pp. 51-83. Есть в Интернете. http://www.eric.ed.gov/ERICDocs/data/ericd...80/38/a6/39.pdf

Olejnik S.F., Algina J. Parametric ANCOVA vs. Rank Transform ANCOVA when Assumptions of Conditional Normality and Homoscedasticity Are Violated // the Annual Meeting of the American Educational Research Association (67th, Montreal, Quebec, April 11-15, 1983). http://www.eric.ed.gov/ERICDocs/data/ericd...80/31/e5/2b.pdf

Edwards L. Applied Analysis of Variance in Behavioral Science / Ed. by L. Edwards. - New York, NY: Chapman & Hall/CRC, 1993. Есть в Интернете (полную версию надо искать smile.gif, в Гугле - интересующий параграф 3.3.3. имеется)

Vickers A.J. Parametric versus non-parametric statistics in the analysis of randomized trials with non-normally distributed data // BMC Medical Research Methodology, 2005, 5:35. Есть в Интернете. http://www.biomedcentral.com/1471-2288/5/35

Porter A.C., McSweeney M. Comparison of Rank Analysis of Covariance and Nonparametric Randomized Blocks Analysis // The Annual Meeting of the American Educational Research Association, New York, New York, February 1971. Есть в Интернете. http://www.eric.ed.gov/ERICDocs/data/ericd...80/39/98/ba.pdf

Conover W.J., Iman R.L. Analysis of covariance using the rank transformation // Biometrics, September 1982, vol. 38, no. 3, pp. 715-724. В Интернете есть, но авторы хотят денег.

Puri M.L., Sen P.K. Analysis of Covariance Based on General Rank Scores // The Annals of Mathematical Statistics, 1969, vol. 40, no. 2, pp. 610-618. Есть в Интернете. http://projecteuclid.org/euclid.aoms/1177697729

Во-вторых, если регрессии одного параметрического семейства и для параметров регрессий вычислены как точечные оценки, так и дисперсии, то можно сравнить их (параметры) по Стьюденту. Это идея тем более обоснованна, если параметры допускают физическую интерпретацию. Могу ошибаться, но представляется, что сравнить физические параметры процессов интереснее, чем некие абстрактные наборы данных, не допускающих осмысленной интерпретации.

Сообщение отредактировал Игорь - 6.02.2010 - 22:45


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 7.02.2010 - 00:50
Сообщение #161





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Да.... Наша отечественная литература по статистике не просто в хвосте у Запада, а в самой натуральной з-це (извиняюсь). В последнее время, чем больше узнаю, тем больше меня как-то придавливает. Английский неизбежен....
Спасибо, Игорь, за ссылки и за мысль про сравнение параметров по Стьюденту. Как-то это уже несколько раз звучало, но все как-то не доходило. Подумаю, почитаю.

Сообщение отредактировал Pinus - 7.02.2010 - 00:51
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Green
сообщение 7.02.2010 - 14:11
Сообщение #162





Группа: Пользователи
Сообщений: 120
Регистрация: 27.08.2009
Пользователь №: 6284



Pinus, осмелюсь Вам дать совет.

У Вас прикладная задача - табулировать данные о росте различных растений в различных условиях.
Для решения таких задач я бы использовала демографическую (эпидемиологическую) аналитическую статистику.
Возраст стратифицируется (диаграмма Лексиса). Далее рассчитываются характеристики страт. Сравниваются, анализируются и проч.
Аналогично этот аппарат можно положить на Вашу задачу. С другими стратами, без учета естественного выбывания и проч.

Поскольку Вы все далее идете в более сложные аспекты анализа, смею заметить, только математика не сможет решить проблему. Прикладные работы, как правило, делаются на простых моделях.

Но это только мое мнение.





Signature
Это не кованализ :)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 8.02.2010 - 09:01
Сообщение #163





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Pinus @ 7.02.2010 - 00:50) *
Да.... Наша отечественная литература по статистике не просто в хвосте у Запада, а в самой натуральной з-це (извиняюсь). В последнее время, чем больше узнаю, тем больше меня как-то придавливает. Английский неизбежен....
Спасибо, Игорь, за ссылки и за мысль про сравнение параметров по Стьюденту. Как-то это уже несколько раз звучало, но все как-то не доходило. Подумаю, почитаю.

Еще немного ссылок:
Quade D. Rank analysis of covariance // Journal of the American Statistical Association, 1967, vol. 62, pp. 1187-1200.

Quade D. Nonparametric analysis of covariance by matching // Biometrics, 1982, vol. 38, pp. 597-611.

Lawson A. Rank analysis of covariance: Alternative approaches // Journal of the Royal Statistical Society. Series D (The Statistician), September 1983, vol. 32, no. 3, pp. 331-337.

Amini S.B., Woolson R.F. Rank covariance methods for the analysis of survival data // Biometrical Journal, 18 January 2007, vol. 33, issue 4, pp. 429-439.

Ramaswamy R., Koch G.G., Amara I.A. Application of rank analysis of covariance methods to analysis of multiple anatomical regions with treatment for seborrheic dermatitis // Journal of Biopharmaceutical Statistics, 1997, vol. 7, issue 3, pp. 403-416.

Adichie J.N. Ranking in analysis of covariance tests // Communications in Statistics - Theory and Methods, 1975, vol. 4, issue 9, pp. 883-890.

Conover W.J., Iman R.L. Analysis of covariance using the rank transformation // Biometrics, September 1982, vol. 38, no. 3, pp. 715-724.

Gary G. A review of some statistical methods for covariance analysis of categorical data / G. Gary, G.G. Koch, I.A. Amara et al. // Biometrics, September 1982, vol. 38, no. 3, Special Issue: Analysis of Covariance, pp. 563-595.

К сожалению, все они недоступны без денег, а авторы не стремятся выложить их на свои сайты (есть информация, что это требование издательств). Есть еще вариант загрузки статей через службу типа JSTOR, но к ней подключены только некоторые университеты (Москва, СПб). Поэтому большинству исследователей статьи недоступны.

Основные источники - это Puri с соавт. и Dana Quade, которая, как считается, первой предложила непараметрический ANCOVA. Тут такая ситуация. По статьям родоначальников метода сделать работающий алгоритм, как правило, не представляется возможным. Они содержат идеи. Нужен некоторый промежуточный слой теоретических и практических исследований (примеров применения), чтобы метод получил широкое употребление в массах. Поэтому, скажем, обзорная статья малоизвестного автора из периферийного университета оказывается более ценной для нас, чем оригинальная работа.

Сообщение отредактировал Игорь - 9.02.2010 - 07:30


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 8.02.2010 - 11:23
Сообщение #164





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(Игорь @ 8.02.2010 - 16:01) *
Поэтому, скажем, обзорная статья малоизвестного автора из периферийного университета оказывается более ценной для нас, чем оригинальная работа.

Игорь, а которая из них "малоизвестного автора из периферийного университета" (более ценная для практического применения)? Чтоб наверняка, по-меньше маяться с переводом.

Сообщение отредактировал Pinus - 8.02.2010 - 11:24
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 8.02.2010 - 11:41
Сообщение #165





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Pinus @ 8.02.2010 - 12:23) *
Игорь, а которая из них "малоизвестного автора из периферийного университета" (более ценная для практического применения)? Чтоб наверняка, по-меньше маяться с переводом.

Совершенно очевидно, что не классики и не монографии. А Dette с соавт. и Olejnik с соавт. Это из того, что есть в свободном доступе.

Хотелось бы, конечно, современных классиков посмотреть - Conover с соавт. (особенно!) и Quade. Но на них денег нет (точнее - жалко). Если найдете - поделитесь, пожалуйста.

Вы собираетесь переводить? А зачем терять время? Все учили английский, сдавали экзамены и кандидатский минимум? Ну вот - есть возможность практически проявить подтвержденные высокими оценками навыки (мне лично, учившему немецкий и не особо обремененному способностями к языкам, без всякой практики, лет 20 назад хватило 2-месячных курсов английского, чтобы с тех пор понимать смысл статей по интересующим тематикам). Чтобы понять десяток формул с пояснениями, переводить статью нет необходимости.

Сообщение отредактировал Игорь - 8.02.2010 - 12:00


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

13 страниц V  « < 9 10 11 12 13 >
Добавить ответ в эту темуОткрыть тему