Непараметрическая статистика - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

13 страниц

« < 9 10 11 12 13 >

Добавить ответ в эту тему

Открыть тему

Непараметрическая статистика, различия в результатах анализа по Фридмену и теста Уилкоксона

DrgLena Просмотр профиля	11.01.2010 - 18:45 Сообщение #151
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Можно и так. Я сделала логистическую регрессию с тремя количественными предикторами. ПО расчетному значению "р" - выделила 4 группы риска по сочетанию этих предикторов. Через час поезд в Карпаты, потому времени нет увидеть продолжение ...

Green Просмотр профиля	13.01.2010 - 16:12 Сообщение #152
Группа: Пользователи Сообщений: 120 Регистрация: 27.08.2009 Пользователь №: 6284	Я ее тоже делала F=b1x1+b2x2+b3y+b4 У меня получились такие значимые коэффициенты b1=-0,086887 b2=-0,032111 b3=0,721294 Тогда сделалa full fraction dur - это длительность x1 age - это возраст x2 Приведены значения p dur 0,251336 age 0,573126 y 0,175546 durage 0,623894 dury 0,607620 agey 0,141068 duragey 0,942329 Убрала часть эффектов в результате получилось при значимом р dur -0,247173 y 2,657539 durage 0,003044 agey -0,037909 Вопросы: Отсюда как группу риска достать? Вы же ищите прогностические факторы? или все-таки факторы риска? -------- Если на отдых, то приятного:) Сообщение отредактировал Green - 13.01.2010 - 18:06 Это не кованализ :)

nokh Просмотр профиля	21.01.2010 - 23:33 Сообщение #153
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(Green @ 10.01.2010 - 14:08) nokh, У Pinus на представленных данных есть все возраста. Правда, в группе z1 есть есть 50-55 лет,которые не представлены в z2. Но выборка достаточно большая, поэтому ничего особенного. Теперь, предположим маргинальный случай. из z1 возьмем данные 40-55 лет, из z2 - от 15 до 19. ... ... Поэтому прошу подкорректировать Ваше мнение о рандомизации. Отношение к рандомизации у меня прежнее: ставишь эксперимент - рандомизируй что не можешь/хочешь контролировать (сейчас в зависимости от дизайна исследования разработаны типовые процедуры рандомизации). Если собираешь данные в природе - контролируй потенциальные мешающие факторы. Рандомизация возможна и в случае Pinus для сведения к минимуму различий в почве, освещённости, влажности и т.п. экологическим факторам. Как вариант - определить направления в посадках и исследовать только деревья по таблице случайных чисел. Но я боюсь, что для увеличения объёма выборки исследовались все объекты, а тогда и простенькая рандомизация невозможна. Идею, которую Вы доносили в рисунках понял. Полностью согласен. Выходит, что действительно ковариационный анализ нужно начинать именно с проверки сопоставимости выборок по величине ковариаты. И как раз здесь, врачи обычно очень педантичны: проверка сопоставимости выборок по полу, возрасту и др. важным в исследовании показателям в ретроспективных исследованиях является необходимым условием последующих сравнений по исследуемым факторам.

Pinus Просмотр профиля	22.01.2010 - 00:55 Сообщение #154
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Цитата(nokh @ 22.01.2010 - 06:33) Но я боюсь, что для увеличения объёма выборки исследовались все объекты... Так и есть. Просто сначала не было гарантии, что вообще можно будет приемлемые выборки набрать. Так же было мнение, что в разных типах посадок параметры роста будут отличаться, что тоже толкало на увеличение массива наблюдений. Выборка не совсем сплошная. На территориях военных ведомств не удалось померить. Цитата(nokh @ 22.01.2010 - 06:33) Выходит, что действительно ковариационный анализ нужно начинать именно с проверки сопоставимости выборок по величине ковариаты. Если зависимость прямолинейная (не спрямленная, а изначально прямая), как можно выйти из положения? Если обрезать длинный хвост (со значениями ковариаты, отсутствующими для других зависимостей) и сравнить значимость различий регрессий по таким усеченным выборкам. А потом сделать сравнение регрессий с первоначальными выборками и посмотреть различаются ли результаты? Какие существуют обоснованные подходы для преодоления разбалансированности? Есть ли какие-либо придержки для оценки степени разбалансированности? Ведь одинаковые по ковариате выборки получаются только при контролируемом эксперименте. В случае наблюдений часто сначала даже нельзя предположить, какой будет размах той или иной переменной в разных сравниваемых группах. По идее должны существовать какие-то стандартные подходы для преодоления этой проблемы. Вообще насколько значительны нарушения при несоответствии по величине ковариаты? Где об это можно почитать (вопрос в т.ч. и к Green)?

Pinus Просмотр профиля	22.01.2010 - 02:24 Сообщение #155
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Попутно возникла идея. Когда разбирали тему выбросов и влияющих наблюдений, там была мера DFBETAS для оценки степени влияния i-го наблюдения на параметры регрессии. Посмотрел формулы, что нам мешает применить эту меру для оценки степени влияния не одного, а одновременно нескольких наблюдений? Тогда подход такой (для линейной регрессии): усекаем выборку до пределов значения ковариаты, соответствующих другим сравниваемым регрессиям. Проверяем мерой DFBETAS значимость изменения параметров регрессии. Если влияние несильное, делаем ANCOVA (можно и по усеченной выборке, и по первоначальной для сравнения). Как думаете?

Green Просмотр профиля	5.02.2010 - 21:34 Сообщение #156
Группа: Пользователи Сообщений: 120 Регистрация: 27.08.2009 Пользователь №: 6284	Доброго времени суток. Прошу прощения за долгое отсутствие. Попробую ответить сразу для nokh и Pinus. >какие-то стандартные подходы для преодоления этой проблемы >ставишь эксперимент - рандомизируй что не можешь/хочешь контролировать (сейчас в зависимости от дизайна исследования разработаны типовые процедуры рандомизации) Pinus, Ваш вопрос больше адресуется к постановке эксперимента. Т.е. должен быть продуман дизайн эксперимента. Есть типовые дизайны экспериментов (не только процедуры рандомизации). >Ведь одинаковые по ковариате выборки получаются только при контролируемом эксперименте. "Одинаковые" - немного не то слово. Взяты из одной генеральной совокупности, принадлежащие одной популяции, скорее так правильнее. > . В случае наблюдений часто сначала даже нельзя предположить, какой будет размах той или иной переменной в разных сравниваемых группах Не путайте зависимые и независимые переменные. Опять же, начнем "от печки". В случае регрессии: есть независимые переменные ( которые контролирует исследователь и даже может задавать) и зависимая переменная ( которую он не контролирует, а только измеряет при некоторых значениях X). Пусть независимая переменная одна. Для регрессии - это ось Х. Поставьте эксперимент таким образом, чтобы данные по оси Х - принадлежали одной выборке. В случае с ирисками - Х это было время рассасывания контрольной ириски неким субъектом. Но если бы ставили эксперимент с ирисками, где часть субъектов были обычные люди, а часть... ну, к примеру с нарушением слюноотделения... и их свалили в одну кучу, имхо, это было бы неверным экспериментом для сравнения скорости рассасывания различных ирисок. Но для изучения нарушения слюноотделения по скорости рассасывания одного типа ирисок - возможно, только - это не кованализ:) ------ Ковариационный анализ был в первую очередь разработан для устранения конфаундеров. Идея удалять регрессию с помощью кованализа мне не принадлежит. В Вашем случае с деревьями... я писала, что возраст ( ось X) у вас рандомный в обеих группах. В средних нет различия. Там мне не нравилась другая идея, о параллельности. Ведь эффект способа посадки должен накапливаться во времени. А это и значит, что не могут они быть параллельными... как-то так... -------- Я придерживаюсь идеи, которую сама себе назвала "follow the data". Мне на анализ иногда попадают данные из не очень продуманных экспериментов. И, тогда я думаю, какие методы анализа тут можно использовать, что можно вытянуть из данных. Что допустимо, что нет, что имеет смысл, объяснение, а что нет. Например, мысль о том, что фактор "накапливается" во времени приводил к мысли, что параллельность линий регрессии - это неправильная посылка, т.е. кованализ туда не пойдет. Потом пролистала книги, нигде в кованализе по оси Х не идет возраст. В эпидемиологических исследованиях возраст стратифицируется, например. Время - вообще "отдельная" категория, есть спецметоды для исследования изменений во времени. Т.е. если понять данные, то найдется адекватный способ анализа. Нельзя использовать методы, видя перед собой только цифры. > Попутно возникла идея. Я уже писала для nokh, повторю. Идея кованализа в том, что отрезок (кусочек прямой линии, линии регрессии) заменяется точками (средними) с координатами по оси Х и Y, и при одинаковых х начинают различаться y ( или не различаются). "х одинаковы" это условно одинаковы, точнее неразличимы, ибо данные для расчета x взяты рандомно из одной генсовокупности. Замена линии (у которой уравнение) точкой (у которой координата x,y). Надеюсь, что понятно написала. Это грубое изложение, но я постаралась передать суть. Посмотрите рисунки выше. Если Вы рассчитали средние по одним данным, потом заменяете их другими? Подумайте, что получится? Это не кованализ :)

Pinus Просмотр профиля	6.02.2010 - 01:20 Сообщение #157
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Green, Ваша идея про то, что в сравниваемых регрессиях должны быть примерно равны размахи предиктора, мне понятна, и я с ней тоже согласен. Что касается планируемого эксперимента, то в моем случае это организовать вряд ли возможно. Приходится довольствоваться выборочными методами пассивного наблюдения (измерения) и соответственно получать то, что есть, а не то, чего бы хотелось. Нашел еще один источник на русском с главой по ANCOVA: Джонстон Дж. Эконометрические методы / Пер. с англ. ? М.: Статистика, 1980. ? 444 с. (есть в сети) Для обсуждения вопросов сравнения нелинейных регрессий приглашаю в тему ?Нелинейная регрессия?.

Игорь Просмотр профиля	6.02.2010 - 13:36 Сообщение #158
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(Pinus @ 6.02.2010 - 02:20) ... вопросов сравнения нелинейных регрессий ... Для этой задачи можно применить ковариационный анализ. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Pinus Просмотр профиля	6.02.2010 - 13:42 Сообщение #159
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Цитата(Игорь @ 6.02.2010 - 20:36) Для этой задачи можно применить ковариационный анализ. Для нелинеаризуемых? Как?

Игорь Просмотр профиля	6.02.2010 - 20:13 Сообщение #160
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(Pinus @ 6.02.2010 - 13:42) Для нелинеаризуемых? Как? Примерно так: Dette H., Neumeyer N. Nonparametric analysis of covariance // The Annals of Statistics, 2001, vol. 29, no. 5, pp. 1361-1400. Есть в Интернете. http://projecteuclid.org/euclid.aos/1013203458 Olejnik S.F., Algina J. A Review of Nonparametric Alternatives To Analysis of Covariance // Evaluation Review, 1985, vol. 9, no. 1, pp. 51-83. Есть в Интернете. http://www.eric.ed.gov/ERICDocs/data/ericd...80/38/a6/39.pdf Olejnik S.F., Algina J. Parametric ANCOVA vs. Rank Transform ANCOVA when Assumptions of Conditional Normality and Homoscedasticity Are Violated // the Annual Meeting of the American Educational Research Association (67th, Montreal, Quebec, April 11-15, 1983). http://www.eric.ed.gov/ERICDocs/data/ericd...80/31/e5/2b.pdf Edwards L. Applied Analysis of Variance in Behavioral Science / Ed. by L. Edwards. - New York, NY: Chapman & Hall/CRC, 1993. Есть в Интернете (полную версию надо искать , в Гугле - интересующий параграф 3.3.3. имеется) Vickers A.J. Parametric versus non-parametric statistics in the analysis of randomized trials with non-normally distributed data // BMC Medical Research Methodology, 2005, 5:35. Есть в Интернете. http://www.biomedcentral.com/1471-2288/5/35 Porter A.C., McSweeney M. Comparison of Rank Analysis of Covariance and Nonparametric Randomized Blocks Analysis // The Annual Meeting of the American Educational Research Association, New York, New York, February 1971. Есть в Интернете. http://www.eric.ed.gov/ERICDocs/data/ericd...80/39/98/ba.pdf Conover W.J., Iman R.L. Analysis of covariance using the rank transformation // Biometrics, September 1982, vol. 38, no. 3, pp. 715-724. В Интернете есть, но авторы хотят денег. Puri M.L., Sen P.K. Analysis of Covariance Based on General Rank Scores // The Annals of Mathematical Statistics, 1969, vol. 40, no. 2, pp. 610-618. Есть в Интернете. http://projecteuclid.org/euclid.aoms/1177697729 Во-вторых, если регрессии одного параметрического семейства и для параметров регрессий вычислены как точечные оценки, так и дисперсии, то можно сравнить их (параметры) по Стьюденту. Это идея тем более обоснованна, если параметры допускают физическую интерпретацию. Могу ошибаться, но представляется, что сравнить физические параметры процессов интереснее, чем некие абстрактные наборы данных, не допускающих осмысленной интерпретации. Сообщение отредактировал Игорь - 6.02.2010 - 22:45 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Pinus Просмотр профиля	7.02.2010 - 00:50 Сообщение #161
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Да.... Наша отечественная литература по статистике не просто в хвосте у Запада, а в самой натуральной з-це (извиняюсь). В последнее время, чем больше узнаю, тем больше меня как-то придавливает. Английский неизбежен.... Спасибо, Игорь, за ссылки и за мысль про сравнение параметров по Стьюденту. Как-то это уже несколько раз звучало, но все как-то не доходило. Подумаю, почитаю. Сообщение отредактировал Pinus - 7.02.2010 - 00:51

Green Просмотр профиля	7.02.2010 - 14:11 Сообщение #162
Группа: Пользователи Сообщений: 120 Регистрация: 27.08.2009 Пользователь №: 6284	Pinus, осмелюсь Вам дать совет. У Вас прикладная задача - табулировать данные о росте различных растений в различных условиях. Для решения таких задач я бы использовала демографическую (эпидемиологическую) аналитическую статистику. Возраст стратифицируется (диаграмма Лексиса). Далее рассчитываются характеристики страт. Сравниваются, анализируются и проч. Аналогично этот аппарат можно положить на Вашу задачу. С другими стратами, без учета естественного выбывания и проч. Поскольку Вы все далее идете в более сложные аспекты анализа, смею заметить, только математика не сможет решить проблему. Прикладные работы, как правило, делаются на простых моделях. Но это только мое мнение. Это не кованализ :)

Игорь Просмотр профиля	8.02.2010 - 09:01 Сообщение #163
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(Pinus @ 7.02.2010 - 00:50) Да.... Наша отечественная литература по статистике не просто в хвосте у Запада, а в самой натуральной з-це (извиняюсь). В последнее время, чем больше узнаю, тем больше меня как-то придавливает. Английский неизбежен.... Спасибо, Игорь, за ссылки и за мысль про сравнение параметров по Стьюденту. Как-то это уже несколько раз звучало, но все как-то не доходило. Подумаю, почитаю. Еще немного ссылок: Quade D. Rank analysis of covariance // Journal of the American Statistical Association, 1967, vol. 62, pp. 1187-1200. Quade D. Nonparametric analysis of covariance by matching // Biometrics, 1982, vol. 38, pp. 597-611. Lawson A. Rank analysis of covariance: Alternative approaches // Journal of the Royal Statistical Society. Series D (The Statistician), September 1983, vol. 32, no. 3, pp. 331-337. Amini S.B., Woolson R.F. Rank covariance methods for the analysis of survival data // Biometrical Journal, 18 January 2007, vol. 33, issue 4, pp. 429-439. Ramaswamy R., Koch G.G., Amara I.A. Application of rank analysis of covariance methods to analysis of multiple anatomical regions with treatment for seborrheic dermatitis // Journal of Biopharmaceutical Statistics, 1997, vol. 7, issue 3, pp. 403-416. Adichie J.N. Ranking in analysis of covariance tests // Communications in Statistics - Theory and Methods, 1975, vol. 4, issue 9, pp. 883-890. Conover W.J., Iman R.L. Analysis of covariance using the rank transformation // Biometrics, September 1982, vol. 38, no. 3, pp. 715-724. Gary G. A review of some statistical methods for covariance analysis of categorical data / G. Gary, G.G. Koch, I.A. Amara et al. // Biometrics, September 1982, vol. 38, no. 3, Special Issue: Analysis of Covariance, pp. 563-595. К сожалению, все они недоступны без денег, а авторы не стремятся выложить их на свои сайты (есть информация, что это требование издательств). Есть еще вариант загрузки статей через службу типа JSTOR, но к ней подключены только некоторые университеты (Москва, СПб). Поэтому большинству исследователей статьи недоступны. Основные источники - это Puri с соавт. и Dana Quade, которая, как считается, первой предложила непараметрический ANCOVA. Тут такая ситуация. По статьям родоначальников метода сделать работающий алгоритм, как правило, не представляется возможным. Они содержат идеи. Нужен некоторый промежуточный слой теоретических и практических исследований (примеров применения), чтобы метод получил широкое употребление в массах. Поэтому, скажем, обзорная статья малоизвестного автора из периферийного университета оказывается более ценной для нас, чем оригинальная работа. Сообщение отредактировал Игорь - 9.02.2010 - 07:30 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Pinus Просмотр профиля	8.02.2010 - 11:23 Сообщение #164
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Цитата(Игорь @ 8.02.2010 - 16:01) Поэтому, скажем, обзорная статья малоизвестного автора из периферийного университета оказывается более ценной для нас, чем оригинальная работа. Игорь, а которая из них "малоизвестного автора из периферийного университета" (более ценная для практического применения)? Чтоб наверняка, по-меньше маяться с переводом. Сообщение отредактировал Pinus - 8.02.2010 - 11:24

Игорь Просмотр профиля	8.02.2010 - 11:41 Сообщение #165
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(Pinus @ 8.02.2010 - 12:23) Игорь, а которая из них "малоизвестного автора из периферийного университета" (более ценная для практического применения)? Чтоб наверняка, по-меньше маяться с переводом. Совершенно очевидно, что не классики и не монографии. А Dette с соавт. и Olejnik с соавт. Это из того, что есть в свободном доступе. Хотелось бы, конечно, современных классиков посмотреть - Conover с соавт. (особенно!) и Quade. Но на них денег нет (точнее - жалко). Если найдете - поделитесь, пожалуйста. Вы собираетесь переводить? А зачем терять время? Все учили английский, сдавали экзамены и кандидатский минимум? Ну вот - есть возможность практически проявить подтвержденные высокими оценками навыки (мне лично, учившему немецкий и не особо обремененному способностями к языкам, без всякой практики, лет 20 назад хватило 2-месячных курсов английского, чтобы с тех пор понимать смысл статей по интересующим тематикам). Чтобы понять десяток формул с пояснениями, переводить статью нет необходимости. Сообщение отредактировал Игорь - 8.02.2010 - 12:00 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

« Предыдущая тема · Медицинская статистика · Следующая тема »

13 страниц

« < 9 10 11 12 13 >

Добавить ответ в эту тему

Открыть тему

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2024 IPS, Inc.