Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

40 страниц V   1 2 3 > » 

плав
Отправлено: 6.04.2018 - 13:45





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Cules2013 @ 6.04.2018 - 00:18) *
В процессе работы возник вот такой вот вопрос - чем отличаются доверительные интервалы, рассчитанные для исходных данных по каждой из выборок, и доверительные интервалы, что рассчитывают пост-хок тесты для множественных попарных сравнений? Помимо очевидных различий, разумеется. Если доверительный интервал по выборке мне, в общем и целом понятен, то второй вариант - нет. Заметил, что это считается недостатком пост-хок метода, если он не считает доверительные интервалы. Ну и разумеется, в фармакологии, например, любят строить график именно по этим доверительным интервалам для групп, а не взять, например, классическую столбчатую диаграмму по исходным данным. В чём смысл и преимущество графика по доверительным интервалам?

Очевидно тем же, что и тесты сравнения двух выборок и тесты множественного сравнения - коррекцией для удержания ошибки I типа на заданном уровне. Преимущества графика с даверительными интервалами лежит в том, что если два интервала не перекрываются, то нулевую гипотезу о существовании различий только за счет случайности можно отвергнуть.
  Форум: Медицинская статистика · Просмотр сообщения: #22871 · Ответов: 12 · Просмотров: 13028

плав
Отправлено: 25.01.2011 - 22:05





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Nina11 @ 17.01.2011 - 16:56) *
Начала работать над материалом докторской, не могли бы подсказать ,какую литературу почитать по статистике, всегда пользовалась ребровой. В настоящий момент требуется проанализировать влияние разных фаткоров риска при ССЗ у выборки 400 человек по динамики 6 лет. Вот в поисках. прошу совета с чего начать. Описательную статистику посчитала, на этом остановилась(.

Найти хорошее руководство по дисперсионному анализу с повторными измерениями (Монтгомери или любое другое) и сильно подумать над новизной темы, разрабатывается вообще-то уже более 60 лет (с Фремингема) и динамика смотрелась, а вот предиктивное значение ФР даже в России описано за 30 лет, а не за 6 (кстати динамику ФР смотрели, если не ошибаюсь, в Новосибирске). Причем упоминаемые исследования - это популяционные проспективные...
  Форум: Медицинская статистика · Просмотр сообщения: #11552 · Ответов: 2 · Просмотров: 6714

плав
Отправлено: 15.01.2011 - 09:48





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Yngi @ 14.01.2011 - 19:36) *
ПОМОГИТЕ!! Можно ли сравнивать группы больных с разным их количеством в группе? Например, имеются 4 группы больных - 1-я группа=20 человек больные гриппом, 2-я=15 чел больные аденовирусной инфекцией,, 3-я=6 чел - РС-вирусная, 4-я=48 человек с парагриппом, необходимо сравнить иммунологические показатели (уровень иммуноглобулинов, цитокинов), чтобы выявить особенности иммунитета при каждой нозологии? Если можно их сравнивать, то какой метод лучше применить?

1) Можно
2) Дисперсионный анализ (вариант для неравных групп)
Основная проблема будет в том случае, если у Вас много показателей, тогда у Вас возникает проблема множественного тестирования (обсуждение см. в других ветках форума). При небольшом количестве наблюдений она (1) наиболее опасна (2) в любом случае на 15 человеках выявить "особенности иммунитета при аденвирусной инфекции" нельзя - люди не батарейки duracell и поэтому такая выборка очевидно не репрезентативна.
  Форум: Медицинская статистика · Просмотр сообщения: #11533 · Ответов: 2 · Просмотров: 8542

плав
Отправлено: 11.01.2011 - 19:49





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Pinus @ 11.01.2011 - 16:30) *
Но ведь в stepwise проверяются не все регрессоры сразу, а по одному (по очереди), так, что как будто других (еще не включенных) нет. И при каждой проверке в модели оказываются только переменные от предыдущего шага плюс эта, которая проверяется. Это в backward (метод исключения) берутся все переменные.
Я пробовал в SPSS считать. Если включаешь в модель, например семь переменных, а потом другой расчет - уже 17, но в которые входят те семь из первого, то и в первом, и во втором случае коэффициенты частной корреляции (а также значения критерия Стьюдента и p-значения) для этих семи переменных остаются одними и теми же. Разве это не говорит о том, что необходимость включения каждой переменной оценивается отдельно от других (не включенных)?
Или я не правильно понимаю?

Плав, если Вас не очень затруднит, подскажите навскидку один-два хороших источника (можно на англ.), где предлагается это правило - "10 наблюдений на один параметр или 100", чтобы можно было сослаться. А то я только у Айвазяна встречал об этом, но он говорит вообще: 5-10 наблюдений на один параметр.

С ходу ссылку не найду, было, по-моему в Jahn, Hale, Die Faktoranalyse.
Что касается же stepwise, то все не просто. Берем 7 регрессоров. На первом этапе коррелируем каждый из них с исходом. При номинальном уровне ошибки 0,05 вздуваем ее до 0,3. Затем на втором этапе вздуваем ее до 0,26 и т.д. Иными словами мы на каждом этапе резко увеличиваем ошибку I типа. Если еще на это наложить малый размер выборки, при котором вероятности обеих ошибок резко растут... Понятно, почему stepwise в принципе не очень хороший метод, а уж при малом количестве наблюдений и подавно.
  Форум: Медицинская статистика · Просмотр сообщения: #11524 · Ответов: 4 · Просмотров: 9581

плав
Отправлено: 10.01.2011 - 10:49





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Pinus @ 8.01.2011 - 14:59) *
Тут вот сомнения берут...
Допустим, есть выборка объемом 70 ед. Если опираться на придержку - 10 наблюдений на один параметр модели (для получения надежного результата), то можем включить в модель 7 параметров (6 параметров при регрессорах плюс свободный член). Значит ли это, что если мы используем шаговый метод включения переменных (stepwise), то мы можем испытать в анализе только 6 различных регрессоров? Мне думается, что это не так, потому что метод работает последовательным включением переменных (с возможностью исключения), а значит выполнение ограничения по числу параметров модели для конкретного объема выборки следует проверять только на каждом шаге. Стало быть, в первичный набор можно включать, например, и 100 регрессоров, но если на каждом шаге и в конечной модели (на последнем шаге) их будет не более шести, то все OK.
Так ли это, кто как думает?

нет, не так, потому что на каждом шаге проверяются все регрессоры и отбирается наиболее сильно связанный с остаточными значениями от предыдущего шага. Кроме того, не забывайте о проблеме множественного тестирования. И еще, правило звучит 10 наблюдений на один параметр или 100, что больше. Соответственно для 7 параметров надо 100 наблюдений.
  Форум: Медицинская статистика · Просмотр сообщения: #11517 · Ответов: 4 · Просмотров: 9581

плав
Отправлено: 9.01.2011 - 11:02





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(nokh @ 8.01.2011 - 11:38) *
Если метод Бонферрони в широком смысле - то да, а в узком - нет: есть менее консервативные последовательные его модификации: Dunn-Šidak, Holm's, Simes-Hochberg, Hommel's methods.

ну у каждого метода есть модификации, мы говорим дисперсионный анализ, а зачастую используем его вариант, являющийся регрессионным. Тут важно, какая идея лежит в основе метода. Так, например, Dunn-Šidak не что иное как точная оценка уровня \alfa для попарных сравнений которая может быть аппроксимирована, аналогично методу Бонферрони (если использовать разложение разности двух величин в степени в ряд), метода Holm вообще стартует с обычного правила Бонферронни, метод Hochberg'а (базирующийся на методе Simes) обращает метод Holm'а (делая дополнительные допущения). Что же касается метода Hommel (базирующегося на идеях теста Schaffer), то он базируется на логическом упорядочивании гипотез и определении, сколько гипотез могут быть справедливы (вместо всех возможных попарных сравнений), однако подход все равно базируется на идее теста Бонферрони (статья Хоммеля называется "Пошаговая процедура отклонения при множественных тестах, базирующаяся на модифицированном тесте Бонферрони"). При этом тесты Сидака, Хоммеля и Хохберга не всегда удерживают уровень общеэкспериментальной ошибки (\alfa).
На самом деле, они все не решают основной проблемы множественного сравнения. Представьте себе, что у нас есть две группы, пришедшие из разных популяций и для них р=0,04. Теперь предположим, что мы, не зная про это, добавляем еще несколько групп и сравниваем их, получая следующие значения р - 0,08; 0,10; 0,50
Используя процедуру Бонферрони мы должны признавать достоверными только различия с р=0,05/4=0,0125, поэтому мы заключаем, что все группы пришли из одной популяции и делаем ошибку второго типа
Используя метод Холма мы получаем тот же результат, поскольку наименьшее р (0,04) все равно больше 0,05/4
Используя метод Хохберга мы получаем тот же результат, поскольку двигаясь от наибольшего р (0,50) мы доходим до наименьшего, которое все равно больше 0,05/4
Иными словами, чтобы мы не делали, мы совершим ошибку второго типа. И чаще всего это будет платой за неумение планировать эксперимент и нежелание заранее решить, какие сравнения заслуживают изучения (я сейчас не говорю о легитимных множественных тестах, например повторное тестирование в клинических испытаниях).

на самом деле в моем предшествующем посту есть более серьезная (хотя и осознанная) неточность - само разделение метода Бонферрони и других методов на основе используемой дисперсии неверно. Во всех описанных выше тестах не обсуждается, как проводилась оценка дисперсии для расчета р (требуется только отсутствие "встроенной" коррекции множественного тестирования). Соответственно никто не мешает использовать суммарную дисперсию для расчета р (как, например, это проиллюстрировано у Гланца) и затем использовать вышеописанные тесты. Однако (отсюда осознанность) большинство рассматривают тест Бонферрони как способ анализировать серию попарных t-тестов и он это позволяет, с чем было и связано мое высказывание выше. Точнее фраза должна быть "методом, который может не использовать общеэкспериментальную дисперсию".
  Форум: Медицинская статистика · Просмотр сообщения: #11508 · Ответов: 7 · Просмотров: 13034

плав
Отправлено: 7.01.2011 - 20:18





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Игорь @ 7.01.2011 - 11:56) *
Вот такие соображения (прошу прощения - немного провокационные).

Автор имеет одну контрольную группу, а также несколько групп (выборок), соответствующих различным методам воздействия. Пусть автор применяет для обработки всего массива данных дисперсионный анализ или аналогичный метод. Статистика критерия при этом и p-значения или p-значения зависят от данных всех выборок.

Теперь предположим, что были сделаны не все эксперименты, а часть из них. При обработке будет получена другая статистика критерия и другие p-значения.

Возникает вопрос, каким образом отсутствующие эксперименты могут повлиять на результат и не нужно ли здесь ограничиться попарным сравнением экспериментальных выборок с контролем?

Так вся статистика посвящена спланированным экспериментам! Если сделаны "не все эксперименты" это означает серьезные отклонения от протокола, их надо объяснять, вносить изменения в протокол и т.д. (по крайней мере так делается в нормальной науке). Соответственно, так легко "не сделать" все эксперименты не получится.
Какова альтернатива? Если неизвестно, какие эксперименты "получатся", а какие нет, то можно отказаться от оценки суммарной дисперсии и пойти на оценку дисперсии по группам и, соответственно, попарным сравнениям. Поскольку теперь омнибусный тест "а есть ли хоть одна группа отличная от остальных" не используется, то аналитик влетает в проблему множественных сравнений или завышения вероятности ошибки I типа. Единственным методом, который при коррекции уровня ошибки I типа не использует полную экспериментальную дисперсию (experiment-wise error rate) является, насколько мне известно, метод Бонферрони. Иными словами, аналитик просто делит предельный экспериментальный уровень ошибки I типа на возможное количество сравнений. Таким образом он резко повышает вероятность ошибки II типа, но тут уж ничего не поделаешь.
Теперь вернемся к исходной задаче. Группы и так маленькие. Отказ от определения полной экспериментальной дисперсии приведет к потере мощности исследования, а использование попарного сравнения еще больше "вздует" ошибку II типа. Соответственно в данном случае попарные сравнения окажутся наихудшим вариантом с точки зрения получения достоверных результатов.
Если же группы очень большие, то тогда некоторая потеря мощности от использования попарного сравнения (внутри/попарная дисперсия + поправка Бонферрони) не приведет к значительному увеличению ошибки II типа и такой подход вполне возможен. Собственно, всякие методы data mining'а и базируются на том, что при очень больших выборках можно отказаться от некоторых теоретических сложностей спланированных экспериментов... но при очень больших...
  Форум: Медицинская статистика · Просмотр сообщения: #11501 · Ответов: 7 · Просмотров: 13034

плав
Отправлено: 7.01.2011 - 10:25





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Rrostis @ 5.01.2011 - 18:46) *
Уважаемые коллеги, помогите, пожалуйста, разобраться какой критерий использовать. У меня есть несколько групп данных. Есть контроль (n=10), и еще несколько групп, в 5 из них n=10, в четырех n=6. Все группы независимые, и все группы необходимо сравнить с контролем. просмотрев большой массив литературы, прихожу к выводу что нужно использовать U критерий Манна-Уитни. Встречаются достоверные различия. Пробовал Краскела_Уоллиса, с поправкой на Данна (пользуюсь Graphpad prizm) уже различий не наблюдаю. Не могли бы вы подсказать, что все-таки мне правильней использовать в данном случае. И еще смотрел, что нужно проводить доп. Исследования по определению нормальности расрпеделения, но если верить книгам то при малых выборках все равно используется непараметрика и тогда есть ли смысл в каких-то предварительных анализах? Заранее благодарю за помощь. Новичок в деле статистики.

А тест Мэнна-Уитни тут не пойдет, несколько групп, значит надо использовать Краскела-Уоллеса. Нет различий, значит нет различий. Это, возможно, плата за желание использовать непараметрику и незнание собственных данных (как в реальности они распределены). Если бы Вы почитали форум, то знали бы, что именно на малых выборках потеря мощности из-за выбора непараметрики становится важным фактором, т.е. утверждение, что при малых выборках надо использовать непараметрику просто ошибочно.
А вообще-то то, что Вы описываете очень напоминает простой дисперсионный анализ, который нужно смотреть вкупе со спланированными контрастами (тест Dunnett)
  Форум: Медицинская статистика · Просмотр сообщения: #11495 · Ответов: 7 · Просмотров: 13034

плав
Отправлено: 5.01.2011 - 11:43





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(nokh @ 4.01.2011 - 20:11) *
Обсуждение ушло в техническую сторону расчёта ДИ, мне же представляется важным определиться с более общими вещами. В приложенном файле содержится другой пример, в котором расчёт Р через Мак-Немара и через разность долей приводит к разным результатам, а также одно- и двухсторонние гипотезы приводят к разным результатам. В связи с этим хочется прояснить 2 вопроса:
1). Какое значение р правильнее использовать на практике: полученное по критерию Мак-Немара (и по какой из многочисленных формул?) или полученное из сравнения двух зависимых биномиальных распределений?
2). Одно- или двухстороннюю гипотезу предпочтительнее проверять? Мне кажется, что "бытовая" формулировка Но ("лечит ли препарат", "эффективно ли лечение", "лучше ли метод" и т.д.) соответствует односторонней гипотезе.

Попробую высказать теоретические соображения
1) Как в случае Мак-Немара, так и во всех остальных случаях мы не сравниваем два распределения, а тестируем гипотезу, что пары пришли из одного распределения. При этом "точные" методы используют само распределение, а МН - распределение статистики (хи2). Теоретически, если бы имели непрерывное распределение, то лучше было бы использовать "точные" методы, но, увы, распределение дискретное, поэтому они не будут точными. Они будут контролировать ошибку I типа за счет II. Соответственно, "лучшего" метода теоретически быть не может, надо выбирать исходя из опасности ошибок I и II типа.
2) Предпочтительнее двусторонняя гипотеза, поскольку формулировка Ho "препарат НЕ лечит", "метод НЕ лучше" и т.д. Альтернативную гипотезу при обычном тестировании по МН не формулируют (это требовало бы точного указания, НАСКОЛЬКО метод лучше и т.п.).
Некоторую путаницу, как мне кажется, внесло цитирование статьи Sidik, который оценивал методы non-inferiority. Тут задачей является доказать, что новый метод не хуже старого, поэтому обычным в данных методах является расчет доверительного интервала, который должен укладываться в определенные пределы "аналогичности препаратов". В этой ситуации авторов часто не интересует "верхняя" граница, т.е. изучается вопрос о том, что новый препарат не хуже (а может быть и лучше), чем старый. Поэтому становится возможным использование односторонней гипотезы. Обычное статистическое тестирование иное. Поскольку тестируется гипотеза "метод не лучше", то возможны оба варианта и используется двусторонняя гипотеза. Тут нет диапазона значений "аналогичности", а только строгое равенство.
  Форум: Медицинская статистика · Просмотр сообщения: #11437 · Ответов: 23 · Просмотров: 45550

плав
Отправлено: 4.01.2011 - 16:43





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Игорь @ 4.01.2011 - 15:24) *
Недоступен источник.

Странно, похоже за вечер поменяли ... сегодня находится тут
http://support.sas.com/documentation/cdl/e...a0000000660.htm
вообще это документация к SAS 9.2, раздел The FREQ procedure далее Details: FREQ Procedure далее Statistical Computations далее Binomial Proportion
  Форум: Медицинская статистика · Просмотр сообщения: #11401 · Ответов: 23 · Просмотров: 45550

плав
Отправлено: 3.01.2011 - 20:28





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Игорь @ 3.01.2011 - 16:41) *
Да, эта тема обсуждалась и здесь на форуме, и в личных беседах с коллегами. И, удивительно для меня, большинство высказывалось, что расчеты нужно давать разными методами (хоть 15-тью). Влияние этого мнения заметно в некоторых модулях AtteStat. Но Вы противоречите сами себе - в StatXact только 2 метода, и оба не упоминаются в классических монографиях Agresti, Флейса и Ребровой.

Возможно. Но проверить не удалось. Сидика торгуют за доллары. Поэтому оснований считать, что StatXact считает правильно, еще более нет.

Может, лучше под названием "стандартная ошибка" было бы выдать стандартную ошибку?

Т.е. Вы намекаете, что методы, описанные в книге про программу STATISTICA, в самой упомянутой программе не представлены? Оригинально.

Давайте только книгу Ребровой не считать "классической монографией". Методов много по одной простой причине, ни один не является "точным" в том смысле, что обеспечивает 95% покрытие, по одной простой причине - дискретность распределения. При дискретном распределении невозможно, в ряде случаев, получить "точно" 95%ДИ. Поэтому все методы и придуманные и те, что еще будут придуманы, всегда будут являться аппроксимацией. Чем меньше количество наблюдений, тем выше вероятность того, что то, что называется 95%ДИ не будет 95%ДИ. Это не катастрофа, это надо принимать как данность. Утверждать, что какой-то метод "не верный", я бы не стал. Вопрос в том, что он делает с ошибками I и II типа. Например, нормальная аппроксимация (интервал Вальда), будет завышать вероятность ошибки I типа, а "точный" интервал Клоппера-Пирсона , будет завышать ошибку II типа. Агрести считает, что его метод является наиболее приемлемым компромиссом, но все-таки компромиссом.
При большом количестве наблюдений все методы будут сходиться к одному интервалу, при небольшом - все будут не вполне "точны".
Что касается, статистических программ, то надо с сожалением признать, что многие (если не все) программы не считают ДИ для долей, кстати это подвигло меня, например, написать модуль для R, который считает те же интервалы, что в упоминавшейся выше экселевской таблице - теперь использую модуль в обучении. Почему авторы статистических программ (коммерческих) игнорируют этот важный инструмент описания данных - непонятно, хотя ситуация меняется. В версии 9.2 SAS, например, появилась опция binomial (ALL) в процедуре FREQ, которая рассчитывает интервалы Вальда и Клоппера-Пирсона (как это делалось и в более ранних версиях), а также Джеффриса, Агрести-Коула и Вилсона. Детали (с формулами, см. http://support.sas.com/documentation/cdl/e...0000000660.htm)
Что касается теста со ссылкой на Sidik, то тут проблема - статья не совсем о том (по крайней мере ссылка) - это тест non-inferiority для парных наблюдений, т.е. доверительные интервалы для ситуации теста Мак-Немара (плюс non-inferiority). Для знакомства можно посмотреть другую статью того же автора, доступную в сети http://www.google.ru/url?sa=t&source=w...ilA&cad=rja
  Форум: Медицинская статистика · Просмотр сообщения: #11382 · Ответов: 23 · Просмотров: 45550

плав
Отправлено: 3.01.2011 - 13:33





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(ladymybizwin @ 2.01.2011 - 12:18) *
Добрый день, Дмитрий и все форумчане.
Спасибо за ответ.
Кто- нибудь знает об офрмлении отпуска для подготовки в аспирантуру?
Возможно ли его оформление?
Если удастся его оформить, то что, на время отпуска продолжаю оставаться студентом и на меня распространяется отсрочка?

для подготовки к поступлению в аспирантуру отпуск не предоставляется, все вытекающее следует из этого.
  Форум: Обучение в аспирантуре · Просмотр сообщения: #11377 · Ответов: 3 · Просмотров: 9883

плав
Отправлено: 28.12.2010 - 18:16





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(mix3d @ 27.12.2010 - 01:14) *
Уважаемые коллеги. Излагаю суть вопроса.
Для установления связи между переменными использую множественную регрессию дабы согласовать по полу, возрасту, некоторым другим моментам. Ваше мнение, в результатах для демонстрации наличия данной значимой независимой связи достаточно указать бета коэффициенты, либо целесообразно указать относительный риск. Последнее более "адекватно" воспринимается широкой общественностью... Но, зависимая переменная представляет собой функциональный параметр (непрерывная количественная переменная по своей сути), а не событие, исход и т.п., поэтому как-то непривычно пользоваться такой терминологией.
Спасибо за любую информацию!

относительный риск при обычной линейной регрессии не используется.
  Форум: Медицинская статистика · Просмотр сообщения: #11346 · Ответов: 2 · Просмотров: 6688

плав
Отправлено: 28.12.2010 - 18:14





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(marmir111 @ 26.12.2010 - 17:50) *
Помогите! У меня вопрос по SPSS
Ввела исх. данные. Потом ввела вычисляемые данные как формулы от первичных. А потом исх. данные добавились, и надо пересчитать для них вычисляемые. И никак не найду, как это можно сделать автоматически. Получается, что могу только по новой вводить формулы для этих вычисляемых, и тогда программа спрашивает, надо ли пересчитать. А формулы достаточно большие. Неужели нет какого-то простого способа, чтобы при вводе новых исходных данных эти вычисляемые колонки считались автоматически?
Спасибо всем!

есть. при первом вводе сохраните сгенерированный системой синтаксис в файл и потом при добавлении данных просто запускайте синтаксический файл.
  Форум: Медицинская статистика · Просмотр сообщения: #11345 · Ответов: 2 · Просмотров: 5994

плав
Отправлено: 28.12.2010 - 18:07





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Игорь @ 27.12.2010 - 08:28) *
А было бы интересно посмотреть, как именно меняется статистика Дарбина-Уотсона при перестановках вариант. Например, взять небольшой ряд (чтобы вычислений не сильно много), сгенерировать все перестановки и для каждой перестановки посчитать статистику.

А как могут выглядеть перестановки вот тут:
y x
1 1
2 1.6
3 2
4 2.4
? Это ведь обычная регрессия, а может y - время?
  Форум: Медицинская статистика · Просмотр сообщения: #11344 · Ответов: 43 · Просмотров: 75482

плав
Отправлено: 25.12.2010 - 13:11





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(100$ @ 23.12.2010 - 23:55) *
Можно. Для того их программа и выдает smile.gif

Прекрасный совет, показывает, что отвечающий не осознает, что среднее арифметическое, а тем более стандартная ошибка базируются на предположении об определенном (нормальном) распределении данных или справедливости допущения распределения выборочных показателей по центральной предельной теореме. В обоих случаях необходимости в использовании непараметрической статистики нет (ввиду ее меньшей мощности). Если же используется непараметрическая статистика, это означает, что у нас ординальные данные и/или мы не можем полагаться на ЦПТ. Тогда указание стандартной ошибки становится бессмыслицей, демонстрирующей незнание базовой теории. Кстати, поскольку большинство по непараметрикой понимают ранговые тесты типа Вилкокосона, то как же можно, зная только ранги рассчитать среднее? А?
Короткий ответ по теме - что бы не считали программы, теоретически правильной записью является медиана и межквартильное расстояние.
  Форум: Медицинская статистика · Просмотр сообщения: #11279 · Ответов: 37 · Просмотров: 66464

плав
Отправлено: 25.12.2010 - 13:00





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(100$ @ 24.12.2010 - 23:25) *
1. Про хронологию (кстати, а почему в кавычках smile.gif Ну, да ладно...): могу согласиться, если эксперимент ставится в течение нескольких лет на одном клочке земли. Если же одновременно на нескольких участках (причем количество удобрений - величина случайная) - на выходе получаем N точек в декартовой ситеме координат: завсимость урожайности от количества удобрений. Другое дело, что на оси абсцисс это количество (удобрений) будет упорядочено по возрастанию. Так это-чисто визуальный эффект, время тут не при чем.

2. Насчет интервальности. Статистика Д-У не интересуется природой откликов и регрессоров: интервальные они, нечеткие или серо-буро-малиновые. В отношении самой регрессии (модели) есть определенные пожелания (см. пост #16 ).

3. Спрашиваете: "А иначе как она "знает" про время?" Отвечаем: она ничего не "знает" про время, просто работает с рядом остаков, как с временным рядом. (Кажется, я повторяюсь). Индекс, который используется в формуле, не необходимости отождествлять со временем. Вам просто дают понять, что для корректного расчета статистики Д-У надо из второго остатка вычесть первый, из третьего-второй и т.д.

4. По поводу искусственно созданных проблем. Сообщите, пож-ста эту драгоценную рекомендацию, Pinus'у. Не нужно в запальчивости доказывать мне то, что я доказывал ему в посте #25.

Похоже Вы не понимаете, или делаете вид, что не хотите понять. Итак, по пунктам:
1) Статистика ДУ работает с упорядоченными данными (это же тест для регресии!). Для упорядочения необходима независимая переменная. Такой переменной является время, концентрация внесенного удобрения или еще что-то. Поэтому переставлять остатки как Вам хочется нельзя.
2) Вы сами-то поняли, что Вы упорядочили данные по времени в своем ответе ?3? А если можно упорядочить по времени, почему нельзя по другой переменной? В чем разница? (вообще создается впечатление, что Вы никогда анализ остатков не делали)
3) Не стоит цепляться к терминам, если не очень разбираетесь. По поводу распределения остатков есть требования - для расчета таблиц используется допущение нормальности распределения остатков, соответственно если шкала будет "серо-буро-малиновая" (а также, например, номинальная), то остатки не смогу быть распределены нормально. Отсюда, кстати, формально следует, что переменная отклика должна измеряться интервальной шкалой, а требование упорядоченности означает, что независимая переменная должна измеряться как минимум при помощи ординальной шкалы. То, что Вы это не поняли, вызывает лишь сожаления.
  Форум: Медицинская статистика · Просмотр сообщения: #11278 · Ответов: 43 · Просмотров: 75482

плав
Отправлено: 24.12.2010 - 21:25





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(100$ @ 23.12.2010 - 20:31) *
Плав, Вы все мудро говорите, только эта ветка про Д-У возникла лишь потому, что никто из собеседников не всетречал в литературе явного запрета на ее использование в регрессионном анализе. Допустим, что мы восстанавливаем зависимость урожайности от количества внесенных удобрений. Никакой хронологии нет и в помине, причин явно вводить время в уравнение регрессии нет. Перестановками в таком случае можно заниматься до вздутия живота, а статистика Д-У всякий раз будет разная. Может быть, именно поэтому она и популярна лишь при анализе временных рядов (эконометрика всецело к нему не сводится). Вот как-то так.

ничего подобного, "хронология" как раз в Вашем примере есть - количество внесенных удобрений. Это интервальная переменная и естественный порядок есть. Время является независимой переменной, соответственно статистика считает зависимость остатков от значения независимой переменной. А как иначе она "знает" про время? Так что не надо находить проблему там, где ее нет.
  Форум: Медицинская статистика · Просмотр сообщения: #11274 · Ответов: 43 · Просмотров: 75482

плав
Отправлено: 23.12.2010 - 14:55





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Во всех рассуждениях выше есть одна проблема - предполагается, что наблюдения можно переставить. Однако это не так. Порядок остатков зависит от "независимой" переменной, которой в эконометрических исследованиях обычно является время. Поэтому и пишут остаток во время t минус остаток во время t-1. Но это просто дань методике. Если Вы предсказываете охват от роста, то рост, как независимая переменная определяет порядок остатков и переставить их не получится. Некая уопрядоченность в тесте DW обязательная и определяется она независимой (незаивисмыми) переменной (-ными)
  Форум: Медицинская статистика · Просмотр сообщения: #11263 · Ответов: 43 · Просмотров: 75482

плав
Отправлено: 21.12.2010 - 21:22





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(ASD @ 21.12.2010 - 19:49) *
Здравствуйте, не может ли кто-нибудь помочь мне разобраться в одном вопросе smile.gif А конкретно - является ли аспирантура обязательно платной, если уже пройдена интернатура/ординатура? Как я понимаю обе формы(асп и инт/орд) относятся к постдипломному обучению? И бюджетное обучение возможно только один раз? Так же как 1 интернатура бесплатна, вторая за деньги smile.gif
Итог: бесплатная интернатура/ординатура и платная аспирантура, либо бесплатная аспирантура(на неклин. кафедре) и платная интернатура/ординатура? Я прав?

Нет, не правы. Во-первых это - послевузовское обучение, а требования платности второго относятся только к высшему образованию. Многие люди имеют комбинацию бюджетной ординатуры/интернатуры и аспирантуры. Если Вас на все это возьмут.
  Форум: Обучение в аспирантуре · Просмотр сообщения: #11248 · Ответов: 1 · Просмотров: 6980

плав
Отправлено: 19.12.2010 - 22:54





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Гематолог @ 8.12.2010 - 15:52) *
Глубокоуважаемые эксперты!

Помогите пожалуйста.

Известны ли Вам критические теоретические работы на тему рандомизации?
Постараюсь сформулировать суть проблемы.
Я встретился с точкой зрения, где идея рандомизации в проспективном контролируемом исследовании критикуется.
Суть критики - группы получаются несбалансированные по значимым факторам риска, что искажает последующие выводы об эффективности или неэффективности исследуемых методов лечения. В качестве альтернативы предлагается case control, когда каждому случаю мы подбираем похожий по факторам риска случай. То есть, я могу воспользоваться ретроспективным материалом для формирования группы сравнения?
Я не встретил публикаций по этой теме.
Я полагал, что рандомизации, как основному алгоритму набора в исследовательские группы клинических трайлов альтернативы нет.
Что ?кейс-контроль? - это различные сложные схемы стратифицированной рандомизации. Цель их ? добиться лучшей сбалансированности групп по известным риск-факторам.
Почему тема меня волнует? Я не могу найти объяснения невоспроизводимости результатов исследований, когда препарат "Х" уже попадает в стационар. С моей точки зрения, сложно реализовать "ангажированность" исследования препарата со стороны производителя, если честно выполняется протокол рандомизации.
Я думал, что проблема и ошибки интерпретации результатов клинических трайлов лежит в селекции и экстраполяции результатов, а не в самой рандомизации.

Итак, есть ли альтернатива? В чем может быть несовершенство проспективного рандомизированного исследования?
Если вдруг предложите ссылки, буду очень рад!

Неплохо бы дать ссылку на такую странную точку зрения. Если кратко, то она не выдерживает критики. Рандомизация обеспечивает балансировку по известным и не известным факторам риска, случай контроль - только по известным, кроме того, исследования случай-контроль страдают от возможной ошибки обратного направления, когда Вы считаете протективный фактор фактором риска. Поэтому доказательность СК крайне низка (вообще-то они относятся к гипотезо-генерирующим, а не доказательным исследованиям). Что касается РКИ, то дисбаланс факторов риска возникает лишь при малом числе наблюдений относительно фактора риска - простое решение - увеличить размер выборки
  Форум: Медицинская статистика · Просмотр сообщения: #11227 · Ответов: 2 · Просмотров: 6909

плав
Отправлено: 19.12.2010 - 22:48





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


метод Каплана-Мейера предпочтительнее, поскольку нет аггрегирования данных, как в методе таблиц дожития. Среднюю продолжительность жизни, если умерли не все 100% пациентов считать нельзя.
  Форум: Медицинская статистика · Просмотр сообщения: #11226 · Ответов: 2 · Просмотров: 5880

плав
Отправлено: 19.12.2010 - 22:46





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(Игорь @ 14.12.2010 - 11:18) *
В последнее время в научных публикациях получила распространение практика использования одного простого экспресс-метода анализа значимости различий между величинами, а именно - исследование перекрытия доверительных интервалов величин. При этом исследователей часто смущает факт расхождения результатов такого анализа со стандартными статистическими критериями, разработанными именно для тех же целей.


А удивительного в расхождении нет - классическое тестирование оценивает дисперсию по суммарным данным двух (или более) групп, а ДИ обычно строятся на основании оценки дисперсии одной группы. Поэтому они шире, соответственно и перекрытие наступает "раньше". При сравнении нескольких групп адекватнее было бы оценивать дисперсию суммарно (как в дисперсионном анализе), но затем варьировать шириной ДИ в зависимости от числа сравнений (чтобы не увеличивать ошибку I типа).
  Форум: Медицинская статистика · Просмотр сообщения: #11225 · Ответов: 1 · Просмотров: 4612

плав
Отправлено: 19.12.2010 - 22:38





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Вообще-то следует говорить не о коррелированности остатков, а о независимости наблюдений. Тогда сразу все станет понятно. Оба глаза коррелированные наблюдения, поскольку из одного организма и подвергались одинаковым воздействиям. Соответственно, это надо учитывать при оценке дисперсии (нужны смешанные модели)
  Форум: Медицинская статистика · Просмотр сообщения: #11224 · Ответов: 43 · Просмотров: 75482

плав
Отправлено: 6.12.2010 - 23:12





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933


Цитата(micin @ 6.12.2010 - 12:51) *
продолжая эту тему:

решил использовать SPSS для анализа, насколько я понял критерий Крускалла-Уоллиса относится к непараметрическим методам статистики. Я ввел данные в статистическую таблицу,

при попытке провести анализ непараметрических критериев для независымых выборок появляется сообщение, что переменные должны быть количественные, а у меня они порядковые.

Версия SPSS 19.

Что делать?

Изменить тип переменной на закладке variables. Если я конечно, правильно понял и у Вас переменные закодированы числами (кроме того используйте версию "старых" непараметрических тестов - внизу меню, новые какие-то глючные).
  Форум: Медицинская статистика · Просмотр сообщения: #11117 · Ответов: 18 · Просмотров: 26975

40 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена