Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

14 страниц V   1 2 3 > » 

DoctorStat
Отправлено: 4.03.2017 - 13:38


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


У меня такое ощущение, что парные корреляции могут быть незначимы, а сложная многомерная зависимость имеет место быть. В продолжение этой догадки: не лучше ли начать с многомерных методов анализа, постепенно уменьшая размерность признаков до минимального (парного) значения ?
  Форум: Медицинская статистика · Просмотр сообщения: #21133 · Ответов: 40 · Просмотров: 6719

DoctorStat
Отправлено: 23.02.2017 - 13:13


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(DrgLena @ 23.02.2017 - 11:09) *
Я думаю, автор поста к этим долям и хочет посчитать ДИ
Даже если категории не упорядочены, можно вычислить ДИ для доли в каждой категории. Выше с помощью тестов хи-квадрат и Фишера была показана независимость двух выборок, следовательно, мы можем их объединить в одну:
полный ответ Стабилизация Частичный ответ
1 3 56
Получается одна выборка из неизвестной генеральной совокупности, частоты (доли) которой нужно оценить . Выборочные доли P_i на основании ЦПТ подчиняются нормальному распределению. Формулу для стандартного отклонения для частот Sigma_i можно найти в учебниках. Тогда 95 %-доверительный интервал i-ой доли равен = P_i +/- 2*Sigma_i
  Форум: Медицинская статистика · Просмотр сообщения: #21082 · Ответов: 11 · Просмотров: 1845

DoctorStat
Отправлено: 18.02.2017 - 18:38


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(kont @ 18.02.2017 - 18:07) *
И тут я впал в ступор, я не могу понять, а как составить таблицу для трех градаций, чтобы посмотреть межгрупповое различие. Мне просто нужно ещё и 95% ДИ рассчитать.
Зашел на сайт on-line калькулятора хи-квадрат, вбил значения и получил ответ (смотри картинку 1). Хи-квадрат - приближенный метод, поэтому его нужно перепроверять точным методом Фишера (смотри картинку 2 - результат работы моей программы). На уровне значимости p=0,05 результаты совпадают.
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
 
  Форум: Медицинская статистика · Просмотр сообщения: #21060 · Ответов: 11 · Просмотров: 1845

DoctorStat
Отправлено: 4.01.2017 - 20:08


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(DrgLena)
По поводу оформления, есть такая книга Ланга и Сесика "Как описывать статистику в медицине", раньше я пользовалась английской версией, точно есть в сети, но сейчас она издана на русском языке, перевод под редакцией В.П. Леонова.
  Форум: Медицинская статистика · Просмотр сообщения: #20785 · Ответов: 47 · Просмотров: 73675

DoctorStat
Отправлено: 4.01.2017 - 11:00


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(doc2012)
1) вот критерием К-У выявил достоверность/недостоверность различий между тремя группами, далее там в программе статистика можно попарно сравнить группы между собой и выявить Н и р при парных уже сравнениях---как при этом трактовать результаты попарных сравнений внутри критерия К-У--? можно ли пользоваться такими попарными данными?-может это уже как критерий Манна-Уитни? или что это?
Предположим, что Критерий Крускала-Уоллиса выявил различие между тремя выборками. Далее, попарно сравнивая выборки, необходимо объединить их в однородные группы (алгоритм кластеризации).
Цитата(doc2012)
2) как лучше записывать результаты К-У---пример:"результаты между тремя группами были достоверно различимы (Н=....;df=...; р=0,014)"--или только (р=0,014)-?
Как правильно записывать результат, должно быть изложено в стандартах по оформлению статистических расчетов
Цитата(doc2012)
3) иногда результаты К-У (сравнивая три группы) показывают уровень достоверности р=0,0000 (и всё--без какого-либо числа)----как данное трактовать и как записать в результат-пример:"различия были достоверны (р=0,0000)---корректна ли такая запись-? (или должно быть какое-то число, кроме 0
Скорее всего уровень значимости р<0,0001. Я бы так и записал в отчете.
  Форум: Медицинская статистика · Просмотр сообщения: #20777 · Ответов: 47 · Просмотров: 73675

DoctorStat
Отправлено: 10.11.2016 - 20:59


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(Kos @ 9.11.2016 - 22:41) *
Особенно интересуют методы без наличия предварительных данных (или данных других исследований).
Объем выборки можно оценить только зная величину эффекта. Допустим возраст увеличивает риск на 0.x % и минимальный размер выборки для обнаружения различий должен быть N. Теперь уменьшим риск в 10 раз: 0.0x %. Соответственно минимальный размер выборки должен быть увеличен в первом приближении также в 10 раз: 10*N.
  Форум: Медицинская статистика · Просмотр сообщения: #20424 · Ответов: 1 · Просмотров: 826

DoctorStat
Отправлено: 12.09.2016 - 18:07


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(papai25 @ 10.09.2016 - 16:45) *
Конечно, группы однородные, операции выполнялись в двух группах
Я не очень разбираюсь в медицинских аспектах, но нить рассуждений может быть такой:
1. Группы однородные, значит отличий по какому-то одному или сразу нескольким параметрам (ЧCC1, АД1, ГормонG1, ГормонS1) быть не должно. Это нужно ПОКАЗАТЬ статистическими методами - скорее всего непараметрическими (вряд ли их распределение будет нормальным).
2. Если отличий по какому-то параметру на первом этапе нет, то можно идти дальше: например, посмотреть, как меняется этот параметр при переходе от одного этапа к другому.
3. Но все-таки, мне кажется, что нужно сравнивать "успешность" двух видов вмешательств, а не сопутствующие второстепенные показатели.
  Форум: Медицинская статистика · Просмотр сообщения: #20283 · Ответов: 12 · Просмотров: 2890

DoctorStat
Отправлено: 7.09.2016 - 21:47


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


papai25, как подбиралась контрольная группа и что для нее измерялось (контрольным людям не делали операцию) ?
  Форум: Медицинская статистика · Просмотр сообщения: #20234 · Ответов: 12 · Просмотров: 2890

DoctorStat
Отправлено: 27.07.2016 - 10:26


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(nironir @ 26.07.2016 - 15:53) *
Но в инете я прочитал что он Равномерно наиболее мощный несмещенный критерий для проверки гипотезы о равенстве p двух биномиальных выборок (и в условном и в безусловном случае). Не могу понять, что это значит...
Это значит, что он наиболее мощный критерий (дает минимальную ошибку второго рода) при фиксированном уровне ошибки первого рода.

Цитата(nironir @ 26.07.2016 - 15:53) *
Я понимаю что говорю глупости но все же существует ли "золотой стандарт" проверки гипотезы равенства частот в таблице сопряженности?
Эти два понятия: "Равномерно наиболее мощный несмещенный критерий" и "золотой стандарт проверки гипотез" эквивалентны smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #19988 · Ответов: 10 · Просмотров: 2677

DoctorStat
Отправлено: 13.06.2016 - 10:00


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(kont @ 10.06.2016 - 21:37) *
Коллеги, а я ещё запутался в терминологии Среднеквадратичная ошибка среднего это показатель точности оценки среднего выборки или теоретическое стандартное отклонение всех средних выборки размера
просто, как сказано на портале Statsoft. Ну, например, пусть среднее М=45, RMSE=1,7 как это интерпретировать это Rmse?
Я не большой специалист в программе Statsoft, но википедия говорит, что root-mean-square error (RMSE) - это выборочная, а не теоретическая оценка дисперсии среднего. Стентон Гланц в книге "Мед-био статистика" в главе "Как описать данные" обозначает эту величину как: sx=s/sqrt(n)
Это значит, что среднее значение совокупности с вероятностью 95% заключено в интервале:
[ M - 2*sqrt(RMSE), M + 2*sqrt(RMSE) ]
  Форум: Медицинская статистика · Просмотр сообщения: #19846 · Ответов: 10 · Просмотров: 2594

DoctorStat
Отправлено: 8.06.2016 - 22:26


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(kont @ 8.06.2016 - 01:20) *
Подскажите, есть ли смысл в зависимой выборке? А почему нельзя обходится только форматом независимых выборок?
Как заметил р2004, зависимые выборки по сравнению с независимыми содержат дополнительную информацию об изменении показателя для каждого пациента. Эта дополнительная информация позволяет повысить мощность критерия, т.е. найти отличия там, где независимая выборка их не находит. См.Гланц "Мед.био статистика", глава 9 "Анализ повторных измерений"
  Форум: Медицинская статистика · Просмотр сообщения: #19837 · Ответов: 10 · Просмотров: 2594

DoctorStat
Отправлено: 10.05.2016 - 16:25


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Выше drgLena уже упоминала про запросы к базам данных. Эти запросы пишутся на языке SQL - structured query language - язык структурированных запросов. Он позволяет делать выборки из базы данных любой сложности. Можно выделить только первое посещение пациента, или только последнее, или взять все его посещения и усреднить их (по времени или как-то еще). SQL сделает выборку из базы и выдаст вам таблицу с уникальными (одна строка - один пациент) пациентами, которую затем можно обработать статистическими методами. Если ваша статистическая программа не поддерживает работу с SQL и базами данных, то таблицу придется вручную копировать в эту программу для дальнейшей обработки.
  Форум: Медицинская статистика · Просмотр сообщения: #19707 · Ответов: 7 · Просмотров: 2227

DoctorStat
Отправлено: 8.04.2016 - 21:58


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(Jacksson @ 8.04.2016 - 15:06) *
Штудирую "Lecture notes on Compositional Data Analysis"
Можно провести аналогию с сравнением 2-х групп по качественным данным с помощью таблиц сопряженности. Анализ разбивается на два шага. Вначале один метод определяет, что различие по КАКИМ-ТО признакам есть, но не уточняет по каким именно. Если на первом шаге различие удалось обнаружить, то уже потом другим методом находятся КОНКРЕТНЫЕ признаки, по которым группы разнятся. В вашем случае исследование должно быть построено аналогично - два шага с последовательной детализацией различий.
  Форум: Медицинская статистика · Просмотр сообщения: #19551 · Ответов: 13 · Просмотров: 2550

DoctorStat
Отправлено: 30.03.2016 - 20:39


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(anna78 @ 30.03.2016 - 19:19) *
А сам принцип - сравнивать попарно, имеет право на существование, это не неправильно? или нужно было изначально сравнивать всех сразу с помощью произвольной таблицы сопряжённости? и тогда, как я понимаю, можно поправку Бонферрони не использовать?
Абсолютно верно - сначала сравниваем все группы, поместив их в большую таблицу сопряженности, с помощью точных методов (например, точного критерия Фишера) без учета поправки Бонферрони. А уже потом, когда найдено значимое отличие в общей таблице, искать какие именно группы отличаются.
  Форум: Медицинская статистика · Просмотр сообщения: #19514 · Ответов: 9 · Просмотров: 2222

DoctorStat
Отправлено: 8.03.2016 - 10:40


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(nokh @ 7.03.2016 - 22:46) *
В благодарность - временная ссылка на учебники

Хьюбер "Робастность в статистике" скачать. Нажать правую кнопку мыши и выбрать пункт меню: "Сохранить как..."
  Форум: Медицинская статистика · Просмотр сообщения: #19429 · Ответов: 11 · Просмотров: 2345

DoctorStat
Отправлено: 6.03.2016 - 22:43


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(statistonline @ 6.03.2016 - 20:14) *
1. Вы немного запутались в матанализе. Производная от частного не равна частной от производных.
Вот еще одна попытка пробиться сквозь формулы и доказать, что существует нетривиальное решение.
Как и прежде используем комбинированный признак: z=a^2*x + b^2*y (квадраты коэффициентов для положительности)
статистику Стьюдента (для наглядности): t(a,b)=(<Z1>-<Z2>)/sqrt(s1+s2)
нормировку коэффициентов (без обоснования - нам так хочется!): a^2 + b^2=1
Теперь (новая идея, которой не было раньше!) вместо двух переменных a и b, у нас из-за наличия нормировки (связи) всего одна. Можно выбрать любую переменную a или b. Выберем произвольно в качестве единственной переменной - a. Вычислим по ней производную числителя (Ч) статистики t(a)=Ч/M :
d(Ч)/da=d(<Z1>)/da-d(<Z2>)/da=2a/n1*SUM(xi-yi)-2a/n2*SUM(xj-yj)
При приравнивании этой производной нулю, мы получаем тривиальное решение a=0, которое очень беспокоило наших участников. Но они забыли про знаменатель! В формуле статистики для t(a)=Ч/M есть знаменатель M. Производная от частного равна:
dt/da=d(Ч/M)/da=[d(Ч)/da*M-Ч*d(M)/da]/M^2=0
Таким образом, в числителе стоит разность двух выражений: d(Ч)/da*M-Ч*d(M)/da=0
Последнее уравнение должно иметь нетривиальное решение: a!=0. Ура - мы победили ! Где взять заслуженный приз? smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #19409 · Ответов: 37 · Просмотров: 6316

DoctorStat
Отправлено: 6.03.2016 - 19:11


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(Олег Кравец @ 6.03.2016 - 17:50) *
Я вообще-то имел в виду техническую тривиальность именно этого момента.
Спасибо за ваши вопросы - они двигают науку вперед! Вычисления частных производных - далеко не тривиальная задача. Я не сумел пробиться до конечных формул, но ради чистоты эксперимента приведу начальные выкладки.
Итак, пусть комбинированный признак имеет (несколько модифицированный) вид: z=a^2*x + b^2*y . Здесь коэффициенты a и b заменены своими квадратами (для положительности вкладов)
Статистика Стьюдента имеет вид: t(a,b)=(<Z1>-<Z2>)/sqrt(s1+s2)
, где <Z1>=1/n1(Z1+...+Zn1)=1/n1(a^2*SUM(xi)+b^2*SUM(yi)) - выборочное среднее для 1-ой группы
s1=1/sqrt(n1-1)*sqrt(SUM[(zi-<Z1>)^2]) - выборочное стандартное отклонение для первой группы
Возьмем производную числителя t(a,b) по переменной a:
d(<Z1>-<Z2>)/da=1/n1*(2a*SUM(xi))-1/n2*(2a*SUM(xj))
Возьмем производную стандартного отклонения для первой группы по переменной a:
d(s1)/da=1/sqrt(n1-1)*1/(2*sqrt(SUM[(zi-<Z1>)^2]))*sqrt(SUM[2*(zi-<Z1>)*2a(xi-SUM(xi)))
К сожалению, дальнейшие вычисления становятся все сложнее, а формулы все запутаннее. Главная идея (брать производные) остается прежней, но количество слагаемых увеличивается frown.gif
  Форум: Медицинская статистика · Просмотр сообщения: #19403 · Ответов: 37 · Просмотров: 6316

DoctorStat
Отправлено: 6.03.2016 - 18:48


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(statistonline @ 6.03.2016 - 17:33) *
1. Так как тут с LATex'ом?
Если честно, то не знаю - никогда им не пользовался. Спросите у модераторов.
Цитата(statistonline @ 6.03.2016 - 17:33) *
2. "Все слышали" - не очень хороший повод для использования. Для бинарных переменных не подойдет никакая, ни параметрическая, ни непараметрическая статистика, использующая при расчете арифметические действия. И сразу же, отвечая на замечание о нормировках - мы не находимся в рамках квантовомеханической картины мира, где суперпозиции волновых состояний (по типу кота Шредингера) - обычная вещь. Бинарный признак не может быть частично присущ классическому объекту, он либо есть, либо нет. Поэтому я не вижу способа, как можно трактовать такую суперпозицию для случая вашей линейной функции. Кроме того, даже если такую интерпретацию придумать, непонятно, как под нее математический аппарат, указанный вами, подогнать. Мы ведь должны, как это делается в серьезной статистике, доказать характер распределения некоторой случайной величины, непрерывной или дискретной, и после смотреть, к чему она там у нас в пределах сойдется, а не брать первую вспомнившуюся как общеупотребимую. А что если, умудрившись ввести на бинарных переменных некоторую статистику, она окажется распределена не по Стьюденту, а, допустим, по Пуассону? И чем хуже нормировка |a|<=1, |b|<=1?
К сожалению, это пока не удочка, это вы мне рукой показали на большущий лес, где можно сломать прут для удочки, а можно и шею smile.gif
Спасибо за ваши сомнения и вопросы - они позволяют улучшить теорию и высветить ее недостатки. К сожалению, моя квалификация и отсутствие свободного времени не позволяют ответить на все замечания или даже исправить неверные формулы. Давайте работать как олимпийские факелоносцы: я передаю вам горящий факел, а вы несете его дальше, чтобы в конце эстафеты зажечь большой костер (разумеется, не сломав при этом себе шею smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #19401 · Ответов: 37 · Просмотров: 6316

DoctorStat
Отправлено: 6.03.2016 - 10:04


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(statistonline @ 6.03.2016 - 09:29) *
2. Про бинарные регрессии, насколько мне известно, пока мало что написано и сказано. Тем более, подходить к этому вопросу с позиции методов для количественных переменных, как то: найдем среднее, дисперсию, и т.д. - крайне сомнительный путь.
Вы правы. Я выбрал параметрическую статистику Стьюдента только из-за соображений удобства - ее все проходили в институте и что-то о ней слышали. Более подходящей для примера была бы непараметрическая статистика, например, Манна-Уитни.
Цитата(statistonline @ 6.03.2016 - 09:29) *
3. Важность двух признаков, равная a/b - это пока только показатель, придуманный "из ноги", а не от головы. Не совсем ясно, что такое "относительная важность двух признаков".
Ну, смотрите. В комбинированный признак z входят два разных бинарных признака с коэффициентами a и b. Если a>>b (гораздо больше), то второй признак почти не влияет на z и его можно исключить. Важность признаков можно измерять разными способами, например, отношением a/b или еще как-то. Я указал простейший способ, но возможно он зависит от нормировки. Тогда для нашей нормировки можно было бы использовать еще отношение квадратов a^2/b^2
Цитата(statistonline @ 6.03.2016 - 09:29) *
4. Нормировка, введенная вами, она откуда? Я понимаю, что вы пытаетесь вписаться в квадрант [1;1]. Но хотелось бы вообще понять - что такое "доля важности признака", и почему ее надо оценивать некоей линейной функцией. С таким же успехом я могу строить "функцию" методами дискретной математики, используя ее язык "И/ИЛИ/НЕ". Во всяком случае, для бинарных переменных это кажется более уместным. Что-то типа: строим логическую функцию
БОЛЬНЫЕ=(КУРИТ)и(УПОТРЕБЛЯЕТ_НАРКОТИКИ)или(неКУРИТ)и(УПОТРЕБЛЯЕТ_НАРКОТИКИ)
Нормировка коэффициентов a^2+b^2=1 обусловлена бинарностью переменных (=0 или 1). Она нужна для учета вклада переменных, различающихся своим интервалом изменения. Например, если бы вторая переменная была давлением (меняющимся в пределах от 0 до 200), то условие нормировки выглядело бы так: a^2+(b/200)^2=1 или нужно было бы изменить комбинированный признак, нормировав давление на 1 : z=a*x+b*(y/200)
Имейте ввиду, что я дал только черновик, набросок, подкинул идею. Другими словами, снабдил вас инструментом для ловли рыбы, а уж ловить рыбку в пруду вы должны сами smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #19396 · Ответов: 37 · Просмотров: 6316

DoctorStat
Отправлено: 5.03.2016 - 22:28


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(Олег Кравец @ 5.03.2016 - 20:39) *
Но если вид функции известен, задача становится тривиальной.
Давайте рассмотрим учебный пример, чтобы стала понятна идея предложенного метода нахождения долей отдельных признаков в различии популяций. Пусть (для простоты) у нас есть только две группы пациентов: контроль и больные (случай), для которых мы регистрируем два (тоже для простоты) признака:
1. X - курит(1)/нет(0) - (качественный бинарный признак)
2. Y - употребляет наркотик(1)/нет(0) - (качественный бинарный признак)

Мы хотим найти комбинированный (составленный из отдельных признаков) показатель, по которому эти две популяции различаются и долю каждого признака в отличии между популяциями. Введем линейную функцию комбинированного признака:
z(x,y) = a*x + b*y, где a, b - неизвестные коэффициенты (доли отдельных признаков, которые мы будем искать), одинаковые для обеих групп. Для ограничения функции z введем нормировку: a^2+b^2=1
Для сравнения групп используем критерий Стьюдента, статистика которого равна:
t(a, b)=(<Z1> - <Z2>)/sqrt(s1^2+s2^2), где <Z1>, <Z2> - выборочные средние двух групп, s1^2, s2^2 - квадраты стандартных ошибок средних этих групп.
Выпишем для примера выборочное среднее для группы 1, которое равно:
<Z1>(a,b)= 1/n(Z1+...+Zn)
Пусть 1-ый пациент группы 1 курит и не употребляет наркотик. Тогда для него комбинированный признак равен Z1(a,b)=a*1+b*0=a
Аналогично вычисляются признаки для остальных пациентов. Подставляя в формулу для среднего, получаем, что среднее значение группы тоже зависит только от двух неизвестных параметров: a и b. Стандартная ошибка среднего s1(a, b) также зависит только от этих параметров. Следовательно, и сама статистика Стьюдента t(a, b) (см.формулу выше) тоже зависит неким сложным образом от a и b.
Теперь (ключевой момент!) нам нужно найти максимум функции Стьюдента. Для этого нужно продифференцировать функцию t(a, b) по каждому аргументу a и b и приравнять частные производные нулю. Я не буду здесь выписывать и, тем более, решать эти два уравнения (важна сама идея). В результате решения мы получим два коэффициента: a и b. Подставим их в формулу для статистики Стьюдента t(a, b) и подсчитаем ее. Если статистика окажется больше критической (для заданной численности групп), то ура ! - нам повезло - комбинированный признак работает - он статистически значим. Вдобавок, в качестве бонуса, мы получили относительную важность двух признаков, которая просто равна отношению коэффициентов a/b.
  Форум: Медицинская статистика · Просмотр сообщения: #19392 · Ответов: 37 · Просмотров: 6316

DoctorStat
Отправлено: 4.03.2016 - 11:44


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(statistonline @ 4.03.2016 - 10:53) *
Вы имеете в виду продифференциировать линейную функцию по переменным?!
Да, нужно продифференцировать функцию по каждой переменной ai и приравнять все частные производные нулю. После решения полученной системы уравнений (12 штук), найдем все коэффициенты ai.
  Форум: Медицинская статистика · Просмотр сообщения: #19388 · Ответов: 37 · Просмотров: 6316

DoctorStat
Отправлено: 4.03.2016 - 10:32


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(statistonline @ 4.03.2016 - 05:01) *
А что значит проварьировать функцию по коэффициентам? В математике понятие вариации функции строго определено, и вряд ли имеет отношение к статистике.
Это значит выписать статистику, по которой проводится анализ, в виде функции от неизвестных коэффициентов: f(a1,...,an) . Проварьировать функцию - это значит найти ее экстремум с помощью частных производных по коэффициентам ai: df/d_ai=0.
  Форум: Медицинская статистика · Просмотр сообщения: #19386 · Ответов: 37 · Просмотров: 6316

DoctorStat
Отправлено: 3.03.2016 - 21:53


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(statistonline @ 3.03.2016 - 07:59) *
Какими критериями можно сравнить группы по частотам, если каждый больной может иметь более одного признака (они частично пересекаются)? Например, больной может иметь 1-й, 7-й и 10-й признаки.
Я, конечно, не большой знаток многомерного анализа. С одной стороны, это плохо, так как я не в курсе общепринятых подходов, которых медики в силу своей консервативности (чуть не сказал косности) должны придерживаться. С другой стороны - хорошо, т.к. не мешает генерации новых идей. Вот одна из них: скомбинировать все признаки (12 штук) в виде линейной функции, например: f(a1,..,an) = a1*p1+...+an*pn, где a1,...,an - неизвестные коэффициенты, p1,...,pn - наличие(=1)/отсутствие(=0) признака. Тогда можно проварьировать функцию f() по коэффициентам ai, так , чтобы хи-квадрат (или какая-либо другая дифференцирующая статистика ) дала максимальное отличие между группами. Тем самым мы найдем всего один (вместо 12) комбинированный признак. Величина коэффициентов ai покажет важность отдельных признаков. Если для каких-то i-ых признаков коэффициенты ai окажутся малы по сравнению с другими, то эти признаки не влияют на результат и, поэтому , их можно исключить.
  Форум: Медицинская статистика · Просмотр сообщения: #19381 · Ответов: 37 · Просмотров: 6316

DoctorStat
Отправлено: 23.02.2016 - 16:22


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(MarSi @ 22.02.2016 - 21:40) *
Уважаемые форумчане, помогите, пожалуйста, найти "рабочий" калькулятор и "постройщик" графиков по методу Каплана-Мейера для анализа выживаемости больных неходжкинской лимфомой. А возможно и другие статистические показатели.
Здравствуйте, Marsi (судя по имени, вы родом с Марса smile.gif
Я получил от вас личное сообщение с просьбой помочь посчитать выживаемость больных с лимфомой. Не являясь специалистом в методе Каплан-Мейера, я тем не менее, догадался открыть книгу Стенцон Гланца "Мед-био статистика" , глава 11 "Анализ выживаемости". В этой главе подробно объясняется алгоритм расчета таблицы и кривой выживаемости. В вашем случае количество пациентов достаточно мало (всего 40), чтобы все расчеты проделать вручную, не пользуясь сомнительными калькуляторами, найденными "в сети". Если в процессе расчета вы встретитесь с непреодолимыми препятствиями, обращайтесь за помощью на форум.
  Форум: Медицинская статистика · Просмотр сообщения: #19359 · Ответов: 4 · Просмотров: 1889

DoctorStat
Отправлено: 21.02.2016 - 17:56


Дух форума
*

Группа: Пользователи
Сообщений: 351
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224


Цитата(nmrdoc @ 21.02.2016 - 14:04) *
А можно по-подробнее и с примерами. Двухклассовая классификация: очаг крупный/мелкий - более 1 см и менее 1 см? Раскидать на тестовой выборке очаги по размеру на 2 класса крупный/мелкий? Построить ROC-кривую для каждого метода визуализации и сравнить? А если один из методов вообще не видит очага, как это обозначать?
Я небольшой специалист в области ROC анализа - прочитал только Википедию. Для начала в качестве признака метастаза оставить один параметр из трех, который кажется вам определяющим, например, размер очага. Затем, дискретизовать этот параметр. Например, если характерный размер очага порядка 1 см, то шаг дискретизации выбрать поменьше - 1 мм. Теперь можно начать процедуру классификации согласно циклическому алгоритму:
1. Выбрать минимальный размер очага и посчитать для него:
  • true-positive, TP - пациент болен, диагноз положительный
  • false-positive, FP - пациент здоров, диагноз положительный
  • true-negative, TN - пациент здоров, диагноз отрицательный
  • false-negative, FN - пациент болен, диагноз отрицательный

2. Увеличить размер очага на шаг дискретизации и вернуться к п.1

Выполнять п.1-2 до достижения максимального очага. Если метод для конкретного больного вообще не видит очага, то отнести этого пациента к группе FN.
Полученные точки для каждого из двух методов нужно нанести на график (он называется ROC-кривая) и выложить на форуме, чтобы мы полюбовались результатом.
  Форум: Медицинская статистика · Просмотр сообщения: #19328 · Ответов: 8 · Просмотров: 1995

14 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена