Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >

Вале а
Отправлено: 9.11.2014 - 09:51





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


хотел спросить, как максимально точно перевести inverse of the prior probability, inverse prior weights
  Форум: Медицинская статистика · Просмотр сообщения: #17686 · Ответов: 1 · Просмотров: 2881

Вале а
Отправлено: 24.10.2014 - 17:48





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Вы смотрели научно-художественный боевик "R против Python: Битва титанов" smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #17643 · Ответов: 29 · Просмотров: 36965

Вале а
Отправлено: 11.10.2014 - 16:33





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(DoctorStat @ 27.03.2014 - 10:59) *
SAS - всеми признанный пакет для статистических расчетов, а R - пакет программ, написанный студентами в перерыве между лекциями.


ну Френка Харрела, написавшего пакеты по регрессиям для R, я б студентом не назвал, его Regression Modeling Strategies уже классика
  Форум: Медицинская статистика · Просмотр сообщения: #17574 · Ответов: 29 · Просмотров: 36965

Вале а
Отправлено: 31.03.2014 - 16:40





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Коллеги, в какой программной среде и каким образом лучше реализовать биннинг по CDF?
  Форум: Медицинская статистика · Просмотр сообщения: #16787 · Ответов: 1 · Просмотров: 3267

Вале а
Отправлено: 27.01.2014 - 19:16





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(p2004r @ 27.01.2014 - 17:42) *
да да конечно


Главное ведь, чтоб программа помогала. И как человек за слова, так же и программа должна ручаться за результаты. А то некоторые программы, как люди, пообещают, а обещаний своих не выполняют, сливаются, так сказать.
  Форум: Медицинская статистика · Просмотр сообщения: #16418 · Ответов: 12 · Просмотров: 19404

Вале а
Отправлено: 27.01.2014 - 10:59





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(p2004r @ 22.01.2014 - 17:17) *
содержательный совет smile.gif ИринаС посоветовала "поставить статистику" , теперь Груздев посоветовал "поставить статистику" smile.gif Оказывается что бы поставить статистику, надо поставить статистику.... Ждем продолжения smile.gif


ну этот Господин здесь писать не будет, я про Груздева. у него-то как раз курсы R, распиаривает по Москве. а мне больше СПСС и Статистика, в R "ни пса не видно"))
  Форум: Медицинская статистика · Просмотр сообщения: #16414 · Ответов: 12 · Просмотров: 19404

Вале а
Отправлено: 22.01.2014 - 09:48





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(TheThing @ 21.01.2014 - 20:28) *
Век здесь ни при чем, профи data science работают и будут работать с командной строкой R или командной строкой IPython, юзеры - жмут на кнопки в меню smile.gif


ну еще б. особенно когда у тебя миллионы наблюдений)
  Форум: Медицинская статистика · Просмотр сообщения: #16393 · Ответов: 12 · Просмотров: 19404

Вале а
Отправлено: 21.01.2014 - 18:39





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(Shahruza @ 18.01.2014 - 15:24) *
Уважаемые коллеги! Недавно установила на свой компьютер программу STATISTICA 6. Пока не усвоила методы пользования, импортировала данные из Excel. Трудновата было пользоваться, мучалась. А сейчас не открывается файл. Требует Time code. Что делать? Почему спрашивает код? Помогите, пожалуйста


покупайте лучше у Петрова R. В 21-й век с командной строкой!! ) А если серьезно, ставьте с рутрекера Статистику 10 и будет вам счастье. Дабы СПСС и Статистика не САС, с которой сутки так незаметно можно "провозится"
  Форум: Медицинская статистика · Просмотр сообщения: #16384 · Ответов: 12 · Просмотров: 19404

Вале а
Отправлено: 16.10.2013 - 16:05





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408



Возможно, кого-то заинтересуют курсы от росс. офиса SPSS (сейчас - Прогностические решения)
? Введение в IBM SPSS Statistics
? Статистический анализ данных в IBM SPSS Statistics
? Представление данных с помощью IBM SPSS Custom Tables
? Эффективные приемы работы в IBM SPSS Statistics
? Введение в командный язык IBM SPSS Statistics
? Сегментация рынка с помощью IBM SPSS Statistics
? Введение в IBM SPSS Decision Trees

Формат doc, pdf

Пишите в личку
  Форум: Медицинская статистика · Просмотр сообщения: #16010 · Ответов: 0 · Просмотров: 3154

Вале а
Отправлено: 27.05.2012 - 17:59





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(vipgroup @ 29.04.2012 - 20:28) *
Добрый день, уважаемые пользователи форума!
Подскажите, пожалуйста, для одного своего исследования мне необходимо сравнить выживаемость пациентов, принимающих два лекарства (Каплан-Майер?), и какие факторы влияют на выживаемость (регрессия Кокса?). Подскажите какой-либо самоучитель SPSS, где был бы объяснен анализ выживаемости в SPSS. В интернете самоучителей по SPSS много, но почему-то ни в одном из них анализ выживаемости не описан. В доступных мне книгах эту тему тоже обошли стороной. Может Вы знаете доступную в интернете статью, или книгу, где данный анализ был бы описан?
Конечно, есть описание данных методов на английском языке, но, к сожалению, на таком высоком уровне я английским не владею, чтобы до конца разобраться во всех тонкостях.
Заранее благодарен,
Андрей


куда вам эти материалы выслать? есть еще здесь немного http://gewissta.livejournal.com/
также есть переведенный туториал spss по регрессии Кокса
  Форум: Медицинская статистика · Просмотр сообщения: #13696 · Ответов: 27 · Просмотров: 49136

Вале а
Отправлено: 16.03.2012 - 20:04





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(TheThing @ 16.03.2012 - 18:29) *
Я трактую следующим образом:

р > 0.05 (как в Вашем случае) - при данных условиях эксперимента не удалось обнаружить достаточно доказательств, чтобы отклонить нулевую гипотезу H0. (это не означает, что мы принимает нулевую гипотезу или говорим, что она истинна) - fail to reject null hypothesis

p < 0.05 - в эксперименте удалось собрать достаточно доказательств, чтобы отклонить нулевую гипотезу - reject null hypothesis.

Приведу цитату R. Fisher'a, который, как считают, и придумал p value, хотя скорее всего, придумал его Карл Пирсон для своего хи-квадрата, а Фишер - популяризировал smile.gif

"In relation to any experiment we may speak of..the "null hypothesis" and it should be noted that the null hypothesis should never be proved or established but is possibly disproved in the course of experimentation. Every experiment may be said to exist only in order to give the facts a chance of disproving the null hypothesis".

Кстати, заметил еще одну неточность в книге - авторы считают, что p value - это вероятность ошибки I рода. На самом деле это не так.

нулевая гипотеза никогда не может быть принята или подтверждена, но лишь, возможно, может быть опровергнута. А можно ссылку на источник для статьи?
  Форум: Медицинская статистика · Просмотр сообщения: #13213 · Ответов: 8 · Просмотров: 18012

Вале а
Отправлено: 16.03.2012 - 17:20





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(TheThing @ 15.03.2012 - 19:38) *
Да и сложно найти у нас кандидатскую/докторскую, в которой бы применялись хотя бы 3 разных алгоритма включения предикторов, в основном используется метод Enter / Block. К тому же в литературе существуют противоречивые данные относительно того, стоит ли применять forward / backward selection алгоритм, некоторые - за, другие - критикуют. Мне бы хотелось найти в иНете авторитетную статью (не заказную), которая бы провела сравнительный анализ пакетов SPSS и SAS, и, как вывод, заявила, что SPSS - игрушка для детей, а SAS - для профи. Увы, пока не нашел. В компании "Боинг" стоит R, мне кажется, что там хватает профессионалов smile.gif

Вы бы могли еще объяснить, что имеете ввиду под недорогими предикторами?

Спасибо!

По алгоритмам построения моделей неплохая статья http://www.basegroup.ru/library/analysis/r...ture_selection/. я сравнивал. метод логистической регрессии в SPSS и SAS. В журнале "Риск-менеджмент в кредитной организации", начиная с 1го номера, начался цикл статей на эту тему (большой материал, пришлось разбить на части). Разные программы - разные философии. Обусловлено тем, что люди, работающие с SAS, изначально ценят в ней возможность программирования, что значительно расширяет арсенал методов. SPSS часто воспринимается как "программа с кнопочным интерфейсом", нажал-и-вывел на экран, SPSS Syntax, написанием скриптов мало кто пользуется. На курсах это обычно всплывает. Но, конечно, ворочать базы по 300000 наблюдений и в 200 переменных в SPSS не будешь. Что касается Боинга, очень достойный выбор.
  Форум: Медицинская статистика · Просмотр сообщения: #13208 · Ответов: 16 · Просмотров: 25515

Вале а
Отправлено: 16.03.2012 - 16:47





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(TheThing @ 15.03.2012 - 19:02) *
Также на протяжении всей книги мне резало глаз, что авторы постоянно употребляют выражение "если значение p > 0.05, значит мы принимаем нулевую гипотезу". Нулевая гипотеза не принимается, а говорится, что у нас недостаточно доказательств, чтобы ее отвергнуть/отклонить. Это принципиально разные вещи ибо "Absence of evidence is not evidence of absence" и о неправильной трактовке статистически незначимых результатов можно прочитать например здесь: http://www.bmj.com/content/311/7003/485.full Хорошая цитата Tukey (1991): "Its foolish to ask - are the effects A and B different? They are always different - for some decimal place". Еще один мэтр статистики Cohen пишет: "It can only be true in the bowels of a computer processor running a Monte Carlo study (and even then a stray electron may make it (null hypothesis) false). If it is false, even to a tiny degree, it must be the case that a large enough sample will produce a significant result and lead to its rejection. So if the null hypothesys is always false, what the big deal about rejecting it?". Этот вопрос поднимает проблему NHST (Null Hypothesys Significance Testing) в целом.


Хорошо. А как быть с такой ситуаций. Калибровочный тест Хосмера-Лемешева проверяет нулевую гипотезу о том, что нет различий между наблюдаемыми и ожидаемыми вероятностями интересующего события (например, дефолта). Значение статистики Хосмера?Лемешева не должно быть меньше уровня значимости 0.05. В моем примере оно составляет 0.855. Значит я не могу написать "нулевая гипотеза принимается, можно говорить о высоком качестве модели", нужно писать "нет серьезных оснований отвергнуть нулевую гипотезу"?
может, внести уточнение?
  Форум: Медицинская статистика · Просмотр сообщения: #13207 · Ответов: 8 · Просмотров: 18012

Вале а
Отправлено: 6.03.2012 - 11:57





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(nokh @ 3.03.2012 - 07:53) *
Что значит "надо"? И кому надо: вам, научному руководителю? Взвешивание и преобразование данных перед анализом это - одно. А здесь это будет не "перевзвешивание", а подгонка данных под какие-то свои, возможно ошибочные мысли, т.е. фасльсификация. Работайте с тем, что есть. Даже самые совершенные процессы в природе не лишены ошибок. А возможно, что и эта ступенька на графике имеет своё объяснение. Если желание "перевзвесить" не уйдёт, задумайтесь: возможно наука - не ваш путь. А если того требует научный руководитель - нужно искать другого. Я знаю людей, которые сменили руководителя, когда им предложили пририсовать цифры для "полного ажура": с такими "учителями" от "науки" не следует вести диалогов, нужно прекращать общение и уходить.


речь именно о подгонке. это не наука, не исследование, сугубо прикладная задача
  Форум: Медицинская статистика · Просмотр сообщения: #13115 · Ответов: 4 · Просмотров: 8036

Вале а
Отправлено: 6.03.2012 - 11:34





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(p2004r @ 6.03.2012 - 12:06) *
ааа, кажется понял smile.gif

Поскольку есть подогнанная логистическая регрессия, по синтетическому входу (где предусмотрены все сочетания (или все встречающиеся на практике сочетания)) получаете с ее помощью выход. Потом все параметры входные преобразуете в "фиктивные" переменные (когда каждому уровню входа переменной логистической регрессии соответствует отдельная переменная входа линейной). И обучаем линейную регрессию. Ну и не забудем отмасштабировать в любимый масштаб начальства smile.gif

PS 600 тысяч блин frown.gif Хотеть! smile.gif


ясно. наверно это и подразумевают разработчики программы под "линеаризацией логрегресионных коэффициентов в баллы"
  Форум: Медицинская статистика · Просмотр сообщения: #13114 · Ответов: 13 · Просмотров: 16904

Вале а
Отправлено: 6.03.2012 - 00:47





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(Larina Tatjana @ 5.03.2012 - 06:24) *
Работала и не только с пакетом STATA, но и с десятком других пакетов. Кстати, по одним и тем же данным разные пакеты дают результаты не только разной структуры и информативности, но и отличающиеся, хотя и немного, по самим значениям коэффициентов. Относительно перевода коэффициентов в баллы. Ваш вопрос говорит о лишь о неполном понимании сути теории логистической регрессии. Я тоже вначале многое не понимала в этом методе. Пока не прошла обучение и мне не выполнили заказ по анализу моих данных. И вот только после этого разбираясь с помощью профессионального биостатистика с полученными уравнениями (а их было более сотни), я стала понимать, что нет такой проблемы, о которой Вы пишете. Начну с того, что Вы не конкретизируете о каких именно КОЭФФИЦИЕНТАХ идёт речь. Ведь после проведения этого анализа получаются коэффициенты разного вида. Далее, если даже не учитывать вид этих коэффициентов, то и в этом случае надо понимать, что коэффициенты есть величины количественные, непрерывные. Т.е. это ЧИСЛОВАЯ шкала. Вы же пишете о том, как превратить ЧИСЛОВУЮ шкалу в БАЛЛЬНУЮ. Это преобразование всегда сопряжено с потерей информации. Кроме того, вариантов превращения, трансформации можно предложить десятки, если не сотни. И все они будут бессмысленны, поскольку в реальности мы работаем не с одним уравнением, а с несколькими. И тогда получается что для каждого уравнения нужно искать свой алгоритм трансформации.

Уважаемый (ая) 'Вале а' ! Задавая свой вопрос, Вы не озадачились аргументацией необходимости, полезности и практической ценности такого преобразования. Поэтому позвольте задать Вам встречный вопрос: ЗАЧЕМ, ДЛЯ ЧЕГО НЕОБХОДИМО ТАКОЕ ПРЕОБРАЗОВАНИЕ? ЧЕМ ВАС НЕ УСТРАИВАЕТ ПОЛУЧАЕМОЕ УРАВНЕНИЕ С КОЭФФИЦИЕНТАМИ? ЧТО, ЕГО ОЧЕНЬ, НУ ОЧЕНЬ ТРУДНО, ИСПОЛЬЗОВАТЬ?


да обычные бета-коэффициенты. не устраивают тем, что нужна скоринговая карта, где общая вероятность дефолта по каждому заемщику выражена в баллах (суммируются баллы характеристик).
http://www.basegroup.ru/deductor/screensho...recard/#picture начальство говорит, хотим, как на картинке, как вот в этой программе, приобретение которой вместе с обучением составляет 600 тыс. руб, а SPSS и Stata можно на Горбушке купить.
Кстати, Леонов перевод коэфф-тов в баллы не рекомендует, да я и сам этого же мнения, лишь потеря информации, только наше начальство приводит убийственный аргумент "так зато понятнее".
  Форум: Медицинская статистика · Просмотр сообщения: #13111 · Ответов: 13 · Просмотров: 16904

Вале а
Отправлено: 6.03.2012 - 00:28





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(Olga_ @ 6.03.2012 - 00:09) *
Поделитесь, пожалуйста, информацией, а где же можно сделать детальный анализ?

И поясните также, пожалуйста, почему нельзя сделать "детальный анализ", например, в СТАТА.


Наверное, из общения с Леоновым. Тоже консультировался у него, когда писал статью в журнал (Анализ данных в SPSS с помощью метода бинарной логистической регрессии). Только тема у меня -скоринг (оценка кредитных рисков). Замечательный ученый. Строгий, требовательный, опытный практик. по поводу Stata и SPSS "Используемые Вами пакеты не рекомендую применять для задач скоринга, они достаточно примитивны. Кроме того, для получения практически ценных уравнений необходимо вначале получить порядка 30-50 уравнений с разными наборами предикторов, полученные к тому же разными алгоритмами, и лишь потом, используя их на практике, выбрать наиболее ценные. Однако и это не всё. Социальная динамика такова, что обновление полученных уравнений необходимо проводить примерно раз в полгода... Более 30 лет работаю с пакетом SAS, в котором есть возможность написания продвинутых макро-программ и т.д. "
  Форум: Медицинская статистика · Просмотр сообщения: #13110 · Ответов: 13 · Просмотров: 16904

Вале а
Отправлено: 3.03.2012 - 17:23





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(Larina Tatjana @ 3.03.2012 - 15:54) *
Привет! У меня тоже была масса вопросов по логистической регрессии, пока не прочитала статью "Логистическая регрессия в медицине и биологии"
(http://www.biometrica.tomsk.ru/logit_1.htm). Потом вышла на автора, с его помощью получила уникальные результаты по своим данным. Но самое главное, я поняла, что для осмысления самого уравнения регрессии нужны и результаты по многим другим методам. Только тогда начинаешь понимать и структуру уравнения, и то, как его можно использовать на практике. И ещё. Я поняла, что реально детальный анализ по этому методу ни в SPSS (у меня 20-я версия), ни в STATISTICA (у меня 10 версия) не сделать.

Татьяна.


а в Stata не пробовала работать? особо проблем с пониманием метода нет, интересно, как лучше откалибровать модель, как коэффициенты регрессии перевести в баллы, в обычную балльную шкалу от 0 до 100.
  Форум: Медицинская статистика · Просмотр сообщения: #13094 · Ответов: 13 · Просмотров: 16904

Вале а
Отправлено: 1.03.2012 - 21:52





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Есть данные по уровню заболеваемости, используется рейтинговая шкала из 10 классов.
1 4,7%
2 9,0%
3 27,7%
4 42,4%
5 39,7%
6 51,2%
7 73,3%
8 81,5%
9 90,0%
10 93.8%
Надо, чтобы уровень заболеваемости плавно нарастал от 1 класса к 10му. Есть проблема: уровень заболеваемости в классе 5 меньше (39,7%), чем в классе 4 (42,4%). Как можно перевзвесить данные так, чтобы исправить это.
  Форум: Медицинская статистика · Просмотр сообщения: #13059 · Ответов: 4 · Просмотров: 8036

Вале а
Отправлено: 9.02.2012 - 14:20





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


всем привет! где можно на русском можно почитать о процедуре и методиках калибровки логистической модели?
  Форум: Медицинская статистика · Просмотр сообщения: #12916 · Ответов: 13 · Просмотров: 16904

Вале а
Отправлено: 8.02.2012 - 17:37





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(p2004r @ 8.02.2012 - 13:15) *
Тогда: средний квадрат разницы величины и её оценки.


да скорее всего так. спасибо.
  Форум: Медицинская статистика · Просмотр сообщения: #12911 · Ответов: 5 · Просмотров: 8605

Вале а
Отправлено: 7.02.2012 - 22:52





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


спасибо. собственно вот:
The Brier score measures the total difference between the event (winning) and the forecast
probability of that event as an average squared difference. As a benchmark, a perfect forecaster would
have a Brier score of 0, a perfect misforecaster (predicts probability of win is 1 when loses and 0
when wins) would have a Brier score of 1, and a fence-sitter (forecasts every game as 50/50) would
have a Brier score of 0.25. Our pundit is doing reasonably well.
  Форум: Медицинская статистика · Просмотр сообщения: #12906 · Ответов: 5 · Просмотров: 8605

Вале а
Отправлено: 7.02.2012 - 17:52





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


average squared difference как лучше перевести этот показатель? разность средней квадратов - это корректно?
  Форум: Медицинская статистика · Просмотр сообщения: #12897 · Ответов: 5 · Просмотров: 8605

Вале а
Отправлено: 7.02.2012 - 14:09





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


замерла веточка
  Форум: Медицинская статистика · Просмотр сообщения: #12895 · Ответов: 62 · Просмотров: 116651

Вале а
Отправлено: 16.01.2012 - 18:34





Группа: Пользователи
Сообщений: 33
Регистрация: 9.01.2012
Пользователь №: 23408


Цитата(Stefa @ 16.01.2012 - 06:22) *
Здравствуйте, Игорь, не уходите, пожалуйста, с форума, Ваши ответы на поставленные вопросы очень профессиональные и при этом понятные, будет очень жалко, если Вы перестанет помогать. Просто не обращайте внимания на всё это


я присоединяюсь к просьбе
  Форум: Медицинская статистика · Просмотр сообщения: #12811 · Ответов: 62 · Просмотров: 116651

2 страниц V   1 2 >

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена