Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

24 страниц V   1 2 3 > » 

100$
Отправлено: 18.04.2018 - 16:45


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(scholar @ 17.04.2018 - 14:32) *
Я решил свой выпрос удалением выбросов:) Тема закрыта
код для удаление выбросов простой
remove_outliers <- function(x, na.rm = TRUE, ...) {
qnt <- quantile(x, probs=c(.25, .75), na.rm = na.rm, ...)
H <- 1.5 * IQR(x, na.rm = na.rm)
y <- x
y[x < (qnt[1] - H)] <- NA
y[x > (qnt[2] + H)] <- NA
y
}


Ваши публичные восторги по поводу собственной сообразительности нахожу слегка преждевременными. Когда вы удалили из временного ряда какие-то там выбросы, возникла проблема пропущенных значений. Не мешало бы их восстановить хотя бы фильтром Калмана.
  Форум: Медицинская статистика · Просмотр сообщения: #22916 · Ответов: 2 · Просмотров: 167

100$
Отправлено: 16.04.2018 - 14:14


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Cules2013 @ 16.04.2018 - 12:45) *
100$, вроде бы и за ответ спасибо, хоть какой-то, но вот таких вот умников терпеть не могу. Знаю я вас - в одном король, в другом... На каждого умника есть свой болт с левой резьбой, не забывайте. Будьте поскромнее. А то видите ли, соизволили с барской плеча черкануть пару строк, дабы я прикоснулся к вашему гению. Куда уж тут великим обращать внимание на какого-то рядового пользователя с его вопросами. А нафига тогда форум создали? Чтобы друг перед другом выделываться? Или может на вопросы отвечать. Я бы понял, если бы спросил какую-то фигню, что можно легко по первой же ссылке в интернете найти, или в любом учебнике прочитать.


Вы не очень-то наблюдательны. Я отвечал вовсе не вам. Я всего лишь пытался (из лучших побуждений) докричаться до потенциальных ответчиков, которые читать-читают, а отвечать не спешат. Так что просьба своим болтом размахивать где-нить в другом месте.
  Форум: Медицинская статистика · Просмотр сообщения: #22911 · Ответов: 5 · Просмотров: 663

100$
Отправлено: 16.04.2018 - 01:23


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Cules2013 @ 15.04.2018 - 23:01) *
Почти две с половиной сотни просмотров и ни одного коммента? Это всем влом писать smile.gif или реально никто не знает ответа?


Действительно, господа созерцатели, безымянные читатели и анонимные знатоки, нарушьте уже обет молчания и ответьте, наконец, человеку. Сообщите ему, так, между прочим, что для решения задач типа 1 vs. 3 есть так называемые канонические корреляции (Canonical correlation analysis - CCA). Пущай усредняет показатели за 21 день и вперед, заре навстречу... Не с марковскими цепями же ему возиться, в самом-то деле, в поисках заветного распределения с древовидной структурой зависимостей...
  Форум: Медицинская статистика · Просмотр сообщения: #22908 · Ответов: 5 · Просмотров: 663

100$
Отправлено: 7.04.2018 - 22:56


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(DrgLena @ 7.04.2018 - 22:33) *
smile.gif


Да, спасибо, хотя Nokh уже угостил ссылкой в #15. Правда, жизнь и впрямь слишком коротка, чтобы осиливать подобные талмуды.
По существу вопроса попутно могу сообщить, что в случае биномиального распределения при p1=p2=p Boschloo сконструирован так, что точной верхней гранью рассматриваемого критериального множества как раз и является результат точного метода Фишера (ТМФ).
  Форум: Медицинская статистика · Просмотр сообщения: #22895 · Ответов: 17 · Просмотров: 1606

100$
Отправлено: 7.04.2018 - 18:41


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 7.04.2018 - 18:12) *
Автор пакета "Exact" и здесь то же повторяет: https://stats.stackexchange.com/questions/1...hloo-or-barnard
Так что это, в отличие от x13, не ошибка какая-то, но я пока не понимаю что это значит unknw.gif
Поразбираться можно, но очень всё это ресурсозатратно. Видно проще хроники написать, чем нормальный учебник: https://errorstatistics.files.wordpress.com...ston-mielke.pdf


Я ворчал только по поводу формулы.
Вот оригинальная статья Boschloo (1970), но требуется регистрация:
https://onlinelibrary.wiley.com/doi/pdf/10.....1970.tb00104.x

Что касается "Хроник...", то - да, книженция любопытная, мне она попадалась в Google.books с очень малым числом страниц для просмотра.
  Форум: Медицинская статистика · Просмотр сообщения: #22893 · Ответов: 17 · Просмотров: 1606

100$
Отправлено: 7.04.2018 - 17:07


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
т.к. итак узнал сегодня много нового:)).


Вашими стараниями я - тоже, особенно вот это (из Exact.pdf):

Boschloo:
Uses the p-value from Fisher?s exact test as the test statistic.

Кстати, в Exact.pdf не обошлось без ошибки в самой первой же формуле: в таблице 2х2 не может появиться элемент X13

Вот так, бывало, некритично отнесешься к прочитанному и все - пиши -"пропало"...
  Форум: Медицинская статистика · Просмотр сообщения: #22890 · Ответов: 17 · Просмотров: 1606

100$
Отправлено: 6.04.2018 - 20:08


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


А теперь дадим слово разработчикам SPSS:

Monte Carlo Estimation

To compute a Monte Carlo estimate of an exact p-value, PROC FREQ generates a
random sample of tables with the same total sample size, row totals, and column to-
tals as the observed table. PROC FREQ uses the algorithm of Agresti, Wackerly, and
Boyett (1979), which generates tables in proportion to their hypergeometric proba-
bilities conditional on the marginal frequencies.
  Форум: Медицинская статистика · Просмотр сообщения: #22880 · Ответов: 17 · Просмотров: 1606

100$
Отправлено: 6.04.2018 - 16:58


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 6.04.2018 - 16:07) *
Критерий Фишера разработан на основе гипергеометрического распределения, тогда как в реальной жизни мы не имеем фиксированных краевых частот таблицы сопряжённости по всем входам. Т.е. критерий предполагает гипергеометрическое распределение, а мы используем его на практике для анализа би- или полиномиального распределения. С теоретической точки зрения это нехорошо, хотя на практике выводы получаются сходными. Поэтому лучше пытаться реализовать точный рандомизационный критерий или Монте-Карло.


Чистая правда, но я уместил это в два слова: "Фишеровская парадигма". Где и как в популярных пакетах реализован подход Барнарда (на основе би- и поли-) мне не ведомо.
  Форум: Медицинская статистика · Просмотр сообщения: #22878 · Ответов: 17 · Просмотров: 1606

100$
Отправлено: 6.04.2018 - 15:57


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nikita_zab @ 5.04.2018 - 09:43) *
Подскажите, пожалуйста, пакет (coin?) и функцию для методов "в" и "г".


Судя по всему, да - coin. Что-то, наверное, можно выжать и из perm. Однако, "рабочая лошадка" exact-методов в рамках Фишеровской парадигмы - fisher.test(), применимый не только к таблицам 2х2, но и RxC (в каковом случае он называется критерием Фишера - Фримана - Холтона).
  Форум: Медицинская статистика · Просмотр сообщения: #22876 · Ответов: 17 · Просмотров: 1606

100$
Отправлено: 6.04.2018 - 14:50


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Cules2013 @ 6.04.2018 - 00:18) *
В процессе работы возник вот такой вот вопрос - чем отличаются доверительные интервалы, рассчитанные для исходных данных по каждой из выборок, и доверительные интервалы, что рассчитывают пост-хок тесты для множественных попарных сравнений? Помимо очевидных различий, разумеется.


А позволяйте узнать (для создания комфортной атмосферы взаимопонимания), какие именно различия в этой истории для вас являются очевидными, а какие - не очень? А то вы так бойко начали...
  Форум: Медицинская статистика · Просмотр сообщения: #22872 · Ответов: 12 · Просмотров: 880

100$
Отправлено: 4.04.2018 - 12:50


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Ну так это не я же придумал все эти ограничения. К слову именно та инфа, что я указал здесь - это из методички по статистике моего вуза, составленной по книгам Рокицкого, Лакина, Плохинского и т.д. Вполне допускаю, что эта инфа уже устарела, но взята отнюдь не с потолка.


А я выше как раз и высказал уверенность, что это не ваши личные прозрения. Тогда мысленно переадресуйте сказанное этим безымянным составителям методичек и начните с чистого листа. Поскольку методическую работу с вузовских преподов требуют (а не так, что хочешь - пиши методички, а не хочешь - то и не надо), и любой препод воспринимает это как повинность, можно представить себе средний уровень этой писанины. Весь наш пятый курс (технического вуза, между прочим) на лабораторных по метрологии и стандартизации чего-то там пялясь в подобные методички так и не обрел понятия, что такое степени свободы, и как выбрать приличествующую случаю квантиль распределения Стьюдента.

Цитата
...или как один человек приводил интересный пример с критерием Смирнова-Колмогорова, что использовался для проверки на нормальность малых выборок данных (меньше 10 случаев) - программа вам может посчитать, что угодно, но в итоге получается, что ему банально не хватает мощности, чтобы отклонить нулевую гипотезу, и на малых выборках он всегда пишет, что распределение нормально, хотя это совсем не так. Вот таких вот проколов хотелось бы избегать. Статистика - это не философия и не литературоведение, здесь должно быть всё чётко и понятно, а не "трактуй, как хочешь". Вот люди и трактуют как хотят - у них критерий Стьюдента подходит на все случаи жизни и т.п.


Ах, зачем вам этих глупостев? Ну не отверглась у какого-то простака нулёвка на выборке объемом 10, ну так что же? Это факт его биографии, да и только. А фактом вашей биографии должно быть понимание того, что мощность критерия - это функция от альтернативной гипотезы. Если вы проверяете критерием Колмогорова гипотезу о принадлежности эмпирического распределения нормальному (н-р, в форме простой гипотезы), то ближайшей альтернативой будет логистическое распределение. Известно, что супремум модуля разности для этих ф-ций распределения есть величина порядка .01. Если совсем уж в первом приближении считать, что ошибка измерения этой разности пропорциональна корню из N, то сразу видно, что для надежного распознавания этих альтернатив грубая оценка требуемого объема выборки ~ 10 000. Вот вам и готовый рецепт избегания проколов.
  Форум: Медицинская статистика · Просмотр сообщения: #22863 · Ответов: 10 · Просмотров: 966

100$
Отправлено: 3.04.2018 - 16:02


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата
Уже давно мучает меня вопрос о том, где бы найти достоверную инфу ... о том, какие требования и допущения к каждому конкретному стат. методу/критерию.


1. В оригинальных статьях автора/-ов критерия (это - печка, от которой надо плясать).
2. В статьях тех, кто либо развивал подобные идеи, либо прямо изучал данный критерий (скажем, Леман предложил, Розенблатт изучил, а мы на выходе имеем критерий Лемана - Розенблатта).
3. Трудах обзорного, обобщающего, справочного характера, учебники не забудьте (Гаек - Шидак, Хеттманспергер, Холлендер - Вульф, Большев - Смирнов, Орлов... их тьмы и тьмы).

Заниматься составлением шпаргалок в рецептурном духе категорически не советую, поскольку известно, что если в бочку меда добавить ложку известного субстрата, то на выходе гарантированно получится... целая бочка этого субстрата уникальный по глупости сборник мифов и городских легенд относительно разных критериев.

Так, например, в бочку меда под названием Page test вы ухитрились (понятно, что с чьей-то подачи) добавить ложку чего-то несъедобного

Цитата
Тот же критерий Пейджа работает на связанных выборках, если их количество не менее 3, но не более 6.


Между тем по свидетельству Холлендера и Вульфа критерий преспокойно работает на 2-х выборках (см. Х и В стр. 166, п. 7.12). А верхнее ограничение на число столбцов в дисперсионном комплексе никому и с бодуна не примнится. Должно быть поэтому Пейдж в своей работе приводит таблицу критических значений для аж - horribile dictu!- 10 столбцов. Видимо, эти ребята не знали чего-то такого сокровенного, что знаете вы.

Остальные ваши тайные знания - такого же качества.

Кроме того, надо понимать, что все эти оценки нижнего предела на численность выборки - родом из докомпьютерной эры, когда все прекрасно понимали, что тот или иной непараметрический критерий в силу дискретности своего распределения при H0 не выдерживает номинальный уровень значимости, и пытались понять, с какого объема выборок дискретностью можно пренебречь и использовать аппроксимации непрерывными распределениями, но возиться с вычислениями было невмочь. Сейчас же для малых объемов вычислить точную (exact) двустороннюю вероятность - не вопрос, монтекарлить до упаду- нет проблем...
  Форум: Медицинская статистика · Просмотр сообщения: #22858 · Ответов: 10 · Просмотров: 966

100$
Отправлено: 28.03.2018 - 19:07


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(medmonitor @ 28.03.2018 - 17:33) *
Я не хотел, чтобы мой вопрос вызвал настолько живую дискуссию, связанную с рекламой услуг статистического анализа.
Я еще сам погуглил по совету passant.
Смотрите, вот пользователь nokh сказал о критерии Хартли, т.е. убрать выбросы. Я тоже об этом думал.
А почему не тест Граббса? он и в R есть.


Ну, а все-таки, товарищ аспирант, что в сухом остатке-то? Что вы нагуглили? При чем здесь кросс-табы с ихней "этой"? Что вы разумеете под "однородностью одной выборки", хоть бы даже и в какой-то там "группе 1"? И чего хотите от присутствующих?
  Форум: Медицинская статистика · Просмотр сообщения: #22813 · Ответов: 13 · Просмотров: 1292

100$
Отправлено: 27.03.2018 - 10:45


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


/С энтузиазмом/
П-р-р-авильно! Позор пьянице и дебоширу любителю привата Лёве_биостату!
  Форум: Медицинская статистика · Просмотр сообщения: #22809 · Ответов: 13 · Просмотров: 1292

100$
Отправлено: 21.03.2018 - 17:46


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(tvsova80 @ 21.03.2018 - 17:11) *
Спасибо. Да, знаю такую функцию, получается при подстановке нестандартизированных коэффициентов тех показателей, которые получились плюс константа при использовании стат.пакета. Правильно понимаю? Здесь я не могу понять до конца, от какого значения отталкиваться при подстановке в уравнение реальных значений какого-либо обследованного, чтобы понять, к какой группе его отнести (эффективных, менее эффективных, средних), так как выводящаяся таблица с центроидами групп - это не те значения на которые стоит ориентироваться. Правильно? Так как центроиды - это средние. Поэтому - какое значение является "начальным" для отнесения к группы эффективных, какое - для группы менее эффективных, а какое для средних. Правильно понимаю, что при определении мы используем полученные значения для 2-х функций (так как группы 3)? Здесь я тоже что-то запуталась.....

Можно где-либо посмотреть или почитать как это происходит по шагам, например, шаг 1 - взяли это, получили это, шаг 2- .... и т.д.?


Прочитайте текст по ссылке. Там содержатся ответы на все вопросы. Из него вы узнаете, что для (трех/много)классовой классификации нет никаких "пороговых значений", а есть
1. простые классифицирующие функции (21)
2. расстояния Махаланобиса (26-28)
3. вероятности (апостериорные) отнесения объекта к тому или иному классу.

Как это работает? А очень просто. Для простых классифицирующих функций вы трижды подставляете в (21) значения х- входное признаковое описание классифицируемого объекта; pooled-матрица внутриклассовой ковариации (сигма) всегда одна и та же для всех классов, каждый центроид - уникален (свой) для каждого из классов. Т.о. получили три различных значения. Если наибольшее значение получено для 1-й к.ф. (т.е. с использованием центроида 1-го класса), то относим объект к 1-му классу, если для 2-го, то относим ко второму, если для третьего-то...

То же и для расстояния Махаланобиса: признаковое описание объекта -уникальное, центроиды классов - уникальные, матрица -одна на всех. Опять получили три разных значения. Объект относится к тому классу, для которого расстояние Махаланобиса - наименьшее. Оно же соответствует наибольшей апостериорной плотности.
  Форум: Медицинская статистика · Просмотр сообщения: #22795 · Ответов: 7 · Просмотров: 1026

100$
Отправлено: 21.03.2018 - 12:51


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(tvsova80 @ 20.03.2018 - 12:12) *
Спасибо.
Могли бы Вы мне еще подсказать информацию по дискриминантному анализу: есть 3 группы - эффективные, менее эффективные, средние. Также обработали их дискриминантным анализом, получили 2 функции и для каждой функции свои нестандартизированные коэффициенты и константу, а также свои центроиды. Следовательно, формула сложить полученные центроиды и разделить на 2 (количество групп) здесь "не работает", так как группы не равные. Каким образом здесь возможно определить порог принадлежности к группе? И не совсем понимаю, какую функцию из двух брать? Ту, у которой выше значение Лямбды Уилкса и выше значимость? (если исходить из величины собственного значения функции: чем больше значение, тем лучше различение). Подзапуталась....


>tvsova80, ознакомьтесь с вот этим. Реальная классификация (в т.ч. и в стат. пакетах) идет по классифицирующим функциям (21) в тексте по ссылке.
  Форум: Медицинская статистика · Просмотр сообщения: #22791 · Ответов: 7 · Просмотров: 1026

100$
Отправлено: 18.03.2018 - 17:35


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694



Нужно смотреть, описаны ли соответствующие методы обработки рез-тов.
Н-р, сравнить три столбца возрастов автор мог дисперсионным анализом.
Остальные р-значения, если не слишком придираться, возможно получены при анализе таблиц сопряженности с поправкой Йейтса.

Но лично меня всего более напрягла небрежность оформления рез-тов: вместо n2=38 должно быть 37, вместо n3=33 должно быть 34, 10 чел от 120 даст 8,3% а не 12%.
  Форум: Медицинская статистика · Просмотр сообщения: #22775 · Ответов: 6 · Просмотров: 823

100$
Отправлено: 17.03.2018 - 13:22


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(nokh @ 17.03.2018 - 05:27) *
... На него можно посмотреть...


А заодно и на Пранаба Кумара Сена, соавтора критериев Пури - Сена, Пури - Сена - Тамуры.
  Форум: Медицинская статистика · Просмотр сообщения: #22773 · Ответов: 2 · Просмотров: 453

100$
Отправлено: 17.03.2018 - 01:48


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Собственно сабж:

"Dana Quade is Professor of biostatistics in the School of Public Health of the University of North Carolina, Chapel Hill. He received his Ph.D. in Statistics from the University of North Carolina in 1960."

Отсюда и отсюда (стр. XXIII)

Откуда следует, что согласно нормам русского языка Quade test = "Тест Даны Квейда"
  Форум: Медицинская статистика · Просмотр сообщения: #22768 · Ответов: 2 · Просмотров: 453

100$
Отправлено: 8.03.2018 - 17:11


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(metalmary @ 8.03.2018 - 13:29) *
Спасибо! Еще есть одна фишка - в каждой группе число число животных разное, например, при температуре Х в группе 1 - 10 животных, в группе 3 - 6 животных, и у каждого животного брли кровь только 1 раз. Я так понимаю, повторные измерения отпадают. Еще необходимо показать с каким уровнем значимости отличается одное значение при конкретной температуре от контрольного. Нужно ли в этом случае делать пересчет уровня значимости?


1. Если объемы групп разные, возникает т.н. несбалансированный дизайн. Для того, чтобы не погружаться в тонкости его анализа, есть смысл сделать наивный препроцессинг исходных данных: скажем, по 6 наблюдениям вычислить среднее и добавить 4 средних значения в эту ячейку, чтобы в результате все чейки содержали одинаковое кол-во наблюдений (н-р,10).
2. То, что в Экселе называется "с повторными измерениями"- это всего лишь особенности локализации программы (издержки перевода на русский язык). На самом деле там реализовано именно то, что вам нужно (двухфакторный ДА с несколькими наблюдениями на ячейку дисперсионного комплекса).
3. Post hoc сравнения будут уместны в том случае, если взаимодействие факторов "Температура*Группа" окажется статистически значимым. Если предполагается попарное сравнение с контролем всего и вся, то да, корректировать достигаемые уровни значимости надо. Н-р, процедурами Ли, Холма, Коппенгейвер - Холланда, Беньямини - Гохберга, Беньямини - Йекутили.
  Форум: Медицинская статистика · Просмотр сообщения: #22745 · Ответов: 7 · Просмотров: 633

100$
Отправлено: 8.03.2018 - 00:02


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(metalmary @ 7.03.2018 - 20:58) *
Всем hi.gif. Не могу никак определиться в выбором критерия. Есть контрольная группа животных, есть 5 экспериментальных групп, у которых определяли содержание некотрого гормона при определенной температуре через разный промежуток времени, т.е. у группы 1 брали кровь через час, у группы 2 - через 2 часа и т.д. Кроме этого, таких "5 экспериментальных групп" было тоже 5, так как было 5 разных температур. Параметрические критерии не подойдут, т.к. распределение не является нормальным, да и выборки маленькие. Нужно сравнить каждое измерение с контролем (я предполагаю критерий Манна-Уитни). Для проверки наличия различий в группах при определенной температуре склоняюсь к Крускалла-Уоллиса. Насчет сравенения разных температур очень сомневаюсь.
Верны ли рассуждения? help.gif, плиз!


Это- экспериментальный план двухфакторного дисперсионного анализа (Two-way ANOVA). Первый фактор "Температура" с 5 уровнями. Эффект фактора - фиксированный (fixed), второй фактор - "Группа" имеет 6 уровней. Тоже fixed. Дизайн настолько распространенный, что на простеньком уровне реализован даже в Экселе ("Двухфакторный дисперсионный анализ с повторениями"). Если очень хочется именно непараметрического аналога - это критерий Шайрера - Рэя - Хэйра. Описан в /Сокал, Рольф, Биометрия, с. 440-441/.
  Форум: Медицинская статистика · Просмотр сообщения: #22739 · Ответов: 7 · Просмотров: 633

100$
Отправлено: 28.02.2018 - 20:00


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(scholar @ 28.02.2018 - 18:46) *
Прошу простить, что задача не из серии медицинской статистики. Но если, кто знаете, может подскажите, как в R решить её

нужно найти компаний максимально и одновременно удовлетворяющих следующим условиям:

1) Параметр NET_DEBT_TO_EBITDA = минимальный (столбец H)
2) Параметр GEO_GROW_NET_SALES = максимальный (столбец I)
3) Параметр GEO_GROW_OPER_INC = максимальный (столбец J)
4) Параметр YLD_YTM_MID = максимальный (столбец M)
5) Параметр DEFAULT PROBABILITY = минимальный (столбец N)
т.е. мы должны получить набор компаний, удовлетворяющих вышеприведенным условиям, при этом средневзвешенный параметр по "портфелю" YLD_YTM_MID должен быть максимизирован, а DEFAULT PROBABILITY ? минимизирован (в данной задаче средневзвешенный параметр это вес компании в портфеле, умноженный на YLD_YTM_MID в первом случае и на DEFAULT PROBABILITY во втором случае).

Количество компаний в результате - не более 30, таким образом вес каждой компании не менее 0% и не более 7%. Сумма всех весов в портфеле - 100%.

Решаема ли в R такая задача, и если да, то какой библиотекой и есть ли пример её решения?


Ключевые слова для этой задачи - многокритериальный выбор, многокритериальная оптимизация, множество Парето, метод "идеальной точки".

А вы не могли бы снисходительно расшифровать названия переменных: GEO_GROW_OPER_INC ? YLD_YTM_MID? Чтобы я понимал, с кем разговариваю.
Обычно все эти вещи используют для прогнозирования дефолта (DEFAULT PROBABILITY). Если такой показатель уже есть, то зачем нужен столбец Н? Ежу понятно, что чем выше у компании отношение чистого долга к ЕБИТДА, тем выше вероятность дефолта.
Вопросы, вопросы...

P.S. А в чем смысл составления этого, извиняюсь за выражение, "портфеля"?
P.P.S. В упор не понимаю, причем здесь R.
  Форум: Медицинская статистика · Просмотр сообщения: #22705 · Ответов: 2 · Просмотров: 525

100$
Отправлено: 27.02.2018 - 12:52


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Blaid @ 27.02.2018 - 12:28) *
Возможно заблуждаюсь, но НИ КАКАЯ СПРАВОЧНАЯ СИСТЕМА НИ В КАКОЙ ПРОГРАММЕ (как бы развита ни была эта система) не заменит чтения соответствующей литературы! Причём литературы - адекватной (как говорят "правильной").
Да и здесь уже сказано было: путь от программы/программ к методу/методам - не правильный! Нужно сначала осваивать (понимать) метод (тот же дисперсионный анализ, например), а уже потом искать прогу, где он реализован (чтобы, грубо говоря, не считать вручную). Весь статистический софт для экономии времени создан (ну, и чтобы ошибки человека при расчётах убрать). Если метод понятен, понята его внутренняя структура, то и многие вопросы применимости и допустимости использования отпадают.
А умение работать с софтом (любым вообще, а не только статистическим) - это, по сути дела, кнопконажимательство и кнопкокликательство. Понажимал и покликал что надо и в нужной последовательности, ну программа и выдала результат... Хотя это тоже надо уметь, но это самое простое и доступное из всего.
Что касается, конкретных прог, то, например, в таком пакете-гиганте, как STATISTICA, реализовано большинство известных стат. методов ( в последних версиях даже нейронные сети появились). Большинству запросов в области стат. обработки и анализа данных STATISTICA вполне себе удовлетворяет.
SPSS "заточен" под психологию, социологию, экономику.
GrahPad Prism - прога для биологов, причём, на мой взгляд, непосредственно сама часть по обработке данных в ней как-бы второстепенна и поэтому развита слабо. Основной упор в ней сделан именно на биологические мат. методы (например, посчитать что-нибудь согласно ур-нию Михаэлиса-Мэнтен, всякие там IC50/EC50, cвязывание лигандов с рецепторами и т.д.).
Другое дело, что всё это коммерческий софт с соответствующей ценой на лицензию...
Но софт всё равно вторичен. Осваивать нужно, в первую очередь, метод, а не проги, в которых он реализован!


Такъ! Спасибо, Кэп!
  Форум: Медицинская статистика · Просмотр сообщения: #22692 · Ответов: 22 · Просмотров: 2775

100$
Отправлено: 26.02.2018 - 17:38


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Daria @ 26.02.2018 - 16:55) *
Не знаю только, насколько такой подход будет правильным.


Схему "До-После" по-другому и не обработаешь. Даже критерий Стьюдента для парных выборок "работает" именно так.
  Форум: Медицинская статистика · Просмотр сообщения: #22687 · Ответов: 12 · Просмотров: 894

100$
Отправлено: 26.02.2018 - 14:23


Дух форума
*

Группа: Пользователи
Сообщений: 615
Регистрация: 23.08.2010
Пользователь №: 22694


Цитата(Daria @ 26.02.2018 - 10:28) *
...корреляция с дельтой количества баллов также сильная и значима (сейчас просто нет данных под рукой).


Вот это - самая драгоценная часть вашего исследования. Я бы еще из озорства проверил гипотезу Ho:P{(X-Y)>0}=1/2 (т.е. о том, что медиана этих разностей равна 0). Критерием Манна - Уитни. Да-да, несмотря на то, что формально он вроде бы здесь и неприменим. При отвержении нулевой гипотезы восстанавливал бы зависимость: Дельта=Константа + Бета*Временной_интервал+ Ашипка.

И все это только для того, чтобы "доказать" ученому миру, что чем грубее шкала, тем больше приходится ждать, чтобы зафиксировать с ее помощью различия в состоянии пациента...
  Форум: Медицинская статистика · Просмотр сообщения: #22683 · Ответов: 12 · Просмотров: 894

24 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена