Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

5 страниц V   1 2 3 > » 

ogurtsov
Отправлено: 6.07.2019 - 10:28


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(100$ @ 5.07.2019 - 16:26) *
Не надо плодить сущности. Есть понятие физиологической нормы.

Не обижайтесь, но у вас второе предложение противоречит первому.
А "норма" у крысы, как и у человека, представляет собой диапазон значений, а не одно число.
Первый попавшийся пример: https://en.wikivet.net/Rat_Biochemistry - уровень холестерина от 40 до 130 является "нормальным". Поэтому в доклиническом исследовании трудно вообразить адекватный эксперимент без контрольной группы (обычно контролей еще и несколько) и/или измерения начальных значений изучаемых параметров.
Если копнуть еще глубже, то показатели биохимии имеют свойство серьезно меняться в зависимости от времени года и от диеты (крыса - животное деликатное, хуже только кролик). Плюс гендерные различия. Плюс линейные крысы разных линий тоже различаются (снова первый попавшийся пример - https://cyberleninka.ru/article/n/lineynye-...i-u-krys-na-in).
  Форум: Медицинская статистика · Просмотр сообщения: #24162 · Ответов: 13 · Просмотров: 516

ogurtsov
Отправлено: 5.07.2019 - 14:15


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(100$ @ 5.07.2019 - 13:53) *
Чтобы снять у них биохимию мозга. Живой-то особи в башку не зелезешь...



Как по мне - так ничего подобного. Есть стрессогенный фактор, есть время. Об уровне воздействия стрессогенного фактора с течением времени судят по косвенному показателю - степени предпочтения сахарозы. После чего пытаются понять:как биохимия мозга зависит от глубины воздействия стресса. Усреднение уровня сахарозы будет происходить сначала по 15 объектам выборки, затем - по 10 и т.д. (ковариата). А собственно биохимия (дисперсионный комплекс в данном случае) будет представлена тремя независимыми выборками по 5 убиенных крыс. Погибших во имя науки.

Для биохимии нету нулевой точки, то есть "как биохимия мозга зависит от глубины воздействия стресса" мы не узнаем в ходе данного эксперимента.
  Форум: Медицинская статистика · Просмотр сообщения: #24158 · Ответов: 13 · Просмотров: 516

ogurtsov
Отправлено: 5.07.2019 - 12:31


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Ну а животных-то зачем убивать? У вас цель состояла в анализе предпочтения сахарозы (о чем вначале сказано не было), это не требует забоя крыс.
В данном случае попытка угнаться за 2 зайцами привела именно к тому, к чему обычно приводит. Для анализа уровня предпочтения сахарозы в динамике данных тупо нет, кроме 5 крыс, убитых последними.
  Форум: Медицинская статистика · Просмотр сообщения: #24156 · Ответов: 13 · Просмотров: 516

ogurtsov
Отправлено: 5.07.2019 - 11:36


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(Cules2013 @ 5.07.2019 - 11:13) *
Про связь "гуманное умерщвление" и "несвязанные выборки" вообще не въехал. При чём тут это?


Было написано
Цитата
я забиваю по 5 животных на биохимию мозга

Из чего как бы следует, что изучаются показатели биохимии, а не что-то еще, что можно измерить многократно. Для биохимии базового уровня нет (в день 0 никого не забивали), затем в 3 и последующие дни имеем по 5 убитых животных в каждой группе. Все выборки по 5 животных абсолютно независимы что при сравнении внутри группы, что при сравнении между группами.
  Форум: Медицинская статистика · Просмотр сообщения: #24153 · Ответов: 13 · Просмотров: 516

ogurtsov
Отправлено: 5.07.2019 - 11:03


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(nokh @ 3.07.2019 - 21:26) *
Если у вас есть ссылки на соответствующие рекомендации, поделитесь ими, пожалуйста, с топикстартером. Мне по этой теме дискутировать не интересно. Остаюсь при своём мнении pardon.gif .

https://en.wikipedia.org/wiki/Reproducibili...ucible_research
https://www.coursera.org/lecture/reproducib...rch-about-FvOGB
А тестовые статистики и степени свободы оставьте в 80-х вместе с таблицами критических значений.
  Форум: Медицинская статистика · Просмотр сообщения: #24151 · Ответов: 5 · Просмотров: 438

ogurtsov
Отправлено: 5.07.2019 - 10:48


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(Cules2013 @ 5.07.2019 - 09:54) *
Добрый день!
Я в первый раз провёл эксперимент по новой для меня схеме, поэтому несколько затрудняюсь, как теперь правильно обработать данные. У меня 3 группы крыс по 15 шт в каждой. Эксперимент длится 21 день, и на 3, 10 и 21-й дни я забиваю по 5 животных на биохимию мозга. Таким образом у меня получается, что 5 крыс у меня прошли весь эксперимент, а 5 только 3 дня, и ещё 5 только 10 дней. По факту у меня получается, что на 10-й и 21-й день у меня часть данных от тех же животных, что на 3-й и 10-й дни, а часть -нет, т.е. у меня выходит смешанная выборка - она и не связанная, и не несвязанная одновременно, 50/50 + кол-во чисел уменьшается с уменьшением кол-ва животных, т.е у меня ещё и missing values присутствуют. Как вообще такое считать статистически?

Сформулируйте цели исследования. Не существует никакого способа взять кучу цифр, "посчитать статистически" и получить на выходе что-то осмысленное.
Выборки, кстати, несвязанные, поскольку каждое животное гуманно умерщвлялось всего один раз.
  Форум: Медицинская статистика · Просмотр сообщения: #24150 · Ответов: 13 · Просмотров: 516

ogurtsov
Отправлено: 3.07.2019 - 13:23


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(nokh @ 1.07.2019 - 07:58) *
Меня учили, что в результатах, опирающихся на статистический критерий нужно приводить все три меры: 1) значение статистики критерия, 2) степени свободы или объёмы выборок (в зависимости от критерия), 3) Р-значение. Если не привести все три меры, то статистическая выкладка перестаёт служить таковой или вообще теряет свой подтверждающий тезу смысл и может указывать на безграмотность исследователя. Например, в зависимости от числа степеней свободы критерий хи-квадрат=5,05 может иметь совершенно различные значения Р, а если человек просто напишет, что Р=0,014, то где дополнительные гарантии, что он не ошибся в расчётах или что вообще что-то считал.


Ничего, кроме p-значения, названия критерия и используемого уровня значимости, для интерпретации результатов не нужно. Никакие степени свободы и значения статистик не могут повысить доверие или что-то гарантировать, поскольку их все можно как написать "от фонаря" (только степени свободы подогнать под размер выборки), так и тщательно сфальсифицировать. Гарантии дает только оформление исследования как воспроизводимого, то есть с предоставлением всех данных, SAP-а и скрипта для всех этапов анализа и генерации отчета.
  Форум: Медицинская статистика · Просмотр сообщения: #24144 · Ответов: 5 · Просмотров: 438

ogurtsov
Отправлено: 6.05.2019 - 19:39


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Какая непалевная реклама с двух фейковых аккаунтов!
  Форум: Медицинская статистика · Просмотр сообщения: #23927 · Ответов: 10 · Просмотров: 1790

ogurtsov
Отправлено: 4.03.2019 - 19:23


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Лично я вижу 2.5 выхода из сложившейся ситуации:
1) Узаконить продажу кандидатских корочек.
2) Диссертанты начинают сами изучать статистику и программирование в необходимом объеме, после чего сами делают анализ корректным и воспроизводимым образом.
2.5) П.2, но с привлечением репетиторов.
  Форум: Медицинская статистика · Просмотр сообщения: #23773 · Ответов: 10 · Просмотров: 1790

ogurtsov
Отправлено: 3.03.2019 - 19:13


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(comisora @ 1.03.2019 - 23:36) *
Доброго вечера.
2ogurtsov

Вы про вот этот инструмент писали? https://blogs.rstudio.com/tensorflow/posts/...ngs-with-keras/

Там на уровне слов работают, но принцип тот же. Можно даже просто усреднять векторные представления слов и получать векторное представление целого текста.
Нервную сетку обучать не обязательно, можно брать обученную модель doc2vec.
  Форум: Медицинская статистика · Просмотр сообщения: #23768 · Ответов: 7 · Просмотров: 1710

ogurtsov
Отправлено: 8.02.2019 - 21:27


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Для уникальных предложений можно строить эмбеддинги (векторные представления) и смотреть, насколько они близко расположены в полученном векторном пространстве. Может быть, некоторые окажутся не такими уж и уникальными.
  Форум: Медицинская статистика · Просмотр сообщения: #23729 · Ответов: 7 · Просмотров: 1710

ogurtsov
Отправлено: 17.10.2018 - 20:10


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Поменять бы PAST на R, и будет полная годнота.
  Форум: Медицинская статистика · Просмотр сообщения: #23440 · Ответов: 8 · Просмотров: 2655

ogurtsov
Отправлено: 16.10.2018 - 20:33


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(nikita_zab @ 16.10.2018 - 17:38) *
Добрый день!

Прошу напомнить термин, которым называют применение всевозможных статистических методов к одним и тем же данным в попытке найти значимую разницу или закономерности.

И второй вопрос из области философии. Имеет ли смысл применять несколько методов для оценки "здесь что-то есть". И если применяется сразу несколько методов как быть, если некоторые из них показывают "р меньше 5 сотых", а другие нет?

p-value-hunting. Или локальный мем данного форума - ковровая бомбардировка тестами.
https://mchankins.wordpress.com/2013/04/21/...-significant-2/
Цитата
(barely) not statistically significant (p=0.052)
a barely detectable statistically significant difference (p=0.073)
a borderline significant trend (p=0.09)
a certain trend toward significance (p=0.08)
a clear tendency to significance (p=0.052)
a clear trend (p<0.09)
a clear, strong trend (p=0.09)
a considerable trend toward significance (p=0.069)
a decreasing trend (p=0.09)
a definite trend (p=0.08)
a distinct trend toward significance (p=0.07)
a favorable trend (p=0.09)
a favourable statistical trend (p=0.09)
a little significant (p<0.1)
a margin at the edge of significance (p=0.0608)
a marginal trend (p=0.09)
a marginal trend toward significance (p=0.052)
a marked trend (p=0.07)
a mild trend (p<0.09)

Имеет ли смысл применять - ну это как вы со своей совестью договоритесь, или насколько умело отписавшийся выше профессионал разведет вас на бабки.
  Форум: Медицинская статистика · Просмотр сообщения: #23435 · Ответов: 6 · Просмотров: 2301

ogurtsov
Отправлено: 1.07.2018 - 21:06


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(leo_biostat @ 19.06.2018 - 13:29) *
И каждое из таких уравнений имеет хороший набор показателей, что позволяет из всех
уравнений самому заказчику выбирать 2-3 лучших уравнения.

Показатели хорошие, и уравнения восхитительные, но какова их прогностическая ценность? Интересуют метрики на отложенной выборке, а еще лучше - "в продакшене".
  Форум: Медицинская статистика · Просмотр сообщения: #23136 · Ответов: 5 · Просмотров: 2651

ogurtsov
Отправлено: 13.05.2018 - 11:17


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(scholar @ 12.05.2018 - 19:22) *
Есть ли статистические техники оценки динамики только по средним?

Нет.
  Форум: Медицинская статистика · Просмотр сообщения: #22997 · Ответов: 2 · Просмотров: 1339

ogurtsov
Отправлено: 6.05.2018 - 17:34


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(Антон Т. @ 6.05.2018 - 17:27) *
Попробую сформулировать иначе. Есть результаты исследования влияния достаточно большого количества признаков (12 аллелей, 29 генотипов) на небольшой выборке (130-150 человек), разделенных на подгруппы. Получен ряд ассоциаций. После коррекции на множественность сравнения общепринятыми методами (Бенжамини-Хохберга и тем более Бонферрони) результаты оказались статистически незначимы. Однако при проведении регрессионного анализа с теми же генотипами в качестве предикторов ("наличие-отсутствие"), в окончательное уравнение регрессии вошли именно те генотипы, которые были ассоциированы с заболеванием после расчета по 2*2. Получается противоречие. И неясно, что делать дальше - можно ли публиковать результаты, сославшись на результаты лог. регрессии, или воздержаться, принимая во внимание коррекцию на множественность?

Никакого противоречия нет. Для коэффициентов регрессии тоже есть своя групповая вероятность ошибки первого рода, то есть каждый по отдельности может быть "значим на уровне значимости 0.05", но это не гарантирует, что на том же уровне значимости значима вся совокупность. Опять же: как отбирали предикторы, которые вошли / не вошли? И более глобально: как оценивается качество модели и как принимается решение, что она хорошая? Какое у нее дальнейшее практическое применение?
  Форум: Медицинская статистика · Просмотр сообщения: #22947 · Ответов: 6 · Просмотров: 2310

ogurtsov
Отправлено: 6.05.2018 - 16:27


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


У вас таблица сопряженности получается 24х8 (192 ячейки). Подумайте, можно ли сделать какие-то выводы при наличии всего 77 собак.
  Форум: Медицинская статистика · Просмотр сообщения: #22945 · Ответов: 36 · Просмотров: 12302

ogurtsov
Отправлено: 6.05.2018 - 14:35


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(Антон Т. @ 6.05.2018 - 12:56) *
Можно ли говорить, что мы проверили таким образом наши результаты на состоятельность с учетом множественности сравнений?

Нет, нельзя. И как вообще понимать состоятельность результатов? Я бы предложил оценивать модель по прогнозной силе на новых наблюдениях.
  Форум: Медицинская статистика · Просмотр сообщения: #22943 · Ответов: 6 · Просмотров: 2310

ogurtsov
Отправлено: 5.04.2018 - 19:17


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(Cules2013 @ 5.04.2018 - 08:22) *
Предлагаете брать с них пример, чтобы не выделяться?

Цитаты плиз, кто и где это предлагает.
  Форум: Медицинская статистика · Просмотр сообщения: #22868 · Ответов: 10 · Просмотров: 3321

ogurtsov
Отправлено: 3.04.2018 - 21:03


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(Cules2013 @ 3.04.2018 - 17:19) *
Ну так это не я же придумал все эти ограничения. К слову именно та инфа, что я указал здесь - это из методички по статистике моего вуза, составленной по книгам Рокицкого, Лакина, Плохинского и т.д. Вполне допускаю, что эта инфа уже устарела, но взята отнюдь не с потолка.
Вы сказали, о "докомпьютерной эпохе" - это одна сторона вопроса, что многие расчёты было раньше сложно или трудоёмко выполнять. Но я имею виду те случаи, когда вы используете данные, что не подходят для данного критерия, т.к. не соответствуют неким математическим допущениям в самой формуле. В итоге вы можете получить ошибку первого/второго рода, или как один человек приводил интересный пример с критерием Смирнова-Колмогорова, что использовался для проверки на нормальность малых выборок данных (меньше 10 случаев) - программа вам может посчитать, что угодно, но в итоге получается, что ему банально не хватает мощности, чтобы отклонить нулевую гипотезу, и на малых выборках он всегда пишет, что распределение нормально, хотя это совсем не так. Вот таких вот проколов хотелось бы избегать. Статистика - это не философия и не литературоведение, здесь должно быть всё чётко и понятно, а не "трактуй, как хочешь". Вот люди и трактуют как хотят - у них критерий Стьюдента подходит на все случаи жизни и т.п.

На самом деле на все случаи жизни есть бустреп - генерируйте тысячи псевдовыборок, стройте эмпирические распределение требуемых статистик, по ним находите ДИ.
  Форум: Медицинская статистика · Просмотр сообщения: #22861 · Ответов: 10 · Просмотров: 3321

ogurtsov
Отправлено: 27.03.2018 - 20:17


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(leo_biostat @ 27.03.2018 - 16:11) *
Уверен, что интересы большинства ответчиков аналогичны.

Вообще неприкрытой коммерцией тут кроме вас никто не занят.
  Форум: Медицинская статистика · Просмотр сообщения: #22811 · Ответов: 13 · Просмотров: 4339

ogurtsov
Отправлено: 20.03.2018 - 22:36


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Тогда еще вопрос - всего строк данных сколько? Что дают однофакторные модели (желательно в плане прогнозного качества по кросс-валидации)?
  Форум: Медицинская статистика · Просмотр сообщения: #22789 · Ответов: 3 · Просмотров: 1590

ogurtsov
Отправлено: 20.03.2018 - 19:50


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Там NA - это, похоже, не NA вовсе.
Начните с обычной линейной модели, лично мне не очевидно, каким образом сюда прикручиваются смешанные эффекты и пуассоновское распределение.
  Форум: Медицинская статистика · Просмотр сообщения: #22785 · Ответов: 3 · Просмотров: 1590

ogurtsov
Отправлено: 19.03.2018 - 21:06


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Цитата(Surgenik @ 19.03.2018 - 21:59) *
тупо сделать по аналогии

Отличный подход! Так держать. Надеюсь, Вас лечить будут ровно так же.
  Форум: Медицинская статистика · Просмотр сообщения: #22779 · Ответов: 6 · Просмотров: 2623

ogurtsov
Отправлено: 18.03.2018 - 19:17


Дух форума
*

Группа: Пользователи
Сообщений: 112
Регистрация: 15.12.2015
Пользователь №: 27760


Если в статье результаты описаны таким вот образом, да еще и проценты не сходятся, то эту статью лучше просто не читать.
  Форум: Медицинская статистика · Просмотр сообщения: #22776 · Ответов: 6 · Просмотров: 2623

5 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена