Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

8 страниц V   1 2 3 > » 

passant
Отправлено: 9.09.2021 - 15:57





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(comisora @ 9.09.2021 - 10:02) *
2 passant

Простую регрессию (simple regression model) можно сделать три раза для каждой переменной, почитав руководство к JASP с целью тренировки и обучения.


Извините, но не три раза. Регрессионная модель - по определению - требует, что-бы и предикторные и зависимая (зависимые) переменные были количественные. А такую зависимость для данной задачи можно строить для каждой пары ЗНАЧЕНИЙ номинальных (качественных) признаков. Другими словами - отдельная модель для (береза, вересковый), отдельная для (береза, лишайниковый), ..... отдельно для (ольха, вересковый), отдельная для (ольха, лишайниковый) и т.д. А учитывая, что у ТС всего-то 20 примеров в наличии, а пар 3*4=12, то чуть больше одного (!!!) примера на каждую возможную комбинацию. И какую модель вы предлагаете строить?

И еще вопрос. Вот в этом уравнении Y=b1*Plotnost+b2*Poroda+b3*Sosnak+b0+e - какие значения у вас могут принимать коэффициенты b2, b3, Poroda, Sosnak. Так что-бы операция умножения имела смысл? Я понимаю, вы намекаете на введение т.н. Dummy-переменных, но их-то у вас должно быть не две, а как минимум 7. И то, что строиться таким образом хоть и называют "регрессией" (как и логистическую регрессию, кстати), но по сути представляет собой типичную классификационную модель (практически - классификация на основе деревьев).


  Форум: Медицинская статистика · Просмотр сообщения: #26958 · Ответов: 13 · Просмотров: 1696

passant
Отправлено: 9.09.2021 - 00:08





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(comisora @ 8.09.2021 - 22:51) *
2 Blaid

Можно начать с простой линейной регрессии. Может потребоваться какая-специфическая модель, например, с экспоненциальным распределением.


Какая может быть простая линейная регрессия если две из трех независимых переменных представлены в номинальной шкале???
  Форум: Медицинская статистика · Просмотр сообщения: #26955 · Ответов: 13 · Просмотров: 1696

passant
Отправлено: 8.09.2021 - 20:32





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Ответ: методы классификации. Их есть много и разных, начиная с kNN, деревья решений, SVM, та же логистическая регрессия (которая на самом-то деле - классификация) и т.д. (Про соответствующие нейросети советовать не буду -
вряд-ли у вас найдется необходимое количество обучающих примеров). Смотрите, выбирайте.
По кнопочным интерфейсам не подскажу. Но вот в Python реализован и доступен наверное один из самых больших арсеналов реализации методов классификации (модуль Scikit-Learn, если что).
  Форум: Медицинская статистика · Просмотр сообщения: #26953 · Ответов: 13 · Просмотров: 1696

passant
Отправлено: 18.08.2021 - 21:19





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Anna_V @ 18.08.2021 - 13:01) *
Добрый день. Если я не ошибаюсь, корректное применение линейных смешанных моделей требует гомоскедастичности остатков. Вопрос: как её проверить (кроме визуального анализа)? Где-то читала, не могу найти, что критерий Ливиня не рекомендуют применять из-за его излишней консервативности в данном случае. В Prism гомоскедастичность остатков предлагается проверять расчетом корреляции Спирмена между предсказанными значениями и абсолютными значениями остатков, на сколько оправдан такой подход?

Методы проверки гомоскедастичности остатков:
- Коэффициент ранговой кореляции Спирмана.
- Тест Голдфелда-Квандта. (На основе критерия Фишера)
- Тест Уайта - построение регрессионной модели зависимости квадратов ошибок от Х.
- Тест Глейзера.
- Тест Бройша — Пагана (Тоже, по сути, на основе критерия Фишера)

Смотрите, изучайте что вам больше подходит, применяйте.
  Форум: Медицинская статистика · Просмотр сообщения: #26916 · Ответов: 1 · Просмотров: 3343

passant
Отправлено: 29.07.2021 - 15:42





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Критерий Хи-квадрат предназначен для проверки соответствия двух распределений. Фраза "Критерий хи-квадрат предназначен только для частот" если бы прозвучала на экзамене, то я бы ее с натяжкой принят, так как действительно для реализации этого критерия надо посчитать частоты значений данных. Вот только что значит "только"? Даже Википедия на этот счет пишет "метод позволяет оценить статистическую значимость различий двух или нескольких относительных показателей (частот, долей)." Ну да ладно.
Теперь возвращаемся к вопросу. "в статьях по моей теме у двух авторов он применяется для сравнения теоретической кривой (зависимость известна) и опытных точек". Каким образом это противоречит предыдущей фразе?
Общая схема данного критерия следующая. У вас есть ваши данные и есть подозрение, что данные получены из выборки, подчиняющейся некоторому известному закону распределения. Таким образом, вы можете разбить весь диапазон возможных значений ваших данных на интервалы и посчитать, сколько элементов вашей выборки попадают в каждый из интервалов, а также посчитать, сколько элементов совокупности, распределенной по "подозреваемому" закону должно попадать в этот интервал. И то и другое - крайне просто. Хотите - в долях, хотите - в частотах.
А далее применяем тот самый Хи-квадрат критерий. При нулевой гипотезе: "данные извлечены из одной и той-же генеральной совокупности", т.е. можно считать, что они распределены по одному закону. Против альтернативной гипотезы "данные извлечены из генеральных совокупностей, имеющих разные законы распределения". То, что одна из ваших выборок получена из теоретического закона распределения только упрощает процедуру.
Все это действительно тривиально реализуется в том-же EXCEL:
https://moluch.ru/archive/251/57618/
http://modeling.at.ua/publ/6-1-0-22
https://statanaliz.info/statistica/proverka...na-khi-kvadrat/
  Форум: Медицинская статистика · Просмотр сообщения: #26889 · Ответов: 2 · Просмотров: 2639

passant
Отправлено: 15.04.2021 - 19:09





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


О, два года прошло, но ничегошеньки не поменялось. Опять Med_Elena и опять реклама НЦ БИОСТАТИСТИКИ. Ну пожалуйста, попробуйте действовать более утонченно, а то даже не интересно.
  Форум: Медицинская статистика · Просмотр сообщения: #26750 · Ответов: 7 · Просмотров: 3793

passant
Отправлено: 14.04.2021 - 10:16





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Теоретически - любым методом проверки гипотез однородности. Практически - при малых объемах выборок и неизвестном распределении - я бы начал с критерия Вилкоксона-Манна- Уитни.
Впрочем, я не врач, поэтому что такое "электромиография" не понимаю и исхожу из того, что по каждому пациенту в вас получается некоторое числовое представление этого самого гипертонуса. Если же ответ просто "да"-"нет" - то можно использовать, например коэффициент ассоциации Юла
  Форум: Медицинская статистика · Просмотр сообщения: #26743 · Ответов: 7 · Просмотров: 3793

passant
Отправлено: 21.01.2021 - 09:16





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Диагностик @ 20.01.2021 - 17:04) *
Я бы попробовал со скользящим коэффициентом регрессии и проверкой каждый раз на статистически значимое отличие.

Во, это то, что я сейчас пытаюсь делать. И возникает куча проблем, начиная с того, что материалов именно по различию коэффициентов регрессии очень мало, а во-вторых, еще не нашел двух источников, которые бы приводили к одинаковым формулам, еще бы и не содержали опечатки :-). Пытаюсь через этот лес продраться.
Ну и еще на тему регрессии хочу посмотреть в сторону критерия Чоу, подсмотренного у эконометриков. Может там тоже кое-что окажется интересным.
  Форум: Медицинская статистика · Просмотр сообщения: #26350 · Ответов: 12 · Просмотров: 5500

passant
Отправлено: 19.01.2021 - 19:08





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Диагностик @ 19.01.2021 - 11:52) *
Критерий Смирнова всё учитывает.

Его я тоже упомянул выше. Но он не для всех задач подходит. Например, во временнЫх рядах его применение возможно, но несколько затруднено. И там как раз может лучше работать некий критерий, анализирующий коэффициент автокорреляции, или критерий основанный на сравнений регрессий. Точно так-же есть и другие области, где классические критерии хотя и применимы, но с определенными оговорками. Поэтому и хочется "попробовать" чего-то новенького. И есть задумки, что делать с ними потом - но пока вот "набираю базу алгоритмов". (Читать справочник Кобзаря - не предлагать. Уже прочел :-) )
  Форум: Медицинская статистика · Просмотр сообщения: #26341 · Ответов: 12 · Просмотров: 5500

passant
Отправлено: 19.01.2021 - 10:51





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Диагностик @ 19.01.2021 - 02:47) *
А разве не может быть, при неотличимых эксцессах выборки неоднородные?
Вполне. Так же как и при неотличимых средних или дисперсиях. Но это не отменяет необходимости иметь в наборе инструментов различные тесты, которые будут реагировать на статистически различимые неоднородности.
  Форум: Медицинская статистика · Просмотр сообщения: #26339 · Ответов: 12 · Просмотров: 5500

passant
Отправлено: 17.01.2021 - 11:52





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Диагностик @ 17.01.2021 - 07:43) *
Например использовать U-критерий Манна - Уитни.

Не, это не катит.
"Речь не про среднее, дисперсию и прочие "легкие" темы. " Такие критерии есть классика, и с ними все понятно. Интересует именно автокорреляция, коэффициенты регрессии, возможно - коэффициенты моделей Брауна-Хольта-Винтерса, моделей ARIMA, показатель Хёрста (не к ночи будет сказано :-) и т.д. Кстати, даже сравнение отличии скоса и эксцесса. Сравнение энтропий может оказаться полезным. Ну и что-нибудь новенькое и более надежное, чем Колмогоров-Смирнов и аналоги для непосредственного сравнения распределений.
  Форум: Медицинская статистика · Просмотр сообщения: #26329 · Ответов: 12 · Просмотров: 5500

passant
Отправлено: 16.01.2021 - 23:22





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Спасибо большое. Это уже - направление.
Единственная проблема, что мои задачи надо решать в режиме он-лайн, причем скорость поступления данных весьма высокая - в некоторых вариантах "тики" могут представлять собой секунды, а время накопления выборки - минуту. Поэтому получится-ли применить МК-подход или нет - пока не знаю. Но буду разбираться. Еще раз спасибо.
  Форум: Медицинская статистика · Просмотр сообщения: #26327 · Ответов: 12 · Просмотров: 5500

passant
Отправлено: 16.01.2021 - 16:32





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Что то наш форум как-то подозрительно затаился. Неужели это все? Или просто реакция на COVID?
Сделаю еще одну попытку его реанимировать, тем более реально считаю этот форум одним из наиболее компетентных в данной сфере на просторах русскоязычного интернет.
Итак.
Предположим, что мы делаем сначала точечную оценку некоторого статистического параметра на разных выборках. Речь не про среднее, дисперсию и прочие "легкие" темы. А например про более сложные случаи - например получаем коэффициент автокорреляции двух временных рядов (разумеется, для каждого отдельно), или оценки коэффициентов регрессии (получаем два набора коэффициентов).
Итак имеем два статистических параметров. Нам надо ответить, можно-ли считать, что выборки были взяты из одной генеральной совокупности.
Что-бы ответить на этот вопрос можно задаться уровнем значимости, построить два доверительных интервала и проверить, пересекаются-ли они. Сразу-же возникает вопрос, а как оценить вероятность такой ситуации. Не просто ответить, что да, такая ситуация возможна, а выяснить с какой именно вероятностью она может возникнуть.
Возможно кто либо встречал "прямое" решение данной задачи, т.е. анализ непосредственно закона распределения для разности указанных параметров и нахождения p_value аналогично тому, как это делается в традиционных алгоритмах проверки гипотез однородности на основе средних, медиан, рангов и пр.

Буду благодарен на любую информационную "наводку" или хотя-бы указания направления, куда "рыть" дальше.

И всех, кто еще заглядывает на этот форум - с прошедшими праздникам! Пусть всякие Ковиды не портят вам настроения!
  Форум: Медицинская статистика · Просмотр сообщения: #26320 · Ответов: 12 · Просмотров: 5500

passant
Отправлено: 19.08.2020 - 16:12





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 19.08.2020 - 13:36) *
Ну, если душа так просит именно одновременного тестирования параметров положения и масштаба, то Кобзарь описывает комбинированный критерий Буша - Винда (Bush, Wieand, 1982) на с. 511) и V-критерий Бхапкара (Bhapkar, 1961) на с.514.

Спасибки :hi.gif :
Оно!!! Как один из вариантов. Но где поток (ну хотя-бы ручеек) соответствующих русскоязычных работ на эту тему? unknw.gif

Цитата(100$ @ 19.08.2020 - 13:36) *
А вообще взять, скажем, критерий Смирнова, тестирующий нулевую гипотезу о том, что две скалярные выборки пришли из одного распределения. Если при неотвержении нулевой гипотезы сил нет как хочется считать это распределение масштабно-сдвиговым, то вот вам и тест на одновременное отсутствие сдвига и в параметре положения, и в параметре масштаба.

С этим - интереснее, но вне рамок этого вопроса. Тут вопрос стоит - у вас есть N параметров одного объекта. Они изменяются во времени, случайным образом. Но если вдруг чего-то происходит в объекте (в медицине - пациент заболел, в экономике - приняли новый закон, в техмониторинге - отвалился болт крепления и пр.) все или некоторые из этих параметров меняются статистически значимо. Можно-ли (вне рамок, например, методов кластеризации) получить единый критерий и по его p-value давать соответствующий сигнал. Еще интереснее, если одни параметры мы анализируем одним набором критериев, другие - другим (например - они измерены в разных типах шкал) и хочется найти способ объединенного анализа. А еще забавнее, когда можно что-то сказать о семантической (прикладной) важности изменения каждого из параметров.
Критерий Смирнова - он понятен, но, например, если данные по параметрам даны в виде временного ряда, то есть критерий обнаружения изменения автокорреляции. Не уверен, что критерий Смирнова его обнаружит.
Или что делать, если вдруг критерий Смирнова, хи-квадрат и Крамера-фон Мизеса дают несогласованные значения p-value? Когда включать сирену тривоги?
Но это, конечно - другая большая тем.
За ссылочку - еще раз спасибо. Именно ее я проглядел sorry.gif



  Форум: Медицинская статистика · Просмотр сообщения: #25997 · Ответов: 7 · Просмотров: 6615

passant
Отправлено: 19.08.2020 - 11:48





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(DrgLena @ 19.08.2020 - 04:00) *
С русскоязычными источниками не помогу, а тест обобщающий location и scale (JLS Test) описан Дэвидом Соаве только в 2015 просто WF = −2(log(pL) + log(pS)).
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4572492/

Спасибо, но тут вы немного ошибаетесь. Впервые такие тесты были описаны в
Cucconi O. Un nuovo test non parametrico per il confronto tra due gruppi campionari. Giornale Degli Economisti. 27 (3/4), 1968: 225?248
Lepage Y. A Combination of Wilcoxon's and Ansari-Bradley's Statistics. Biometrika, vol. 58, no. 1, 1971, pp. 213?217.
И конечно, за последние годы многократно обсасывались с разных сторон, улучшались, модифицировались и анализировалось.
Так что новыми эти подходы никак назвать не получается. Что делает вопрос об отсутствии источников на русском тем более странным.

И еще, приведенный в вашем источнике подход, хотя и лежит "в русле", но немного отличается. То, что написано в вашей статье - это объединение результатов (как правило - p-values) набора тестов в единый обобщающий результат. А вот второе направление - это создание тестов, способных сразу выработать единый p-value. Оба подхода (а есть еще и другие) имеют право на жизнь, имеют свои плюсы и свои минусы и могут оказаться эффективными в своих прикладных нишах.
  Форум: Медицинская статистика · Просмотр сообщения: #25995 · Ответов: 7 · Просмотров: 6615

passant
Отправлено: 19.08.2020 - 11:42





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(Диагностик @ 19.08.2020 - 02:50) *
Проверка гипотез о параметре местоположения (центра распределения). Например t-тест, U- критерий Манна ? Уитни или критерий суммы рангов Вилкоксона и др.

Спасибо, но это точно не то. Гипотеза о сдвиге местоположения как и гипотеза об изменении размаха (по отдельности) - это вполне понятная, классическая(из учебника) и хорошо проработанная тема, тут не о чем и говорить. А вот "location-scale test" - это тест ОДНОВРЕМЕННО проверяющий эти две гипотезы. И в этом его фишка. Есть разновидности и с тремя тестами, и с другими гипотезами. Но НИЧЕГО не могу найти на русском. Это конечно не критично, хватает информации и на английском. Но вопрос - а почему нет на русском? Склоняюсь к мысли, что неправильно формулирую поисковый запрос ввиду неправильного перевода термина. Или все-таки на просторах бывшего СНГ эта тема почему-то "не модна"?
  Форум: Медицинская статистика · Просмотр сообщения: #25994 · Ответов: 7 · Просмотров: 6615

passant
Отправлено: 19.08.2020 - 00:36





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Уважаемые коллеги. Кто нибудь встречал хоть что-то русскоязычное на тему "location-scale tests". Вижу множество статей на английском. Постоянно, примерно с 2001 года количество публикаций растет. Есть публикации и чисто статистические, и экономические, и медицинские. А на просторах русскоязычной научной мысли - тишина. Впрочем, допускаю, что этот термин у нас как-то по хитрому перевели, и я просто не могу догадаться как. Кто-нибудь в курсе? Заранее спасибо за "наводку".
  Форум: Медицинская статистика · Просмотр сообщения: #25991 · Ответов: 7 · Просмотров: 6615

passant
Отправлено: 27.07.2020 - 22:06





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Какая незатейливая реклама!
Неужели у центра все так плохо, что нельзя просто заказать платный банер, повесить его и спокойно собирать клиентов.
Неужели центр считает всех посетителей сайте полными идиотами, неспособными отличить рекламу от нормальных сообщений.
Я точно никогда не буду клиентом центра, но даже если бы у меня возникло такое желание, столь низкопробная реклама меня бы просто оттолкнула.
Неужели врачи мыслят по другому?
P.S. potap_O - кстати, вы к своему дяде "медицинскому директору и проверщику поступаемых диссертаций" так и не обратились за прошедшее время? Решили лучше отдать деньги "чужому дяде", чем общаться со своим родненьким? Высокие отношения!
  Форум: Медицинская статистика · Просмотр сообщения: #25974 · Ответов: 16 · Просмотров: 147961

passant
Отправлено: 18.07.2020 - 23:20





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 18.07.2020 - 19:27) *
Похоже, passant начал что-то подозревать...

Не, я просто устрашился попасть в руки такому врачу, еще и целому кандидату наук. crazy.gif И начал подозревать, почему некоторые люди предпочитают идти сразу к знахарям. lazy.gif
  Форум: Медицинская статистика · Просмотр сообщения: #25966 · Ответов: 16 · Просмотров: 147961

passant
Отправлено: 17.07.2020 - 22:33





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


он медицинский директор, и проверщик поступаемых диссертаций. И перегружен своей работой, поэтому по конкретным базам данных и не может уточнять методы статистического анализа.
Настолько перегружен, что ознакомиться с вашей работой и ее раскритиковать успел, а вот "уточнить" метод анализа нет?? Просто дать название или ссылочку?? Родной племяннице? Жесть.

P.S. Если бы так: "проверщик поступаемых диссертаций" и "медицинский директор перегруженный своей работой" писал бы школьник средних классов - это бы меня повеселило. Если бы нечто подобное написал мне мой студент - я бы засомневался в его адекватности. Но кандидат в кандидаты медицинских наук??? Жесть в квадрате.
  Форум: Медицинская статистика · Просмотр сообщения: #25961 · Ответов: 16 · Просмотров: 147961

passant
Отправлено: 10.07.2020 - 23:18





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(smeilz @ 10.07.2020 - 22:42) *
Я кстати не собирался Вам доказывать, что разбиение необходимо, мне просто было интересно рассуждать вслух. Сейчас я пришел к выводу, что данные разбивать бесмысленно, если не знаешь почему эти сегменты могут иметь различные закономерности. В моем случае есть один вариант разбиения на 2 сегмента, но он практически пока слишком сложный в реализации, и я его отложу, и возьму все данные целиком.

Ну, я специально тут молча постоял в сторонке, пока шло обсуждение. И я рад, что суммарная рекомендация, которая выработалась в ходе дискуссии практически совпало с тем, о чем я вам говорил на другом форуме.
Держите нас в курсе своих изысканий, будет интересно.
И лучше на этом форуме. Тут вас, конечно, побъют сильнее wink.gif , зато и профессиональнее, а значит - полезнее для дальнейшего научного опыта.
  Форум: Медицинская статистика · Просмотр сообщения: #25944 · Ответов: 25 · Просмотров: 145398

passant
Отправлено: 9.07.2020 - 10:55





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(100$ @ 9.07.2020 - 00:17) *
я же и спугнул. Жаль модераторы потерли...

Жаль, пропустил.

Цитата(100$ @ 9.07.2020 - 00:17) *
А вот по поводу ваших несбывшихся ожиданий имею-таки сказать следующее: в соседней теме про СOVID-19 - там, похоже, вся тема создана таким "явлением".

У меня тоже сложилось такое же впечатление. Но
Цитата(100$ @ 9.07.2020 - 00:17) *
начали вежливо да тактично лекцыи читать этому клону.

в надежде на "а вдруг все таки нет". Ошибся, признаю.


Цитата(100$ @ 9.07.2020 - 00:17) *
В этой связи у меня вопрос: форум - фсё?

Очень надеюсь, что нет. В "той" теме искренне описал свое отношение к этому форуму. И будет очень-очень жаль, если "фсё".

Кстати, с появлением короновируса на других форумах, особенно английских, наблюдался взрывной интерес к статметодам обработки информации касаемой этой проблемы. Ожидал, что и тут появится что-то интересное. Но нет. Это что - показатель состояния современного состояния мед. статистики на постсоветском пространстве?

  Форум: Медицинская статистика · Просмотр сообщения: #25919 · Ответов: 25 · Просмотров: 145398

passant
Отправлено: 8.07.2020 - 21:31





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Нет, коллеги. В данном случае - вы ошибаетесь. Это действительно вопрос, который сначала фигурировал на другом форуме и судя до форме его представления и ответах на вопросы -ТС действительно интересуется вопросом, просто еще не столь глубоко в теме, что-бы его корректно задать (ну что поделать, результаты активного маркетинга различных ускоренных курсов и прочего "с нуля до профи за 7 дней"). Но на мой взгляд помочь ТС, дать ему различные вИдения, в конце концов "наставить его на путь истинный" области МL - я считаю, это где-то наш долг. Поэтому и отвечаю по четвертому кругу. Я свое мнение ему уже высказал. Если будет ваша добрая воля и желание ТС - будет даже интересно узнать и ваше мнение на предмет.
А вот что-до " как скоро в этой теме появится один из бесчисленных клонов.... " я ожидал этого "явления" в соседней теме про анализ СOVID-19. Но, видать спугнули :-)
  Форум: Медицинская статистика · Просмотр сообщения: #25917 · Ответов: 25 · Просмотров: 145398

passant
Отправлено: 8.07.2020 - 11:30





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Уважаемый smeilz.

Что-то вы начинаете "путаться в показаниях". На другом форуме вы пишете:
Есть датасет с одним бинарным признаком(зависимой переменной) 0 или 1. Распределение 57/43
На этом:
Есть очень большая выборка для бинарной классификации. Нужно предсказать 2 класса(0/1)
Это как бы две совершенно разные задачи. В одном случае - обучение с учителем (т.е. датасет с признаком) , в другом - обучение без учителя (признака изначально нет).

Кроме того, вы так и не пояснили, что означает
поведение предсказываемых классов будет существенно отличаться.
как вы себе представляете "поведение класса"? В чем оно у час выражается?
Что такое "сегмент" и чем он в вашем представлении отличается от "класса". Подчеркну - "предсказываемых классов" ??

Что означает
Как грамотно найти эти сегменты и поделить выборку для дальнейшего предсказания?
Если вы разбиваете выборку на то-ли сегменты, то-ли классы, то что вы собираетесь предсказывать дальше?

Про кластеризацию, и ее возможное использование как предварительный этап классификации вам сказали что тут, что там. Но ясности как не было, так и нет.
И я еще раз повторю:
Поставьте четко задачу, а то создается все более уверенное впечатление, что вы вообще не очень понимаете, а что в итоге вам надо?
  Форум: Медицинская статистика · Просмотр сообщения: #25913 · Ответов: 25 · Просмотров: 145398

passant
Отправлено: 2.07.2020 - 17:21





Группа: Пользователи
Сообщений: 184
Регистрация: 27.04.2016
Пользователь №: 28223


Цитата(potap_O @ 2.07.2020 - 06:51) *
Мой родственник д.м.н., а не математик.

А я математик, а не "д.м.н". Правда, математик я "прикладной", но то таке. И как я понимаю, этой фразой вы пытаетесь меня унизить - т.е. есть великие "д.м.н", к которым за советом даже обратиться страшно, а есть какие-то "математики", которые - ну что о них вообще там думать, они ведь на столько тупы, что не понимают, что "COVID-19 очень опасная болезнь"

Цитата(potap_O @ 2.07.2020 - 06:51) *
И как эксперт ВАК он и рецензирует диссертации.

Я рад за вашего дядю, но думаю, что у многих завсегдатаев этого форума первая буква в их научных регалиях, то-же "д". Но даже если она и "к.", и даже если ее вообще нет, и не все они АЖ "эксперты ВАК", но люди, которые пользуются авторитетом и в офф-лайн сообществе и на этом зубастом форуме. И в отличии от вашего уважаемого дяди, который сквозь зубы цедит свое высочайшее мнение и не снисходит до его разъяснения черни, тут иногда дают такие советы, в том числе по математике и статистике, которые нигде по русскоязычных просторах интернета вы больше не получите.
И это с точки зрения общественной пользы - это на много выше, чем какие-то заскорузлые мнения какого-то там ВАКа.

Цитата(potap_O @ 2.07.2020 - 06:51) *
. И со временем эта болезнь может дойти до многих участников этого форума.

Как говориться,спасибо и вам на добром слове. Чего пожелаете другим, то - часто - возвращается и вам. С сторицей. Это не я, это народная мудрость так гласит.

Цитата(potap_O @ 2.07.2020 - 06:51) *
Почему же они и не рекомендуют мне производить продуктивные методы анализа моей базы данных?

Потому что вам никто ничем не обязан. Впрочем, а ваш великий дядя - он тоже не понимает опасности COVID, раз не пожелал рекомендовать вам производить (!!!!!) продуктивные (!?!?!) методы анализа?

Но вообще-то непонятно, чего вы хотите услышать-прочитать на форуме? Перечень "продуктивных" методов? Так они в любом учебнике по (мед)статистике для студентов какого-то там курса. Берем, читаем, разбираемся, натыкаемся на непонятку, приходим на форум С КОНКРЕТНЫМ вопросом и получаем СУПЕРКВАЛИФИЦИРОВНАНЫЙ ответ. На худой конец - выложите куда-нибудь вашу диссертацию, может у кого будет пару свободных часов, настроение и вдохновение, что-бы по примеру вашего дяди прочитать и раскритиковать вашу роботу, но в отличии от него - еще и что-то дельное подсказать. А как давать рекомендации относительно того, что никто кроме вас и вашего дяди не читал? Или вам тут кратко изложить методы многомерного анализа в трех параграфах? Или расчет доверительных интервалов для вас представляют непреодолимые трудности? Фраза "как можно сделать такие результаты." - я вообще возьму себе в загашник, буду ею пугать студентов.

Я тут общаюсь на нескольких форумах, которые вокруг статистики, машинного обучения и пр. Русско- и не только - язычных. Не знаю, как про опасность COVID - это путь врачи решают, но про вредное воздействие карантина на интеллектуальный уровень задаваемых на форумах вопросов - тут действительно впору скоро диссертации писать.
  Форум: Медицинская статистика · Просмотр сообщения: #25893 · Ответов: 16 · Просмотров: 147961

8 страниц V   1 2 3 > » 

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена