Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Диагностика и прогнозирование
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
brimal
Не совсем обычная просьба. Типовая задача: провести анализ имеющихся параметров и результатов уже реализованных процессов с целью определения результата будущего процесса для данного набора параметров, т.е. диагностика/прогнозирование. Процесс не совсем обычный. Многофакторный,часть из которых имеет случайный характер. Применен метод, позволивший получать приемлемые результаты. Хочется проверить всеядность используемого метода, т.е. применимость к системам в другой области.
Медицина также имеет дело с многофакторными системами, где диагностика типовая задача.
Просьба. Если кто то выделит время и предложит выборку хотя бы 10 случаев из своей практики, каждый из которых включает набор параметров для анализа и результат, подтвержденный практикой, будем очень признательны.
Количество параметров в наборе не более 12. Допустимо ограниченное количество (2-3)
параметров в бинарной шкале (Да/Нет),остальные в количественной.(Наш опыт работы с параметрами в порядковой шкале пока ограничен). Наборы параметров без пропусков. Результаты в бинарной шкале (Да/Нет). В выборке должны присутствовать результаты обоих видов. Все в обезличенной форме. (Желательно избыточное с вашей точки зрения
количество параметров наборе. Мы встретились с ситуацией когда априорное ранжирование параметров по важности оказалось ошибочным). Далее пример выборки из двух наборов.
Пар.1 Пар.2 Пар.3 Пар.4 Пар.5 Пар.6 Пар.7 Рез-т
Набор1 Нет -0,786 -0,786 Нет 0,344828 0,482759 1 Да
Набор2 Да -0,655 -0,207 Да 0,2 -0,16667 -0,5 Нет
Спасибо.
Игорь
Есть тестовые наборы данных для машинного обучения - специально для тестирования алгоритмов и ПО. Ниже ссылки на обзоры проблемы.
Тестовые наборы данных https://habr.com/ru/companies/edison/articles/480408/
Медицинские наборы https://habr.com/ru/articles/718438/ и https://webiomed.ru/blog/obzor-otkrytykh-is...ogo-obucheniia/
ИНО
Учить модель на 10 многомерных наблюдениях? Ёк shok.gif
brimal
Потому и интерес из любопытства появился попробовать на других системах.А так сами удивляемся. Видать у детеныша IQ высокий,гены хорошие.
Да,а как с выборкой? Ползать по справочникам у нас времени нет,да и образование не позволяет. Где мы и где медицина.
Можно подумать,что каждый день предлагают апробировать метод,работающий с разнородными данными и без узкой специализации как ИИ.
Ладно, мы согласные. Можете еще немного разбавить порядковой шкалой. Только тогда немного как то опишите ее.
ИНО
Что Вы подразумеваете под разнородными данными? Что Вы подразумеваете под "узкой специализацией ИИ"? Пока что с первым не шибко радужно, судя по описанию:
Цитата
Количество параметров в наборе не более 12. Допустимо ограниченное количество (2-3)
параметров в бинарной шкале (Да/Нет),остальные в количественной.(Наш опыт работы с параметрами в порядковой шкале пока ограничен) Наборы параметров без пропусков. Результаты в бинарной шкале (Да/Нет).

Например, банальный случайный лес Бреймана прожует без проблем несколько тысяч предикторов, измеренных в любых шкалах, даже при p>>n. А у Вас такие жесткие ограничения, что
получить хотя бы просто p>n действительно можно только на выборке из 10 (на крайняк - 11) случаев.

Ну, допустим, Вы обучите вашу ноу-хау чудо-модель на выборке из 10 наблюдений, любезно предоставленных доктором Х. А на чем проверять будете? Или Вы эту бигдату:) планируете еще и разделять на обучающую и проверочную? shok.gif
Цитата
Ползать по справочникам у нас времени нет,да и образование не позволяет. Где мы и где медицина.

Тю, а все те, кто мучает ирисы Фишера, обязаны были закончить биофак по специальности "Ботаника" lol.gif
Игорь
Нашел в своих заметках. Может, пригодится топикстартеру.

Если вы составляете научное программное обеспечение, то нуждаетесь в реальных данных для его тестирования. Кроме того, эти данные могут использоваться в соответствующем учебном процессе для выполнения лабораторных и курсовых работ. Ниже список репозиториев таких данных:
1. Statistical Datasets. University of Massachusetts Amherst.
http://www.umass.edu/statdata/statdata/index.html
2. UCI Machine Learning Repository. University of California Irvine.
https://archive.ics.uci.edu/ml/datasets.html
3. SILSO data/image, Royal Observatory of Belgium, Brussels.
http://sidc.oma.be/silso/datafiles
4. Официальная статистика. Федеральная служба государственной статистики.
http://www.gks.ru
5. Data base UIS.Stat. Университет статистики UNESCO.
http://www.uis.unesco.org
6. Банк данных Глобальной обсерватории здравоохранения. Всемирная организация здравоохранения.
http://www.who.int/gho/database/ru/
7. The World Factbook. Центральное Разведывательное Управление.
https://www.cia.gov/library/publications/the-world-fa..
8. United Nations Data. United Nations Statistics Division.
http://data.un.org
9. WEB аналитика
http://gs.statcounter.com
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.