Здравствуйте, гость ( Вход | Регистрация )
5.01.2022 - 14:55
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 97 Регистрация: 14.03.2006 Из: Москва Пользователь №: 870 |
Добрый день!
Вроде бы должна быть информация, но алгоритм ускользает. Можно помочь? Есть две выборки. Можно рассчитать уровень значимости, на котором средние статистически различны? На мой взгляд это и есть p-value. СПАСИБО! p.s. Критерий Стьюдента при ручном расчете в Excel 0.7. Сообщение отредактировал Choledochus - 5.01.2022 - 15:07
Прикрепленные файлы
|
|
|
![]() |
![]() |
![]() |
8.01.2022 - 16:37
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Позволю себе маленький оффтопик, учитывая, что в эту тему, похоже, заглядывают все, кто так сказать "в теме" - извините за тавтологию.
Я понимаю, 50 лет назад, когда рассчитать какую либо статистику на выборке объемом 1000 значений - это уже диссертация, а если еще и p_vаlue вычислить - то почти научный подвиг. В таких условиях, конечно, считать статистику сдвига среднего или масштаба - куда проще, чем анализировать однородность распределений выборок. Но вот сегодня, когда любой (практически) критерий - это вызов одной функции, которая еще и бонусом вернет p_value. А если готовой реализации не сыщется - то самому написать ее на любом доступном инструменте программирования под силу студенту-третьекурснику? Какой смысл "придерживаться" критериев анализа отдельных параметров выборки, если гораздо более точнее - анализировать всю выборку целиком? Ладно бы в системах реального времени, когда имеет значение принятие решения за несколько миллисекунд. А в медицине, экономике, финансах, маркетинге? Почему народ так "держится" старых и очень приблизительных методов, когда ответ можно получить с тем-же усилиями более точный и адекватный? Интересно услышать мнения специалистов, которые в "теме"? |
|
|
![]() |
![]() |
8.01.2022 - 18:22
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Позволю себе маленький оффтопик, учитывая, что в эту тему, похоже, заглядывают все, кто так сказать "в теме" - извините за тавтологию. Я понимаю, 50 лет назад, когда рассчитать какую либо статистику на выборке объемом 1000 значений - это уже диссертация, а если еще и p_vаlue вычислить - то почти научный подвиг. В таких условиях, конечно, считать статистику сдвига среднего или масштаба - куда проще, чем анализировать однородность распределений выборок. Но вот сегодня, когда любой (практически) критерий - это вызов одной функции, которая еще и бонусом вернет p_value. А если готовой реализации не сыщется - то самому написать ее на любом доступном инструменте программирования под силу студенту-третьекурснику? Какой смысл "придерживаться" критериев анализа отдельных параметров выборки, если гораздо более точнее - анализировать всю выборку целиком? Ладно бы в системах реального времени, когда имеет значение принятие решения за несколько миллисекунд. А в медицине, экономике, финансах, маркетинге? Почему народ так "держится" старых и очень приблизительных методов, когда ответ можно получить с тем-же усилиями более точный и адекватный? Интересно услышать мнения специалистов, которые в "теме"? Потому что параметры распределения также вызывают интерес. А то спросит вас на защите уважаемый оппонент или член Совета: "Ну а что там в среднем? Скорость клубочковой фильтрации увеличилась, ай нет?". А вы уважаемому вопрошающему про совпадение функций распределения... |
|
|
![]() |
![]() |
8.01.2022 - 19:12
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Потому что параметры распределения также вызывают интерес. А то спросит вас на защите уважаемый оппонент или член Совета: "Ну а что там в среднем? Скорость клубочковой фильтрации увеличилась, ай нет?". А вы уважаемому вопрошающему про совпадение функций распределения... Ну, это понятно, хотя мне быть спрошенным уважаемым профессором уже не грозит :-). Я больше интересуюсь с практической, ну и немного абстрактно-философской точки зрения. Зачем решать частную (частные) задачи, если по сложности не проще, а по точности результата - не лучше, чем решать общую? P.S. Немного еще поразмыслил над вашим ответом - и вот родилось такое предположения. Я смотрю на задачу с точки зрения динамики текущего мониторинга - обнаружить момент, когда в объекте (организме ?) происходят некие изменения. А врачи - с точки зрения статики оценки результата: есть ли вероятность того, что значение некоторого параметра в результате воздействия (лечения) измениться или нет. Возможно - это один из факторов. А еще? Сообщение отредактировал passant - 8.01.2022 - 19:21 |
|
|
![]() |
![]() |
8.01.2022 - 20:05
Сообщение
#5
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Я больше интересуюсь с практической, ну и немного абстрактно-философской точки зрения. Зачем решать частную (частные) задачи, если по сложности не проще, а по точности результата - не лучше, чем решать общую? Любой статистический критерий, сконструированный для решения задач самого общего вида, будет уступать по мощности критериям, сконструированным для тестирования конкретных альтернатив. Это - раз. Желательно, чтобы для критерия вероятность отвергнуть нулевую гипотезу в случае, когда она неверна, -> 1. Так рождается понятие состоятельности критерия. Скажем, по "косвенным признакам", я знаю, что в случае тестирования гипотезы самого общего вида критерии Смирнова и Лемана-Розенблатта являются состоятельными. А вот про критерии Катценбайссера - Хакля или Эппса - Синглтона я того же сказать не могу. Значит, надо, обложившись оригинальными статьями, выяснять это. А пока этого не сделано, лихо тестировать ими гипотезы не резон: осадок остается... Это - второй раз. Цитата Я смотрю на задачу с точки зрения динамики текущего мониторинга - обнаружить момент, когда в объекте (организме ?) происходят некие изменения. На эту тему отказываюсь говорить, так как вы еще не отчитались о проделанной в этом направлении работе. ) Цитата А врачи - с точки зрения статики оценки результата: есть ли вероятность того, что значение некоторого параметра в результате воздействия (лечения) изменит В отношении врачей все не так: уж там-то мониторинг состояния происходит вовсю. Дисперсионный анализ для связанных выборок, критерии Фридмана и Пейджа у меня не пылятся - рекомендую налево и направо... Сообщение отредактировал 100$ - 8.01.2022 - 20:15 |
|
|
![]() |
![]() |
8.01.2022 - 21:45
Сообщение
#6
|
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Желательно, чтобы для критерия вероятность отвергнуть нулевую гипотезу в случае, когда она неверна, -> 1. Так рождается понятие состоятельности критерия. Скажем, по "косвенным признакам", я знаю, что в случае тестирования гипотезы самого общего вида критерии Смирнова и Лемана-Розенблатта являются состоятельными. А вот про критерии Катценбайссера - Хакля или Эппса - Синглтона я того же сказать не могу. Значит, надо, обложившись оригинальными статьями, выяснять это. А пока этого не сделано, лихо тестировать ими гипотезы не резон: осадок остается... Это - второй раз. Согласен. Может у меня просто глаз замылин, но в той предметной области, с которой мне приходиться дело иметь ошибки первого рода так-же нежелательны, как и ошибки второго рода. Ну или почти также. И каждый раз приходиться искать жесткий компромисс. На эту тему отказываюсь говорить, так как вы еще не отчитались о проделанной в этом направлении работе. ) Ух ты, не забыли :-). Процесс идет, не так быстро, как хотелось бы, но движется. Сейчас вот погрузился в многомерную проверку гипотез. Еще и (хотелось бы) при наличии корреляции между признаками. И связь всего этого с ансамблевыми методами обучения. И там пока "застрял". Мне важно не просто "написать очередную статью", а довести решение до программного продукта. А это ох как не просто. И отнимает много сил. И времени. А его критически не хватает. В отношении врачей все не так: уж там-то мониторинг состояния происходит вовсю. Дисперсионный анализ для связанных выборок, критерии Фридмана и Пейджа у меня не пылятся - рекомендую налево и направо... Интересно. Дисперсионный анализ для Change Point Detection? Мне казалось, что он все-таки не для временнЫх рядов. Надо подумать. Сообщение отредактировал passant - 8.01.2022 - 21:47 |
|
|
![]() |
![]() |
8.01.2022 - 22:00
Сообщение
#7
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Интересно. Дисперсионный анализ для Change Point Detection? Мне казалось, что он все-таки не для временнЫх рядов. Надо подумать. А зачем мне этот самый point, если у меня пациенты взяты в исследование в точке t0, а затем наблюдаются ч/з 6 мес (t6), 9 мес (t9) и 12 мес (t12)? Вы мне еще этот ряд на стационарность предложите проверить... Вот и проверяем линейные контрасты t0 vs t6. Можем под настроение и критерием Даннетта сравнить с первой группой. Сообщение отредактировал 100$ - 8.01.2022 - 22:17 |
|
|
![]() |
![]() |
Choledochus p-value в Excel или SPSS 5.01.2022 - 14:55
100$ А в чем проблема-то?
Дисперсии статистически нера... 5.01.2022 - 16:41
Choledochus Цитата(100$ @ 5.01.2022 - 16:41... 5.01.2022 - 17:31
100$ Цитата(Choledochus @ 5.01.2022 - 17... 5.01.2022 - 17:32
Choledochus Можно про тест Клотца пару слов?
Почитал Айвазяна,... 6.01.2022 - 11:43
Игорь Цитата(Choledochus @ 6.01.2022 - 11... 6.01.2022 - 12:56
100$ Цитата(Choledochus @ 6.01.2022 - 11... 6.01.2022 - 14:31
Choledochus Как раз эти страницы "изучал". 6.01.2022 - 22:59
cardio70 Цитата(Choledochus @ 5.01.2022 - 14... 5.01.2022 - 16:45
Choledochus Спасибо, Игорь! С праздниками. 6.01.2022 - 13:24
Диагностик Посмотрите критерий Лемана-Розенблатта. Проверяет ... 7.01.2022 - 11:12
Игорь Хотелось заострить внимание на вопросе эквивалентн... 7.01.2022 - 13:54
100$ Цитата(Диагностик @ 7.01.2022 - 11:1... 7.01.2022 - 14:07
Диагностик Цитата(100$ @ 7.01.2022 - 19:07... 8.01.2022 - 01:58
100$ Цитата(Диагностик @ 8.01.2022 - 01:5... 8.01.2022 - 12:09
passant Цитата(100$ @ 8.01.2022 - 21:00... 8.01.2022 - 22:35
100$ Цитата(passant @ 8.01.2022 - 22:35) ... 9.01.2022 - 00:59
passant Цитата(100$ @ 8.01.2022 - 23:59... 9.01.2022 - 01:13
100$ Цитата(passant @ 9.01.2022 - 01:13) ... 9.01.2022 - 02:04
Диагностик Цитата(100$ @ 8.01.2022 - 17:09... 9.01.2022 - 02:24
100$ Цитата(Диагностик @ 9.01.2022 - 02:2... 9.01.2022 - 13:00
Диагностик Цитата(100$ @ 9.01.2022 - 18:00... 9.01.2022 - 13:12
100$ Цитата(Диагностик @ 9.01.2022 - 13:1... 9.01.2022 - 13:20
passant Цитата(Диагностик @ 9.01.2022 - 12:1... 9.01.2022 - 13:51
Игорь ICMJE сообщает http://www.icmje.org/recommendation... 8.03.2022 - 07:50![]() ![]() |