Автор: Anna_V 30.06.2019 - 08:08
Добрый день! Подскажите, пожалуйста, если можно с ссылками на литературу, при описании результатов в статье/диссертации требуется приводить значение самого критерия, или можно указывать только значение P?
Автор: nokh 1.07.2019 - 07:58
Цитата(Anna_V @ 30.06.2019 - 10:08)
Добрый день! Подскажите, пожалуйста, если можно с ссылками на литературу, при описании результатов в статье/диссертации требуется приводить значение самого критерия, или можно указывать только значение P?
Меня учили, что в результатах, опирающихся на статистический критерий нужно приводить все три меры: 1) значение статистики критерия, 2) степени свободы или объёмы выборок (в зависимости от критерия), 3) Р-значение. Если не привести все три меры, то статистическая выкладка перестаёт служить таковой или вообще теряет свой подтверждающий тезу смысл и может указывать на безграмотность исследователя. Например, в зависимости от числа степеней свободы критерий хи-квадрат=5,05 может иметь совершенно различные значения Р, а если человек просто напишет, что Р=0,014, то где дополнительные гарантии, что он не ошибся в расчётах или что вообще что-то считал. А если автор пишет, что просто P<0,05, то этот человек вызывает подозрения вдвойне, т.к. такая форма указывает на то, что и статей по своей тематике он не читает (по крайней мере хороших).
Примеры можно найти в учебниках по биостатистике Сокала и Рольфа, Зара, а также в разделах описания результатов в кн. Ланг, Сесик (2011) - Как описывать статистику в медицине, она есть в сети. Также посмотрите штук 12 лучших статей по своей тематике, имеющих доказательства, основанные на статистике (не обзоров). Штуки 3-4 из них будут содержать все 3 показателя. Хотя в последнее время их число сокращается, т.к. сейчас более часто используют точные рандомизационные (перестановочные, permutation) критерии или рандомизационные критерии Монте-Карло, в которых Р-значение вычисляется напрямую, без опоры на известные статистические распределения.
Но бывают случаи, когда проверок очень много и приведение всех трёх мер сильно загромождает работу, делая её похожей на черновик со статистическими выкладками. Лично я в таких случаях могу ограничиться приведением только Р-значения в таблицах, но при обсуждении каких-то из них в тексте даю полную выкладку, чтобы люди видели, что я знаю как нужно, но объём статьи не позволяет.
Прикрепил хорошие рекомендации Ланга и Альтмана. Про 3 меры есть, например при описании результатов дисперсионного анализа (ANOVA).
Автор: Anna_V 2.07.2019 - 18:39
Огромное Вам спасибо. У статьи Ланга и Альтмана есть перевод на русский, на всякий случай выложу, мало ли кому пригодится
Автор: ogurtsov 3.07.2019 - 13:23
Цитата(nokh @ 1.07.2019 - 07:58)
Меня учили, что в результатах, опирающихся на статистический критерий нужно приводить все три меры: 1) значение статистики критерия, 2) степени свободы или объёмы выборок (в зависимости от критерия), 3) Р-значение. Если не привести все три меры, то статистическая выкладка перестаёт служить таковой или вообще теряет свой подтверждающий тезу смысл и может указывать на безграмотность исследователя. Например, в зависимости от числа степеней свободы критерий хи-квадрат=5,05 может иметь совершенно различные значения Р, а если человек просто напишет, что Р=0,014, то где дополнительные гарантии, что он не ошибся в расчётах или что вообще что-то считал.
Ничего, кроме p-значения, названия критерия и используемого уровня значимости, для интерпретации результатов не нужно. Никакие степени свободы и значения статистик не могут повысить доверие или что-то гарантировать, поскольку их все можно как написать "от фонаря" (только степени свободы подогнать под размер выборки), так и тщательно сфальсифицировать. Гарантии дает только оформление исследования как воспроизводимого, то есть с предоставлением всех данных, SAP-а и скрипта для всех этапов анализа и генерации отчета.
Автор: nokh 3.07.2019 - 21:26
Цитата(ogurtsov @ 3.07.2019 - 15:23)
Ничего, кроме p-значения, названия критерия и используемого уровня значимости, для интерпретации результатов не нужно. Никакие степени свободы и значения статистик не могут повысить доверие или что-то гарантировать, поскольку их все можно как написать "от фонаря" (только степени свободы подогнать под размер выборки), так и тщательно сфальсифицировать. Гарантии дает только оформление исследования как воспроизводимого, то есть с предоставлением всех данных, SAP-а и скрипта для всех этапов анализа и генерации отчета.
Если у вас есть ссылки на соответствующие рекомендации, поделитесь ими, пожалуйста, с топикстартером. Мне по этой теме дискутировать не интересно. Остаюсь при своём мнении
.
Автор: ogurtsov 5.07.2019 - 11:03
Цитата(nokh @ 3.07.2019 - 21:26)
Если у вас есть ссылки на соответствующие рекомендации, поделитесь ими, пожалуйста, с топикстартером. Мне по этой теме дискутировать не интересно. Остаюсь при своём мнении
.
https://en.wikipedia.org/wiki/Reproducibility#Reproducible_research
https://www.coursera.org/lecture/reproducible-research/what-is-reproducible-research-about-FvOGB
А тестовые статистики и степени свободы оставьте в 80-х вместе с таблицами критических значений.