![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 9.03.2016 Пользователь №: 28049 ![]() |
Часто путают сущность ДИ для средних величин (это, как правило, дают разные калькуляторы и статистические программы) и ДИ, который рассчитывается по правилу трех сигм (или трех стандартных отклонений - S). Пожалуйста, объясните популярно, в чем разница. Как назвать ДИ, рассчитанный по правилу трех сигм? Его надо определять вручную или есть для этого калькуляторы? Буду очень благодарен!
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Часто путают сущность ДИ для средних величин (это, как правило, дают разные калькуляторы и статистические программы) и ДИ, который рассчитывается по правилу трех сигм (или трех стандартных отклонений - S). Пожалуйста, объясните популярно, в чем разница. Как назвать ДИ, рассчитанный по правилу трех сигм? Его надо определять вручную или есть для этого калькуляторы? Буду очень благодарен! Его можно назвать "интервалом шести сигм", или "диапазоном шести сигм". Такой стандарт и философия используются в промышленной статистике, но не в биостатистике. Поэтому, если ваши данные - биологические, коллеги вас не поймут. В биологии и медицине принято приводить доверительный интервал (ДИ), в подавляющем большинстве случаев - 95% ДИ (похоже только фармакологи предпочитают более либеральный 90% ДИ, но это скорее от лукавого, поскольку как раз им-то бы и следовало построже). В отличие от интервала +/- 3 сигмы такой ДИ: 1) Ближе к +/- 2 сигмы. 2) Зависит от объёма выборки. 3) Может быть рассчитан для любого распределения, а не только в предположении нормального или известного (для неизвестного может быть получен складным ножом или бутстрепом). |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 9.03.2016 Пользователь №: 28049 ![]() |
Его можно назвать "интервалом шести сигм", или "диапазоном шести сигм". Такой стандарт и философия используются в промышленной статистике, но не в биостатистике. Поэтому, если ваши данные - биологические, коллеги вас не поймут. В биологии и медицине принято приводить доверительный интервал (ДИ), в подавляющем большинстве случаев - 95% ДИ (похоже только фармакологи предпочитают более либеральный 90% ДИ, но это скорее от лукавого, поскольку как раз им-то бы и следовало построже). В отличие от интервала +/- 3 сигмы такой ДИ: 1) Ближе к +/- 2 сигмы. 2) Зависит от объёма выборки. 3) Может быть рассчитан для любого распределения, а не только в предположении нормального или известного (для неизвестного может быть получен складным ножом или бутстрепом). Вот такой пример из одной работы: Исследования выполнены на первокурсниках одного из университетов, возраст которых, по данным автора, 17-18 лет. Далее приводится средний их возраст M+/-m 18,20+/- 1,1 года (средняя +/-стандартная ошибка средней), n = 120. Насколько правдоподобны приведенные данные? Как это проверить? Расчеты показывают, что в этом случае S (стандартное отклонение) = 12,05, 95% ДИ для средней = 16,02 - 20,38, по правилу 3-х сигм при нормальном распределении 95% членов вариационного ряда должны попасть в интервал от -5,9 до 42,3. Правильным ли будет вывод о неправдоподобности приведенных в работе данных о возрасте обследованных? |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
Вот такой пример из одной работы: Исследования выполнены на первокурсниках одного из университетов, возраст которых, по данным автора, 17-18 лет. Далее приводится средний их возраст M+/-m 18,20+/- 1,1 года (средняя +/-стандартная ошибка средней), n = 120. Насколько правдоподобны приведенные данные? Как это проверить? Расчеты показывают, что в этом случае S (стандартное отклонение) = 12,05, 95% ДИ для средней = 16,02 - 20,38, по правилу 3-х сигм при нормальном распределении 95% членов вариационного ряда должны попасть в интервал от -5,9 до 42,3. Правильным ли будет вывод о неправдоподобности приведенных в работе данных о возрасте обследованных? Рождения соответствуют равномерному распределению. Два года --- поскольку это реальное поколение школьников. Есть не пошедшие учиться в школу родившиеся в декабре например, слишком молодые. Код > quantile(replicate(100000, mean(sample(c(18+((11:12)/12), 17+((1:10)/12)), 120, replace=T))), probs=c(0.025, 0.5, 0.975)) 2.5% 50% 97.5% 17.60347 17.70694 17.81806 > quantile(replicate(100000, sd(sample(c(18+((11:12)/12), 17+((1:10)/12)), 120, replace=T))), probs=c(0.025, 0.5, 0.975)) 2.5% 50% 97.5% 0.5092436 0.6012375 0.6762434 ![]() |
|
![]() |
![]() |
![]() ![]() |