ещё ликбез по выборкам - Форум врачей-аспирантов

ещё ликбез по выборкам

Опции

kont

8.06.2016 - 01:20

Сообщение #1

Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005

Подскажите, есть ли смысл в зависимой выборке? Вернее лучше сказать в тестах для зависимых выборок.
например. рис 1
стандартная подача для т-теста для зависимых выборок до-после
правее стандартная подача для т-теста для независимых выборок
Вопрос. А почему нельзя обходится только форматом независимых выборок? Измерил сегодня, измерил завтра. Сделал один столбец(группирующая переменная)
день измерения
сегодня
завтра
сегодня
завтра
сегодня
завтра
сегодня
завтра
сегодня
завтра

получил динамику, т.е. сравнение средних.Если я что-то недопонимаю, прошу строго не судить.

Можно углубить вопрос. Зачем нужен Анова, если все равно требуется ПостХок со странными критериями(Шеффе, Дункан, Даннет, Тьюки....) Если можно просто сделать несколько раз сравнение тем же т-тестом. Например, если у нас 4 выборки
1-2
1-3
1-4
2-3
2-4
3-4
Вот и весь постхок был бы.

Эскизы прикрепленных изображений

Ответить с цитированием данного сообщения

p2004r Просмотр профиля	8.06.2016 - 09:44 Сообщение #2
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(kont @ 8.06.2016 - 01:20) Подскажите, есть ли смысл в зависимой выборке? Вернее лучше сказать в тестах для зависимых выборок. например. рис 1 стандартная подача для т-теста для зависимых выборок до-после правее стандартная подача для т-теста для независимых выборок Вопрос. А почему нельзя обходится только форматом независимых выборок? Измерил сегодня, измерил завтра. Сделал один столбец(группирующая переменная) день измерения сегодня завтра сегодня завтра сегодня завтра сегодня завтра сегодня завтра получил динамику, т.е. сравнение средних.Если я что-то недопонимаю, прошу строго не судить. Можно углубить вопрос. Зачем нужен Анова, если все равно требуется ПостХок со странными критериями(Шеффе, Дункан, Даннет, Тьюки....) Если можно просто сделать несколько раз сравнение тем же т-тестом. Например, если у нас 4 выборки 1-2 1-3 1-4 2-3 2-4 3-4 Вот и весь постхок был бы. Мыслить категориями "групп" (а не "выборок") крайне вредно. Уже эти два понятия путаются как видим. Если вспомнить, что выборка на самом деле не совсем выборка, то у "связанных выборок" есть дополнительная информация в виде "объект наблюдения" и "факт воздействия". Для этого достаточно представить данные в нормальном "длинном формате". Если кратко излагать "почему не множественные сравнения", то: вариация в выборке это "одеяло", и его "по отдельности" легко можно натянуть "то на голову, то на ноги", но вот если "одеяло коротковато", то одновременно натянуть его и на голову и на ноги не получиться... придется "урезать осетра гипотезы" http://r-statistics.livejournal.com/

kont Просмотр профиля	8.06.2016 - 15:04 Сообщение #3
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005	p2004r, а что всякие Шеффе......Тьюки удлиняют одеяло, что и на голову и на ноги хватило?))

p2004r Просмотр профиля	8.06.2016 - 16:09 Сообщение #4
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(kont @ 8.06.2016 - 15:04) p2004r, а что всякие Шеффе......Тьюки удлиняют одеяло, что и на голову и на ноги хватило?)) "Группы" это зло. Если понимать, что это просто подогнанная к данным наилучшим образом модель, то понятен "подспудный смысл" постхок --- посмотреть на данные (вместе с подогнанной моделью) под таким углом, когда видна только интересующая нас "разница между группами". Сообщение отредактировал p2004r - 8.06.2016 - 19:55 http://r-statistics.livejournal.com/

DoctorStat Просмотр профиля	8.06.2016 - 22:26 Сообщение #5
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(kont @ 8.06.2016 - 01:20) Подскажите, есть ли смысл в зависимой выборке? А почему нельзя обходится только форматом независимых выборок? Как заметил р2004, зависимые выборки по сравнению с независимыми содержат дополнительную информацию об изменении показателя для каждого пациента. Эта дополнительная информация позволяет повысить мощность критерия, т.е. найти отличия там, где независимая выборка их не находит. См.Гланц "Мед.био статистика", глава 9 "Анализ повторных измерений" Сообщение отредактировал DoctorStat - 8.06.2016 - 22:27 Просто включи мозги => http://doctorstat.narod.ru

kont Просмотр профиля	10.06.2016 - 21:37 Сообщение #6
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005	Коллеги, а я ещё запутался в терминологии Среднеквадратичная ошибка среднего это показатель точности оценки среднего выборки или теоретическое стандартное отклонение всех средних выборки размера просто, как сказано на портале Statsoft. Ну, например, пусть среднее М=45, RMSE=1,7 как это интерпретировать это Rmse?

p2004r Просмотр профиля	11.06.2016 - 09:26 Сообщение #7
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(kont @ 10.06.2016 - 21:37) Коллеги, а я ещё запутался в терминологии Среднеквадратичная ошибка среднего это показатель точности оценки среднего выборки или теоретическое стандартное отклонение всех средних выборки размера просто, как сказано на портале Statsoft. Ну, например, пусть среднее М=45, RMSE=1,7 как это интерпретировать это Rmse? Код > runif(10) [1] 0.15777836 0.33600955 0.64628139 0.49859762 0.95817068 0.05088469 [7] 0.57508005 0.95273789 0.07290973 0.81564387 > data <- runif(1000) > mean(data) [1] 0.4929045 > sd(data) [1] 0.2900703 > sd(data)/(1000)^0.5 [1] 0.009172827 > sd(replicate(1000000, mean(sample(data, replace=T)))) [1] 0.00918224 Сомнений не осталось? http://r-statistics.livejournal.com/

kont Просмотр профиля	12.06.2016 - 23:59 Сообщение #8
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005	у меня на этом месте sd(replicate(1000000, mean(sample(data, replace=T)))) зависает R) Ну ладно, винду может переустановить нужно. А почему мы стандартное отклонение делим на 1000^0,5 1000 это у нас нагенерено случайным образом наблюдение(выборка), но почему в степени 0.5?

p2004r Просмотр профиля	13.06.2016 - 06:32 Сообщение #9
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(kont @ 12.06.2016 - 23:59) у меня на этом месте sd(replicate(1000000, mean(sample(data, replace=T)))) зависает R) Ну ладно, винду может переустановить нужно. А почему мы стандартное отклонение делим на 1000^0,5 1000 это у нас нагенерено случайным образом наблюдение(выборка), но почему в степени 0.5? 1000 это размер выборки случайных чисел, а ^0.5 это корень квадратный --- всё вместе оценка стандартного отклонения среднего арифметического. http://r-statistics.livejournal.com/

DoctorStat Просмотр профиля	13.06.2016 - 10:00 Сообщение #10
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(kont @ 10.06.2016 - 21:37) Коллеги, а я ещё запутался в терминологии Среднеквадратичная ошибка среднего это показатель точности оценки среднего выборки или теоретическое стандартное отклонение всех средних выборки размера просто, как сказано на портале Statsoft. Ну, например, пусть среднее М=45, RMSE=1,7 как это интерпретировать это Rmse? Я не большой специалист в программе Statsoft, но википедия говорит, что root-mean-square error (RMSE) - это выборочная, а не теоретическая оценка дисперсии среднего. Стентон Гланц в книге "Мед-био статистика" в главе "Как описать данные" обозначает эту величину как: s_x=s/sqrt(n) Это значит, что среднее значение совокупности с вероятностью 95% заключено в интервале: [ M - 2sqrt(RMSE), M + 2sqrt(RMSE) ] Сообщение отредактировал DoctorStat - 13.06.2016 - 10:09 Просто включи мозги => http://doctorstat.narod.ru

kont Просмотр профиля	14.06.2016 - 16:50 Сообщение #11
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005	Теперь стало яснее))

« Предыдущая тема · Медицинская статистика · Следующая тема »