Какие выборки считаются связанными |
Здравствуйте, гость ( Вход | Регистрация )
Какие выборки считаются связанными |
4.12.2011 - 17:40
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Ну ну... "глупость" это лонгитудинальное наблюдение считать независимым от времени. И _никакой_ учтенный фактор "по годам" природу модели в части зависимости значения текущего года от предыдущего не изменит (да и сам скорее всего будет зависим от своих предыдущих по времени значений). Вообще-то все началось с вопроса о том, что такое связанные выборки. Может быть Stef'е надо всего лишь проверить однородность мат. ожиданий для двух городов, и она просто хочет узнать, каким критерием Стьюдента все это тестить применительно к своей задаче. Не могли бы Вы в качестве небольшой любезности сообщить, что это за листинги вы повесили в постах 4, 5 и 7? Заранее спасибо за снисходительные комментарии. Сообщение отредактировал 100$ - 4.12.2011 - 17:41 |
|
4.12.2011 - 18:08
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Не могли бы Вы в качестве небольшой любезности сообщить, что это за листинги вы повесили в постах 4, 5 и 7? Заранее спасибо за снисходительные комментарии. 1. Это листинги на языке R ( http://cran.r-project.org/ ). Этот язык собственно и разработали что бы не описывать алгоритм обработки данных на естественном языке (ввиду того что каждый понимает его по своему). Моё личное наблюдение заключается в том, что описание своих идей и советов на таком искусственном языке позволяет из области пенисометрии сместить нить дискуссии в область собственно метрологии. 2. Вы принципиально не ходите по ссылкам? Раз наблюдение проводится лонгитудинально над двумя объектами, то и методика должна этот факт учитывать. Повторные измерения одних и тех же объектов позволяет учесть Mixed model. Цитата Книга (на простом английском языке) с описание методик анализа лежит здесь http://lme4.r-forge.r-project.org/book/ В меру своих сил то, что изложено в книге я применил к данным этого обсуждения. Сообщение отредактировал p2004r - 4.12.2011 - 18:12 |
|
4.12.2011 - 18:50
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата 1. Моё личное наблюдение заключается в том, что описание своих идей и советов на таком искусственном языке позволяет из области пенисометрии сместить нить дискуссии в область собственно метрологии. Мое личное наблюдение заключается в следующем: 1. Хронологически Вы присоединились к беседе раньше меня. 2. Автор темы, судя по нику - женска полу. Так это Вы с ней собирались заняться пенисометрией? Извините, если (непреднамеренно) отвлек. Цитата 2. Вы принципиально не ходите по ссылкам? Раз наблюдение проводится лонгитудинально над двумя объектами, то и методика должна этот факт учитывать. Повторные измерения одних и тех же объектов позволяет учесть Mixed model. Не то, чтобы принципиально, просто пока мне не сообщили, что от меня хотят, незачем беспокоиться. Это могут быть и панельные данные, и многомерный временной ряд, и просто задачка на сравнение двух выборочных средних. Поживем - узнаем. |
|
4.12.2011 - 20:03
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Мое личное наблюдение заключается в следующем: 1. Хронологически Вы присоединились к беседе раньше меня. 2. Автор темы, судя по нику - женска полу. Так это Вы с ней собирались заняться пенисометрией? Извините, если (непреднамеренно) отвлек. Вы сексист? Иначе не понятно почему Вы отказываете прекрасной половине человечества в амбициозности Вообще наиболее амбициозные люди которые мне попадались были женщинами (моя выборка конечно не репрезентативна ). Более того скажу, если не являешься объектом упражнения в амбициозности таких женщин, так даже очень ничего такое поведение добавляет им шарма. Что характерно мужчины с такой особенностью поведения как правило выглядят почему то смешно . PS А книжку бы почитали, с удовольствием услышал бы Ваше мнение о изложенном в ней методе. |
|
5.12.2011 - 05:44
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 33 Регистрация: 31.07.2008 Пользователь №: 5185 |
Спасибо большое?действительно спасибо.
Буду сидеть читать, пытаться разобраться. На самом деле задача состоит в том, чтобы сказать больше всё-таки этих несчастных койко-мест в городе 2, чем в городе 1, или нет. Притом такая задача у меня возникает постоянно, когда надо сравнивать показатели в динамике в двух городах, например болезненность населения, смертность, рождаемость и т.д. При этом часто данные показатели необходимо сравнить и внутри одного города по разным группам, например болезненность мужчин и женщин, уровень инвалидизации в разных возрастных группах и т.д. Почему-то вся литература, которую я нашла, направлена на описание методов применительно к клиническим исследованиям - группа опыта, группа контроля. Если кто-то порекомендует книгу про анализ показателей здравоохранения в рамках города, региона и т.д. буду очень признательна. Я училась на информатика в сфере управления и у нас был только один курс статистики за всё время обучения, да и то на уровне что такое дисперсия и что такое среднее, а работать приходится как раз в сфере статистики и анализа (притом работа очень нравится). Читаю книги, но, к сожалению, почему-то не хватает ясности и четкости, что и когда надо делать и желательно с объяснением, почему это надо делать. С удовольствием прошла бы курсы по статистике и анализу, но в городе таковых нет, дистанционные курсы есть у Леонова, но цена этих курсов, к сожалению, для меня неподъемная. Поэтому буду рада любой помощи: ссылкам на статьи, книги, курсы? еще раз спасибо всем большое. |
|
5.12.2011 - 11:18
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Спасибо большое?действительно спасибо. Буду сидеть читать, пытаться разобраться. На самом деле задача состоит в том, чтобы сказать больше всё-таки этих несчастных койко-мест в городе 2, чем в городе 1, или нет. Притом такая задача у меня возникает постоянно, когда надо сравнивать показатели в динамике в двух городах, например болезненность населения, смертность, рождаемость и т.д. Поэтому буду рада любой помощи: ссылкам на статьи, книги, курсы? еще раз спасибо всем большое. Тогда можно поступить следующим образом (не желая усложнять Вам жизнь): два разных города - это две независимые выборки. Тестируете критерием Стьюдента для независимых выборок (или критерием Крамера-Уэлча в терминологии проф. Орлова). Если сравнивать показатели койко-мест в динамике - то для двух этих временных рядов просто посчитайте цепные и базисные темпы роста (прироста) Не забудьте также средний темп роста (прироста) по формуле средней геометрической. И для одного из рядов (у которого средний темп окажется выше) посчитать т.н. коэффициент опережения. Успехов! Сообщение отредактировал 100$ - 5.12.2011 - 11:40 |
|
5.12.2011 - 11:59
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Тогда можно поступить следующим образом (не желая усложнять Вам жизнь): два разных города - это две независимые выборки. Тестируете критерием Стьюдента для независимых выборок (или критерием Крамера-Уэлча в терминологии проф. Орлова). Код > plot(density(data$"Город 1")) > rug(data$"Город 1") > plot(density(data$"Город 2")) > rug(data$"Город 2") А я бы не сравнивал это Стьюдентом. |
|
5.12.2011 - 12:34
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
А я бы не сравнивал это Стьюдентом. Скажу Вам как родному: я бы тоже не стал. Поэтому и упомянул Крамера с Уэлчем. Однако вопрос имею. Судя по данным, во втором городе значения явно выше, чем в первом. Интересно, почему при оценке плотности распределения (density) для второго города ширина окна (bandwidth=,0146) меньше, чем для первого (h=,292)? Можно ли в R задавать пользовательское значение этого параметра? P.S. Подозреваю, что если оценить плотность для второго города с параметром h=0,5, то картинка будет, как на первом графике. Такая же одномодальная. Сообщение отредактировал 100$ - 5.12.2011 - 12:44 |
|
5.12.2011 - 13:00
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Скажу Вам как родному: я бы тоже не стал. Поэтому и упомянул Крамера с Уэлчем. Однако вопрос имею. Судя по данным, во втором городе значения явно выше, чем в первом. Интересно, почему при оценке плотности распределения (density) для второго города ширина окна (bandwidth=,0146) меньше, чем для первого (h=,292)? Можно ли в R задавать пользовательское значение этого параметра? P.S. Подозреваю, что если оценить плотность для второго города с параметром h=0,5, то картинка будет, как на первом графике. Такая же одномодальная. "Ты Зин на грубость нарываешься" (С) юбилей у Поэта однако Ваши подозрения напрасны, вот картинка с одинаковым окном (вдобавок ядро сглаживания соответсвует самым современным воззрениям сглаживателей, Venables, W. N. and Ripley, B. D. (2002) "Modern Applie Statistics with S". New York: Springer.). Я точно не советую сравнивать это Стьюдентом, да и любым другим параметрическим критерием тоже. |
|
5.12.2011 - 13:53
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
"Ты Зин на грубость нарываешься" (С) юбилей у Поэта однако Ваши подозрения напрасны, вот картинка с одинаковым окном (вдобавок ядро сглаживания соответсвует самым современным воззрениям сглаживателей, Venables, W. N. and Ripley, B. D. (2002) "Modern Applie Statistics with S". New York: Springer.). Я точно не советую сравнивать это Стьюдентом, да и любым другим параметрическим критерием тоже. 2004-й ну не в службу, а в дружбу, ответьте на заданные вопросы, а? А то Вы только на постскриптумы реагируете. |
|
5.12.2011 - 14:08
Сообщение
#26
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
2004-й ну не в службу, а в дружбу, ответьте на заданные вопросы, а? А то Вы только на постскриптумы реагируете. 1. какие вопросы? в заголовке рисунка полная строка которой построен график. параметр называется adjust= , на него умножается расчитанное по канону (заметьте что не от балды взятое, а вычисленное оптимальным образом) окно. задача не корректная и параметр регуляризации надо вычислять а не брать с потолка. и этим параметром обычно уменьшают вычисленное окно, что бы увидеть как "расползается" решение, а не увеличивают. 2. если вопросы топикстартера, то вот ищу (час уже убил) книгу по западному здравоохранению и принятой там статистике показателей клиники. но с современными гигантскими дисками это нереально ... помню читал, помню что не удалял.... но где она думаю топикстартеру проще в поисковиках поискать литературу о медицинской статотчетности и какие показатели каноничны в этой области. PS а смешанную модель для средних я в самом начале посчитал (даже в нескольких вариантах). там сразу видна разница между городами и доверительный интервал для уровней обеспеченности в городах. |
|
5.12.2011 - 15:57
Сообщение
#27
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
1. какие вопросы? Ну, разумеется, про ширину окна. При разговоре об оценках типа Розенблатта-Парзена вопросы бывают только про нее родимую , да форму ядра. Я это вот к чему: самому приходилось заниматься этими вещами и оптимизировать ширину окна методами кросс-валидации на основе наименьших квадратов и наибольшего правдоподобия. Функция правдоподобя, н-р, очень даже запросто может быть многоэкстремальной. У меня в каком-то случае было 3 локальных пика и 1 глобальный. Любой оптимизационный алгоритм вполне может застрять в локальном экстремуме. Вот я и спросил про пользовательскую ширину окна. И доводы о том, что это, дескать, прога так насчитала, конечно, хороши, но в меру. Так что, оценивая плотность по 5 наблюдениям, картинки можно получить самые забавные. P.S. И еще. Ответы из серии "Так надо" я и сам давать умею. Пройденный этап. Просто от вас я жду большего. Только не кипятитесь, как (холодный) самовар. P.P.S. А девушку тут уже достаточно загрузили. Она с перепугу только "спасибо" и сумела сказать. Теперь уйдет от нас, и я останусь безутешным. Короче всем спасибо, все свободны. Уходя, гасите свет. Сообщение отредактировал 100$ - 5.12.2011 - 16:04 |
|
5.12.2011 - 18:50
Сообщение
#28
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Короче всем спасибо, все свободны. Уходя, гасите свет. Из десятка найденных в интернетах статей о показателе койко-обеспеченности на просторах СНГ я обнаружил --- никто никакими сравнениями не грузится вообще. Просто приводят цифры по годам и говорят "вот здесь больше, а здесь меньше". А топикстартера с ну очень похожим вопросом уже как минимум один раз я видел. Думаю что "отпугнуть" не получится |
|
6.12.2011 - 03:58
Сообщение
#29
|
|
Группа: Пользователи Сообщений: 33 Регистрация: 31.07.2008 Пользователь №: 5185 |
Не получится К кому же мне еще обращаться за помощью. А спасибо было не "с перепугу", а от души. И всё же хотелось бы уточнить: при сравнении показателей в двух группах в динамике в случае нормального распределения (и равенства дисперсий ?) применяется двухфакторный дисперсионный анализ. В случае несоблюдения предпосылок применяется его непараметрический аналог - критерий Фридмана?
Сообщение отредактировал Stefa - 6.12.2011 - 06:03 |
|
6.12.2011 - 10:11
Сообщение
#30
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
В случае несоблюдения предпосылок применяется его непараметрический аналог - критерий Фридмана? Только он, как и Пейдж, для данных "измеренных в трех или более условиях на одной и той же выборке испытуемых." В приведенных данных по моему два условия. PS а сколько у Вас всего городов к сравнению между собой? Может их хотя бы десяток наберется? Сообщение отредактировал p2004r - 6.12.2011 - 10:12 |
|