Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Вопрос о сравнении двух выборок
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Anored
Доброе утро, дорогие друзья.
Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется.
passant
Цитата(Anored @ 12.02.2017 - 08:04) *
Доброе утро, дорогие друзья.
Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется.

Добрый день.
Вообще-то начинать надо не с вопроса "каким критерием", а с описания, что Вы изучаете, что и как пытаетесь сравнивать. Ответ сильно зависит от множества факторов, которые Вам, очевидно, известны, а нам нет. А именно - каков размер выборки? В какой шкале измерения представлены "разные результаты"? Если "респонденты" - это что-то типа "пациентов", то можно-ли считать исходные выборки действительно рандомизированными? Ну, это для самого начала.
Anored
Спасибо за ответ!
Две группы людей. Выборка не очень большая, даже на количественное исследование не сильно тянет - по 15 человек в группе. Результаты представлены в порядковой шкале (я их объединила по группам), но, в принципе, я могу их представить и в интервальной шкале, без объединения в группы. Респонденты действительно что-то вроде пациентов, и отбор в группы осуществлялся по квотным критериям (возраст, пол и пр.), так что не знаю, можно ли назвать выборку рандомной.
Надеюсь, я ответила на все вопросы, я не очень сильна в статистике...
p2004r
Цитата(Anored @ 13.02.2017 - 08:33) *
Спасибо за ответ!
Две группы людей. Выборка не очень большая, даже на количественное исследование не сильно тянет - по 15 человек в группе. Результаты представлены в порядковой шкале (я их объединила по группам), но, в принципе, я могу их представить и в интервальной шкале, без объединения в группы. Респонденты действительно что-то вроде пациентов, и отбор в группы осуществлялся по квотным критериям (возраст, пол и пр.), так что не знаю, можно ли назвать выборку рандомной.
Надеюсь, я ответила на все вопросы, я не очень сильна в статистике...


Если не было рандомизации в назначении "фактора X", то и оценить значимость различий нельзя. Просто эффект от "фактора Х" не отделим от "факторов разделения на группы".
leo_biostat
Цитата(Anored @ 12.02.2017 - 09:04) *
Доброе утро, дорогие друзья.
Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется.


Здравствуйте, коллега!

Представьте, что к врачу приходит пациент и говорит ему всего лишь 5 предложений о своих проблемах со здоровьем. Естественно, что продуктивной помощи врач в этом случае пациенту не сможет оказать.
Т.е. обращаясь за помощью по проведению стат. анализа, следует очень подробно описывать и сам массив, и цель исследования. На подобную же краткую информацию невозможно продуктивно ответить.

Если желаете узнать, какие виды стат. анализа в принципе возможно выполнить в ситуациях, подобной Вашей, можете почитать статью об этом по адресу http://www.biometrica.tomsk.ru/comp_aver.htm

P.S.
Более детальные рекомендации даю тем, кто на мой мэйл высылает свой массив с его описанием, и описанием цели исследования, ради которой и собран был этот массив.

Желаю успешного исследования!
Anored
Всех благодарю за ответы!

p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются?

leo_biostat
Цитата
Если желаете узнать, какие виды стат. анализа в принципе возможно выполнить в ситуациях, подобной Вашей, можете почитать статью об этом по адресу http://www.biometrica.tomsk.ru/comp_aver.htm


Вы совершенно правы, именно это я и желаю выяснить. Я пыталась читать статьи по статистике, но понимаю их с трудном, поэтому и обратилась к здесь присутствующим. Я пользуюсь SPSS, поэтому после краткого "обычно в таких случаях используют критерий Манна-Уитни" или "юзай тест Стьюдента" (хотя он мне в данном случае не подходит, по-моему, ибо для него нужна группирующая переменная) я всё понимаю, благодарю, и уползаю производить расчёты. smile.gif

Цитата
цель исследования


Очень проста: я желаю статистическим методом констатировать, что результаты в этих двух (равных) группах различны, и различие это статистически значимо.
Т.е. чисто в теории это сравнение средних. Это я понимаю, но не понимаю, чем пользоваться в данном случае.
Простите, если излагаю сумбурно...

leo_biostat
Цитата(Anored @ 13.02.2017 - 15:13) *
Всех благодарю за ответы!

p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются?

leo_biostat


Вы совершенно правы, именно это я и желаю выяснить. Я пыталась читать статьи по статистике, но понимаю их с трудном, поэтому и обратилась к здесь присутствующим. Я пользуюсь SPSS, поэтому после краткого "обычно в таких случаях используют критерий Манна-Уитни" или "юзай тест Стьюдента" (хотя он мне в данном случае не подходит, по-моему, ибо для него нужна группирующая переменная) я всё понимаю, благодарю, и уползаю производить расчёты. smile.gif



Очень проста: я желаю статистическим методом констатировать, что результаты в этих двух (равных) группах различны, и различие это статистически значимо.
Т.е. чисто в теории это сравнение средних. Это я понимаю, но не понимаю, чем пользоваться в данном случае.
Простите, если излагаю сумбурно...



"Различие результатов" - это не только "различие средних". Кроме "различия средних" могут быть обнаружены и другие, не менее важные различия. То есть не одни лишь средние значения важны для разработки технологии с помощью результатов стат. анализа. В частности, важно учитывать и другие параметры распределений, а также и наличие взаимосвязи между признаками. В качестве примера приведу ссылку на описания использования любого мед.препарата. Кроме условий использования этого препарата, там упоминаются и ограничения, и связи с другими препаратами, и т.п. То есть анализ средних - это одномерный анализа. А необходимо использовать многомерные методы анализа. А эти методы определяются подробным описанием цели исследования.
Anored
Цитата
"Различие результатов" - это не только "различие средних". Кроме "различия средних" могут быть обнаружены и другие, не менее важные различия. То есть не одни лишь средние значения важны для разработки технологии с помощью результатов стат. анализа. В частности, важно учитывать и другие параметры распределений, а также и наличие взаимосвязи между признаками. В качестве примера приведу ссылку на описания использования любого мед.препарата. Кроме условий использования этого препарата, там упоминаются и ограничения, и связи с другими препаратами, и т.п. То есть анализ средних - это одномерный анализа. А необходимо использовать многомерные методы анализа. А эти методы определяются подробным описанием цели исследования.


Хорошо, может быть мне реально поможет пример?
И если я не могу чётко сформулировать свои мысли, то смогу на аналогичном примере понять, подходит ли мне тот или иной критерий?
Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае?
passant
Цитата(Anored @ 13.02.2017 - 15:55) *
Хорошо, может быть мне реально поможет пример?
И если я не могу чётко сформулировать свои мысли, то смогу на аналогичном примере понять, подходит ли мне тот или иной критерий?
Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае?

Ну, если самое-самое простое объяснение нужно, и Вас не интересует зависимость результата еще и от пола, возраста, профессии...... и т.д., а только от "получили или нет препарат", а также если данные у Вас представлены в ранговой или интервальной шкалах, и самих данных не много и нет никакой априорной информации о них, то тогда наиболее употребимым критерием является критерий Манна-Уитни. Если нужны примеры-аналоги - их масса. Ну, например - специально для врачей и с использованием SPSS http://cyberleninka.ru/article/n/analiz-ko...zavisimyh-grupp
Anored
passant, большое спасибо! smile.gif
Пойду, почитаю подробности.
p2004r

p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются?

Да, отсутствие рандомизации (то что собственно и означает "квотная выборка") делает это исследование бесполезным с точки зрения ответа на вопрос "повлиял ли именно фактор Х". С таким же успехом повлиял исследователь уже разбивая на группы.
DrgLena
Цитата(Anored @ 13.02.2017 - 16:55) *
Хорошо, может быть мне реально поможет пример?

Нет, не поможет, поскольку вы не в состоянии понять популярные (популистские) статьи по статистике, линк на которые вам предложил leobiostat. Или вы просто не хотите себя утруждать чтением.
Цитата(Anored @ 13.02.2017 - 16:55) *
Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае?

Разные критерии, в зависимости от типа клинического исследования, почитайте хоть Флетчер.
Результатами ТЕСТИРОВАНИЯ могут быть различия в числе новых случаев заболевания под действием фактора или числа осложнений или различие в скорости регрессии опухоли или различия в каких то шкалах оценки до и после интервенции и, наконец, различия в изменении какого то показателя крови под действием фактора. Но изменение показателя, на который вы хотите воздействовать предполагает измерение до и после как в группе под влиянием фактора, таки без такового. Нельзя измерить показатель в двух группах только после воздействия, никому не известно, то что было до воздействия.
Anored
p2004r
Цитата
Да, отсутствие рандомизации (то что собственно и означает "квотная выборка") делает это исследование бесполезным с точки зрения ответа на вопрос "повлиял ли именно фактор Х". С таким же успехом повлиял исследователь уже разбивая на группы.


С точки зрения разбивания на группы по "субъективным" критериям исследователь действительно может повлиять и исказить картину, я понимаю.
Но если деление происходит по полу-возрасту? Здесь исследователь вряд ли может сильно на что-то повлиять, ведь так?

DrgLena
Цитата
Но изменение показателя, на который вы хотите воздействовать предполагает измерение до и после как в группе под влиянием фактора, таки без такового. Нельзя измерить показатель в двух группах только после воздействия, никому не известно, то что было до воздействия.


Само собой разумеется.
p2004r
Цитата(Anored @ 14.02.2017 - 08:52) *
p2004r


С точки зрения разбивания на группы по "субъективным" критериям исследователь действительно может повлиять и исказить картину, я понимаю.
Но если деление происходит по полу-возрасту? Здесь исследователь вряд ли может сильно на что-то повлиять, ведь так?


1. Если разделение на две smile.gif "группы" по полу, тогда непонятно при чем тут "квотные выборки".

2. Остается большой вопрос каков вообще был критерий включения в выборку до её разделения "на группы по полу". Исследователь в данном случае должен обеспечить _репрезентативность_ сделанной выборки. Иначе с "научностью" опять всё плохо.
DrgLena
"Само собой разумеется".

Дизайн исследования все еще остается не ясным для участников форума, а потому М-У предложили использовать, как самый подходящий. Что же вы все таки измеряете до и после в двух группах, сколько показателей, что они из себя представляют?
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.