Вопрос о сравнении двух выборок |
Здравствуйте, гость ( Вход | Регистрация )
Вопрос о сравнении двух выборок |
12.02.2017 - 09:04
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 12.02.2017 Пользователь №: 29313 |
Доброе утро, дорогие друзья.
Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется. Сообщение отредактировал Anored - 12.02.2017 - 09:09 |
|
12.02.2017 - 19:29
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Доброе утро, дорогие друзья. Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется. Добрый день. Вообще-то начинать надо не с вопроса "каким критерием", а с описания, что Вы изучаете, что и как пытаетесь сравнивать. Ответ сильно зависит от множества факторов, которые Вам, очевидно, известны, а нам нет. А именно - каков размер выборки? В какой шкале измерения представлены "разные результаты"? Если "респонденты" - это что-то типа "пациентов", то можно-ли считать исходные выборки действительно рандомизированными? Ну, это для самого начала. |
|
13.02.2017 - 08:33
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 12.02.2017 Пользователь №: 29313 |
Спасибо за ответ!
Две группы людей. Выборка не очень большая, даже на количественное исследование не сильно тянет - по 15 человек в группе. Результаты представлены в порядковой шкале (я их объединила по группам), но, в принципе, я могу их представить и в интервальной шкале, без объединения в группы. Респонденты действительно что-то вроде пациентов, и отбор в группы осуществлялся по квотным критериям (возраст, пол и пр.), так что не знаю, можно ли назвать выборку рандомной. Надеюсь, я ответила на все вопросы, я не очень сильна в статистике... |
|
13.02.2017 - 13:02
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Спасибо за ответ! Две группы людей. Выборка не очень большая, даже на количественное исследование не сильно тянет - по 15 человек в группе. Результаты представлены в порядковой шкале (я их объединила по группам), но, в принципе, я могу их представить и в интервальной шкале, без объединения в группы. Респонденты действительно что-то вроде пациентов, и отбор в группы осуществлялся по квотным критериям (возраст, пол и пр.), так что не знаю, можно ли назвать выборку рандомной. Надеюсь, я ответила на все вопросы, я не очень сильна в статистике... Если не было рандомизации в назначении "фактора X", то и оценить значимость различий нельзя. Просто эффект от "фактора Х" не отделим от "факторов разделения на группы". |
|
13.02.2017 - 13:41
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 105 Регистрация: 23.11.2016 Пользователь №: 28953 |
Доброе утро, дорогие друзья. Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется. Здравствуйте, коллега! Представьте, что к врачу приходит пациент и говорит ему всего лишь 5 предложений о своих проблемах со здоровьем. Естественно, что продуктивной помощи врач в этом случае пациенту не сможет оказать. Т.е. обращаясь за помощью по проведению стат. анализа, следует очень подробно описывать и сам массив, и цель исследования. На подобную же краткую информацию невозможно продуктивно ответить. Если желаете узнать, какие виды стат. анализа в принципе возможно выполнить в ситуациях, подобной Вашей, можете почитать статью об этом по адресу http://www.biometrica.tomsk.ru/comp_aver.htm P.S. Более детальные рекомендации даю тем, кто на мой мэйл высылает свой массив с его описанием, и описанием цели исследования, ради которой и собран был этот массив. Желаю успешного исследования! |
|
13.02.2017 - 15:13
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 12.02.2017 Пользователь №: 29313 |
Всех благодарю за ответы!
p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются? leo_biostat Цитата Если желаете узнать, какие виды стат. анализа в принципе возможно выполнить в ситуациях, подобной Вашей, можете почитать статью об этом по адресу http://www.biometrica.tomsk.ru/comp_aver.htm Вы совершенно правы, именно это я и желаю выяснить. Я пыталась читать статьи по статистике, но понимаю их с трудном, поэтому и обратилась к здесь присутствующим. Я пользуюсь SPSS, поэтому после краткого "обычно в таких случаях используют критерий Манна-Уитни" или "юзай тест Стьюдента" (хотя он мне в данном случае не подходит, по-моему, ибо для него нужна группирующая переменная) я всё понимаю, благодарю, и уползаю производить расчёты. Цитата цель исследования Очень проста: я желаю статистическим методом констатировать, что результаты в этих двух (равных) группах различны, и различие это статистически значимо. Т.е. чисто в теории это сравнение средних. Это я понимаю, но не понимаю, чем пользоваться в данном случае. Простите, если излагаю сумбурно... |
|
13.02.2017 - 15:46
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 105 Регистрация: 23.11.2016 Пользователь №: 28953 |
Всех благодарю за ответы! p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются? leo_biostat Вы совершенно правы, именно это я и желаю выяснить. Я пыталась читать статьи по статистике, но понимаю их с трудном, поэтому и обратилась к здесь присутствующим. Я пользуюсь SPSS, поэтому после краткого "обычно в таких случаях используют критерий Манна-Уитни" или "юзай тест Стьюдента" (хотя он мне в данном случае не подходит, по-моему, ибо для него нужна группирующая переменная) я всё понимаю, благодарю, и уползаю производить расчёты. Очень проста: я желаю статистическим методом констатировать, что результаты в этих двух (равных) группах различны, и различие это статистически значимо. Т.е. чисто в теории это сравнение средних. Это я понимаю, но не понимаю, чем пользоваться в данном случае. Простите, если излагаю сумбурно... "Различие результатов" - это не только "различие средних". Кроме "различия средних" могут быть обнаружены и другие, не менее важные различия. То есть не одни лишь средние значения важны для разработки технологии с помощью результатов стат. анализа. В частности, важно учитывать и другие параметры распределений, а также и наличие взаимосвязи между признаками. В качестве примера приведу ссылку на описания использования любого мед.препарата. Кроме условий использования этого препарата, там упоминаются и ограничения, и связи с другими препаратами, и т.п. То есть анализ средних - это одномерный анализа. А необходимо использовать многомерные методы анализа. А эти методы определяются подробным описанием цели исследования. |
|
13.02.2017 - 16:55
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 12.02.2017 Пользователь №: 29313 |
Цитата "Различие результатов" - это не только "различие средних". Кроме "различия средних" могут быть обнаружены и другие, не менее важные различия. То есть не одни лишь средние значения важны для разработки технологии с помощью результатов стат. анализа. В частности, важно учитывать и другие параметры распределений, а также и наличие взаимосвязи между признаками. В качестве примера приведу ссылку на описания использования любого мед.препарата. Кроме условий использования этого препарата, там упоминаются и ограничения, и связи с другими препаратами, и т.п. То есть анализ средних - это одномерный анализа. А необходимо использовать многомерные методы анализа. А эти методы определяются подробным описанием цели исследования. Хорошо, может быть мне реально поможет пример? И если я не могу чётко сформулировать свои мысли, то смогу на аналогичном примере понять, подходит ли мне тот или иной критерий? Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае? |
|
13.02.2017 - 17:40
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Хорошо, может быть мне реально поможет пример? И если я не могу чётко сформулировать свои мысли, то смогу на аналогичном примере понять, подходит ли мне тот или иной критерий? Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае? Ну, если самое-самое простое объяснение нужно, и Вас не интересует зависимость результата еще и от пола, возраста, профессии...... и т.д., а только от "получили или нет препарат", а также если данные у Вас представлены в ранговой или интервальной шкалах, и самих данных не много и нет никакой априорной информации о них, то тогда наиболее употребимым критерием является критерий Манна-Уитни. Если нужны примеры-аналоги - их масса. Ну, например - специально для врачей и с использованием SPSS http://cyberleninka.ru/article/n/analiz-ko...zavisimyh-grupp Сообщение отредактировал passant - 13.02.2017 - 18:30 |
|
13.02.2017 - 18:53
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 12.02.2017 Пользователь №: 29313 |
passant, большое спасибо!
Пойду, почитаю подробности. |
|
13.02.2017 - 19:03
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются? Да, отсутствие рандомизации (то что собственно и означает "квотная выборка") делает это исследование бесполезным с точки зрения ответа на вопрос "повлиял ли именно фактор Х". С таким же успехом повлиял исследователь уже разбивая на группы. |
|
13.02.2017 - 22:44
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Хорошо, может быть мне реально поможет пример? Нет, не поможет, поскольку вы не в состоянии понять популярные (популистские) статьи по статистике, линк на которые вам предложил leobiostat. Или вы просто не хотите себя утруждать чтением. Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае? Разные критерии, в зависимости от типа клинического исследования, почитайте хоть Флетчер. Результатами ТЕСТИРОВАНИЯ могут быть различия в числе новых случаев заболевания под действием фактора или числа осложнений или различие в скорости регрессии опухоли или различия в каких то шкалах оценки до и после интервенции и, наконец, различия в изменении какого то показателя крови под действием фактора. Но изменение показателя, на который вы хотите воздействовать предполагает измерение до и после как в группе под влиянием фактора, таки без такового. Нельзя измерить показатель в двух группах только после воздействия, никому не известно, то что было до воздействия. |
|
14.02.2017 - 08:52
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 12.02.2017 Пользователь №: 29313 |
p2004r
Цитата Да, отсутствие рандомизации (то что собственно и означает "квотная выборка") делает это исследование бесполезным с точки зрения ответа на вопрос "повлиял ли именно фактор Х". С таким же успехом повлиял исследователь уже разбивая на группы. С точки зрения разбивания на группы по "субъективным" критериям исследователь действительно может повлиять и исказить картину, я понимаю. Но если деление происходит по полу-возрасту? Здесь исследователь вряд ли может сильно на что-то повлиять, ведь так? DrgLena Цитата Но изменение показателя, на который вы хотите воздействовать предполагает измерение до и после как в группе под влиянием фактора, таки без такового. Нельзя измерить показатель в двух группах только после воздействия, никому не известно, то что было до воздействия. Само собой разумеется. |
|
14.02.2017 - 09:43
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
p2004r С точки зрения разбивания на группы по "субъективным" критериям исследователь действительно может повлиять и исказить картину, я понимаю. Но если деление происходит по полу-возрасту? Здесь исследователь вряд ли может сильно на что-то повлиять, ведь так? 1. Если разделение на две "группы" по полу, тогда непонятно при чем тут "квотные выборки". 2. Остается большой вопрос каков вообще был критерий включения в выборку до её разделения "на группы по полу". Исследователь в данном случае должен обеспечить _репрезентативность_ сделанной выборки. Иначе с "научностью" опять всё плохо. |
|
14.02.2017 - 10:29
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
"Само собой разумеется".
Дизайн исследования все еще остается не ясным для участников форума, а потому М-У предложили использовать, как самый подходящий. Что же вы все таки измеряете до и после в двух группах, сколько показателей, что они из себя представляют? |
|