Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Вопрос о сравнении двух выборок
Anored
сообщение 12.02.2017 - 09:04
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 12.02.2017
Пользователь №: 29313



Доброе утро, дорогие друзья.
Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется.

Сообщение отредактировал Anored - 12.02.2017 - 09:09
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 12.02.2017 - 19:29
Сообщение #2





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(Anored @ 12.02.2017 - 08:04) *
Доброе утро, дорогие друзья.
Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется.

Добрый день.
Вообще-то начинать надо не с вопроса "каким критерием", а с описания, что Вы изучаете, что и как пытаетесь сравнивать. Ответ сильно зависит от множества факторов, которые Вам, очевидно, известны, а нам нет. А именно - каков размер выборки? В какой шкале измерения представлены "разные результаты"? Если "респонденты" - это что-то типа "пациентов", то можно-ли считать исходные выборки действительно рандомизированными? Ну, это для самого начала.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Anored
сообщение 13.02.2017 - 08:33
Сообщение #3





Группа: Пользователи
Сообщений: 6
Регистрация: 12.02.2017
Пользователь №: 29313



Спасибо за ответ!
Две группы людей. Выборка не очень большая, даже на количественное исследование не сильно тянет - по 15 человек в группе. Результаты представлены в порядковой шкале (я их объединила по группам), но, в принципе, я могу их представить и в интервальной шкале, без объединения в группы. Респонденты действительно что-то вроде пациентов, и отбор в группы осуществлялся по квотным критериям (возраст, пол и пр.), так что не знаю, можно ли назвать выборку рандомной.
Надеюсь, я ответила на все вопросы, я не очень сильна в статистике...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 13.02.2017 - 13:02
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Anored @ 13.02.2017 - 08:33) *
Спасибо за ответ!
Две группы людей. Выборка не очень большая, даже на количественное исследование не сильно тянет - по 15 человек в группе. Результаты представлены в порядковой шкале (я их объединила по группам), но, в принципе, я могу их представить и в интервальной шкале, без объединения в группы. Респонденты действительно что-то вроде пациентов, и отбор в группы осуществлялся по квотным критериям (возраст, пол и пр.), так что не знаю, можно ли назвать выборку рандомной.
Надеюсь, я ответила на все вопросы, я не очень сильна в статистике...


Если не было рандомизации в назначении "фактора X", то и оценить значимость различий нельзя. Просто эффект от "фактора Х" не отделим от "факторов разделения на группы".


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 13.02.2017 - 13:41
Сообщение #5





Группа: Пользователи
Сообщений: 105
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(Anored @ 12.02.2017 - 09:04) *
Доброе утро, дорогие друзья.
Подскажите, пожалуйста, человеку не сведущему, как поступить. Имеется две независимые выборки с равным количеством респондентов. На одну выборку оказывалось влияние с помощью фактора X, на другую - нет. На выходе после измерения получились разные результаты. С помощью какого критерия их сравнивать? SPSS в доступе имеется.


Здравствуйте, коллега!

Представьте, что к врачу приходит пациент и говорит ему всего лишь 5 предложений о своих проблемах со здоровьем. Естественно, что продуктивной помощи врач в этом случае пациенту не сможет оказать.
Т.е. обращаясь за помощью по проведению стат. анализа, следует очень подробно описывать и сам массив, и цель исследования. На подобную же краткую информацию невозможно продуктивно ответить.

Если желаете узнать, какие виды стат. анализа в принципе возможно выполнить в ситуациях, подобной Вашей, можете почитать статью об этом по адресу http://www.biometrica.tomsk.ru/comp_aver.htm

P.S.
Более детальные рекомендации даю тем, кто на мой мэйл высылает свой массив с его описанием, и описанием цели исследования, ради которой и собран был этот массив.

Желаю успешного исследования!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Anored
сообщение 13.02.2017 - 15:13
Сообщение #6





Группа: Пользователи
Сообщений: 6
Регистрация: 12.02.2017
Пользователь №: 29313



Всех благодарю за ответы!

p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются?

leo_biostat
Цитата
Если желаете узнать, какие виды стат. анализа в принципе возможно выполнить в ситуациях, подобной Вашей, можете почитать статью об этом по адресу http://www.biometrica.tomsk.ru/comp_aver.htm


Вы совершенно правы, именно это я и желаю выяснить. Я пыталась читать статьи по статистике, но понимаю их с трудном, поэтому и обратилась к здесь присутствующим. Я пользуюсь SPSS, поэтому после краткого "обычно в таких случаях используют критерий Манна-Уитни" или "юзай тест Стьюдента" (хотя он мне в данном случае не подходит, по-моему, ибо для него нужна группирующая переменная) я всё понимаю, благодарю, и уползаю производить расчёты. smile.gif

Цитата
цель исследования


Очень проста: я желаю статистическим методом констатировать, что результаты в этих двух (равных) группах различны, и различие это статистически значимо.
Т.е. чисто в теории это сравнение средних. Это я понимаю, но не понимаю, чем пользоваться в данном случае.
Простите, если излагаю сумбурно...

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 13.02.2017 - 15:46
Сообщение #7





Группа: Пользователи
Сообщений: 105
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(Anored @ 13.02.2017 - 15:13) *
Всех благодарю за ответы!

p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются?

leo_biostat


Вы совершенно правы, именно это я и желаю выяснить. Я пыталась читать статьи по статистике, но понимаю их с трудном, поэтому и обратилась к здесь присутствующим. Я пользуюсь SPSS, поэтому после краткого "обычно в таких случаях используют критерий Манна-Уитни" или "юзай тест Стьюдента" (хотя он мне в данном случае не подходит, по-моему, ибо для него нужна группирующая переменная) я всё понимаю, благодарю, и уползаю производить расчёты. smile.gif



Очень проста: я желаю статистическим методом констатировать, что результаты в этих двух (равных) группах различны, и различие это статистически значимо.
Т.е. чисто в теории это сравнение средних. Это я понимаю, но не понимаю, чем пользоваться в данном случае.
Простите, если излагаю сумбурно...



"Различие результатов" - это не только "различие средних". Кроме "различия средних" могут быть обнаружены и другие, не менее важные различия. То есть не одни лишь средние значения важны для разработки технологии с помощью результатов стат. анализа. В частности, важно учитывать и другие параметры распределений, а также и наличие взаимосвязи между признаками. В качестве примера приведу ссылку на описания использования любого мед.препарата. Кроме условий использования этого препарата, там упоминаются и ограничения, и связи с другими препаратами, и т.п. То есть анализ средних - это одномерный анализа. А необходимо использовать многомерные методы анализа. А эти методы определяются подробным описанием цели исследования.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Anored
сообщение 13.02.2017 - 16:55
Сообщение #8





Группа: Пользователи
Сообщений: 6
Регистрация: 12.02.2017
Пользователь №: 29313



Цитата
"Различие результатов" - это не только "различие средних". Кроме "различия средних" могут быть обнаружены и другие, не менее важные различия. То есть не одни лишь средние значения важны для разработки технологии с помощью результатов стат. анализа. В частности, важно учитывать и другие параметры распределений, а также и наличие взаимосвязи между признаками. В качестве примера приведу ссылку на описания использования любого мед.препарата. Кроме условий использования этого препарата, там упоминаются и ограничения, и связи с другими препаратами, и т.п. То есть анализ средних - это одномерный анализа. А необходимо использовать многомерные методы анализа. А эти методы определяются подробным описанием цели исследования.


Хорошо, может быть мне реально поможет пример?
И если я не могу чётко сформулировать свои мысли, то смогу на аналогичном примере понять, подходит ли мне тот или иной критерий?
Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 13.02.2017 - 17:40
Сообщение #9





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(Anored @ 13.02.2017 - 15:55) *
Хорошо, может быть мне реально поможет пример?
И если я не могу чётко сформулировать свои мысли, то смогу на аналогичном примере понять, подходит ли мне тот или иной критерий?
Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае?

Ну, если самое-самое простое объяснение нужно, и Вас не интересует зависимость результата еще и от пола, возраста, профессии...... и т.д., а только от "получили или нет препарат", а также если данные у Вас представлены в ранговой или интервальной шкалах, и самих данных не много и нет никакой априорной информации о них, то тогда наиболее употребимым критерием является критерий Манна-Уитни. Если нужны примеры-аналоги - их масса. Ну, например - специально для врачей и с использованием SPSS http://cyberleninka.ru/article/n/analiz-ko...zavisimyh-grupp

Сообщение отредактировал passant - 13.02.2017 - 18:30
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Anored
сообщение 13.02.2017 - 18:53
Сообщение #10





Группа: Пользователи
Сообщений: 6
Регистрация: 12.02.2017
Пользователь №: 29313



passant, большое спасибо! smile.gif
Пойду, почитаю подробности.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 13.02.2017 - 19:03
Сообщение #11





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699




p2004r, не буду делать вид, что поняла, о чём Вы. Но догадываюсь, что вы нашли какую-то ошибку в моих рассуждениях. Рандомизация является обязательной в подобных случаях? Квотные выборки не используются?

Да, отсутствие рандомизации (то что собственно и означает "квотная выборка") делает это исследование бесполезным с точки зрения ответа на вопрос "повлиял ли именно фактор Х". С таким же успехом повлиял исследователь уже разбивая на группы.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 13.02.2017 - 22:44
Сообщение #12





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Anored @ 13.02.2017 - 16:55) *
Хорошо, может быть мне реально поможет пример?

Нет, не поможет, поскольку вы не в состоянии понять популярные (популистские) статьи по статистике, линк на которые вам предложил leobiostat. Или вы просто не хотите себя утруждать чтением.
Цитата(Anored @ 13.02.2017 - 16:55) *
Предположим, тестируется определённый препарат, и сравниваются результаты тестирования людей, которые получили этот препарат или не получали его. По ощущениям, это почти что мой случай. Какой критерий чаще всего используют в данном случае?

Разные критерии, в зависимости от типа клинического исследования, почитайте хоть Флетчер.
Результатами ТЕСТИРОВАНИЯ могут быть различия в числе новых случаев заболевания под действием фактора или числа осложнений или различие в скорости регрессии опухоли или различия в каких то шкалах оценки до и после интервенции и, наконец, различия в изменении какого то показателя крови под действием фактора. Но изменение показателя, на который вы хотите воздействовать предполагает измерение до и после как в группе под влиянием фактора, таки без такового. Нельзя измерить показатель в двух группах только после воздействия, никому не известно, то что было до воздействия.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Anored
сообщение 14.02.2017 - 08:52
Сообщение #13





Группа: Пользователи
Сообщений: 6
Регистрация: 12.02.2017
Пользователь №: 29313



p2004r
Цитата
Да, отсутствие рандомизации (то что собственно и означает "квотная выборка") делает это исследование бесполезным с точки зрения ответа на вопрос "повлиял ли именно фактор Х". С таким же успехом повлиял исследователь уже разбивая на группы.


С точки зрения разбивания на группы по "субъективным" критериям исследователь действительно может повлиять и исказить картину, я понимаю.
Но если деление происходит по полу-возрасту? Здесь исследователь вряд ли может сильно на что-то повлиять, ведь так?

DrgLena
Цитата
Но изменение показателя, на который вы хотите воздействовать предполагает измерение до и после как в группе под влиянием фактора, таки без такового. Нельзя измерить показатель в двух группах только после воздействия, никому не известно, то что было до воздействия.


Само собой разумеется.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 14.02.2017 - 09:43
Сообщение #14





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Anored @ 14.02.2017 - 08:52) *
p2004r


С точки зрения разбивания на группы по "субъективным" критериям исследователь действительно может повлиять и исказить картину, я понимаю.
Но если деление происходит по полу-возрасту? Здесь исследователь вряд ли может сильно на что-то повлиять, ведь так?


1. Если разделение на две smile.gif "группы" по полу, тогда непонятно при чем тут "квотные выборки".

2. Остается большой вопрос каков вообще был критерий включения в выборку до её разделения "на группы по полу". Исследователь в данном случае должен обеспечить _репрезентативность_ сделанной выборки. Иначе с "научностью" опять всё плохо.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 14.02.2017 - 10:29
Сообщение #15





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



"Само собой разумеется".

Дизайн исследования все еще остается не ясным для участников форума, а потому М-У предложили использовать, как самый подходящий. Что же вы все таки измеряете до и после в двух группах, сколько показателей, что они из себя представляют?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему