Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Большая выборка и критерий Манна-Уитни
sanabat
сообщение 7.02.2018 - 21:45
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 3
Регистрация: 7.02.2018
Пользователь №: 30961



Пожалуйста, помогите! Есть 2 группы пациентов: (1) n1 = 842 и (2) n2= 197, которые сравниваю по значению некого количественного признака. Для первой группы среднее значение и SD равны 2,74 и 5,08; min - max = 0,09-51,74; для второй 3,46 и 5,05; min - max = 0,02-35,32. Проверила вид распределения с использованием критерия Шапиро-Уилка. Получилось - отличное от нормального. Применила для сравнения этих выборок критерий Манна Уитни ( р= 0,0296, но этот результат настораживает, поскольку средние отличаются незначительно). Можно ли в данном случае использовать критерий Манна -Уитни? Читала, что его не применяют при размере выборки более 60, а используют t-тест (правда ли это?). Тогда какой критерий применить? Пробовала независимый t-тест. Результат = 0,0723. Но корректно ли его применять, ведь распределение параметра отличное от нормального?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 7.02.2018 - 22:29
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 96
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(sanabat @ 7.02.2018 - 21:45) *
Пожалуйста, help.gif !!!! Есть 2 группы пациентов: (1) n1 = 842 и (2) n2= 197, которые сравниваю по значению некого количественного признака. Для первой группы среднее значение и SD равны 2,74 и 5,08; min - max = 0,09-51,74; для второй 3,46 и 5,05; min - max =0,02-35,32. Проверила вид распределения с использованием критерия Шапиро-Уилка. Получилось - отличное от нормального. Применила для сравнения этих выборок критерий Манна Уитни ( р= 0,0296, но этот результат настораживает, поскольку средние отличаются незначительно). Можно ли в данном случае использовать критерий Манна -Уитни? Читала, что его не применяют при размере выборки более 60, а используют t-тест (правда ли это?). Тогда какой критерий применить? Пробовала независимый t-тест. Результат =0,0723. Но корректно ли его применять, ведь распределение параметра отличное от нормального?


Коллега, hi.gif!

Используйте критерии Ван дер Вардена, Краскела-Валлиса, Сиджела-Тьюки и Ансари-Брэдли, а также и медианный критерий.
Если в группах кроме одного количественного признака есть и иные признаки, то рекомендую использовать как дискриминантный анализ,
так и метод логистической регрессии (см. http://www.biometrica.tomsk.ru/logit_0.htm).

Успеха!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 8.02.2018 - 06:29
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 1309
Регистрация: 27.11.2007
Пользователь №: 4573



Коллега, leo_biostat!

1. Вы вновь повторяете весь текст автора поста, но сами, как будто его не читали. Задан конкретный вопрос о сравнении ДВУХ групп по какому то количественному признаку. Даже, если бы таких признаков было бы больше, чем этот один, конкретно описанный, зачем рекомендовать дискриминантный анализ, что вы предлагаете дискриминировать ? А также, в случае другого вашего совета, применения логистической регрессии, вероятность какого события вы советуете изучить?

2. Относительно списка критериев, которые вы рекомендуете

Ван дер Вардена, ограничения применимости этого критерия - различия в числе наблюдений в группах более 5.
Краскела-Уоллиса, = критериюМанна-Уитни при анализе двух групп.
Сиджела-Тьюки и Ансари-Брэдли, - используют для сравнения рассеяния, при проверке гипотезы о равенстве дисперсий.
Медианный критерий - вообще устаревший, чего ему тягаться с Манна Уитни.

Вы перечислили все эти критерии, чтобы применить их всех при анализе описанных двух выборок, а потом по результату остановиться на самом желанном значении р? Какие соображения лежат в основе ваших рекомендаций?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
sanabat
сообщение 8.02.2018 - 10:41
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 3
Регистрация: 7.02.2018
Пользователь №: 30961



Цитата(DrgLena @ 8.02.2018 - 07:29) *
Коллега, leo_biostat!

1. Вы вновь повторяете весь текст автора поста, но сами, как будто его не читали. Задан конкретный вопрос о сравнении ДВУХ групп по какому то количественному признаку. Даже, если бы таких признаков было бы больше, чем этот один, конкретно описанный, зачем рекомендовать дискриминантный анализ, что вы предлагаете дискриминировать ? А также, в случае другого вашего совета, применения логистической регрессии, вероятность какого события вы советуете изучить?

2. Относительно списка критериев, которые вы рекомендуете

Ван дер Вардена, ограничения применимости этого критерия - различия в числе наблюдений в группах более 5.
Краскела-Уоллиса, = критериюМанна-Уитни при анализе двух групп.
Сиджела-Тьюки и Ансари-Брэдли, - используют для сравнения рассеяния, при проверке гипотезы о равенстве дисперсий.
Медианный критерий - вообще устаревший, чего ему тягаться с Манна Уитни.

Вы перечислили все эти критерии, чтобы применить их всех при анализе описанных двух выборок, а потом по результату остановиться на самом желанном значении р? Какие соображения лежат в основе ваших рекомендаций?



Спасибо за ответ! Но все-таки, непонятно, корректно ли будет сравнивать 2 большие выборки используя критерий Манна-Уитни?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 8.02.2018 - 11:46
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(sanabat @ 8.02.2018 - 10:41) *
Спасибо за ответ! Но все-таки, непонятно, корректно ли будет сравнивать 2 большие выборки используя критерий Манна-Уитни?


Да, корректно.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 8.02.2018 - 12:02
Сообщение #6


Дух форума
*

Группа: Пользователи
Сообщений: 632
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DrgLena @ 8.02.2018 - 06:29) *
Коллега, leo_biostat!


Это не коллега. Это - генератор случайных текстов, постящий лучезарную чушь по небрежно запрограммированному алгоритму. Осилив любое из его "сообщений", хочется глаза с мылом помыть.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 8.02.2018 - 12:42
Сообщение #7


Дух форума
*

Группа: Пользователи
Сообщений: 96
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(DrgLena @ 8.02.2018 - 06:29) *
Коллега, leo_biostat!

1. Вы вновь повторяете весь текст автора поста,

Вы правы. Не заметил, что весь текст повторил.

но сами, как будто его не читали.
Вы не правы. Весь текст читал. Потому и отвечал.


Задан конкретный вопрос о сравнении ДВУХ групп по какому то количественному признаку. Даже, если бы таких признаков было бы больше, чем этот один, конкретно описанный, зачем рекомендовать дискриминантный анализ, что вы предлагаете дискриминировать ?
Отвечаю на Ваш вопрос. Дискриминантный анализ предлагается затем, чтобы исследователь по результату этого анализа смог понять, а какой конкретно количественный признак следует более глубоко изучать. Причём не только по сравнению средних значений.

А также, в случае другого вашего совета, применения логистической регрессии, вероятность какого события вы советуете изучить?
Отвечаю на Ваш вопрос. Применение логистической регрессии позволяет объяснить, какие конкретные значений качественных, группирующих признаков, и значения каких количественных признаков, а также их взаимосвязи между собой, объясняют значения вероятностей появления тех или иных событий. Эти события есть принадлежность анализируемых наблюдений к конкретным группам сравнения. То есть использование многомерных методов статистического анализа позволяет учитывать при сравнении групп не только один количественный признак, о котором идёт речь в вопросе не профессионального статистика, но также учитывать и большое количество как взаимосвязей между всеми признаками, так и их параметры. И поэтому результаты таких методов статистического анализа более продуктивны для их использования в медицинских технологиях, нежели одни лишь сравнения средних значений.

2. Относительно списка критериев, которые вы рекомендуете

Ван дер Вардена, ограничения применимости этого критерия - различия в числе наблюдений в группах более 5.

Цитирую фрагмент вопроса автора sanabat. "Пожалуйста, help.gif !!!! Есть 2 группы пациентов: (1) n1 = 842 и (2) n2= 197, которые сравниваю по значению некого количественного признака".
То есть имеются 2 группы пациентов: (1) n1 = 842 и (2) n2= 197. О возможностях критерия Ван дер Вардена можете прочитать в книгах Р. Шторм. "Теория вероятностей. Математическая статистика. Статистический контроль качества", А.И. Кобзарь "Прикладная математическая статистика", П. Мюллер, П. Нойман, Р. Шторм. "Таблицы по математической статистике", С.Р. Рао. "Линейные статистические методы и их применения", и во многих иных книгах.

Краскела-Уоллиса, = критериюМанна-Уитни при анализе двух групп.

Вы правы. Не стоило рекомендовать.

Сиджела-Тьюки и Ансари-Брэдли, - используют для сравнения рассеяния, при проверке гипотезы о равенстве дисперсий.

Цитирую фрагмент вопроса автора sanabat. "Для первой группы среднее значение и SD равны 2,74 и 5,08; min - max = 0,09-51,74; для второй 3,46 и 5,05; min - max =0,02-35,32". Поэтому и надо было сравнить дисперсии. Поскольку результаты сравнения групповых средних зависят ещё и от значений дисперсий и интервалов разброса значений признаков. При этом нередко в этих интервалах находятся значения выбросов. И эти значения следует перепроверять.

Медианный критерий - вообще устаревший, чего ему тягаться с Манна Уитни.
Проверка равенства медиан полезна при совместной проверке как групповых средних, так и дисперсий. Поскольку результаты этих сравнений помогают понять характер распределений в каждой из групп сравнения.
В частности, можно увидеть, где находятся относительно друг друга значения среднего и медианы в каждой конкретной группе сравнения. В одной группе медиана находится относительно среднего слева, а в другой - справа.
И важно оценить разницы этих значений. То есть следует изучить характеры групповых распределений, чтобы найти причины неравенства групповых средних.

Вы перечислили все эти критерии, чтобы применить их всех при анализе описанных двух выборок, а потом по результату остановиться на самом желанном значении р? Какие соображения лежат в основе ваших рекомендаций?

Соображение единственное: исследователю нужно расширить область своего исследования, не зациклившись лишь на одном сравнении средних. И при таком расширении исследователь будет читать новые книги, статьи.
И значит получать более продуктивные результаты, что будет полезно как самому исследователю, так и пациентам, для которых будут использовать эти лучшие результаты.


Сообщение отредактировал leo_biostat - 8.02.2018 - 15:05
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему