Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Непараметрическая статистика на 3х малых группах и повторные измерения
doc2012
сообщение 31.12.2016 - 21:21
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 14
Регистрация: 31.12.2016
Пользователь №: 29139



С наступающим 2017!
Здравствуйте, помогите пожалуйста,? вопрос: имеются три группы по 20-25 человек каждая--в 1 группе (21 человек) заболевание А, во 2ой группе (26 человек)--заболевание Б, 3я группа (23 человека)--здоровые обследуемые. К каждой группе применяли измерение АД (артериального давления) за одни сутки---скажем 7 раз (т.е в 1 группе 7 раз, во 2 группе--7 раз, в третьей группе 7 раз) Какой метод исследования для ТРЁХ групп при МНОЖЕСТВЕННЫХ (скажем 7 раз) повторных измерениях на каждой группе (НЕзависимых) (+малая выборка--20-25 чел в каждой группе)---???? Какие используются методы статистической обработки--? confused.gif

Запутался
кто-то посоветовал--Двухфакторный дисперсионный анализ: один фактор - номер измерения, второй фактор - номер группы.
ВОПРОС---ведь дисперсион анализ проводится при НОРмальном распределении
Где-то я вычитал ниже написанное
Сравнение зависимых групп (повторные измерения!)
а) Сравнение двух групп.
МЕТОД - Критерий Уилконсона (Вилконсона). Альтернативный метод ?
критерий знаков.
б) Сравнение трех и более групп.
!! МЕТОД - Критерий Фридмана . Выявляет различия между всеми группами. Для
оценки различий между конкретными двумя группами проводят попарное сравнение с
помощью адаптированных (непараметрических) вариантов критериев Ньюмена-Кейлса
или Даннета.----(НО посоветовали, что НЕ подходит так как тут-ДВУФАКТОРНЫЙ АНАЛИЗ----один фактор - номер измерения, второй фактор - номер группы.

КТО-ТО советовал--регрессионный анализ с бутстрапированием (там нормальность не нужна)-----Я вообще не знаю что это и как делать.
КТО-ТО советовал ---медианную регрессию

ПОМОГИТЕ разобраться, пожалуйста.

Пожалуйста, не надо раскидывать идентичные сообщения по разным темам.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 31.12.2016 - 21:31
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 104
Регистрация: 23.11.2016
Пользователь №: 28953



Коллега, привет!

Чтобы я мог помочь Вам советами и реально полезными методами анализа, высылайте на мой электронный адрес свой массив данных с его описанием (согласно образцам по адресу http://www.biometrica.tomsk.ru/DATA%20PRIMER.rar )
Также рекомендую выслать мне в этом же письме и свой ник в Скайпе. Обсудим эти проблемы по Скайпу.

Сообщение отредактировал leo_biostat - 1.01.2017 - 01:38
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 2.01.2017 - 19:42
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 1113
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(doc2012 @ 31.12.2016 - 23:21) *
С наступающим 2017!
Здравствуйте, помогите пожалуйста,? вопрос: имеются три группы по 20-25 человек каждая--в 1 группе (21 человек) заболевание А, во 2ой группе (26 человек)--заболевание Б, 3я группа (23 человека)--здоровые обследуемые. К каждой группе применяли измерение АД (артериального давления) за одни сутки---скажем 7 раз (т.е в 1 группе 7 раз, во 2 группе--7 раз, в третьей группе 7 раз) Какой метод исследования для ТРЁХ групп при МНОЖЕСТВЕННЫХ (скажем 7 раз) повторных измерениях на каждой группе (НЕзависимых) (+малая выборка--20-25 чел в каждой группе)---???? Какие используются методы статистической обработки--? confused.gif

Запутался
кто-то посоветовал--Двухфакторный дисперсионный анализ: один фактор - номер измерения, второй фактор - номер группы.
ВОПРОС---ведь дисперсион анализ проводится при НОРмальном распределении
Где-то я вычитал ниже написанное
Сравнение зависимых групп (повторные измерения!)
а) Сравнение двух групп.
МЕТОД - Критерий Уилконсона (Вилконсона). Альтернативный метод ?
критерий знаков.
б) Сравнение трех и более групп.
!! МЕТОД - Критерий Фридмана . Выявляет различия между всеми группами. Для
оценки различий между конкретными двумя группами проводят попарное сравнение с
помощью адаптированных (непараметрических) вариантов критериев Ньюмена-Кейлса
или Даннета.----(НО посоветовали, что НЕ подходит так как тут-ДВУФАКТОРНЫЙ АНАЛИЗ----один фактор - номер измерения, второй фактор - номер группы.

КТО-ТО советовал--регрессионный анализ с бутстрапированием (там нормальность не нужна)-----Я вообще не знаю что это и как делать.
КТО-ТО советовал ---медианную регрессию

ПОМОГИТЕ разобраться, пожалуйста.

Пожалуйста, не надо раскидывать идентичные сообщения по разным темам.

С Новым годом всех!

Для сложных экспериментальных схем распространённых непараметрических аналогов нет. Поэтому ранговые методы типа парного Уилкоксона и Фридмана, конечно, отпадают. В качестве малоизвестных методов можно предложить рандомизационные (permutation) варианты дисперсионного анализа с использованием в качестве меры оценки центральной тенденции не среднего значения, а других значений, например, медианы или робастной обобщённой М-оценки Хьюбера. Но это - экзотика...

Я бы использовал в вашем случае дисперсионный анализ со сложными повторными измерениями после предварительного преобразования данных по Боксу - Коксу. "Сложные" здесь означает, что помимо серии зависимых выборок (7-кратные измерения у одних и тех же пациентов), есть ещё и фактор "Группы", в который эти пациенты вложены. Такой анализ неоднократно обсуждался на этом форуме, т.к. это очень распространённая задача в медицине: сравнить 2 или более групп в динамике. В статистических пакетах такой анализ можно задать двумя способами: или через модуль повторных измерений, или через модуль общих линейных моделей (можно ещё и через модуль обобщённых линейных измерений, но тогда результаты будут не в терминах дисперсионного анализа). Оба способа дают в точности одни и те же значения, если не используются поправки (об этом ниже). Я выкладывал видео со вторым способом в пакете Statistica сюда: https://yadi.sk/i/uakfR0fxZkhhf. Материал дан не без недочётов и спорных утверждений, зато нудно; в качестве образца сгодится:)

По поводу нормальности распределения. Распространено заблуждение, что нормально должен быть распределён во-первых, - показатель, во-вторых - в выборке, и некоторые участники форума тиражируют его. Применительно к дисперсионному анализу, то в его современных реализациях требуется нормальное распределение ошибки модели. Пакеты обычно предоставляют какой-то инструментарий чтобы её оценить, а даже если не предоставляют, можно сохранить остатки (residuals) модели и посмотреть их распределение на гистограмме. Если их распределение асимметрично, значит, вероятно, и показатель распределён в генеральной совокупности асимметрично и данные нужно предварительно нормализовать с помощью преобразований. Одно из лучших преобразований - преобразование Бокса - Кокса, почитайте про него, в т.ч. на этом форуме. Поскольку чаще всего дисперсии в ячейках дисперсионного комплекса неоднородны именно в силу асимметрии распределения, преобразование решает одновременно и задачу требования нормальности и задачу требования однородности дисперсий. По поводу последней: в анализе повторных измерений она называется требованием сферичности; существуют разные способы её оценки и разные решения в случае несоблюдения (пакет SPSS даёт полный расклад по этой части). Проще всего сделать преобразование Б-К в пакете PAST (http://folk.uio.no/ohammer/past/ , путь: Transform - Box-Cox), преобразовывать нужно не по группам, а весь набор целиком. Модулем повторных измерений в нём пока лучше не пользоваться (не всё сходится с др. пакетами).

Сообщение отредактировал nokh - 2.01.2017 - 19:43
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
doc2012
сообщение 3.01.2017 - 11:56
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 14
Регистрация: 31.12.2016
Пользователь №: 29139



Цитата(leo_biostat @ 31.12.2016 - 21:31) *
Коллега, привет!

Чтобы я мог помочь Вам советами и реально полезными методами анализа, высылайте на мой электронный адрес свой массив данных с его описанием (согласно образцам по адресу http://www.biometrica.tomsk.ru/DATA%20PRIMER.rar )
Также рекомендую выслать мне в этом же письме и свой ник в Скайпе. Обсудим эти проблемы по Скайпу.



Если можно напишите, пожалуйста, какие используются методики--я описал вид исследования подробно. Наличие числовых данных(120/80 или 125/83 или 127/81 и т.д) у каждого человека из 3х групп-вряд ли особо помогут выбрать методы исследования малых выборок 3х групп при многократных повторных измерениях.
Мне бы хотелось просто узнать --как делать? Какие методы использовать? Думаю за 20-30 лет уж кто-то делал подобные повторные измерения на 3х групах с малой выборкой. Подскажите, пожалуйста, как по аналогии делать? (кто уже делал что-то подобное ранее). Интересуют просто статистические методики
Скайпа у меня нет.
Благодарю.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
doc2012
сообщение 3.01.2017 - 12:06
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 14
Регистрация: 31.12.2016
Пользователь №: 29139



Цитата(nokh @ 2.01.2017 - 19:42) *
С Новым годом всех!

Для сложных экспериментальных схем распространённых непараметрических аналогов нет. Поэтому ранговые методы типа парного Уилкоксона и Фридмана, конечно, отпадают. В качестве малоизвестных методов можно предложить рандомизационные (permutation) варианты дисперсионного анализа с использованием в качестве меры оценки центральной тенденции не среднего значения, а других значений, например, медианы или робастной обобщённой М-оценки Хьюбера. Но это - экзотика...

Я бы использовал в вашем случае дисперсионный анализ со сложными повторными измерениями после предварительного преобразования данных по Боксу - Коксу. "Сложные" здесь означает, что помимо серии зависимых выборок (7-кратные измерения у одних и тех же пациентов), есть ещё и фактор "Группы", в который эти пациенты вложены. Такой анализ неоднократно обсуждался на этом форуме, т.к. это очень распространённая задача в медицине: сравнить 2 или более групп в динамике. В статистических пакетах такой анализ можно задать двумя способами: или через модуль повторных измерений, или через модуль общих линейных моделей (можно ещё и через модуль обобщённых линейных измерений, но тогда результаты будут не в терминах дисперсионного анализа). Оба способа дают в точности одни и те же значения, если не используются поправки (об этом ниже). Я выкладывал видео со вторым способом в пакете Statistica сюда: https://yadi.sk/i/uakfR0fxZkhhf. Материал дан не без недочётов и спорных утверждений, зато нудно; в качестве образца сгодится:)

По поводу нормальности распределения. Распространено заблуждение, что нормально должен быть распределён во-первых, - показатель, во-вторых - в выборке, и некоторые участники форума тиражируют его. Применительно к дисперсионному анализу, то в его современных реализациях требуется нормальное распределение ошибки модели. Пакеты обычно предоставляют какой-то инструментарий чтобы её оценить, а даже если не предоставляют, можно сохранить остатки (residuals) модели и посмотреть их распределение на гистограмме. Если их распределение асимметрично, значит, вероятно, и показатель распределён в генеральной совокупности асимметрично и данные нужно предварительно нормализовать с помощью преобразований. Одно из лучших преобразований - преобразование Бокса - Кокса, почитайте про него, в т.ч. на этом форуме. Поскольку чаще всего дисперсии в ячейках дисперсионного комплекса неоднородны именно в силу асимметрии распределения, преобразование решает одновременно и задачу требования нормальности и задачу требования однородности дисперсий. По поводу последней: в анализе повторных измерений она называется требованием сферичности; существуют разные способы её оценки и разные решения в случае несоблюдения (пакет SPSS даёт полный расклад по этой части). Проще всего сделать преобразование Б-К в пакете PAST (http://folk.uio.no/ohammer/past/ , путь: Transform - Box-Cox), преобразовывать нужно не по группам, а весь набор целиком. Модулем повторных измерений в нём пока лучше не пользоваться (не всё сходится с др. пакетами).



Благодарю! smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 3.01.2017 - 12:26
Сообщение #6


Дух форума
*

Группа: Пользователи
Сообщений: 1324
Регистрация: 27.11.2007
Пользователь №: 4573



В описанном дизайне возможно использование дисперсионного анализа для ПОВТОРНЫХ измерений, о чем nokh уже написал. У вас должно быть две отдельных переменных - систолическое давление и диастолическое (а не дробь, как вы написали). 7 измерений в каждой группе - это фактор времени. Повторные измерения должны быть расположены в виде отдельный переменных. Второй фактор - принадлежность к группе (3 уровня, A,B и C). Если используете программу Statistica, то трансформацию (если она необходима для ваших переменных, я советую проводить в той же программе, при этом указать все переменные (7х2) и там же указать группирующую. В программе PAST это просто нельзя сделать, как и двухфакторный ДА для повторных измерений. Если нам нужна нормальность или симметрия в ячейках дисперсионного комплекса, то почему трансформацию не провести в каждой группе. Если автор поста прицепит свои данные, можем обсудить результаты и, кстати продвинимся в сферичности или зацепим MANOVA, учитывая, что фактор может различным образом влиять на систолическое и диастолическое давление.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 3.01.2017 - 15:09
Сообщение #7


Дух форума
*

Группа: Пользователи
Сообщений: 717
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DrgLena @ 3.01.2017 - 12:26) *
... или зацепим MANOVA....


DrgLena,
кстати, если-таки зацепим, то не случалось ли вам читать мнение, что MANOVA относительно устойчива к отклонениям от нормальности? Я где-то когда-то это читал, но источник не вызвал у меня доверия.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 3.01.2017 - 16:24
Сообщение #8


Дух форума
*

Группа: Пользователи
Сообщений: 104
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(doc2012 @ 3.01.2017 - 11:56) *
Если можно напишите, пожалуйста, какие используются методики--я описал вид исследования подробно. Наличие числовых данных(120/80 или 125/83 или 127/81 и т.д) у каждого человека из 3х групп-вряд ли особо помогут выбрать методы исследования малых выборок 3х групп при многократных повторных измерениях.
Мне бы хотелось просто узнать --как делать? Какие методы использовать? Думаю за 20-30 лет уж кто-то делал подобные повторные измерения на 3х групах с малой выборкой. Подскажите, пожалуйста, как по аналогии делать? (кто уже делал что-то подобное ранее). Интересуют просто статистические методики
Скайпа у меня нет.
Благодарю.


Привет, коллега! С Новым годом поздравляю!
Если нет Скайпа, (что, признаюсь, странно, т.к. установить Скайп несложно), то вновь повторю, что надо по электронной почте выслать свой массив, и описать как сам массив, так и ЦЕЛИ исследования.
Поверьте, что адекватные и продуктивные рекомендации в принципе всем участникам форума возможно сделать лишь при наличии такой информации.
Представьте себе, что больной пациент написал Вам также несколько аналогично кратких предложений с просьбой помочь ему в лечении.
А для этого практикующему врачу нужна более подробная информация.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 3.01.2017 - 16:55
Сообщение #9


Дух форума
*

Группа: Пользователи
Сообщений: 1324
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(100$ @ 3.01.2017 - 16:09) *
DrgLena,
кстати, если-таки зацепим, то не случалось ли вам читать мнение, что MANOVA относительно устойчива к отклонениям от нормальности? Я где-то когда-то это читал, но источник не вызвал у меня доверия.

Относительно устойчивости нарушения предположений однородности дисперсии для одномерного F критерия предлагается ссылка Lindman 1974, стр. 33.
Для многомерных критериев, кроме лямбды Уилка, еще 3 реализованы в популярных пакетах и есть мнение, что об их устойчивости мало что известно. Как правило, обсуждение робастности касается, в основном, одномерного дисперсионного анализа. Так же есть мнение, что сферичность и сложная симметрия, которые редко выполняются, также не важны при использовании многомерных критериев. Ссылок нет под рукой, нужно искать специально.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 3.01.2017 - 17:18
Сообщение #10


Дух форума
*

Группа: Пользователи
Сообщений: 717
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DrgLena @ 3.01.2017 - 16:55) *
Относительно устойчивости нарушения предположений однородности дисперсии для одномерного F критерия предлагается ссылка Lindman 1974, стр. 33.
Для многомерных критериев, кроме лямбды Уилка, еще 3 реализованы в популярных пакетах и есть мнение, что об их устойчивости мало что известно. Как правило, обсуждение робастности касается, в основном, одномерного дисперсионного анализа. Так же есть мнение, что сферичность и сложная симметрия, которые редко выполняются, также не важны при использовании многомерных критериев. Ссылок нет под рукой, нужно искать специально.


Вас понял, спасибо.
Собственно про устойчивость/неустойчивость критериев проверки однородности дисперсий можно и у Лемешко с соавт. почитать. Это как раз не секрет.
А вот про всю эту многомерщину: лямбду Уилкса, следы Пиллая и Хотеллинга, наибольший корень Роя как раз и хотелось узнать. Они же все аппроксимируются F-распределением.
В общем, складывается ощущение, что в MANOV'е многомерными проверками нормальности и преобразованиями Бокса - Кокса можно и не заморачиваться.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
doc2012
сообщение 3.01.2017 - 22:54
Сообщение #11


Дух форума
*

Группа: Пользователи
Сообщений: 14
Регистрация: 31.12.2016
Пользователь №: 29139



Цитата(leo_biostat @ 3.01.2017 - 16:24) *
Привет, коллега! С Новым годом поздравляю!
Если нет Скайпа, (что, признаюсь, странно, т.к. установить Скайп несложно), то вновь повторю, что надо по электронной почте выслать свой массив, и описать как сам массив, так и ЦЕЛИ исследования.
Поверьте, что адекватные и продуктивные рекомендации в принципе всем участникам форума возможно сделать лишь при наличии такой информации.
Представьте себе, что больной пациент написал Вам также несколько аналогично кратких предложений с просьбой помочь ему в лечении.
А для этого практикующему врачу нужна более подробная информация.


Ещё раз--: имеются три группы по 20-25 человек каждая(одного пола и возраста, заболевания А и Б-как бы "родственники", но всё же разные)--в 1 группе (21 человек) заболевание А, во 2ой группе (26 человек)--заболевание Б, 3я группа (23 человека)--здоровые обследуемые. К каждой группе применяли измерение АД (артериального давления или взять просто пульс) за одни сутки---скажем 7 раз (т.е в 1 группе 7 раз, во 2 группе--7 раз, в третьей группе 7 раз) Какой метод исследования для ТРЁХ групп при МНОЖЕСТВЕННЫХ (скажем 7 раз) повторных измерениях на каждой группе (НЕзависимых) (+малая выборка--20-25 чел в каждой группе)---???? Какие используются методы статистической обработки--?
Интересуют просто методики применяемые при данной обработке данных (в подобных работах)--малые независимые группы, ненормальное распределение, повторные измерения (числовые значения), два фактора (время измерения, группа)
Несколько человек на данном форуме написали свои пояснения(см тему) не требуя массива, присланного по почте.
Скайп для меня НЕ жизненная необходимость....как-то хорошо живу и без него. wink.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 4.01.2017 - 11:03
Сообщение #12


Дух форума
*

Группа: Пользователи
Сообщений: 104
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(doc2012 @ 3.01.2017 - 22:54) *
Ещё раз--: имеются три группы по 20-25 человек каждая(одного пола и возраста, заболевания А и Б-как бы "родственники", но всё же разные)--в 1 группе (21 человек) заболевание А, во 2ой группе (26 человек)--заболевание Б, 3я группа (23 человека)--здоровые обследуемые. К каждой группе применяли измерение АД (артериального давления или взять просто пульс) за одни сутки---скажем 7 раз (т.е в 1 группе 7 раз, во 2 группе--7 раз, в третьей группе 7 раз) Какой метод исследования для ТРЁХ групп при МНОЖЕСТВЕННЫХ (скажем 7 раз) повторных измерениях на каждой группе (НЕзависимых) (+малая выборка--20-25 чел в каждой группе)---???? Какие используются методы статистической обработки--?
Интересуют просто методики применяемые при данной обработке данных (в подобных работах)--малые независимые группы, ненормальное распределение, повторные измерения (числовые значения), два фактора (время измерения, группа)
Несколько человек на данном форуме написали свои пояснения(см тему) не требуя массива, присланного по почте.
Скайп для меня НЕ жизненная необходимость....как-то хорошо живу и без него. wink.gif



Итак, у Вас есть 3 группы. Из них 2 группы с заболеваниями А и Б, а 3-я группа - здоровые. Вы упоминаете о трёх измерениях: 2 артериальных давления (полагаю, это САД и ДАД), и пульс. Наличие 7-кратных измерений в сутки, т.е. в разные времена, говорит о наличии признака "Время измерения". Целью сравнения таких трёх групп является установление наличия различий, или их отсутствия у параметров распределения значений измеряемых количественных признаков. Такие параметры разные. Например, средние значения по конкретным группам конкретного количественного признака, например, САД, иди пульса. Но кроме средних значений интересно сравнивать и другие параметры. Подробное описание параметров и специфики таких сравнений, с указанием используемых при этом стат. критериев, привожу по адресу http://www.biometrica.tomsk.ru/comp_aver.htm

Следующий аспект сравнения этих 3-х групп. У Вас есть 7 временных периодов суточных измерений. В этом случае массив данных можно представить в двух вариантах (см. http://www.biometrica.tomsk.ru/logit_7.htm). То есть можно ввести признак "Время измерения" с 7-ю градациями, и сравнить эти 7 подгрупп в КАЖДОЙ ИЗ 3-Х ГРУПП. То есть узнать, в чём отличия в разные временные измерения. Также можно провести отдельные сравнения 3-х групп в каждый из 7 временных моментов времени. То есть узнать, в какое время параметры равны, а в какое время параметры не равны. При этом вначале можно проверять гипотезы равенства/неравенства ВСЕХ 7 параметров (например, семи средних значений САД), а потом можно сравнивать пары временных измерений. Таких пар будет 7*(7-1)/2=7*3=21. Так Вы узнаете, когда, в какое время, например, повышается среднее значение САД, или среднее значение пульса. При этом, если даже есть всего лишь 3 количественных признака, САД, ДАД и пульс, (что, конечно, странно, поскольку обычно измеряют гораздо более 3-х признаков), то следует вначале установить наличие латентных, скрытых группировок пациентов. Число которых может быть равно и 2, и 3, и т.д. Для этого следует провести кластерный анализ разными алгоритмами. И, получив несколько новых признаков, определяющих нумерацию кластеров для каждого пациента, следует сравнить эти кластеры подобно сравнению 3-х прежних групп. Также следует провести анализ таблиц сопряжённости признака ГРУППА (со значениями А, Б и здоровые) с новыми признаками по нумерации кластеров. Естественно, при этом будут статистически значимые взаимосвязи пар качественных признаков. И для этих пар нужно провести анализ структуры взаимосвязей. (пример см. http://www.biometrica.tomsk.ru/logit_9.htm)

Следующий нюанс сравнения групп. Поскольку у этих групп (3-х групп, или 7 групп, или кластерных групп) есть минимум три количественных признака, то можете использовать дискриминантный анализ. Установив при этом, по каким признакам максимальные различия этих сравниваемых групп (3-х групп, или 7 групп, или кластерных групп). С примером подобных сравнений можете познакомиться скачав результаты стат. анализа, прочитав статью по адресу http://www.biometrica.tomsk.ru/Avetis.htm .

Напомню, что второй вариант представления исходного массива можно сформировать с наличием 7 признаков по САД, по ДАД, и по пульсу. Каждый из этих признаков относится к конкретному времени измерения. Т.е. получаете 7*3=21 количественный признак для каждой из групп А, Б и Здоровые. В этом случае можете провести корреляционный анализ, получив при этом 21*(21-1)/2=21*10=210 коэффициентов корреляции. Так узнаете, между какими временными моментами измерений максимальные корреляции, а в других моментах - минимальные корреляции. Такой анализ можно сделать раздельно по 3-м группам. В принципе можно использовать и дискриминантный анализ (с пошаговым алгоритмом) сравнивая группы А, Б и Здоровые с 21 признаком.


P.S.
Это последние мои рекомендации. Делайте выбор доступных Вам методов.


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 7.01.2017 - 23:29
Сообщение #13


Дух форума
*

Группа: Пользователи
Сообщений: 1113
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(DrgLena @ 3.01.2017 - 14:26) *
...В программе PAST это просто нельзя сделать, как и двухфакторный ДА для повторных измерений.

Проект PAST не стоит на месте, там постоянно что-то добавляется. Относительно недавно, например, там появились апостериорные сравнения после Краскела-Уоллиса методом Данна (до этого предлагались только Манн-Уитни с поправкой Бонферрони), скорректированные стандартизованные остатки (остатки Хабермана) для плоских таблиц сопряжённости (правда пока без р, но это элементарно решается в электронных таблицах типа Excel). В руководстве для версии 3.14 Two way repeated measures ANOVA описан на стр. 68. Но когда я его пробовал результат не сошёлся с др. пакетами; деталей не помню...
Цитата(DrgLena @ 3.01.2017 - 14:26) *
Если нам нужна нормальность или симметрия в ячейках дисперсионного комплекса, то почему трансформацию не провести в каждой группе.

Конечно, трансформацию нужно проводить во всех группах. Но она должна быть идентичной, а я советовал Бокса - Кокса. Если применять его к каждой группе в отдельности, то получится ерунда. Например, в первой группе получится лямбда=1, что равносильно отсутствию трансформации, а во второй группе лямбда=0,5, что равносильно преобразованию квадратного корня. Мы не можем сравнивать 2 группы, когда в одной - исходные данные, а в другой - корень из исходных. Поэтому я и писал, что преобразовывать нужно весь массив целиком, как одну выборку.

Сообщение отредактировал nokh - 7.01.2017 - 23:35
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 8.01.2017 - 01:03
Сообщение #14


Дух форума
*

Группа: Пользователи
Сообщений: 1324
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(nokh @ 7.01.2017 - 23:29) *
Проект PAST не стоит на месте, там постоянно что-то добавляется. Относительно недавно, например, там появились апостериорные сравнения после Краскела-Уоллиса методом Данна (до этого предлагались только Манн-Уитни с поправкой Бонферрони), скорректированные стандартизованные остатки (остатки Хабермана) для плоских таблиц сопряжённости (правда пока без р, но это элементарно решается в электронных таблицах типа Excel). В руководстве для версии 3.14 Two way repeated measures ANOVA описан на стр. 68. Но когда я его пробовал результат не сошёлся с др. пакетами; деталей не помню...

Да, у меня старый PAST, я использую его только для сравнения индексов диверсификации, но предоставленная вами информация об их развитии весьма полезна, может и в индексах они продвинулись.
Цитата(nokh @ 7.01.2017 - 23:29) *
Конечно, трансформацию нужно проводить во всех группах. Но она должна быть идентичной, а я советовал Бокса - Кокса. Если применять его к каждой группе в отдельности, то получится ерунда. Например, в первой группе получится лямбда=1, что равносильно отсутствию трансформации, а во второй группе лямбда=0,5, что равносильно преобразованию квадратного корня. Мы не можем сравнивать 2 группы, когда в одной - исходные данные, а в другой - корень из исходных. Поэтому я и писал, что преобразовывать нужно весь массив целиком, как одну выборку.

Я тоже советую Бокса-Кокса, но советую проводить трансформацию по всем подгруппам одновременно, указывая при трансформации группирующую (щие) переменные. При этом лямбда будет одна и та же для всех подгрупп. С этим справляется программа Statistica. В этом модуле предоставляется возможность добавить все трансформированные переменные к вашей базе данных (с учетом пропущенных значений). Если же вы используете PAST (повторюсь, у меня старая версия) и руками тащите туда каждую подгруппу, то там есть возможность руками вводить лямбду, что дает вам возможность использовать одинаковую лямбду.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 9.01.2017 - 18:53
Сообщение #15


Дух форума
*

Группа: Пользователи
Сообщений: 1113
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(100$ @ 3.01.2017 - 19:18) *
...
А вот про всю эту многомерщину: лямбду Уилкса, следы Пиллая и Хотеллинга, наибольший корень Роя как раз и хотелось узнать. Они же все аппроксимируются F-распределением.
В общем, складывается ощущение, что в MANOV'е многомерными проверками нормальности и преобразованиями Бокса - Кокса можно и не заморачиваться.

Книжек много, не упомнишь где что есть... Но вот в энциклопедию залез и сразу нашёл. Посмотрите разделы Multivariate Analysis of Variance и Multivariate Techniques, Robustness. Там немного обобщено + есть ссылки на источники. https://yadi.sk/i/4JDFeTYb382ARY
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему