Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Анализ повторных измерений
Marinheiro
сообщение 28.11.2016 - 03:23
Сообщение #1





Группа: Пользователи
Сообщений: 5
Регистрация: 15.05.2016
Пользователь №: 28268



Здравствуйте! Мне необходимо провести анализ массива данных одного исследования.
В группе 20 человек. Длительность исследования 3 месяца. Изучается динамика состояния рабочих в течение их работы в "некоторых условиях". Для этого проведено 16 исследований группы. Таким образом, имею 16 связанных малых выборок (этапов исследования), соответственно, объемы выборок одинаковые. У каждого участника на каждом этапе имеется примерно 120 переменных, полученных в ходе обследования. Данные не подчиняются закону нормального распределения.
Одной из задач является сравнение этих выборок на предмет наличия статистически значимой динамики переменных между этими этапами, для чего хочу применить непараметрический критерий Фридмана. Однако, если он "найдет" различия на 16 этапах, то не скажет, между какими конкретно. С помощью какого критерия мне провести апостериорный анализ и уточнить, между какими этапами есть значимые различия?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 28.11.2016 - 10:45
Сообщение #2





Группа: Пользователи
Сообщений: 105
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(Marinheiro @ 28.11.2016 - 03:23) *
Здравствуйте! Мне необходимо провести анализ массива данных одного исследования.
В группе 20 человек. Длительность исследования 3 месяца. Изучается динамика состояния рабочих в течение их работы в "некоторых условиях". Для этого проведено 16 исследований группы. Таким образом, имею 16 связанных малых выборок (этапов исследования), соответственно, объемы выборок одинаковые. У каждого участника на каждом этапе имеется примерно 120 переменных, полученных в ходе обследования. Данные не подчиняются закону нормального распределения.
Одной из задач является сравнение этих выборок на предмет наличия статистически значимой динамики переменных между этими этапами, для чего хочу применить непараметрический критерий Фридмана. Однако, если он "найдет" различия на 16 этапах, то не скажет, между какими конкретно. С помощью какого критерия мне провести апостериорный анализ и уточнить, между какими этапами есть значимые различия?



Здравствуйте, Marinheiro!

Из Вашего описания неясно, сколько наблюдений в Вашем массиве данных: 16*20=320, или же всего 20 человек. А 16 исследований - это 120 переменных.
Как специалист, занимающийся статистическим анализом как медикобиологических, так и иных, специальных данных, уже более 35 лет, хочу обратить Ваше внимание на то, в реальных исследованиях надо вначале выбирать не набор статистических критериев, используемых для анализа, а ясно и чётко формулировать цели самого исследования. То есть написать, зачем проводится конкретное исследование? Какую цель желает достичь исследователь? Как планируется использовать будущие результаты статистического анализа? Например, использовать для улучшения технологии лечения больных пациентов, либо корректировать состояния изучаемых объектов (например, рабочих, студентов, и т.п.) изменяя в конкретных направлениях (уменьшая или увеличивая) значения некоторого набора признаков. И т.д. И вот из этих целей далее можно (и нужно!) формулировать вначале желаемые методы анализа. Причём, если признаков не 2-3, а больше, то использовать не только сравнения средних параметрическими или непараметрическими методами, но и разные многомерные методы, которые учитывают не только различия средних, но и взаимосвязи между разными признаками. В тех исследованиях, которые мы с коллегами проводим уже более 35 лет, для таких задач обычно используется порядка 15-25 разных видов статистического анализа. А с учётом количества анализируемых признаков количество взаимозависимостей между признаками гораздо больше. Прочитайте пару статей по адресам http://www.biometrica.tomsk.ru/comp_aver.htm и http://www.biometrica.tomsk.ru/percent_00.htm , и там приведены примеры того, какие наиболее популярные виды анализа используются в реальных исследованиях в медицине. Также хочу обратить внимание на следующий аспект Вашего исследования. 120 переменных - это отличный результат! Тем более 16 выборок в динамике. Значит помимо использования критериев типа Фридмана, следует обязательно применить и такие многомерные методы, как логистическая регрессия (http://www.biometrica.tomsk.ru/logit_1.htm --- http://www.biometrica.tomsk.ru/logit_1.htm ) и кластерный анализ (http://www.biometrica.tomsk.ru/cluster_1.htm)

Относительно выбора стат. критерия для сравнения более двух групп. Не следует выбирать только один критерий. А следует использовать несколько разных критериев. Поскольку специфика разных сравниваемых групп разная. И разные методы могут как раз эту специфику помочь обнаруживать. В качестве примера такого подхода ниже приведу один из результатов по использованию набора разных критериев.


Analysis of Variance for Variable Y12
Classified by Variable XX2

XX2 N Mean

лёгкая полиморб-ть 31 60.967742
средняя полиморб-ть 170 47.458824
тяжёлая полиморб-ть 10 25.000000


Source DF Sum of Squares Mean Square F Value Pr > F

Among 2 10522.488740 5261.244370 36.4110 <.0001
Within 208 30055.179507 144.496055

Wilcoxon Scores (Rank Sums) for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 5069.0 3286.0 311.047182 163.516129
средняя полиморб-ть 170 17079.0 18020.0 347.636653 100.464706
тяжёлая полиморб-ть 10 218.0 1060.0 186.684044 21.800000

Average scores were used for ties.


Kruskal-Wallis Test

Chi-Square 48.8335
DF 2
Pr > Chi-Square <.0001


Pairwise Two-Sided Multiple Comparison Analysis
Dwass, Steel, Critchlow-Fligner Method
Variable: Y12

(Здесь производятся попарные сравнения групп)


Y12 Wilcoxon Z DSCF Value Pr > DSCF

лёгкая полиморб-ть vs. средняя полиморб-ть 5.5254 7.8141 <.0001
лёгкая полиморб-ть vs. тяжёлая полиморб-ть 4.7241 6.6808 <.0001
средняя полиморб-ть vs. тяжёлая полиморб-ть 4.3428 6.1416 <.0001


Median Scores (Number of Points Above Median) for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 25.20 15.426540 2.457283 0.812903
средняя полиморб-ть 170 79.80 84.597156 2.746341 0.469412
тяжёлая полиморб-ть 10 0.00 4.976303 1.474810 0.000000

Average scores were used for ties.


Median One-Way Analysis

Chi-Square 24.9336
DF 2
Pr > Chi-Square <.0001

Van der Waerden Scores (Normal) for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 30.656406 0.0 4.962789 0.988916
средняя полиморб-ть 170 -15.806146 0.0 5.546578 -0.092977
тяжёлая полиморб-ть 10 -14.850260 0.0 2.978563 -1.485026

Average scores were used for ties.


Van der Waerden One-Way Analysis

Chi-Square 57.8095
DF 2
Pr > Chi-Square <.0001

Siegel-Tukey Scores for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 2614.4454 3286.0 302.721216 84.336949
средняя полиморб-ть 170 19320.5175 18020.0 338.331277 113.650103
тяжёлая полиморб-ть 10 431.0370 1060.0 181.686972 43.103704

Average scores were used for ties.


Siegel-Tukey One-Way Analysis

Chi-Square 18.4854
DF 2
Pr > Chi-Square <.0001

Центр BIOSTATISTICA. Skype: leo_1911 E-mail: leo.biostat@gmail.com
Web-Site BIOMETRICA http:\\www.biometrica.tomsk.ru\

Ansari-Bradley Scores for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 1314.60 1650.78673 151.374798 42.406452
средняя полиморб-ть 170 9703.40 9052.70142 169.181498 57.078824
тяжёлая полиморб-ть 10 218.00 532.51185 90.852003 21.800000

Average scores were used for ties.


Ansari-Bradley One-Way Analysis

Chi-Square 18.4983
DF 2
Pr > Chi-Square <.0001

Отмечу, что предварительно, до проведения данного блока анализа, следует произвести проверку нормальности ВСЕХ сравниваемых количественных признаков, раздельно во ВСЕХ сравниваемых группах.
Это очень важно, т.к. помимо выбора параметрического или непараметрического критерия сравнения, отсутствие нормального распределения будет информацией о том, что данный признак имеет связи с другими признаками, группирующими (например, периодами наблюдения) или количественными (корреляции, регрессии, и т.п.).

Итак, желаю Вам вначале ясно и чётко сформулировать саму цель исследования, и под неё выбрать целый набор продуктивных методов анализа. Лишь тогда Ваши выводы и рекомендации будут убедительны и доказательны для тех, кому они будут рекомендованы.

Желаю успешного исследования!

Сообщение отредактировал leo_biostat - 28.11.2016 - 13:27
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 28.11.2016 - 13:20
Сообщение #3





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Marinheiro @ 28.11.2016 - 03:23) *
Здравствуйте! Мне необходимо провести анализ массива данных одного исследования.
В группе 20 человек. Длительность исследования 3 месяца. Изучается динамика состояния рабочих в течение их работы в "некоторых условиях". Для этого проведено 16 исследований группы. Таким образом, имею 16 связанных малых выборок (этапов исследования), соответственно, объемы выборок одинаковые. У каждого участника на каждом этапе имеется примерно 120 переменных, полученных в ходе обследования. Данные не подчиняются закону нормального распределения.
Одной из задач является сравнение этих выборок на предмет наличия статистически значимой динамики переменных между этими этапами, для чего хочу применить непараметрический критерий Фридмана. Однако, если он "найдет" различия на 16 этапах, то не скажет, между какими конкретно. С помощью какого критерия мне провести апостериорный анализ и уточнить, между какими этапами есть значимые различия?


Если результатом каждого этапа является вектор из 120 параметров на человека, то это задача для однофакторной MANOV'ы с повторными измерениями (Within-фактор = время).
Post hoc'и при этом можно провести парным критерием Хотеллинга, достигаемые уровни значимости с учетом их коррелированности откорректировать процедурой Беньямини-Йекутили.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Marinheiro
сообщение 28.11.2016 - 17:56
Сообщение #4





Группа: Пользователи
Сообщений: 5
Регистрация: 15.05.2016
Пользователь №: 28268



Цитата(leo_biostat @ 28.11.2016 - 11:45) *
Здравствуйте, Marinheiro!

Из Вашего описания неясно, сколько наблюдений в Вашем массиве данных: 16*20=320, или же всего 20 человек. А 16 исследований - это 120 переменных.
Как специалист, занимающийся статистическим анализом как медикобиологических, так и иных, специальных данных, уже более 35 лет, хочу обратить Ваше внимание на то, в реальных исследованиях надо вначале выбирать не набор статистических критериев, используемых для анализа, а ясно и чётко формулировать цели самого исследования. То есть написать, зачем проводится конкретное исследование? Какую цель желает достичь исследователь? Как планируется использовать будущие результаты статистического анализа? Например, использовать для улучшения технологии лечения больных пациентов, либо корректировать состояния изучаемых объектов (например, рабочих, студентов, и т.п.) изменяя в конкретных направлениях (уменьшая или увеличивая) значения некоторого набора признаков. И т.д. И вот из этих целей далее можно (и нужно!) формулировать вначале желаемые методы анализа. Причём, если признаков не 2-3, а больше, то использовать не только сравнения средних параметрическими или непараметрическими методами, но и разные многомерные методы, которые учитывают не только различия средних, но и взаимосвязи между разными признаками. В тех исследованиях, которые мы с коллегами проводим уже более 35 лет, для таких задач обычно используется порядка 15-25 разных видов статистического анализа. А с учётом количества анализируемых признаков количество взаимозависимостей между признаками гораздо больше. Прочитайте пару статей по адресам http://www.biometrica.tomsk.ru/comp_aver.htm и http://www.biometrica.tomsk.ru/percent_00.htm , и там приведены примеры того, какие наиболее популярные виды анализа используются в реальных исследованиях в медицине. Также хочу обратить внимание на следующий аспект Вашего исследования. 120 переменных - это отличный результат! Тем более 16 выборок в динамике. Значит помимо использования критериев типа Фридмана, следует обязательно применить и такие многомерные методы, как логистическая регрессия (http://www.biometrica.tomsk.ru/logit_1.htm --- http://www.biometrica.tomsk.ru/logit_1.htm ) и кластерный анализ (http://www.biometrica.tomsk.ru/cluster_1.htm)

Относительно выбора стат. критерия для сравнения более двух групп. Не следует выбирать только один критерий. А следует использовать несколько разных критериев. Поскольку специфика разных сравниваемых групп разная. И разные методы могут как раз эту специфику помочь обнаруживать. В качестве примера такого подхода ниже приведу один из результатов по использованию набора разных критериев.


Analysis of Variance for Variable Y12
Classified by Variable XX2

XX2 N Mean

лёгкая полиморб-ть 31 60.967742
средняя полиморб-ть 170 47.458824
тяжёлая полиморб-ть 10 25.000000


Source DF Sum of Squares Mean Square F Value Pr > F

Among 2 10522.488740 5261.244370 36.4110 <.0001
Within 208 30055.179507 144.496055

Wilcoxon Scores (Rank Sums) for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 5069.0 3286.0 311.047182 163.516129
средняя полиморб-ть 170 17079.0 18020.0 347.636653 100.464706
тяжёлая полиморб-ть 10 218.0 1060.0 186.684044 21.800000

Average scores were used for ties.


Kruskal-Wallis Test

Chi-Square 48.8335
DF 2
Pr > Chi-Square <.0001


Pairwise Two-Sided Multiple Comparison Analysis
Dwass, Steel, Critchlow-Fligner Method
Variable: Y12

(Здесь производятся попарные сравнения групп)


Y12 Wilcoxon Z DSCF Value Pr > DSCF

лёгкая полиморб-ть vs. средняя полиморб-ть 5.5254 7.8141 <.0001
лёгкая полиморб-ть vs. тяжёлая полиморб-ть 4.7241 6.6808 <.0001
средняя полиморб-ть vs. тяжёлая полиморб-ть 4.3428 6.1416 <.0001


Median Scores (Number of Points Above Median) for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 25.20 15.426540 2.457283 0.812903
средняя полиморб-ть 170 79.80 84.597156 2.746341 0.469412
тяжёлая полиморб-ть 10 0.00 4.976303 1.474810 0.000000

Average scores were used for ties.


Median One-Way Analysis

Chi-Square 24.9336
DF 2
Pr > Chi-Square <.0001

Van der Waerden Scores (Normal) for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 30.656406 0.0 4.962789 0.988916
средняя полиморб-ть 170 -15.806146 0.0 5.546578 -0.092977
тяжёлая полиморб-ть 10 -14.850260 0.0 2.978563 -1.485026

Average scores were used for ties.


Van der Waerden One-Way Analysis

Chi-Square 57.8095
DF 2
Pr > Chi-Square <.0001

Siegel-Tukey Scores for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 2614.4454 3286.0 302.721216 84.336949
средняя полиморб-ть 170 19320.5175 18020.0 338.331277 113.650103
тяжёлая полиморб-ть 10 431.0370 1060.0 181.686972 43.103704

Average scores were used for ties.


Siegel-Tukey One-Way Analysis

Chi-Square 18.4854
DF 2
Pr > Chi-Square <.0001

Центр BIOSTATISTICA. Skype: leo_1911 E-mail: leo.biostat@gmail.com
Web-Site BIOMETRICA http:\\www.biometrica.tomsk.ru\

Ansari-Bradley Scores for Variable Y12
Classified by Variable XX2

Sum of Expected Std Dev Mean
V156A N Scores Under H0 Under H0 Score

лёгкая полиморб-ть 31 1314.60 1650.78673 151.374798 42.406452
средняя полиморб-ть 170 9703.40 9052.70142 169.181498 57.078824
тяжёлая полиморб-ть 10 218.00 532.51185 90.852003 21.800000

Average scores were used for ties.


Ansari-Bradley One-Way Analysis

Chi-Square 18.4983
DF 2
Pr > Chi-Square <.0001

Отмечу, что предварительно, до проведения данного блока анализа, следует произвести проверку нормальности ВСЕХ сравниваемых количественных признаков, раздельно во ВСЕХ сравниваемых группах.
Это очень важно, т.к. помимо выбора параметрического или непараметрического критерия сравнения, отсутствие нормального распределения будет информацией о том, что данный признак имеет связи с другими признаками, группирующими (например, периодами наблюдения) или количественными (корреляции, регрессии, и т.п.).

Итак, желаю Вам вначале ясно и чётко сформулировать саму цель исследования, и под неё выбрать целый набор продуктивных методов анализа. Лишь тогда Ваши выводы и рекомендации будут убедительны и доказательны для тех, кому они будут рекомендованы.

Желаю успешного исследования!


Спасибо за совет!

Цитата(100$ @ 28.11.2016 - 14:20) *
Если результатом каждого этапа является вектор из 120 параметров на человека, то это задача для однофакторной MANOV'ы с повторными измерениями (Within-фактор = время).
Post hoc'и при этом можно провести парным критерием Хотеллинга, достигаемые уровни значимости с учетом их коррелированности откорректировать процедурой Беньямини-Йекутили.

Спасибо, буду работать!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему