Анализ повторных измерений |
Здравствуйте, гость ( Вход | Регистрация )
Анализ повторных измерений |
28.11.2016 - 03:23
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 15.05.2016 Пользователь №: 28268 |
Здравствуйте! Мне необходимо провести анализ массива данных одного исследования.
В группе 20 человек. Длительность исследования 3 месяца. Изучается динамика состояния рабочих в течение их работы в "некоторых условиях". Для этого проведено 16 исследований группы. Таким образом, имею 16 связанных малых выборок (этапов исследования), соответственно, объемы выборок одинаковые. У каждого участника на каждом этапе имеется примерно 120 переменных, полученных в ходе обследования. Данные не подчиняются закону нормального распределения. Одной из задач является сравнение этих выборок на предмет наличия статистически значимой динамики переменных между этими этапами, для чего хочу применить непараметрический критерий Фридмана. Однако, если он "найдет" различия на 16 этапах, то не скажет, между какими конкретно. С помощью какого критерия мне провести апостериорный анализ и уточнить, между какими этапами есть значимые различия? |
|
28.11.2016 - 10:45
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 105 Регистрация: 23.11.2016 Пользователь №: 28953 |
Здравствуйте! Мне необходимо провести анализ массива данных одного исследования. В группе 20 человек. Длительность исследования 3 месяца. Изучается динамика состояния рабочих в течение их работы в "некоторых условиях". Для этого проведено 16 исследований группы. Таким образом, имею 16 связанных малых выборок (этапов исследования), соответственно, объемы выборок одинаковые. У каждого участника на каждом этапе имеется примерно 120 переменных, полученных в ходе обследования. Данные не подчиняются закону нормального распределения. Одной из задач является сравнение этих выборок на предмет наличия статистически значимой динамики переменных между этими этапами, для чего хочу применить непараметрический критерий Фридмана. Однако, если он "найдет" различия на 16 этапах, то не скажет, между какими конкретно. С помощью какого критерия мне провести апостериорный анализ и уточнить, между какими этапами есть значимые различия? Здравствуйте, Marinheiro! Из Вашего описания неясно, сколько наблюдений в Вашем массиве данных: 16*20=320, или же всего 20 человек. А 16 исследований - это 120 переменных. Как специалист, занимающийся статистическим анализом как медикобиологических, так и иных, специальных данных, уже более 35 лет, хочу обратить Ваше внимание на то, в реальных исследованиях надо вначале выбирать не набор статистических критериев, используемых для анализа, а ясно и чётко формулировать цели самого исследования. То есть написать, зачем проводится конкретное исследование? Какую цель желает достичь исследователь? Как планируется использовать будущие результаты статистического анализа? Например, использовать для улучшения технологии лечения больных пациентов, либо корректировать состояния изучаемых объектов (например, рабочих, студентов, и т.п.) изменяя в конкретных направлениях (уменьшая или увеличивая) значения некоторого набора признаков. И т.д. И вот из этих целей далее можно (и нужно!) формулировать вначале желаемые методы анализа. Причём, если признаков не 2-3, а больше, то использовать не только сравнения средних параметрическими или непараметрическими методами, но и разные многомерные методы, которые учитывают не только различия средних, но и взаимосвязи между разными признаками. В тех исследованиях, которые мы с коллегами проводим уже более 35 лет, для таких задач обычно используется порядка 15-25 разных видов статистического анализа. А с учётом количества анализируемых признаков количество взаимозависимостей между признаками гораздо больше. Прочитайте пару статей по адресам http://www.biometrica.tomsk.ru/comp_aver.htm и http://www.biometrica.tomsk.ru/percent_00.htm , и там приведены примеры того, какие наиболее популярные виды анализа используются в реальных исследованиях в медицине. Также хочу обратить внимание на следующий аспект Вашего исследования. 120 переменных - это отличный результат! Тем более 16 выборок в динамике. Значит помимо использования критериев типа Фридмана, следует обязательно применить и такие многомерные методы, как логистическая регрессия (http://www.biometrica.tomsk.ru/logit_1.htm --- http://www.biometrica.tomsk.ru/logit_1.htm ) и кластерный анализ (http://www.biometrica.tomsk.ru/cluster_1.htm) Относительно выбора стат. критерия для сравнения более двух групп. Не следует выбирать только один критерий. А следует использовать несколько разных критериев. Поскольку специфика разных сравниваемых групп разная. И разные методы могут как раз эту специфику помочь обнаруживать. В качестве примера такого подхода ниже приведу один из результатов по использованию набора разных критериев. Analysis of Variance for Variable Y12 Classified by Variable XX2 XX2 N Mean лёгкая полиморб-ть 31 60.967742 средняя полиморб-ть 170 47.458824 тяжёлая полиморб-ть 10 25.000000 Source DF Sum of Squares Mean Square F Value Pr > F Among 2 10522.488740 5261.244370 36.4110 <.0001 Within 208 30055.179507 144.496055 Wilcoxon Scores (Rank Sums) for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 5069.0 3286.0 311.047182 163.516129 средняя полиморб-ть 170 17079.0 18020.0 347.636653 100.464706 тяжёлая полиморб-ть 10 218.0 1060.0 186.684044 21.800000 Average scores were used for ties. Kruskal-Wallis Test Chi-Square 48.8335 DF 2 Pr > Chi-Square <.0001 Pairwise Two-Sided Multiple Comparison Analysis Dwass, Steel, Critchlow-Fligner Method Variable: Y12 (Здесь производятся попарные сравнения групп) Y12 Wilcoxon Z DSCF Value Pr > DSCF лёгкая полиморб-ть vs. средняя полиморб-ть 5.5254 7.8141 <.0001 лёгкая полиморб-ть vs. тяжёлая полиморб-ть 4.7241 6.6808 <.0001 средняя полиморб-ть vs. тяжёлая полиморб-ть 4.3428 6.1416 <.0001 Median Scores (Number of Points Above Median) for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 25.20 15.426540 2.457283 0.812903 средняя полиморб-ть 170 79.80 84.597156 2.746341 0.469412 тяжёлая полиморб-ть 10 0.00 4.976303 1.474810 0.000000 Average scores were used for ties. Median One-Way Analysis Chi-Square 24.9336 DF 2 Pr > Chi-Square <.0001 Van der Waerden Scores (Normal) for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 30.656406 0.0 4.962789 0.988916 средняя полиморб-ть 170 -15.806146 0.0 5.546578 -0.092977 тяжёлая полиморб-ть 10 -14.850260 0.0 2.978563 -1.485026 Average scores were used for ties. Van der Waerden One-Way Analysis Chi-Square 57.8095 DF 2 Pr > Chi-Square <.0001 Siegel-Tukey Scores for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 2614.4454 3286.0 302.721216 84.336949 средняя полиморб-ть 170 19320.5175 18020.0 338.331277 113.650103 тяжёлая полиморб-ть 10 431.0370 1060.0 181.686972 43.103704 Average scores were used for ties. Siegel-Tukey One-Way Analysis Chi-Square 18.4854 DF 2 Pr > Chi-Square <.0001 Центр BIOSTATISTICA. Skype: leo_1911 E-mail: leo.biostat@gmail.com Web-Site BIOMETRICA http:\\www.biometrica.tomsk.ru\ Ansari-Bradley Scores for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 1314.60 1650.78673 151.374798 42.406452 средняя полиморб-ть 170 9703.40 9052.70142 169.181498 57.078824 тяжёлая полиморб-ть 10 218.00 532.51185 90.852003 21.800000 Average scores were used for ties. Ansari-Bradley One-Way Analysis Chi-Square 18.4983 DF 2 Pr > Chi-Square <.0001 Отмечу, что предварительно, до проведения данного блока анализа, следует произвести проверку нормальности ВСЕХ сравниваемых количественных признаков, раздельно во ВСЕХ сравниваемых группах. Это очень важно, т.к. помимо выбора параметрического или непараметрического критерия сравнения, отсутствие нормального распределения будет информацией о том, что данный признак имеет связи с другими признаками, группирующими (например, периодами наблюдения) или количественными (корреляции, регрессии, и т.п.). Итак, желаю Вам вначале ясно и чётко сформулировать саму цель исследования, и под неё выбрать целый набор продуктивных методов анализа. Лишь тогда Ваши выводы и рекомендации будут убедительны и доказательны для тех, кому они будут рекомендованы. Желаю успешного исследования! Сообщение отредактировал leo_biostat - 28.11.2016 - 13:27 |
|
28.11.2016 - 13:20
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Здравствуйте! Мне необходимо провести анализ массива данных одного исследования. В группе 20 человек. Длительность исследования 3 месяца. Изучается динамика состояния рабочих в течение их работы в "некоторых условиях". Для этого проведено 16 исследований группы. Таким образом, имею 16 связанных малых выборок (этапов исследования), соответственно, объемы выборок одинаковые. У каждого участника на каждом этапе имеется примерно 120 переменных, полученных в ходе обследования. Данные не подчиняются закону нормального распределения. Одной из задач является сравнение этих выборок на предмет наличия статистически значимой динамики переменных между этими этапами, для чего хочу применить непараметрический критерий Фридмана. Однако, если он "найдет" различия на 16 этапах, то не скажет, между какими конкретно. С помощью какого критерия мне провести апостериорный анализ и уточнить, между какими этапами есть значимые различия? Если результатом каждого этапа является вектор из 120 параметров на человека, то это задача для однофакторной MANOV'ы с повторными измерениями (Within-фактор = время). Post hoc'и при этом можно провести парным критерием Хотеллинга, достигаемые уровни значимости с учетом их коррелированности откорректировать процедурой Беньямини-Йекутили. |
|
28.11.2016 - 17:56
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 15.05.2016 Пользователь №: 28268 |
Здравствуйте, Marinheiro! Из Вашего описания неясно, сколько наблюдений в Вашем массиве данных: 16*20=320, или же всего 20 человек. А 16 исследований - это 120 переменных. Как специалист, занимающийся статистическим анализом как медикобиологических, так и иных, специальных данных, уже более 35 лет, хочу обратить Ваше внимание на то, в реальных исследованиях надо вначале выбирать не набор статистических критериев, используемых для анализа, а ясно и чётко формулировать цели самого исследования. То есть написать, зачем проводится конкретное исследование? Какую цель желает достичь исследователь? Как планируется использовать будущие результаты статистического анализа? Например, использовать для улучшения технологии лечения больных пациентов, либо корректировать состояния изучаемых объектов (например, рабочих, студентов, и т.п.) изменяя в конкретных направлениях (уменьшая или увеличивая) значения некоторого набора признаков. И т.д. И вот из этих целей далее можно (и нужно!) формулировать вначале желаемые методы анализа. Причём, если признаков не 2-3, а больше, то использовать не только сравнения средних параметрическими или непараметрическими методами, но и разные многомерные методы, которые учитывают не только различия средних, но и взаимосвязи между разными признаками. В тех исследованиях, которые мы с коллегами проводим уже более 35 лет, для таких задач обычно используется порядка 15-25 разных видов статистического анализа. А с учётом количества анализируемых признаков количество взаимозависимостей между признаками гораздо больше. Прочитайте пару статей по адресам http://www.biometrica.tomsk.ru/comp_aver.htm и http://www.biometrica.tomsk.ru/percent_00.htm , и там приведены примеры того, какие наиболее популярные виды анализа используются в реальных исследованиях в медицине. Также хочу обратить внимание на следующий аспект Вашего исследования. 120 переменных - это отличный результат! Тем более 16 выборок в динамике. Значит помимо использования критериев типа Фридмана, следует обязательно применить и такие многомерные методы, как логистическая регрессия (http://www.biometrica.tomsk.ru/logit_1.htm --- http://www.biometrica.tomsk.ru/logit_1.htm ) и кластерный анализ (http://www.biometrica.tomsk.ru/cluster_1.htm) Относительно выбора стат. критерия для сравнения более двух групп. Не следует выбирать только один критерий. А следует использовать несколько разных критериев. Поскольку специфика разных сравниваемых групп разная. И разные методы могут как раз эту специфику помочь обнаруживать. В качестве примера такого подхода ниже приведу один из результатов по использованию набора разных критериев. Analysis of Variance for Variable Y12 Classified by Variable XX2 XX2 N Mean лёгкая полиморб-ть 31 60.967742 средняя полиморб-ть 170 47.458824 тяжёлая полиморб-ть 10 25.000000 Source DF Sum of Squares Mean Square F Value Pr > F Among 2 10522.488740 5261.244370 36.4110 <.0001 Within 208 30055.179507 144.496055 Wilcoxon Scores (Rank Sums) for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 5069.0 3286.0 311.047182 163.516129 средняя полиморб-ть 170 17079.0 18020.0 347.636653 100.464706 тяжёлая полиморб-ть 10 218.0 1060.0 186.684044 21.800000 Average scores were used for ties. Kruskal-Wallis Test Chi-Square 48.8335 DF 2 Pr > Chi-Square <.0001 Pairwise Two-Sided Multiple Comparison Analysis Dwass, Steel, Critchlow-Fligner Method Variable: Y12 (Здесь производятся попарные сравнения групп) Y12 Wilcoxon Z DSCF Value Pr > DSCF лёгкая полиморб-ть vs. средняя полиморб-ть 5.5254 7.8141 <.0001 лёгкая полиморб-ть vs. тяжёлая полиморб-ть 4.7241 6.6808 <.0001 средняя полиморб-ть vs. тяжёлая полиморб-ть 4.3428 6.1416 <.0001 Median Scores (Number of Points Above Median) for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 25.20 15.426540 2.457283 0.812903 средняя полиморб-ть 170 79.80 84.597156 2.746341 0.469412 тяжёлая полиморб-ть 10 0.00 4.976303 1.474810 0.000000 Average scores were used for ties. Median One-Way Analysis Chi-Square 24.9336 DF 2 Pr > Chi-Square <.0001 Van der Waerden Scores (Normal) for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 30.656406 0.0 4.962789 0.988916 средняя полиморб-ть 170 -15.806146 0.0 5.546578 -0.092977 тяжёлая полиморб-ть 10 -14.850260 0.0 2.978563 -1.485026 Average scores were used for ties. Van der Waerden One-Way Analysis Chi-Square 57.8095 DF 2 Pr > Chi-Square <.0001 Siegel-Tukey Scores for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 2614.4454 3286.0 302.721216 84.336949 средняя полиморб-ть 170 19320.5175 18020.0 338.331277 113.650103 тяжёлая полиморб-ть 10 431.0370 1060.0 181.686972 43.103704 Average scores were used for ties. Siegel-Tukey One-Way Analysis Chi-Square 18.4854 DF 2 Pr > Chi-Square <.0001 Центр BIOSTATISTICA. Skype: leo_1911 E-mail: leo.biostat@gmail.com Web-Site BIOMETRICA http:\\www.biometrica.tomsk.ru\ Ansari-Bradley Scores for Variable Y12 Classified by Variable XX2 Sum of Expected Std Dev Mean V156A N Scores Under H0 Under H0 Score лёгкая полиморб-ть 31 1314.60 1650.78673 151.374798 42.406452 средняя полиморб-ть 170 9703.40 9052.70142 169.181498 57.078824 тяжёлая полиморб-ть 10 218.00 532.51185 90.852003 21.800000 Average scores were used for ties. Ansari-Bradley One-Way Analysis Chi-Square 18.4983 DF 2 Pr > Chi-Square <.0001 Отмечу, что предварительно, до проведения данного блока анализа, следует произвести проверку нормальности ВСЕХ сравниваемых количественных признаков, раздельно во ВСЕХ сравниваемых группах. Это очень важно, т.к. помимо выбора параметрического или непараметрического критерия сравнения, отсутствие нормального распределения будет информацией о том, что данный признак имеет связи с другими признаками, группирующими (например, периодами наблюдения) или количественными (корреляции, регрессии, и т.п.). Итак, желаю Вам вначале ясно и чётко сформулировать саму цель исследования, и под неё выбрать целый набор продуктивных методов анализа. Лишь тогда Ваши выводы и рекомендации будут убедительны и доказательны для тех, кому они будут рекомендованы. Желаю успешного исследования! Спасибо за совет! Если результатом каждого этапа является вектор из 120 параметров на человека, то это задача для однофакторной MANOV'ы с повторными измерениями (Within-фактор = время). Post hoc'и при этом можно провести парным критерием Хотеллинга, достигаемые уровни значимости с учетом их коррелированности откорректировать процедурой Беньямини-Йекутили. Спасибо, буду работать! |
|