t-критерий Стьюдента для зависимых групп |
Здравствуйте, гость ( Вход | Регистрация )
t-критерий Стьюдента для зависимых групп |
11.08.2012 - 14:53
Сообщение
#1
|
|||
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064 |
Добрый день! Изучаю статистику по О.Ю.Реброву самостоятельно, использую Statistica 8.
Подскажите, пожалуйста, 2 группы, исследуем 4 количественных признака, в каждой группе n=70. Наша задача: сопоставить анализ крови до и после принятия препарата у здоровых и у больных. Наши действия: 1. Проверили на нормальность - каждый признака по Тесту Колмогорову ?Смирнову (у всех признаков результат примерно аналогичен 2. Т.к. распределение признаков нормальное, и группы зависимые (признаки изучали у одной группы до и после принятия препарата) применили статистический анализ (t-критерий Стьюдента для зависимых групп) 3. При анализе выходит примерно такой ответ ( Вопрос: 1. Правильны ли наши действия? 2. Различия значений всех 4-х количественных признаков недостоверны? 3. У нас получается р> 0.05, подскажите пожалуйста как можно интерпретировать, и провести описание результатов? Большое спасибо! |
||
|
11.08.2012 - 16:28
Сообщение
#2
|
|||
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Добрый день! Изучаю статистику по О.Ю.Реброву самостоятельно, использую Statistica 8. Подскажите, пожалуйста, 2 группы, исследуем 4 количественных признака, в каждой группе n=70. Наша задача: сопоставить анализ крови до и после принятия препарата у здоровых и у больных. Наши действия: 1. Проверили на нормальность - каждый признака по Тесту Колмогорову ?Смирнову (у всех признаков результат примерно аналогичен 2. Т.к. распределение признаков нормальное, и группы зависимые (признаки изучали у одной группы до и после принятия препарата) применили статистический анализ (t-критерий Стьюдента для зависимых групп) 3. При анализе выходит примерно такой ответ ( Вопрос: 1. Правильны ли наши действия? 2. Различия значений всех 4-х количественных признаков недостоверны? 3. У нас получается р> 0.05, подскажите пожалуйста как можно интерпретировать, и провести описание результатов? Большое спасибо! Поскольку одновременно изучаются 4 количественных признака, то необходимо задействовать инструменты многомерного статистического анализа (One-way MANOVA). |
||
|
11.08.2012 - 17:34
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064 |
Спасибо большое за ответ. Мы изучали каждый признак по отдельности. MANOVA как я понял, применяется, когда 3 и более групп, поэтому использовали Стьюдента
|
|
11.08.2012 - 19:35
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
Спасибо большое за ответ. Мы изучали каждый признак по отдельности. MANOVA как я понял, применяется, когда 3 и более групп, поэтому использовали Стьюдента Когда Вы изучаете каждый из 4 признаков по отдельности, то есть 4 раза в одной работе применяете тест Стьюдента, существует вероятность, что Вы совершите ошибку 1 рода - найдете отличия между изучаемыми признаками, когда на самом деле эти различия очень малы, чтобы считать их статистически значимыми или у вас недостаточная выборка, чтобы обнаружить эти отличия. Поэтому используйте или методы многомерного анализа данных или применяете поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др). Хотя если Вы не получили ни одного статистически значимого признака по-отдельнсти, понятно, что поправки лишь все это дело сделают еще более консервативным, но, по-крайней мере, это будет методологически правильно. Поищите на этом форуме как трактуются результаты при р > .05 (была тема) - не допускайте ошибки, что различий между изучаемыми признакми нет (Вы этого никогда не узнаете ) |
|
11.08.2012 - 19:48
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064 |
TheThing, большое спасибо Вам. Начинаю понимать, действительно у нас между признаками различия незначительны, поэтому и выдает такой ответ. Буду искать на форуме трактовку результатов p>0.05. А поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др) вычисляются в Statistica и какие методы многомерного анализа данных посоветуйте в моем случае? Спасибо.
|
|
11.08.2012 - 21:51
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
TheThing, большое спасибо Вам. Начинаю понимать, действительно у нас между признаками различия незначительны, поэтому и выдает такой ответ. Буду искать на форуме трактовку результатов p>0.05. А поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др) вычисляются в Statistica и какие методы многомерного анализа данных посоветуйте в моем случае? Спасибо. Большинство поправок можно высчитать "ручками" - например, Бонферрони: 1) выбираете уровень стат. значимости, который Вас устраивает, например 0.01. 2) Делите 0.01 на количество анализируемых признаков(если у Вас 4 признака, получится 0,0025. 3) проводите 4 теста Стьюдента, получаете p-value. 4) Если полученное p-value меньше 0,0025, значит признак стат. значим. Остальные поправки ненамного сложнее, FDR требует сортировки значений и способности умножить одну величину на другую Просто в Вашем случае все равно, какую поправку Вы примените, поскольку Вы в любом случае не получите стат. значимых отличий (если не получилось получить без поправок, с поправками будет вообще невозможно). Я не работаю в Статистика, поэтому не могу подсказать, где искать эти поправки. В любом случае, если умные люди придумали методы многомерного анализа данных, нужно применять их. Попробуйте применить метод, который посоветовал 100$, когда подсчитаете, если не затруднит, выложите результаты здесь. |
|
11.08.2012 - 22:05
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064 |
Большое спасибо за ценные советы! Да в любом случае мы не получим статистически значимых отличий, но для ?спортивного? интереса попробую применить метод ?One-way MANOVA?, правда еще не знаю как это делать, надеюсь О.Ю.Ребров мне поможет в этом . Если что то получиться, обязательно выложу результаты. Спасибо.
|
|
11.08.2012 - 22:34
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Большое спасибо за ценные советы! Да в любом случае мы не получим статистически значимых отличий, но для ?спортивного? интереса попробую применить метод ?One-way MANOVA?, правда еще не знаю как это делать, надеюсь О.Ю.Ребров мне поможет в этом . Если что то получиться, обязательно выложу результаты. Спасибо. Применительно к вашему случаю подойдет критерий Хотеллинга (многомерный аналог Стьюдента) и Шайрера-Рея-Хейра (непараметрический аналог). Оба реализованы в программе AtteStat (http://Attestatsoft.narod.ru). Не поленитесь прочитать стр. 239 pdf-мануала. |
|
13.08.2012 - 10:11
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064 |
Применительно к вашему случаю подойдет критерий Хотеллинга (многомерный аналог Стьюдента) и Шайрера-Рея-Хейра (непараметрический аналог). Оба реализованы в программе AtteStat (http://Attestatsoft.narod.ru). Не поленитесь прочитать стр. 239 pdf-мануала. Попробовал установить Attestat, вначале произошла интеграция в Excel, но после перезагрузки компьютера- исчезла, и как тщательно я ее не искал в Excel и не открывал программу Attestat больше она не появлялась, может из-за того что office 2010 или другие причины я не знаю (. В связи с этим решил, продолжать изучение statistica У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже? 2. Если все же продолжать, можно ли использовать многомерные статистические анализы, такие как: кластерный анализ, дискриминантный анализ и др. методы реализованные в statistica? Спасибо. |
|
13.08.2012 - 10:31
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Попробовал установить Attestat, вначале произошла интеграция в Excel, но после перезагрузки компьютера- исчезла, и как тщательно я ее не искал в Excel и не открывал программу Attestat больше она не появлялась, может из-за того что office 2010 или другие причины я не знаю (. В связи с этим решил, продолжать изучение statistica У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже? 2. Если все же продолжать, можно ли использовать многомерные статистические анализы, такие как: кластерный анализ, дискриминантный анализ и др. методы реализованные в statistica? Спасибо. Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться. |
|
13.08.2012 - 10:50
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064 |
Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться. Хорошо, спасибо большое за советы, так и сделаем! |
|
13.08.2012 - 14:10
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже? Статистически значимых отличий мы не получили, когда проверяли все 4 признака "по отдельности". Могут ли стать эти признаки стат. значимыми при использовании многомерного анализа - вопрос. В моей практике я очень часто (очень-очень часто) получал также стат.незначимые результаты при многомерном анализе (может просто "не везло"? ) Дело в том, что при наличии нескольких изучаемых факторов, применять методы одномерного анализа - это палеозойская эра, с поправками на множ. сравнения - это уже мезозойская Ну, или как говорит уважаемый nokh - "копать огород при помощи топора". Бывает, что под рукой кроме топора ничего нет, поэтому если работа отправляется в западный журнал, я бы все таки советовал разобраться с многомерным, если в наш - не парьтесь, если в диссер и ученый совет без "кибернетиков" - тоже не парьтесь. |
|
13.08.2012 - 18:53
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться. зависимости в данных бывают и нелинейные PS я бы вообще подход --- когда считается какой то тест, и его "достоверные" результаты являются причиной печатать статью не применял бы. в интернете масса страничек где можно ощутить всю бессмысленность такого подхода к данным. правильно сначала увидеть эффект в дисперсии данных и только потом проверять гипотезу о его достоверности. Сообщение отредактировал p2004r - 13.08.2012 - 19:19 |
|
13.08.2012 - 22:02
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
зависимости в данных бывают и нелинейные PS я бы вообще подход --- когда считается какой то тест, и его "достоверные" результаты являются причиной печатать статью не применял бы. в интернете масса страничек где можно ощутить всю бессмысленность такого подхода к данным. правильно сначала увидеть эффект в дисперсии данных и только потом проверять гипотезу о его достоверности. Здесь на форуме уже была статья Коэна "The earth is round, p < .05" (Cohen), где высмеивался данный подход. И это проблема не только массы страничек в интернете, а проблема подхода к анализу статистических данных вот уже более 50 лет. Поскольку статистика предполагает вероятностный исход результатов, то очень много людей именно и стремятся к получению заветной "достоверности". Про величину эффекта редко вспоминают. В Американской ассоциации психологов (APA) было предложение даже "забанить" практически трактовать статистически значимые результаты, основываясь лишь на p-value. Такое намерение конечно придушили.. |
|
13.08.2012 - 23:09
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
про "странички в интернете" я имел в виду странички в которые встроены эмуляторы "исследований", которые вывод ГСЧ прогоняют через параметрические тесты и показывают что в любом мало мальски обширном исследовании обязательно будут заветные p<0.05. Посетителю там предоставлено право торжественно понажимать на кнопку "провести исследование" ... результаты вменяемых людей крайне отрезвляют
(к сожалению не коллекционирую данные ссылки ) |
|