Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> t-критерий Стьюдента для зависимых групп
husrus
сообщение 11.08.2012 - 14:53
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 10.08.2012
Пользователь №: 24064



Добрый день! Изучаю статистику по О.Ю.Реброву самостоятельно, использую Statistica 8.
Подскажите, пожалуйста, 2 группы, исследуем 4 количественных признака, в каждой группе n=70.
Наша задача: сопоставить анализ крови до и после принятия препарата у здоровых и у больных.
Наши действия: 1. Проверили на нормальность - каждый признака по Тесту Колмогорову ?Смирнову (у всех признаков результат примерно аналогичен
Прикрепленное изображение
);
2. Т.к. распределение признаков нормальное, и группы зависимые (признаки изучали у одной группы до и после принятия препарата) применили статистический анализ (t-критерий Стьюдента для зависимых групп)
3. При анализе выходит примерно такой ответ (
Прикрепленное изображение
) у каждого призака
Вопрос: 1. Правильны ли наши действия?
2. Различия значений всех 4-х количественных признаков недостоверны?
3. У нас получается р> 0.05, подскажите пожалуйста как можно интерпретировать, и провести описание результатов?
Большое спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 11.08.2012 - 16:28
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(husrus @ 11.08.2012 - 14:53) *
Добрый день! Изучаю статистику по О.Ю.Реброву самостоятельно, использую Statistica 8.
Подскажите, пожалуйста, 2 группы, исследуем 4 количественных признака, в каждой группе n=70.
Наша задача: сопоставить анализ крови до и после принятия препарата у здоровых и у больных.
Наши действия: 1. Проверили на нормальность - каждый признака по Тесту Колмогорову ?Смирнову (у всех признаков результат примерно аналогичен
Прикрепленное изображение
);
2. Т.к. распределение признаков нормальное, и группы зависимые (признаки изучали у одной группы до и после принятия препарата) применили статистический анализ (t-критерий Стьюдента для зависимых групп)
3. При анализе выходит примерно такой ответ (
Прикрепленное изображение
) у каждого призака
Вопрос: 1. Правильны ли наши действия?
2. Различия значений всех 4-х количественных признаков недостоверны?
3. У нас получается р> 0.05, подскажите пожалуйста как можно интерпретировать, и провести описание результатов?
Большое спасибо!


Поскольку одновременно изучаются 4 количественных признака, то необходимо задействовать инструменты многомерного статистического анализа (One-way MANOVA).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
husrus
сообщение 11.08.2012 - 17:34
Сообщение #3





Группа: Пользователи
Сообщений: 6
Регистрация: 10.08.2012
Пользователь №: 24064



Спасибо большое за ответ. Мы изучали каждый признак по отдельности. MANOVA как я понял, применяется, когда 3 и более групп, поэтому использовали Стьюдента
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 11.08.2012 - 19:35
Сообщение #4





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Цитата(husrus @ 11.08.2012 - 17:34) *
Спасибо большое за ответ. Мы изучали каждый признак по отдельности. MANOVA как я понял, применяется, когда 3 и более групп, поэтому использовали Стьюдента


Когда Вы изучаете каждый из 4 признаков по отдельности, то есть 4 раза в одной работе применяете тест Стьюдента, существует вероятность, что Вы совершите ошибку 1 рода - найдете отличия между изучаемыми признаками, когда на самом деле эти различия очень малы, чтобы считать их статистически значимыми или у вас недостаточная выборка, чтобы обнаружить эти отличия. Поэтому используйте или методы многомерного анализа данных или применяете поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др). Хотя если Вы не получили ни одного статистически значимого признака по-отдельнсти, понятно, что поправки лишь все это дело сделают еще более консервативным, но, по-крайней мере, это будет методологически правильно.

Поищите на этом форуме как трактуются результаты при р > .05 (была тема) - не допускайте ошибки, что различий между изучаемыми признакми нет (Вы этого никогда не узнаете smile.gif )
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
husrus
сообщение 11.08.2012 - 19:48
Сообщение #5





Группа: Пользователи
Сообщений: 6
Регистрация: 10.08.2012
Пользователь №: 24064



TheThing, большое спасибо Вам. Начинаю понимать, действительно у нас между признаками различия незначительны, поэтому и выдает такой ответ. Буду искать на форуме трактовку результатов p>0.05. А поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др) вычисляются в Statistica и какие методы многомерного анализа данных посоветуйте в моем случае? Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 11.08.2012 - 21:51
Сообщение #6





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Цитата(husrus @ 11.08.2012 - 19:48) *
TheThing, большое спасибо Вам. Начинаю понимать, действительно у нас между признаками различия незначительны, поэтому и выдает такой ответ. Буду искать на форуме трактовку результатов p>0.05. А поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др) вычисляются в Statistica и какие методы многомерного анализа данных посоветуйте в моем случае? Спасибо.


Большинство поправок можно высчитать "ручками" - например, Бонферрони: 1) выбираете уровень стат. значимости, который Вас устраивает, например 0.01. 2) Делите 0.01 на количество анализируемых признаков(если у Вас 4 признака, получится 0,0025. 3) проводите 4 теста Стьюдента, получаете p-value. 4) Если полученное p-value меньше 0,0025, значит признак стат. значим.

Остальные поправки ненамного сложнее, FDR требует сортировки значений и способности умножить одну величину на другую smile.gif Просто в Вашем случае все равно, какую поправку Вы примените, поскольку Вы в любом случае не получите стат. значимых отличий (если не получилось получить без поправок, с поправками будет вообще невозможно).
Я не работаю в Статистика, поэтому не могу подсказать, где искать эти поправки.

В любом случае, если умные люди придумали методы многомерного анализа данных, нужно применять их. Попробуйте применить метод, который посоветовал 100$, когда подсчитаете, если не затруднит, выложите результаты здесь.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
husrus
сообщение 11.08.2012 - 22:05
Сообщение #7





Группа: Пользователи
Сообщений: 6
Регистрация: 10.08.2012
Пользователь №: 24064



Большое спасибо за ценные советы! Да в любом случае мы не получим статистически значимых отличий, но для ?спортивного? интереса попробую применить метод ?One-way MANOVA?, правда еще не знаю как это делать, надеюсь О.Ю.Ребров мне поможет в этом smile.gif . Если что то получиться, обязательно выложу результаты. Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 11.08.2012 - 22:34
Сообщение #8





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(husrus @ 11.08.2012 - 22:05) *
Большое спасибо за ценные советы! Да в любом случае мы не получим статистически значимых отличий, но для ?спортивного? интереса попробую применить метод ?One-way MANOVA?, правда еще не знаю как это делать, надеюсь О.Ю.Ребров мне поможет в этом smile.gif . Если что то получиться, обязательно выложу результаты. Спасибо.



Применительно к вашему случаю подойдет критерий Хотеллинга (многомерный аналог Стьюдента) и Шайрера-Рея-Хейра (непараметрический аналог). Оба реализованы в программе AtteStat (http://Attestatsoft.narod.ru). Не поленитесь прочитать стр. 239 pdf-мануала.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
husrus
сообщение 13.08.2012 - 10:11
Сообщение #9





Группа: Пользователи
Сообщений: 6
Регистрация: 10.08.2012
Пользователь №: 24064



Цитата(100$ @ 11.08.2012 - 23:34) *
Применительно к вашему случаю подойдет критерий Хотеллинга (многомерный аналог Стьюдента) и Шайрера-Рея-Хейра (непараметрический аналог). Оба реализованы в программе AtteStat (http://Attestatsoft.narod.ru). Не поленитесь прочитать стр. 239 pdf-мануала.


Попробовал установить Attestat, вначале произошла интеграция в Excel, но после перезагрузки компьютера- исчезла, и как тщательно я ее не искал в Excel и не открывал программу Attestat больше она не появлялась, может из-за того что office 2010 или другие причины я не знаю (. В связи с этим решил, продолжать изучение statistica
У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже?
2. Если все же продолжать, можно ли использовать многомерные статистические анализы, такие как: кластерный анализ, дискриминантный анализ и др. методы реализованные в statistica? Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 13.08.2012 - 10:31
Сообщение #10





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(husrus @ 13.08.2012 - 10:11) *
Попробовал установить Attestat, вначале произошла интеграция в Excel, но после перезагрузки компьютера- исчезла, и как тщательно я ее не искал в Excel и не открывал программу Attestat больше она не появлялась, может из-за того что office 2010 или другие причины я не знаю (. В связи с этим решил, продолжать изучение statistica
У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже?
2. Если все же продолжать, можно ли использовать многомерные статистические анализы, такие как: кластерный анализ, дискриминантный анализ и др. методы реализованные в statistica? Спасибо.


Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
husrus
сообщение 13.08.2012 - 10:50
Сообщение #11





Группа: Пользователи
Сообщений: 6
Регистрация: 10.08.2012
Пользователь №: 24064



Цитата(100$ @ 13.08.2012 - 11:31) *
Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться.


Хорошо, спасибо большое за советы, так и сделаем!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 13.08.2012 - 14:10
Сообщение #12





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Цитата(husrus @ 13.08.2012 - 10:11) *
У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже?


Статистически значимых отличий мы не получили, когда проверяли все 4 признака "по отдельности". Могут ли стать эти признаки стат. значимыми при использовании многомерного анализа - вопрос. В моей практике я очень часто (очень-очень часто) получал также стат.незначимые результаты при многомерном анализе (может просто "не везло"? smile.gif )

Дело в том, что при наличии нескольких изучаемых факторов, применять методы одномерного анализа - это палеозойская эра, с поправками на множ. сравнения - это уже мезозойская smile.gif Ну, или как говорит уважаемый nokh - "копать огород при помощи топора". Бывает, что под рукой кроме топора ничего нет, поэтому если работа отправляется в западный журнал, я бы все таки советовал разобраться с многомерным, если в наш - не парьтесь, если в диссер и ученый совет без "кибернетиков" - тоже не парьтесь.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 13.08.2012 - 18:53
Сообщение #13





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(100$ @ 13.08.2012 - 10:31) *
Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться.


зависимости в данных бывают и нелинейные smile.gif

PS я бы вообще подход --- когда считается какой то тест, и его "достоверные" результаты являются причиной печатать статью не применял бы. в интернете масса страничек где можно ощутить всю бессмысленность такого подхода к данным. правильно сначала увидеть эффект в дисперсии данных и только потом проверять гипотезу о его достоверности.


Сообщение отредактировал p2004r - 13.08.2012 - 19:19


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 13.08.2012 - 22:02
Сообщение #14





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Цитата(p2004r @ 13.08.2012 - 18:53) *
зависимости в данных бывают и нелинейные smile.gif

PS я бы вообще подход --- когда считается какой то тест, и его "достоверные" результаты являются причиной печатать статью не применял бы. в интернете масса страничек где можно ощутить всю бессмысленность такого подхода к данным. правильно сначала увидеть эффект в дисперсии данных и только потом проверять гипотезу о его достоверности.


Здесь на форуме уже была статья Коэна "The earth is round, p < .05" (Cohen), где высмеивался данный подход. И это проблема не только массы страничек в интернете, а проблема подхода к анализу статистических данных вот уже более 50 лет. Поскольку статистика предполагает вероятностный исход результатов, то очень много людей именно и стремятся к получению заветной "достоверности". Про величину эффекта редко вспоминают. В Американской ассоциации психологов (APA) было предложение даже "забанить" практически трактовать статистически значимые результаты, основываясь лишь на p-value. Такое намерение конечно придушили..
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 13.08.2012 - 23:09
Сообщение #15





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



про "странички в интернете" я имел в виду странички в которые встроены эмуляторы "исследований", которые вывод ГСЧ прогоняют через параметрические тесты и показывают что в любом мало мальски обширном исследовании обязательно будут заветные p<0.05. Посетителю там предоставлено право торжественно понажимать на кнопку "провести исследование" ... результаты вменяемых людей крайне отрезвляют smile.gif

(к сожалению не коллекционирую данные ссылки frown.gif )


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему