t-критерий Стьюдента для зависимых групп

t-критерий Стьюдента для зависимых групп

Опции

husrus

11.08.2012 - 14:53

Сообщение #1

Группа: Пользователи
Сообщений: 6
Регистрация: 10.08.2012
Пользователь №: 24064

Добрый день! Изучаю статистику по О.Ю.Реброву самостоятельно, использую Statistica 8.
Подскажите, пожалуйста, 2 группы, исследуем 4 количественных признака, в каждой группе n=70.
Наша задача: сопоставить анализ крови до и после принятия препарата у здоровых и у больных.
Наши действия: 1. Проверили на нормальность - каждый признака по Тесту Колмогорову ?Смирнову (у всех признаков результат примерно аналогичен

);
2. Т.к. распределение признаков нормальное, и группы зависимые (признаки изучали у одной группы до и после принятия препарата) применили статистический анализ (t-критерий Стьюдента для зависимых групп)
3. При анализе выходит примерно такой ответ (

) у каждого призака
Вопрос: 1. Правильны ли наши действия?
2. Различия значений всех 4-х количественных признаков недостоверны?
3. У нас получается р> 0.05, подскажите пожалуйста как можно интерпретировать, и провести описание результатов?
Большое спасибо!

Ответить с цитированием данного сообщения

100$

11.08.2012 - 16:28

Сообщение #2

Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694

Цитата(husrus @ 11.08.2012 - 14:53)

Добрый день! Изучаю статистику по О.Ю.Реброву самостоятельно, использую Statistica 8.
Подскажите, пожалуйста, 2 группы, исследуем 4 количественных признака, в каждой группе n=70.
Наша задача: сопоставить анализ крови до и после принятия препарата у здоровых и у больных.
Наши действия: 1. Проверили на нормальность - каждый признака по Тесту Колмогорову ?Смирнову (у всех признаков результат примерно аналогичен

);
2. Т.к. распределение признаков нормальное, и группы зависимые (признаки изучали у одной группы до и после принятия препарата) применили статистический анализ (t-критерий Стьюдента для зависимых групп)
3. При анализе выходит примерно такой ответ (

) у каждого призака
Вопрос: 1. Правильны ли наши действия?
2. Различия значений всех 4-х количественных признаков недостоверны?
3. У нас получается р> 0.05, подскажите пожалуйста как можно интерпретировать, и провести описание результатов?
Большое спасибо!

Поскольку одновременно изучаются 4 количественных признака, то необходимо задействовать инструменты многомерного статистического анализа (One-way MANOVA).

husrus Просмотр профиля	11.08.2012 - 17:34 Сообщение #3
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064	Спасибо большое за ответ. Мы изучали каждый признак по отдельности. MANOVA как я понял, применяется, когда 3 и более групп, поэтому использовали Стьюдента

TheThing Просмотр профиля	11.08.2012 - 19:35 Сообщение #4
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251	Цитата(husrus @ 11.08.2012 - 17:34) Спасибо большое за ответ. Мы изучали каждый признак по отдельности. MANOVA как я понял, применяется, когда 3 и более групп, поэтому использовали Стьюдента Когда Вы изучаете каждый из 4 признаков по отдельности, то есть 4 раза в одной работе применяете тест Стьюдента, существует вероятность, что Вы совершите ошибку 1 рода - найдете отличия между изучаемыми признаками, когда на самом деле эти различия очень малы, чтобы считать их статистически значимыми или у вас недостаточная выборка, чтобы обнаружить эти отличия. Поэтому используйте или методы многомерного анализа данных или применяете поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др). Хотя если Вы не получили ни одного статистически значимого признака по-отдельнсти, понятно, что поправки лишь все это дело сделают еще более консервативным, но, по-крайней мере, это будет методологически правильно. Поищите на этом форуме как трактуются результаты при р > .05 (была тема) - не допускайте ошибки, что различий между изучаемыми признакми нет (Вы этого никогда не узнаете )

husrus Просмотр профиля	11.08.2012 - 19:48 Сообщение #5
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064	TheThing, большое спасибо Вам. Начинаю понимать, действительно у нас между признаками различия незначительны, поэтому и выдает такой ответ. Буду искать на форуме трактовку результатов p>0.05. А поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др) вычисляются в Statistica и какие методы многомерного анализа данных посоветуйте в моем случае? Спасибо.

TheThing Просмотр профиля	11.08.2012 - 21:51 Сообщение #6
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251	Цитата(husrus @ 11.08.2012 - 19:48) TheThing, большое спасибо Вам. Начинаю понимать, действительно у нас между признаками различия незначительны, поэтому и выдает такой ответ. Буду искать на форуме трактовку результатов p>0.05. А поправки на множественные сравнения (Сидака, Бонферони, False-discovery rate и др) вычисляются в Statistica и какие методы многомерного анализа данных посоветуйте в моем случае? Спасибо. Большинство поправок можно высчитать "ручками" - например, Бонферрони: 1) выбираете уровень стат. значимости, который Вас устраивает, например 0.01. 2) Делите 0.01 на количество анализируемых признаков(если у Вас 4 признака, получится 0,0025. 3) проводите 4 теста Стьюдента, получаете p-value. 4) Если полученное p-value меньше 0,0025, значит признак стат. значим. Остальные поправки ненамного сложнее, FDR требует сортировки значений и способности умножить одну величину на другую Просто в Вашем случае все равно, какую поправку Вы примените, поскольку Вы в любом случае не получите стат. значимых отличий (если не получилось получить без поправок, с поправками будет вообще невозможно). Я не работаю в Статистика, поэтому не могу подсказать, где искать эти поправки. В любом случае, если умные люди придумали методы многомерного анализа данных, нужно применять их. Попробуйте применить метод, который посоветовал 100$, когда подсчитаете, если не затруднит, выложите результаты здесь.

husrus Просмотр профиля	11.08.2012 - 22:05 Сообщение #7
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064	Большое спасибо за ценные советы! Да в любом случае мы не получим статистически значимых отличий, но для ?спортивного? интереса попробую применить метод ?One-way MANOVA?, правда еще не знаю как это делать, надеюсь О.Ю.Ребров мне поможет в этом . Если что то получиться, обязательно выложу результаты. Спасибо.

100$ Просмотр профиля	11.08.2012 - 22:34 Сообщение #8
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Цитата(husrus @ 11.08.2012 - 22:05) Большое спасибо за ценные советы! Да в любом случае мы не получим статистически значимых отличий, но для ?спортивного? интереса попробую применить метод ?One-way MANOVA?, правда еще не знаю как это делать, надеюсь О.Ю.Ребров мне поможет в этом . Если что то получиться, обязательно выложу результаты. Спасибо. Применительно к вашему случаю подойдет критерий Хотеллинга (многомерный аналог Стьюдента) и Шайрера-Рея-Хейра (непараметрический аналог). Оба реализованы в программе AtteStat (http://Attestatsoft.narod.ru). Не поленитесь прочитать стр. 239 pdf-мануала.

husrus Просмотр профиля	13.08.2012 - 10:11 Сообщение #9
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064	Цитата(100$ @ 11.08.2012 - 23:34) Применительно к вашему случаю подойдет критерий Хотеллинга (многомерный аналог Стьюдента) и Шайрера-Рея-Хейра (непараметрический аналог). Оба реализованы в программе AtteStat (http://Attestatsoft.narod.ru). Не поленитесь прочитать стр. 239 pdf-мануала. Попробовал установить Attestat, вначале произошла интеграция в Excel, но после перезагрузки компьютера- исчезла, и как тщательно я ее не искал в Excel и не открывал программу Attestat больше она не появлялась, может из-за того что office 2010 или другие причины я не знаю (. В связи с этим решил, продолжать изучение statistica У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже? 2. Если все же продолжать, можно ли использовать многомерные статистические анализы, такие как: кластерный анализ, дискриминантный анализ и др. методы реализованные в statistica? Спасибо.

100$ Просмотр профиля	13.08.2012 - 10:31 Сообщение #10
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Цитата(husrus @ 13.08.2012 - 10:11) Попробовал установить Attestat, вначале произошла интеграция в Excel, но после перезагрузки компьютера- исчезла, и как тщательно я ее не искал в Excel и не открывал программу Attestat больше она не появлялась, может из-за того что office 2010 или другие причины я не знаю (. В связи с этим решил, продолжать изучение statistica У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже? 2. Если все же продолжать, можно ли использовать многомерные статистические анализы, такие как: кластерный анализ, дискриминантный анализ и др. методы реализованные в statistica? Спасибо. Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться.

husrus Просмотр профиля	13.08.2012 - 10:50 Сообщение #11
Группа: Пользователи Сообщений: 6 Регистрация: 10.08.2012 Пользователь №: 24064	Цитата(100$ @ 13.08.2012 - 11:31) Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться. Хорошо, спасибо большое за советы, так и сделаем!

TheThing Просмотр профиля	13.08.2012 - 14:10 Сообщение #12
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251	Цитата(husrus @ 13.08.2012 - 10:11) У меня возникло два вопроса: 1. Можно ли оставить на этом этапе, все равно как сказал TheThing - "вы в любом случае не получите стат. значимых отличий", может и не стоит "копать" глубже? Статистически значимых отличий мы не получили, когда проверяли все 4 признака "по отдельности". Могут ли стать эти признаки стат. значимыми при использовании многомерного анализа - вопрос. В моей практике я очень часто (очень-очень часто) получал также стат.незначимые результаты при многомерном анализе (может просто "не везло"? ) Дело в том, что при наличии нескольких изучаемых факторов, применять методы одномерного анализа - это палеозойская эра, с поправками на множ. сравнения - это уже мезозойская Ну, или как говорит уважаемый nokh - "копать огород при помощи топора". Бывает, что под рукой кроме топора ничего нет, поэтому если работа отправляется в западный журнал, я бы все таки советовал разобраться с многомерным, если в наш - не парьтесь, если в диссер и ученый совет без "кибернетиков" - тоже не парьтесь.

p2004r Просмотр профиля	13.08.2012 - 18:53 Сообщение #13
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(100$ @ 13.08.2012 - 10:31) Понимаете, какое дело: дисперсионный анализ - это способ проверить гипотезу о средней, а кластерный и дискриминантный анализы - это все-таки задачи классификации объектов. Это далеко не одно и то же. Так что лучше всего констатировать отсутствие различий и на этом успокоиться. зависимости в данных бывают и нелинейные PS я бы вообще подход --- когда считается какой то тест, и его "достоверные" результаты являются причиной печатать статью не применял бы. в интернете масса страничек где можно ощутить всю бессмысленность такого подхода к данным. правильно сначала увидеть эффект в дисперсии данных и только потом проверять гипотезу о его достоверности. Сообщение отредактировал p2004r - 13.08.2012 - 19:19 http://r-statistics.livejournal.com/

TheThing Просмотр профиля	13.08.2012 - 22:02 Сообщение #14
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251	Цитата(p2004r @ 13.08.2012 - 18:53) зависимости в данных бывают и нелинейные PS я бы вообще подход --- когда считается какой то тест, и его "достоверные" результаты являются причиной печатать статью не применял бы. в интернете масса страничек где можно ощутить всю бессмысленность такого подхода к данным. правильно сначала увидеть эффект в дисперсии данных и только потом проверять гипотезу о его достоверности. Здесь на форуме уже была статья Коэна "The earth is round, p < .05" (Cohen), где высмеивался данный подход. И это проблема не только массы страничек в интернете, а проблема подхода к анализу статистических данных вот уже более 50 лет. Поскольку статистика предполагает вероятностный исход результатов, то очень много людей именно и стремятся к получению заветной "достоверности". Про величину эффекта редко вспоминают. В Американской ассоциации психологов (APA) было предложение даже "забанить" практически трактовать статистически значимые результаты, основываясь лишь на p-value. Такое намерение конечно придушили..

p2004r Просмотр профиля	13.08.2012 - 23:09 Сообщение #15
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	про "странички в интернете" я имел в виду странички в которые встроены эмуляторы "исследований", которые вывод ГСЧ прогоняют через параметрические тесты и показывают что в любом мало мальски обширном исследовании обязательно будут заветные p<0.05. Посетителю там предоставлено право торжественно понажимать на кнопку "провести исследование" ... результаты вменяемых людей крайне отрезвляют (к сожалению не коллекционирую данные ссылки ) http://r-statistics.livejournal.com/

« Предыдущая тема · Медицинская статистика · Следующая тема »