Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Как рассчитать LSD (наименьшая значимая разница)

Автор: Statisticafil 25.11.2014 - 17:13

Добрый день коллеги,
прошу подскажите как рассчитать величину LSD least significant difference (наименьшая значимая разница)
Сделали однофакторный ANOVA, влияние есть, но LSD-test в Statistica 10 выдает только табличку где p, а не сами значения, а у приятеля, которому я помогаю в предметной области традиционно указывают величину LSD

Нашел описание, но, к сожалению, пока не разобрался
https://www.utdallas.edu/~herve/abdi-LSD2010-pretty.pdf

Автор: nokh 30.11.2014 - 09:17

Цитата(Statisticafil @ 25.11.2014 - 20:13) *
Добрый день коллеги,
прошу подскажите как рассчитать величину LSD least significant difference (наименьшая значимая разница)
Сделали однофакторный ANOVA, влияние есть, но LSD-test в Statistica 10 выдает только табличку где p, а не сами значения, а у приятеля, которому я помогаю в предметной области традиционно указывают величину LSD

LSD=t(альфа/2; dfw) * SQRT (MSw * (1/n1 + 1/n2)),
где t - площадь под кривой t-распределения, dfw и MSw - соответственно степени свободы и средний квадрат для эффекта "внутри групп" из таблицы результатов дисперсионного анализа, а n1 и n2 - объёмы сравниваемых выборок. С этим критическим значением сравнивается абсолютное значение разности средних сравниваемых групп. Если эта разность больше LSD нулевая гипотеза об отсутствии различий отклоняется на уровне значимости альфа. Эта формула переписывается так, чтобы получалось значение t-критерия, скорее всего именно это значение и приводят традиционно папуасы в окружении вашего друга:
t=(/среднее1 - среднее2/) / (SQRT (MSw * (1/n1 + 1/n2)))
подставляя это значение в вероятностном калькуляторе Statistica для t-распределения Стьюдента, при галочках в two-tailed и (1-Cumulative p) при df=dfw получим те же значения р, что даются в модуле апостериорных сравнений для LSD.

Но, вообще говоря, если ваша статистикофилия не является перверзией из разряда "поиметь", а подразумевает истинную Любовь, то полезно знать, что метод наименьшей значимой разности Фишера не является корректной процедурой для множественных сравнений, т.к. не удерживает уровень значимости семейства гипотез на выбранном значении (например, 0,05). Это можно найти и в учебниках, и в википедии. Из предлагаемых пакетом Statistica этот метод - худшее, что можно выбрать. Я по ситуации выбираю либо Тьюки, либо Ньюмена - Кёйлса и привожу только р.

Автор: Statisticafil 30.11.2014 - 23:11

Цитата(nokh @ 30.11.2014 - 10:17) *
LSD=t(альфа/2; dfw) * SQRT (MSw * (1/n1 + 1/n2)),
где t - площадь под кривой t-распределения, dfw и MSw - соответственно степени свободы и средний квадрат для эффекта "внутри групп" из таблицы результатов дисперсионного анализа, а n1 и n2 - объёмы сравниваемых выборок. С этим критическим значением сравнивается абсолютное значение разности средних сравниваемых групп. Если эта разность больше LSD нулевая гипотеза об отсутствии различий отклоняется на уровне значимости альфа. Эта формула переписывается так, чтобы получалось значение t-критерия, скорее всего именно это значение и приводят традиционно папуасы в окружении вашего друга:
t=(/среднее1 - среднее2/) / (SQRT (MSw * (1/n1 + 1/n2)))
подставляя это значение в вероятностном калькуляторе Statistica для t-распределения Стьюдента, при галочках в two-tailed и (1-Cumulative p) при df=dfw получим те же значения р, что даются в модуле апостериорных сравнений для LSD.

Но, вообще говоря, если ваша статистикофилия не является перверзией из разряда "поиметь", а подразумевает истинную Любовь, то полезно знать, что метод наименьшей значимой разности Фишера не является корректной процедурой для множественных сравнений, т.к. не удерживает уровень значимости семейства гипотез на выбранном значении (например, 0,05). Это можно найти и в учебниках, и в википедии. Из предлагаемых пакетом Statistica этот метод - худшее, что можно выбрать. Я по ситуации выбираю либо Тьюки, либо Ньюмена - Кёйлса и привожу только р.


Благодарю за ответ, научнику приятеля 70, поэтому проще рассчитать что приводят традиционно.

Analysis of Variance
Marked effects are significant at p < ,05000
SS df MS SS df MS F p
Effect Effect Effect Error Error Error
1 Height cm 1,493 4 0,37325 0,595 15 0,0396666667 9,40966387 0,000518257917


в каждой группе по 10 объектов

Вот отсюда http://www.statisticshowto.com/tables/t-distribution-table-two-tails/ я беру значение двустороннего т-критерия для р0,05 и степеней свободы =4 (2,776)
и получаем выражение lsd = 2,776 sqrt (0,37325(1/10+1/10) )

Верно? Или я перепутал что-то?

LSD у них указывают единственное значение для нескольких групп, поэтому скорее всего "пересчет в т-китерий" не делают
Я не уверен что разобрался, и еще раз благодарю за подсказку

Автор: nokh 1.12.2014 - 00:35

Цитата(Statisticafil @ 1.12.2014 - 01:11) *
в каждой группе по 10 объектов
Вот отсюда http://www.statisticshowto.com/tables/t-distribution-table-two-tails/ я беру значение двустороннего т-критерия для р0,05 и степеней свободы =4 (2,776)
и получаем выражение lsd = 2,776 sqrt (0,37325(1/10+1/10) )
Верно? Или я перепутал что-то?


1) Проверьте всё. У вас не может быть во всех группах по 10 объектов, только по 4. Число групп = dfмежду+1 = 4+1=5. Всего объектов = dfвнутри+число групп=15+5=20. 20/5=4 объекта на группу.
2) df и MS берутся для эффектов внутри групп (для ошибки), а не между группами как у вас.
3) критические значения берутся не с неизвестных сайтов, а только из авторитетных учебников или справочников. Если пользуетесь пакетом Statistica - брать нужно из него: Statistics - Probability Calculator - Distributions... - t (Student). Можно односторонний для p=0,05/2=0,025, можно двусторонний (two-tailed) для р=0,05.


Автор: Statisticafil 1.12.2014 - 03:58

Цитата(nokh @ 1.12.2014 - 01:35) *
1) Проверьте всё. У вас не может быть во всех группах по 10 объектов, только по 4. Число групп = dfмежду+1 = 4+1=5. Всего объектов = dfвнутри+число групп=15+5=20. 20/5=4 объекта на группу.
2) df и MS берутся для эффектов внутри групп (для ошибки), а не между группами как у вас.
3) критические значения берутся не с неизвестных сайтов, а только из авторитетных учебников или справочников. Если пользуетесь пакетом Statistica - брать нужно из него: Statistics - Probability Calculator - Distributions... - t (Student). Можно односторонний для p=0,05/2=0,025, можно двусторонний (two-tailed) для р=0,05.

ОК, проверю, за неделю мог подзабыть
Благодарю за подсказки smile.gif

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)