Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Помогите разобраться, ANOVA?
maxandron
сообщение 28.09.2014 - 16:56
Сообщение #1





Группа: Пользователи
Сообщений: 14
Регистрация: 15.06.2014
Пользователь №: 26464



Здравствуйте!
Прочитал одну статью: [url="http://www.pharmtech.com/pharmtech/article/articleDetail.jsp?id=711308&sk=&date=&pageID=2#"/url]. Видел ее перевод на одном из форумов. Один из вопросов, который у меня возник, это таблица 3 (Table III: Estimated variance component for furosemide content in the powder blend). Про нее написано:
Цитата
To understand process variation, the authors performed a fully nested ANOVA (see Table III). The result showed that 72.90% of the observed variation in the furosemide content resulted from a batch factor. Thus, to minimize the process variability, the causes of the variation among batches required further investigation.

Я попробовал тоже посчитать в программе STATISTICA и вручную. Получил один и тот же результат, который не совпадает со статейным. Прикладываю в прикрепленном файле результаты. Не могу понять, что делаю не так. Хочу разобраться. Может кто поможет? Жду ответов. Заранее благодарен за помощь.

Сообщение отредактировал maxandron - 28.09.2014 - 16:57
Прикрепленные файлы
Прикрепленный файл  Data.zip ( 25,63 килобайт ) Кол-во скачиваний: 322
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Medic
сообщение 7.02.2015 - 18:26
Сообщение #2





Группа: Пользователи
Сообщений: 11
Регистрация: 28.09.2013
Пользователь №: 25345



Помогите разобраться... и правильно я написал вывод...
На основании использования критерия Ливиня было установлено, что дисперсии сравниваемых беременных по степеням ожирения статистически значимо не различаются (значение критерия Ливиня = 0,362 при р = 0,781). Это дает нам основание для дальнейшего использования результатов однофакторного дисперсного анализа. В результате его применения было выявлено, что среднее значение ВБД у беременных с различной степенью ожирения статистически достоверно различаются ? F = 4,892 при p = 0,003. Таким образом, беременные с разной степенью ожирения имеют статистически значимо разные (качественно различающиеся) уровни ВБД.
Была так же выявленная умеренная положительная связь высокой степени значимости между уровнем ВБД и ИМТ у беременных с ожирением ? r-Пирсона = 0,36 при p ≤ 0,001.
Однако в результате множественных попарных сравнений с использованием критерия Шеффе, мы установили, что между беременными с различной степенью ожирения нет статистически значимых различий. (так как p больше 0,05).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 8.02.2015 - 23:56
Сообщение #3





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Medic @ 7.02.2015 - 20:26) *
Помогите разобраться... и правильно я написал вывод...
На основании использования критерия Ливиня было установлено, что дисперсии сравниваемых беременных по степеням ожирения статистически значимо не различаются (значение критерия Ливиня = 0,362 при р = 0,781). Это дает нам основание для дальнейшего использования результатов однофакторного дисперсного анализа. В результате его применения было выявлено, что среднее значение ВБД у беременных с различной степенью ожирения статистически достоверно различаются ? F = 4,892 при p = 0,003. Таким образом, беременные с разной степенью ожирения имеют статистически значимо разные (качественно различающиеся) уровни ВБД.
Была так же выявленная умеренная положительная связь высокой степени значимости между уровнем ВБД и ИМТ у беременных с ожирением ? r-Пирсона = 0,36 при p ≤ 0,001.
Однако в результате множественных попарных сравнений с использованием критерия Шеффе, мы установили, что между беременными с различной степенью ожирения нет статистически значимых различий. (так как p больше 0,05).

1) р - площадь под кривой распределения статистики, т.е. статистика - сама по себе, а не "при р". А вот р - при статистике. Т.е. "при р" некоррекно. Лучше давать статистику и р через "," или ";"
2) Любая статистистическая выкладка даётся тремя значениями: (1) Статистика. (2) Степени свободы или объёмы выборок (в зависимости от статистики). (3) значение р. Двух значений недостаточно. Раз хотите приводить Левне - Ливена - Ливиня, то посмотрите какое (2) ему нужно записать. Для F-критерия тоже дайте степени свободы. Если автор приводит 2 значения, значит не понимает, что при данном значении критерия, но других объёмах выборки значение р будет совсем другим. А если приводит везде только р - вообще ничего не понимает, и может быть даже фальсифицирует результаты исследования.
3) "Это дает нам основание для дальнейшего использования результатов классического однофакторного дисперсного анализа." Т.к.при неравных дисперсиях можно также: (1) предварительно преобразовать данные для "стабилизации" дисперсии, (2) использовать подходы с штрафами за несоблюдение требований типа подходов Вэлча или Мардии - Земроч, (3) использовать рандомизационный дисперсионный анализ. Ну и скорее использования не "результатов", а самого анализа. Для сравнения используется анализ, а его результаты - для выводов.
4) Я жёстко придерживаюсь мнения о некорректности использования в науке занятых терминов. Точнее в меня это вбили ещё в аспирантуре, когда я в популяционной экологической работе использовал занятый здесь термин "когорта" в демографическом смысле. Просто последовавшей серией вопросов показали в деталях, что я не "молодой учёный", и даже не личинка, которая в учении может окуклиться и потом полететь, а простой червь, который в лучшем случае просто выберется на поверхность из кромешной тьмы своих заблуждений. Термин "достоверный" используется в теории вероятности для событий, имеющих вероятность 1. В математической статистике может быть 0,9999999999 и т.д., но 1 никогда нет. Если человек начитавшись дурных учебников пишет "достоверный" вместо "статистически значимый", значит он выдаёт этим свою некомпетентность в математике, т.к. или не знает что 1 не может быть, либо не знает что матстатистика базируется на теории вероятности. Ну и вообще, статистика - английское изобретение, там нет иного штампа кроме "statistically significant", т.е. "статистически значимый". К статистически значимому результату исследователь может относиться как к достоверному, но это уже его проблема.
5) Если пишете знаками, то везде: не "p больше 0,05", а "p>0,05".
6) Избегайте скобок - обилие скобок указывает на некую разорванность мышления, что обычно свойственно новичкам. В результате ваши читатели тоже вынуждены будут спотыкаться о скобки, а мысль должна литься. Можно, конечно, и скобки, но когда по другому никак не выходит.
7) По правилам русского языка перед пояснением ставится двоеточие, а не тире (при копировании из ворда тире превращаются здесь в ?)
8) Про корреляцию не понял ни с первого, ни со второго прочтения. Значит написано неудачно. Попробуйте "вплести" идею с корреляцией иначе.
Ну а в общем и целом - нормально smile.gif Видно, что новичок, но по крайней мере использует статистику осознанно.

Сообщение отредактировал nokh - 9.02.2015 - 01:30
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Medic
сообщение 9.02.2015 - 08:54
Сообщение #4





Группа: Пользователи
Сообщений: 11
Регистрация: 28.09.2013
Пользователь №: 25345



Цитата(nokh @ 8.02.2015 - 23:56) *
Ну а в общем и целом - нормально smile.gif Видно, что новичок, но по крайней мере использует статистику осознанно.

Спасибо Вам большое за такой развернутый ответ, очень приятно видеть не только свои ошибки, но и как их исправить.
1. ст. св. между группами указывать или внутри групп при F, а если Ливиня то ст. св. 1 или ст. св.2. (пользуюсь SPSS 21.)
2. Если я пишу средние значения то такой вариант написания подходит: среднее арифм (стандарт отклонения) +/- ст. ошибка ср. откл.
3. Сам для себя не могу объяснить следующее...
"...Таким образом, беременные с разной степенью ожирения имеют статистически значимо разные (качественно различающиеся) уровни ВБД.
...Однако в результате множественных попарных сравнений с использованием критерия Шеффе, мы установили, что между беременными с различной степенью ожирения нет статистически значимых различий...

Сообщение отредактировал Medic - 9.02.2015 - 13:08
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 13.02.2015 - 20:38
Сообщение #5





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Medic @ 9.02.2015 - 10:54) *
Спасибо Вам большое за такой развернутый ответ, очень приятно видеть не только свои ошибки, но и как их исправить.
1. ст. св. между группами указывать или внутри групп при F, а если Ливиня то ст. св. 1 или ст. св.2. (пользуюсь SPSS 21.)
2. Если я пишу средние значения то такой вариант написания подходит: среднее арифм (стандарт отклонения) +/- ст. ошибка ср. откл.
3. Сам для себя не могу объяснить следующее...
"...Таким образом, беременные с разной степенью ожирения имеют статистически значимо разные (качественно различающиеся) уровни ВБД.
...Однако в результате множественных попарных сравнений с использованием критерия Шеффе, мы установили, что между беременными с различной степенью ожирения нет статистически значимых различий...

1. Для F-критерия указываются 2 степени свободы, например: F[15; 306]=2,00; р=0,015. Для Ливена не знаю, смотрите про этот тест.
2. "среднее +/- ст. ошибка" - устаревший стандарт, по крайней мере в медицине - безнадёжно устаревший. Приводите "Среднее (95% ДИ)", типа: 3,6 (95% ДИ: 2,8 - 5,6).
3. Про это не понял. Критерий Шеффе очень маломощный, т.к. используется для случаев когда интересует очень много сравнений средних в рамках дисперсионного комплекса. Может поэтому не находит, хотя дисп. анализ значимый. Попробуйте Тьюки - хороший, строгий тест. Рекомендуют также Ньюмена - Кёйлса. Если сравнений мало (на 1 меньше числа групп) - лучшее, что возможно - не множественный пост-хок, а запланированные сравнения: там мощность ещё больше (за счёт меньшего числа одновременно проверяемых простых гипотез).

Сообщение отредактировал nokh - 13.02.2015 - 20:41
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Medic
сообщение 14.02.2015 - 11:51
Сообщение #6





Группа: Пользователи
Сообщений: 11
Регистрация: 28.09.2013
Пользователь №: 25345



Цитата(nokh @ 13.02.2015 - 20:38) *
2. "среднее +/- ст. ошибка" - устаревший стандарт, по крайней мере в медицине - безнадёжно устаревший. Приводите "Среднее (95% ДИ)", типа: 3,6 (95% ДИ: 2,8 - 5,6).

Как я понимаю 95% ДИ это для нормального распределения, а если ненорм то 25% - 75% процентили, так?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему