![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() ![]() |
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 5.02.2015 Пользователь №: 27011 ![]() |
Здравствуйте!
Я располагаю данными по 5 количественным признакам (биохимия). Два из них выражены в процентах. Во внимание принимается 2 фактора - А,В (независимые переменные). Массив данных ровный. Измерения в 4 повторениях. Нужно определить влияние факторов и их взаимодействий на 5 признаков. 1)Оцениваю данные на наличие "выбросов" - коробчатые графики. 2)Проверяю нормальность распределения остатков (гистограмма+колмогоров-смирнов). Если асимметрия, то преобразовываю (логарифмирование). Перепроверка после преобразования. Как быть с признаками выраженными в %? Их в любом случае надо преобразовывать? Каким способом лучше? 3) ДА. Если влияние факторов подтверждается по F, то дальше попарные сравнения. 4)Для попарных сравнений - проверка нормальности (Шапиро-Уилк) и однородности дисперсии (Левин или Браун-Форсайт)в группах по факторам А, В. Если дисперсии в норме - Тьюки (указываю среднюю и ДИ после "обратной трансформации"), нет - Тамхейн (указываю среднюю и ДИ). Или там где асимметрия лучше указать медиану+интерквартильный размах? Спасибо! |
|
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
На пишите подробнее про то, как были сделаны 4 повторения: это нужно грамотно учесть в ходе анализа. Про преобразования % - читайте про угловое фи-преобразование (преобразование арксинуса).
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 5.02.2015 Пользователь №: 27011 ![]() |
Вы уж извините, что на форуме для врачей задаю вопросы об интерпретации результатов эксперимента в области биотехнологии растений.
Просто никто из коллег не смог ответить на мои вопросы. А я понадеялся, что у медиков дела со статистикой обстоят получше, чем у биологов. Фактор А - 20 генотипов растений. Каждый генотип представлен 50 клонами. Из числа этих клонов отбирали четыре группы по 5 растений. Растения в пределах каждой группы гомогенизировались - это и есть повторности. |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Вы уж извините, что на форуме для врачей задаю вопросы об интерпретации результатов эксперимента в области биотехнологии растений. Просто никто из коллег не смог ответить на мои вопросы. А я понадеялся, что у медиков дела со статистикой обстоят получше, чем у биологов. Фактор А - 20 генотипов растений. Каждый генотип представлен 50 клонами. Из числа этих клонов отбирали четыре группы по 5 растений. Растения в пределах каждой группы гомогенизировались - это и есть повторности. Как эколог - биотехнологу: это - лучший русскоязычный форум по биостатистике, здесь далеко не только медики ![]() Я почему спросил: 4 повторности можно организовать по-разному. (1) можно 4 раза измерять один и тот же образец - это будут измерения внутри образца (вложенный или иерархический эффект). (2) можно несколько раз провести сам эксперимент, тогда нужно вводить случайный фактор "эксперимент". В вашем дизайне эти 4 измерения выполняют роль обычных объектов, т.е. не являются ни повторными измерениями, ни повторностями в широком смысле (собственно, повторностями). Т.е. это просто 4 значения в ячейке дисперсионного комплекса. 1). Раз в ячейке 4 значения - как можно проверить их на выбросы? Ведь анализом предполагается, что нормальное распределение - в этой ячейке (не совсем корректно, но по-сути - так). 4 проверить нельзя, а объединённые данные - тем более, т.к. якобы "выбросы" могут оказаться результатом действия факторов или их взаимодействий. Убирайте пункт 1). На выбросы имеет смысл проверить данные после оцифровки данных для обнаружения возможных ошибок набора (пропущенная десятичная запятая, 2 значения подряд при несработавшей Enter и т.п.) - можно графически, можно по описательной статистике. 2). Верно. Но логарифмирование - под вопросом. Если из литературы или теории известно, что ваши показатели распределены обычно логнормально - вопрос отпадает. Если же это результат исключительно графического анализа распределения остатков, логарифмирование - грубо. Лучше использовать преобразование Бокса - Кокса (для всего массива данных по асимметричному показателю). Если лямбда будет близка к 0 (где то от -0,1 до 0,1, или чуть шире) можно для простоты использовать преобразование логарифма, если далеко от нуля - делать преобразование Бокса - Кокса с данным конкретным значением лямбды. Про % написал выше. Есть и более экзотические угловые преобразования, типа углового преобразования Фримана - Тьюки для биномиально распределённых данных (не путать с преобразованием Фримана - Тьюки типа квадратного корня для редких событий). Но классика - фи-преобразование. Лучше в радианах, тогда значения от 0 до 100% трансформируются в значения от 0 до пи (3,14). 3) Нормально 4) Для попарных сравнений никаких нормальности и однородности уже не нужно. Это делается на этапе 2) - проверка требований ANOVA. Методов для апостериорных сравнений много, не обязательно такой консервативный брать как Тьюки, но и он пойдёт. Про Тамхейна услышал впервые, не знаю, обычно при неравных дисперсиях используют Геймса-Ховела. 5) Ретрансформация - отдельный пункт, т.к. все выводы уже сделаны в 4), а здесь - отдельная задача. Если использовалась трансформация - то при расчёте среднего и ДИ логично использовать ретрансформацию (независимо от (не)однородности дисперсий - откуда это вообще). Здесь есть тонкость: обычная ретрансформация называется наивной (naive retransformation), она даёт несколько смещённые оценки для популяционных средних. Если в работе важен именно сравнительный аспект (пункты 3 и 4), то можно обойтись и наивной: часто методики по которым работают исследователи столь нестандартизованы, что толку от значений собственно средних нет, важно только где больше или меньше. Если же важно также привести средние и ДИ поточнее, именно как полученные в эксперименте популяционные характеристики - правильнее будет повозиться с ретрансформацией - читать в учебнике Zar главу 13 (https://yadi.sk/i/1OY_84-0cZXj4). В случае Бокса - Кокса наивная ретрансформация посложнее чем для логарифмов и арксинусов, но только чуть-чуть, а вот несмещённая - заметно сложнее и есть разные способы (но это уже дебри). Медиана и межквартильный размах - из другой оперы. Если приводить порядковую статистику, то и сравнения логично делать порядковой непараметрикой: вместо дисп. анализа - критерий Фридмана с попарными сравнениями по Неменьи или типа того. Можно привести среднее и ДИ вычисленное бутстрепом, но тогда и сравнения делать ресэмплинг-техникой: рандомизационным дисп. анализом. PS Т.к. у вас несколько признаков будьте готовы ответить на вопросы вроде: "а что там у вас с ошибкой I рода (типа)?", "а почему не использовали MANOVA?" PPS На форуме есть чудик, любящий после моего развёрнутого ответа ляпнуть что-нибудь своё блаженное невпопад, но близко к теме - тоже будьте готовы:) Сообщение отредактировал nokh - 9.02.2015 - 00:53 |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 28.09.2013 Пользователь №: 25345 ![]() |
1. Можно ли использовать однофакторный дисперсный анализ при не нормальном распределение между группами?
2. Дисперсии равны, а распределение отличается от нормального, какой критерий для сравнения средних можно использовать? Сообщение отредактировал Medic - 9.02.2015 - 20:54 |
|
![]() |
![]() |
![]()
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 5.02.2015 Пользователь №: 27011 ![]() |
Спасибо! Буду разбираться с преобразованиями.
медик, нормально должна быть распределена ошибка http://forum.disser.ru/index.php?showtopic=3457 http://r-analytics.blogspot.com/2013/05/bl...ml#.VNj4jU0cTIV
Прикрепленные файлы
|
|
![]() |
![]() |
![]()
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 28.09.2013 Пользователь №: 25345 ![]() |
медик, нормально должна быть распределена ошибка т.е. если я правильно понял, то если дисперсии равны по ливиню, то можно использовать критерий стьюдента, а если нет, то вариант использования манна уитни, для определния значимости различий или сходств средних ? и тогда вопрос, что надо проверять изначально , одинаковость дисперсий или распределение относительно нормальности? Сообщение отредактировал Medic - 9.02.2015 - 21:49 |
|
![]() |
![]() |
![]()
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
1. Можно ли использовать однофакторный дисперсный анализ при не нормальном распределение между группами? 2. Дисперсии равны, а распределение отличается от нормального, какой критерий для сравнения средних можно использовать? 1. См. ответ в сообщении #6: http://forum.disser.ru/index.php?showtopic=3591 2. Если распределение ненормальное, то (не)равенство дисперсий не важно. Нужно использовать робастные методы дисперсионного анализа (см. п.1) или непараметрические аналоги (например вместо однофакторного дисп. анализа - критерий Краскела - Уоллиса, или критерий Даны Квейд). |
|
![]() |
![]() |
![]() ![]() |