Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: сравнение дисперсий
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
kmuranov
Dear All!

Каким образом можно оценить эффект воздействия, кoторый выражается не смещении среднего, а в увеличении дисперсии? Например, при подсчете площадей клеточных ядер в контроле прошадь составляет 20 +- 5 (mean+- SD), а в опыте 20+-15. N ~ 800.

C уважением,
kmuranov
DrgLena
Тест Левена
Levene test
nokh
1. Если известно, что распределение нормальное
а) групп только 2: F-критерий. Т.е. бóльшая выборочная дисперсия делится на меньшую и полученное значение сравнивается с критическим значением F-распределения для нужного уровня значимости α (обычно α=0,05) при числе степеней свободы ν1 = n1-1 и ν2 = n2-1. Если F >Fα, то нулевая гипотеза о равенстве дисперсий отклоняется и принимается альтернативная: дисперсии в выборках различаются. Есть и другие , но менее мощные критерии. (см. Кобзарь).
б) групп более двух: критерии Бартлетта, Кохрана или лучше Ливена.
2. Если характер распределения неизвесетн
а) групп только 2: критерий Зигеля ? Тьюки (Siegel - Tukey), критерий Муда и др. (см Закс Л., 1976; Кобзарь, 2006 - выходные данные есть на форуме, книги есть в сети).
б) групп более двух: критерий Бхапкара- Дешпанде.

Учитывая, что ваш признак - площадь, возможно скорее нормально будет распределён не он, а квадратный корень из него. И ещё: в биостатистике через +/- принято приводить не стандартное отклонение, а стандартную ошибку.
kmuranov
Спасибо, большое!

Цитата(nokh @ 26.11.2010 - 18:28) *
И ещё: в биостатистике через +/- принято приводить не стандартное отклонение, а стандартную ошибку.


По-поводу +/- Вы меня удивили. Представьте какова будет ошибка если, SD разделить на корень из n? Что бы Вы подумали об эффекте, про который я толкую?

С уважением,
kmuranov
Игорь
Цитата(kmuranov @ 27.11.2010 - 17:38) *
По-поводу +/- Вы меня удивили. Представьте какова будет ошибка если...

Пояснение, почему надо поступать так, см. на с. 24 книги "Тейлор Дж. Введение в теорию ошибок. - М.: Мир, 1985".

Цитата(nokh @ 26.11.2010 - 18:28) *
б) групп более двух: критерий Бхапкара- Дешпанде.

Критерий может оказаться сложным в "ручном" вычислении, ибо комбинаторный. У Кобзаря (с. 515) даже на простом примере видно, насколько много вычислений. Впрочем, программное решение (естественно, на Си) может быть удивительно компактным и красивым, если использовать рекурсию. У меня в принципе есть работающая заготовка - можно было бы легко добавить в AtteStat данный метод и еще пару родственных (упомянутых Кобзарем), но пока никому не понадобилось.
nokh
Цитата(kmuranov @ 27.11.2010 - 19:38) *
... По-поводу +/- Вы меня удивили. Представьте какова будет ошибка если, SD разделить на корень из n? ...

А зачем мне это представлять? confused.gif Я увидел неграмотную форму записи и указал на неё. В хороших учебниках написано так, а статьи безграмотных коллег авторитетными источниками не считаю. Можно пойти и дальше: в самых современных учебниках форма записи с +/- вообще не приводится, т.к. очень часто распределения являются асимметричными, а значит использование знака +/- абсолютно некорректно. Приводят точечную и интервальную оценку среднего: среднее и грамотно рассчитанный 95%-ный доверительный интервал, который для асимметричных распределений тоже будет асимметричным.
Цитата(Игорь @ 27.11.2010 - 19:45) *
... можно было бы легко добавить в AtteStat данный метод и еще пару родственных (упомянутых Кобзарем), но пока никому не понадобилось.

Честно говоря я тоже ни разу не сталкивался с необходимостью использовать этот критерий (да и узнал о нём не так давно). Но в AtteStat реализовано много уникальных методов, думаю что этот критерий хорошо бы туда вписался:) К тому же у него, похоже, мало или вовсе нет функциональных аналогов - непараметрических омнибусных тестов сравнения изменчивости. И не понятно чем считать, если объёмы выборок неравны.
DrgLena
Тест Левена (судя по Google, так чаще переводят Levene, но мой сосед по фамилии Левин, утверждает, что это его фамилия Levene) тестирует гомогенность дисперсий k групп, и k может быть равно двум, как и его модификация - тест Брауна и Форсайта (Brown&Forsythe ) может быть использован и для двух групп.
Поэтому в программе Statistica в модуле сравнения двух групп и по критерию Стьюдента и в модуле дисперсионного анализа реализованы оба эти критерия.
Эти два теста реализованы и в других пакетах ? гигантах (SAS, SPSS).
Игорь
Цитата(nokh @ 27.11.2010 - 20:17) *
Честно говоря я тоже ни разу не сталкивался с необходимостью использовать этот критерий (да и узнал о нём не так давно). Но в AtteStat реализовано много уникальных методов, думаю что этот критерий хорошо бы туда вписался:) К тому же у него, похоже, мало или вовсе нет функциональных аналогов - непараметрических омнибусных тестов сравнения изменчивости. И не понятно чем считать, если объёмы выборок неравны.

Критерии V, D и L помещены в модуль "Дисперсионный анализ...".
Игорь
Цитата(DrgLena @ 28.11.2010 - 03:03) *
Тест Левена ...

В том же модуле AtteStat
Цитата(DrgLena @ 28.11.2010 - 03:03) *
как и его модификация - тест Брауна и Форсайта (Brown&Forsythe )

И Брауна-Форсайта тоже

Кстати, критерий упомянут в Википедии http://en.wikipedia.org/wiki/Brown%E2%80%93Forsythe_test и тут http://wapedia.mobi/en/Brown%E2%80%93Forsythe_test. Однако в обоих источниках неточности в ссылках - в книге Good о критерии ничего нет. Есть в NYST: http://www.itl.nist.gov/div898/handbook/ed...ion3/eda35a.htm.

И еще кстати, о NYST. Несколько времени назад было объявлено, что NYST бесплатно рассылает CD с программой Dataplot и электронным руководством (аналогичным содержанию сайта). Сначала пришел ответ, что в США (в отличие от РФ) по закону запрещено торговать результатами исследований, выполненных на федеральные деньги, и попросили подождать недельку. Через неделю бесплатно пришел по почте упомянутый CD.
DoctorStat
Прежде, чем проверять увеличение дисперсии распределения площадей клеточных ядер, неплохо для начала убедиться на графиках в одномодальности распределения до и после опыта. Чует мое сердце, что после неизвестного воздействия на ядра, вместо одного пика появились сразу несколько пиков на функции распределения. Не нарисовав гистограммы, вы подумали, что форма распределения осталась прежней, а увеличилась лишь его ширина (дисперсия). Рисуйте больше и чаще - возможно именно в вас дремлет талант художника smile.gif
kmuranov
Цитата(DoctorStat @ 29.11.2010 - 22:49) *
Прежде, чем проверять увеличение дисперсии распределения площадей клеточных ядер, неплохо для начала убедиться на графиках в одномодальности распределения до и после опыта. Чует мое сердце, что после неизвестного воздействия на ядра, вместо одного пика появились сразу несколько пиков на функции распределения. Не нарисовав гистограммы, вы подумали, что форма распределения осталась прежней, а увеличилась лишь его ширина (дисперсия). Рисуйте больше и чаще - возможно именно в вас дремлет талант художника smile.gif


Ваше сердце ошиблось... smile.gif
Почему это дремлет? Представляете сколько гистограмм, распределений, корреляций можно нарисовать, имея 30 стекол да по 2х800 точек с каждого, уму непостижимо... weep.gif

А если серьезно, то воздействие (гамма-лучи), как бы смещает исходное распределение вправо - появляются ядра большего размера, но старение тоже вызывает подобный эффект. Вот между такими воздействиями (радиация и возраст) и требуется подтвердить/опровергнуть различие.

kmuranov
kmuranov
Цитата(Игорь @ 27.11.2010 - 17:45) *
Пояснение, почему надо поступать так, см. на с. 24 книги "Тейлор Дж. Введение в теорию ошибок. - М.: Мир, 1985".


Критерий может оказаться сложным в "ручном" вычислении, ибо комбинаторный. У Кобзаря (с. 515) даже на простом примере видно, насколько много вычислений. Впрочем, программное решение (естественно, на Си) может быть удивительно компактным и красивым, если использовать рекурсию. У меня в принципе есть работающая заготовка - можно было бы легко добавить в AtteStat данный метод и еще пару родственных (упомянутых Кобзарем), но пока никому не понадобилось.


Пользуясь случаем, выражаю Вам великую благодарность за Attestat!!!

kmuranov
DrgLena
DoctorStat высказал очень хорошую идею, которая и должна быть реализована вначале исследования. Не знаю, как точно спланирован эксперимент, но сравниваются фактически три группы: контроль или начало наблюдения, облучение и старение. Именно визуальный анализ гистограмм даст ответ на вопрос в каких категориях (диапазонах размеров) можно найти различия или доказать однородность в соотношении определенных категорий размеров. Для этого можно использовать анализ таблиц сопряженности. Не руками же вы должны строить такие гистограммы, программе все равно 80 или 800 значений вы измерили, а число диапазонов вы задаете сами. Тогда сможете сделать вывод, что после облучения статистически значимо повышается доля больших ядер ( с... до...), относительно их доли до облучения. А старение приводит к повышению доли ядер из другого диапазона, а может и из того же самого, это и будет доказательством однонаправленности действия облучения и старения.
Относительно сравнения дисперсий, kmuranov дал толчок для развития AtteStat, но для приведенных данных, это мало информативно. Самый быстрый взгляд на пример - дисперсии безусловно различаются в 9 раз, ну и что?
По критериям Левина и Брауна и Форсайта, хотелось бы уточнить не только звучание первой фамилии, но и сходимость расчетов с другими программами и с ручным расчетом.
Игорь
Цитата(DrgLena @ 1.12.2010 - 18:46) *
Относительно сравнения дисперсий, kmuranov дал толчок для развития AtteStat, но для приведенных данных, это мало информативно.

Программу эту не развивать нужно, а кончать. А взамен быстрее запускать мультисистемный проект на базе библиотеки Qt, ориентированный в первую очередь на Linux (также на MacOS и Windows). Сейчас фактически проект AtteStat служит продвижению связки Windows + Office от компании Microsoft.

Вот тут, если кому интересно, интерфейсная часть нового проекта: http://narod.ru/disk/656279001/Q.ZIP.html, которая сейчас пока позиционируется в качестве его основы. Это механическая пересборка Linux-ового варианта (без каких-либо изменений) для Windows. Разархивировать, запустить EXE файл. В Linux это выглядит точно так же.
Цитата(DrgLena @ 1.12.2010 - 18:46) *
По критериям Левина и Брауна и Форсайта, хотелось бы уточнить не только звучание первой фамилии, но и сходимость расчетов с другими программами и с ручным расчетом.

Указанные критерии технически сводятся к определенному элементарному преобразованию исходных данных, а затем к применению к полученному массиву обычного ANOVA. Т.е., если в преобразованиях не наврано и ANOVA исправна, то и результат верен. Проверку можно сделать так: 1) Преобразовать данные в таблице Excel; 2) Выполнить ANOVA в "Пакете анализа" Excel (данный метод в нем считается верно). Результат должен совпасть с прочими программами.
DrgLena
Да, действительно, ANOVA исправна, но преобразования сделаны не верно.
Для теста Левина ряд преобразуется вычитанием среднего для каждой подгруппы, а для Брауна-Форсайта вычитанием медианы.
Это легко проверить, используя тестовый пример в прилагаемой ссылке: F -тест Левина=7,6256 (р=0,0023), модифицированный Брауна-Форсайта 4,3769 (р=0,0226). В Attestat F -тест Левина= 3,673058 (р=0,0776), Брауна-Форсайта =1,976661 (р=0,31615).

http://www.personal.psu.edu/users/d/m/dmr/papers/levenes.PDF
Игорь
Цитата(DrgLena @ 2.12.2010 - 02:06) *
Да, действительно, ANOVA исправна, но преобразования сделаны не верно.

Да, есть такая неточность. Вечером исправлю и размещу. Работы на 1 минуту, но Office XP, на котором разрабатывается AtteStat, есть только дома. Если сделать изменения на работе (Office 2003 и 2007, на выбор), повредятся шаблоны Excel. Это вызвано тем, что для компании Microsoft обеспечение прямой и обратной совместимость различных версий своих же собственных форматов представляет неразрешимую проблему (лишний повод перейти на Linux).
...
Исправлено.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.