Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Бета-распределение -- как анализировать

Автор: Физиолог 6.06.2014 - 18:44

Здравствуйте, уважаемые коллеги!

проведено исследование на крысах с оценкой условной реакции предпочтения места. Суть теста в том, что крыса помещается в ящик, дно которого разделено на 2 равных зоны с разными поверхностями. Например, гладкая и шершавая. Регистрируется процент времени, которое крыса проводит на одной из поверхностей. Эксперимент был спланирован для дисперсионного анализа. Было 2 фактора, требуется узнать влияение каждого из факторов и взаимодействие. Распределение данной переменной оказалось "не нормальное", поэтому дисперсионный анализ использовать нельзя. Долго пробовал выйти из положения применяя различные модификации анализа таблиц частот (например, разбить крыс на 2 группы -- больше и меньше 50 % времени проводят на одной из поврехностей -- сделать таблицу частот), логит регрессию... Не получается доказать то, что я вижу в данных. Хотелось бы всё-таки применить параметрический анализ. Но для этого нужно как-то привести распределение к нормальному.
Подскажите, пожалуйста:
1. Как доказать, что имеется бета-распреджление. Для работы имею программы Statistica 8.0, SPSS 17, дали пробную версию StatXact, но в них я не нашёл способа подгонки бета-распределения?
2. Как привести бета-распределение к нормальному? Есть ли более-менее простое решение, так как я не математик?
3. Может быть есть специальные критерии для работы с переменными, распределёнными такми образом, какой-либо аналог двухфакторного дисперсионного анализа?
Мне очень важно доказать не только влияние факторов, что я с грехом пополам вижу с помощью критерия Манна-Уитни, но и взаимодействие факторов!
Прикрепляю файл с иллюстрацией распределения. Действительно ли это бета-распределение? Почему Statistica не хочет рисовать кривую подгонки, нельзя нуои что-ли, или в пределах 0 - 1 должно быть?
Помогите, пожалуйста!



 Distribution.bmp ( 990,05 килобайт ) : 911
 

Автор: nokh 6.06.2014 - 19:17

Посмотрите в этой теме сообщения nokh и диалог: http://ru-spss.livejournal.com/193634.html
На картинке не бета-распределение, а смесь распределений. Возможно потому, что здесь всё в кучу, а смотреть нужно распределение остатков после дисперсионного анализа.

Автор: 100$ 6.06.2014 - 21:16

Цитата(Физиолог @ 6.06.2014 - 19:44) *
Подскажите, пожалуйста:
1. Как доказать, что имеется бета-распреджление. Для работы имею программы Statistica 8.0, SPSS 17, дали пробную версию StatXact, но в них я не нашёл способа подгонки бета-распределения?
2. Как привести бета-распределение к нормальному? Есть ли более-менее простое решение, так как я не математик?
3. Может быть есть специальные критерии для работы с переменными, распределёнными такми образом, какой-либо аналог двухфакторного дисперсионного анализа?
Мне очень важно доказать не только влияние факторов, что я с грехом пополам вижу с помощью критерия Манна-Уитни, но и взаимодействие факторов!
Прикрепляю файл с иллюстрацией распределения. Действительно ли это бета-распределение? Почему Statistica не хочет рисовать кривую подгонки, нельзя нуои что-ли, или в пределах 0 - 1 должно быть?
Помогите, пожалуйста!


Если уж очень хочется повозиться с распределением, то:
1. Носителем бета-распределения является величина X, распределенная на отрезке [0;1]. Так что вы уж выразите свои проценты в долях единицы. Сделайте реверанс в сторону статистики как науки и Статистики как программы.
2. Т.к. плотность вероятности бета-распределения уходит в бесконечность на концах интервала при параметрах альфа=бета=0,5, то проверить гипотезу о виде распределения с известными параметрами можно чем-нибудь из арсенала критериев согласия: критерия согласия Колмогорова, Крамера-Мизеса-Смирнова, и т.д.
3. Ежели гипотеза о бета-распределении с указанными параметрами не отвергается, то бета- распределение приводится к стандартному нормальному с помощью аппроксимации Кемпа-Полсона (Кобзарь, стр. 42). Это http://librarum.org/book/10683/42
4. А дальше- двухфакторный ДА из параметрического арсенала. Как учили.

Автор: DoctorStat 6.06.2014 - 22:34

Цитата(Физиолог @ 6.06.2014 - 19:44) *
1. Как доказать, что имеется бета-распреджление. Для работы имею программы Statistica 8.0, SPSS 17, дали пробную версию StatXact, но в них я не нашёл способа подгонки бета-распределения?

У бета-распределения два неизвестных параметра, которые вам нужно определить из эксперимента. Оценками параметров занимается наука статистика. Они бывают разные: состоятельные, несмещенные и т.д. Почитайте книжки по статистике, чтобы понять, какие свойства оценок вам наиболее важны и после этого используйте соответствующие методы для их получения. В SPSS я не нашел функцию подгонки для бета-распределения.
Цитата(Физиолог @ 6.06.2014 - 19:44) *
2. Как привести бета-распределение к нормальному? Есть ли более-менее простое решение, так как я не математик?
Бета распределение не приводится к нормальному хотя бы потому, что у него больше параметров. Смотрите, например, http://ru.wikipedia.org/wiki/%D0%91%D0%B5%D1%82%D0%B0-%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5.
Цитата(Физиолог @ 6.06.2014 - 19:44) *
3. Может быть есть специальные критерии для работы с переменными, распределёнными такми образом, какой-либо аналог двухфакторного дисперсионного анализа?
Наверняка такие критерии кто-то уже придумал, но вы вряд ли найдете это в интернете. Проще всего обратиться к математику, который занимается подобными проблемами и решит не задачу в общем виде (что сложно), а частную, которая нужна именно вам (что гораздо легче).

Автор: 100$ 6.06.2014 - 23:30

Цитата(DoctorStat @ 6.06.2014 - 23:34) *
Бета распределение не приводится к нормальному хотя бы потому, что у него больше параметров.


Итак, у двухпараметрического бета-распределения параметров, оказывается, больше, чем у двухпараметрического нормального распределения (масштабно-сдвигового). А мужики-то и не знали.
Doctor, да не иссякнет источник мудрости вашей!

Автор: DoctorStat 7.06.2014 - 09:34

Цитата(100$ @ 7.06.2014 - 00:30) *
Итак, у двухпараметрического бета-распределения параметров, оказывается, больше, чем у двухпараметрического нормального распределения (масштабно-сдвигового).
Вы правы, количество параметров у обоих распределений одинаково и равно двум. Хоть я и не доктор, но тоже иногда ошибаюсь smile.gif
Цитата(Физиолог)
1. Как доказать, что имеется бета-распреджление
Забыл спросить топикстартера о самом главном. У вас есть теория, что распределение ДОЛЖНО иметь вид бета, или это предположение "взято с потолка" ? Бета распределение на практике встречается редко и нужно иметь веские основания для его использования.

Автор: p2004r 7.06.2014 - 12:58

Цитата(Физиолог @ 6.06.2014 - 18:44) *
Помогите, пожалуйста!


Построить регрессионную модель (GLM) с соответствующей (вполне подойдет биноминальная) связью.

Автор: Физиолог 9.06.2014 - 16:11

Цитата(nokh @ 6.06.2014 - 20:17) *
Посмотрите в этой теме сообщения nokh и диалог: http://ru-spss.livejournal.com/193634.html
На картинке не бета-распределение, а смесь распределений. Возможно потому, что здесь всё в кучу, а смотреть нужно распределение остатков после дисперсионного анализа.


А если смесь распределений, то только непараметрические методы, правильно?
А может быть это не смесь, а просто провалы не успели заполниться (при данном числе наблюдений)?
Попробую разобраться с Generalized linear model в SPSS, как gorgonops на форуме, куда Вы меня отослали...
Преобразование Бокса-Кокса при первом наскоке не даёт нормального распределения. Как подбирать параметры длянего, я не знаю.

Автор: Физиолог 9.06.2014 - 16:26

Цитата(100$ @ 6.06.2014 - 22:16) *
Если уж очень хочется повозиться с распределением, то:
1. Носителем бета-распределения является величина X, распределенная на отрезке [0;1]. Так что вы уж выразите свои проценты в долях единицы. Сделайте реверанс в сторону статистики как науки и Статистики как программы.


Это понятно.


Цитата(100$ @ 6.06.2014 - 22:16) *
2. Т.к. плотность вероятности бета-распределения уходит в бесконечность на концах интервала при параметрах альфа=бета=0,5, то проверить гипотезу о виде распределения с известными параметрами можно чем-нибудь из арсенала критериев согласия: критерия согласия Колмогорова, Крамера-Мизеса-Смирнова, и т.д.


Не существует ли какого-либо автоматизированного способа проверки?


Цитата(100$ @ 6.06.2014 - 22:16) *
3. Ежели гипотеза о бета-распределении с указанными параметрами не отвергается, то бета- распределение приводится к стандартному нормальному с помощью аппроксимации Кемпа-Полсона (Кобзарь, стр. 42). Это http://librarum.org/book/10683/42


На формулы, доступные по ссылке, мне, не специалисту, страшно смотреть! Боюсь, я с этим ничего не смогу сделать.
В книге Закса на с. 468 и 248 прочитал о довольно простом тригонометрическом преобразовании для значений, измеренных в процентах: arcsin ( sqrt (x) ). Как смотрите на такое преобразование, может ли оно подойти.

Автор: Физиолог 9.06.2014 - 16:39

Цитата(DoctorStat @ 7.06.2014 - 10:34) *
Забыл спросить топикстартера о самом главном. У вас есть теория, что распределение ДОЛЖНО иметь вид бета, или это предположение "взято с потолка" ? Бета распределение на практике встречается редко и нужно иметь веские основания для его использования.


Я читал, что такое распределение имеют переменные, значения которых ограницены с обеих сторон (например, 0 -- 100 %). Форма моего распределенияпоказалась мне похожей на то, что я нашёл в интернете. Поэтому,у меня возникола надежда, что я наконец нашёл, что у меня за распределение. Но остались вопросы: как это доказать? Как это анализировать с целью доказать своии гипотезы о влиянии факторов на эту переменную?

Автор: Физиолог 9.06.2014 - 16:42

Цитата(p2004r @ 7.06.2014 - 13:58) *
Построить регрессионную модель (GLM) с соответствующей (вполне подойдет биноминальная) связью.


Спасибо, буду пробовать. Пробовал логит регрессию и пробит регрессию (переделал зависимую переменную на бинарную). Нет, не видит того, что видит критерий Манна-Уитни -- отличия одной из групп от контрольной.

Автор: p2004r 10.06.2014 - 00:12

Цитата(Физиолог @ 9.06.2014 - 16:42) *
Спасибо, буду пробовать. Пробовал логит регрессию и пробит регрессию (переделал зависимую переменную на бинарную). Нет, не видит того, что видит критерий Манна-Уитни -- отличия одной из групп от контрольной.


зачем переделывать переменную? насколько данные секретны?

Автор: DoctorStat 10.06.2014 - 09:43

Цитата(Физиолог @ 9.06.2014 - 17:39) *
Я читал, что такое распределение имеют переменные, значения которых ограницены с обеих сторон (например, 0 -- 100 %). Форма моего распределенияпоказалась мне похожей на то, что я нашёл в интернете. Поэтому,у меня возникола надежда, что я наконец нашёл, что у меня за распределение. Но остались вопросы: как это доказать? Как это анализировать с целью доказать своии гипотезы о влиянии факторов на эту переменную?
Одной похожести на кривую какого-то распределения недостаточно для его использования в анализе. Необходимо теоретически доказать, что ваш параметр подчиняется этому распределению. Как это доказать - не знаю.

Автор: 100$ 10.06.2014 - 10:54

Цитата(DoctorStat @ 10.06.2014 - 10:43) *
Необходимо теоретически доказать, что ваш параметр подчиняется этому распределению. Как это доказать - не знаю.


Пифагоровы штаны
На все стороны равны.
Чтобы это доказать,
Надо снять и показать. (с) Народ

Автор: Физиолог 10.06.2014 - 11:14

Цитата(100$ @ 10.06.2014 - 11:54) *
Надо снять и показать. (с) Народ


Показываю Вам, p2004r и всем желающим.
Штаны. В прикреплённом файле.

К сожалению, прикрепить файл не удалось. Пишет "Неудачная загрузка. Вам запрещено загружать такой тип файлов".

Автор: 100$ 10.06.2014 - 11:57

Цитата(Физиолог @ 10.06.2014 - 12:14) *
К сожалению, прикрепить файл не удалось. Пишет "Неудачная загрузка. Вам запрещено загружать такой тип файлов".


Файл надо заархивировать.

Автор: anserovtv 17.06.2014 - 18:31

Цитата(Физиолог @ 9.06.2014 - 17:11) *
Преобразование Бокса-Кокса при первом наскоке не даёт нормального распределения. Как подбирать параметры для него, я не знаю.

Преобразование Бокса-Кокса имеется в /бесплатном/ пакете PAST (или Past).
Параметр лямбда определяется автоматически (но по каждой переменной отдельно!), само преобразование также выполняется автоматически (т.е. без ручного набора формул и т. д.).
Загружаете (импортируете!) данные; выделяете нужную переменную (столбец); Transform/ Box-Cox...
http://www.nhm2.uio.no/norlex/past/Past.exe
http://www.nhm2.uio.no/norlex/past/pastmanual.pdf
Преобразование Бокса-Кокса имеется и в пакете SPSS: автоматическая подготовка данных...

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)