Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Оценка изменчивости признаков для непараметрических данных, нужно сравнить изменчивость у разных выборок по ряду параметров
Giulietta
сообщение 11.03.2014 - 10:18
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 11.03.2014
Из: Иркутск
Пользователь №: 26157



Всем добрый день!
Проводим анализ изменчивости признаков. Нужно не только визуально определить изменчивость, но и получить конкретные цифры, её оценивающие, а потом проверить достоверность отличия изменчивости в выборках.
Нашли отличные формулы у Л.А. Животовского (Журнал общей биологии 1980, N2), позволяют и обобщённую дисперсию вычислить, и статистически её оценить, но всё это для параметрических данных. А у нас они непараметрические. Существует ли что нибудь подобное применительно к непараметрическим выборкам?
Спасибо smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 11.03.2014 - 19:43
Сообщение #2





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Giulietta @ 11.03.2014 - 13:18) *
Всем добрый день!
Проводим анализ изменчивости признаков. Нужно не только визуально определить изменчивость, но и получить конкретные цифры, её оценивающие, а потом проверить достоверность отличия изменчивости в выборках.
Нашли отличные формулы у Л.А. Животовского (Журнал общей биологии 1980, N2), позволяют и обобщённую дисперсию вычислить, и статистически её оценить, но всё это для параметрических данных. А у нас они непараметрические. Существует ли что нибудь подобное применительно к непараметрическим выборкам?
Спасибо smile.gif

Во-первых, непараметрическими могут быть только методы (критерии, подходы), но никак не данные или выборки. Разберитесь с этим вопросом, т.к. это - азы, "завалитесь" на первой же конференции. Лучше не использовать специальных терминов вообще, чем использовать их неправильно.

Во-вторых, мер оценки рассеяния (масштаба), как и мер оценки центральной тенденции несколько, например: размах, межквартильный размах, коэффициент вариации ... В зависимости от того, какой мерой пользоваться нужно будет и выбирать критерии для сравнения. Хороший справочник есть в сети - Кобзарь. Прикладная математическая статистика. См. начиная с раздела 4.2.2. Хотя пока не ясно что именно вам нужно, т.к. не понятно о каких признаках идёт речь: о количественных с ненормальным распределением, о счётных, о частотах, в т.ч. редких вариантах? Все они обрабатываются непараметрическими критериями. Например, у того же Животовского есть формула для расчёта среднего числа вариаций в выборке, которая позволяет оценивать изменчивость по качественным признакам; я её использовал для сравнения вариабельности окрасов бродячих собак в разных районах родного города (скоро опубликуем laugh.gif ). Но не факт что вам нужно именно это.

В-третьих, с коллегами нужно говорить на том языке, который они понимают. По крайней мере, сперва нужно доказать свою адекватность традиционными подходами, а уже потом "грузить" коллег статистической экзотикой. Какой язык понимают ваши коллеги, какие методы используют? Не может быть, чтобы никто, никогда, а вы - первая. Всё равно, кто-то, когда-то, как-то. Поднимайте литературу: кто, когда и как? А за рубежом? Например, насколько я знаю, дальше восточной Европы наработки того же Животовского не используют. А что используют в вашей области науки?

Сообщение отредактировал nokh - 11.03.2014 - 20:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Giulietta
сообщение 13.03.2014 - 11:26
Сообщение #3





Группа: Пользователи
Сообщений: 6
Регистрация: 11.03.2014
Из: Иркутск
Пользователь №: 26157



Спасибо за разъяснения!
Извиняюсь за неточность терминов. Я имела в виду ненормальное распределение в выборке. Признаки - количественные. А именно, длина, площадь, толщина органов изучаемых растений. Нужно провести анализ изменчивости фенотипических признаков. Строили диаграммы размаха ("ящик с усами"), соответственно чисто зрительно, по величине размаха, оценивали увеличение-уменьшение изменчивости. Но ведь мало просто визуально оценить. Как-то нужно это выразить в цифрах. Мне кажется, если вычислить грамотно показатель изменчивости (может быть даже не принципиально каким способом, лишь бы он был оправдан для выборки с ненормальным распределением) можно будет обработать эти цифры, с помощью, скажем, критерия Манна-Уитни. И тогда можно будет сказать "изменчивость увеличилась достоверно". Поправьте меня, если я что-то не то говорю! Я не спец в статистике. Работы коллег смотрела, но, честно скажу, в основном русскоязычные. Я биолог, медицинские журналы не очень доступны, в биологических же нужные статистические методы мне что-то не попались (в основном в таких случаях кивают на того же Животовского да на Глотова). Мне казалось, что может быть я просто упускаю что-то, и не замечаю методы, которые давно известны. По-видимому, это и правда экзотика какая-то. Плюнуть на всё, и сделать вид, будто выборка с нормальным распределением и обработать по Животовскому? Или рыть дальше уже в иностранной литературе .. insane.gif
Для начала пойду справочник Кобзаря поищу wink.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 16.03.2014 - 20:56
Сообщение #4





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Giulietta @ 13.03.2014 - 14:26) *
... Плюнуть на всё, и сделать вид, будто выборка с нормальным распределением и обработать по Животовскому?

Ну и кого вы обманите? Ройте, всё есть! Я бы попробовал критерий Сьегля-Тьюки (Siegel-Tukey test). Подробно описан в Закс Л. Статистическое оценивание со стр. 264 (кстати, это - одна из любимых книг Н.В. Глотова, полезно иметь, хотя и заметно устаревшая местами). Минус критерия - сильно падает мощность при росте различий в средних/медианах. Так что сравнивать Манном-Уитни всё равно придётся. Искать в пакетах Сьегля-Тьюки или что-то подобное пока совсем некогда, но сразу попался код на R: https://stat.ethz.ch/pipermail/r-help/2010-...ary/229215.html. А в качестве собствено меры изменчивости к нему дать межквартильный размах. Для надёжности можно параллельно вычислять коэффициенты вариации. Формулу для оценки статистической значимости различий CV с помощью F-критерия давал в сообщении #14 здесь: http://molbiol.ru/forums/index.php?showtopic=527397 . Я противник того, чтобы сваливать разные признаки в одну кучу (кроме задач для PCA-подобных техник); как в случае сравнения средних через MANOVA, так и относительно обобщённой дисперсии. Считал бы по каждому признаку отдельно.

Сообщение отредактировал nokh - 16.03.2014 - 21:33
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему