Критерий Фишера для таблиц NxM при малых выборках

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Критерий Фишера для таблиц NxM при малых выборках

Camel1000 Просмотр профиля	4.03.2013 - 19:25 Сообщение #1
Группа: Пользователи Сообщений: 17 Регистрация: 3.02.2013 Пользователь №: 24599	Всем добрый день! Такая ситуация: есть экспрессия некоего гена, оцененная ИГХ в баллах от 1 до 5. Строим таблицу для клинического фактора Z - первая и вторая степени, условно. Получаем таблицу сопряженности 5x2: Э Z1 Z2 1 2 1 2 2 8 3 6 3 4 3 1 5 0 3 Расчет точного критерия Фишера (в SPSS) дает 0,065 (допустим, нас интересуют случаи < 0,1). Но как при попытках свести это к любой таблице 2x2, так и при попытках попарных сравнений (довольно беспомощных, потому что на самом деле я не очень понимаю, как делать post hoc попарные сравнения в таком случае) ничего осмысленного не выходит. Вопрос: можно ли, как думают уважаемые форумчане, дальше пытаться что-то из этого выжать, или при таком объеме данных все это не имеет физического смысла? Андрей АКА Camel1000 Сообщение отредактировал Camel1000 - 4.03.2013 - 19:28

Ответов

nokh Просмотр профиля	11.03.2013 - 21:25 Сообщение #2
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(Camel1000 @ 4.03.2013 - 22:25) Всем добрый день! Такая ситуация: есть экспрессия некоего гена, оцененная ИГХ в баллах от 1 до 5. Строим таблицу для клинического фактора Z - первая и вторая степени, условно. Получаем таблицу сопряженности 5x2: Э Z1 Z2 1 2 1 2 2 8 3 6 3 4 3 1 5 0 3 Расчет точного критерия Фишера (в SPSS) дает 0,065 (допустим, нас интересуют случаи < 0,1). Но как при попытках свести это к любой таблице 2x2, так и при попытках попарных сравнений (довольно беспомощных, потому что на самом деле я не очень понимаю, как делать post hoc попарные сравнения в таком случае) ничего осмысленного не выходит. Вопрос: можно ли, как думают уважаемые форумчане, дальше пытаться что-то из этого выжать, или при таком объеме данных все это не имеет физического смысла? Андрей АКА Camel1000 1. Я не сталкивался с оценкой экспрессии в баллах. Она измеряется иначе и имеет конкретное числовое выражение. С этими цифрами и нужно работать - именно они и есть ваши данные, а не баллы. Если по каким-то причинам в ходе анализа предпочтительнее уйти к баллам - это допустимо, но это есть огрубление исходных данных и сопряжено с потерей информации. С вашими объёмами выборок лучше эту информацию не терять. 2. Попытки анализировать таблицы сопряжённости без учёта упорядоченного характера категорий - потеря информации. Т.е. здесь ни хи-квадрат, ни ТМФ не годятся. 3. Критерий Фишера - дедовский способ. Я не говорю, что им не работают; работают, но это от недостатка знания. В основе этого критерия лежит гипергеометрическое распределение, которое практически никогда не встречается в способе получения тех данных, которые пытаются с помощью этого критерия обсчитать. За неимением компьютеров это был неплохой вариант хоть как-то справиться со слабонасыщенными таблицами сопряжённости. Современный и технически грамотный подход - точный перестановочный метод (exact permutation test), основанный на биномиальном распредлении. 4. Кластеризация - мощный, но равно и опасный инструмент. При желании найти кластеры - они будут обнаружены по любому! Но не всегда за этими кластерами стоит что-то реальное. Применительно к Вашим данным крайне маловероятно, что кластеры удастся объяснить. Это - один ген. У одного экспрессируется сильно, у другого ещё сильнее, у третьего слабее и т.д. В другой группе такая-же чехарда, причём никаких различий в среднем уровне экспрессии нет даже на уровне тенденции. Полагаю, что единственное что можно сделать с вашими данными - попробовать доказать и просто констатировать различный характер распределения экспрессии в группах с помощью сериального критерия типа Вальда-Вольфовица.

Сообщений в этой теме

Camel1000 Критерий Фишера для таблиц NxM при малых выборках 4.03.2013 - 19:25

DoctorStat Цитата(Camel1000 @ 4.03.2013 - 20:25... 4.03.2013 - 20:41

nokh Цитата(Camel1000 @ 4.03.2013 - 22:25... 11.03.2013 - 21:25

Camel1000 Цитата(nokh @ 11.03.2013 - 22:25) 1.... 22.03.2013 - 14:07

Choledochus Программист спрашивает: в каких пределах изменяетс... 25.05.2020 - 13:36

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум