Цитата(nokh @ 11.03.2013 - 22:25)

1. Я не сталкивался с оценкой экспрессии в баллах. Она измеряется иначе и имеет конкретное числовое выражение. С этими цифрами и нужно работать - именно они и есть ваши данные, а не баллы. Если по каким-то причинам в ходе анализа предпочтительнее уйти к баллам - это допустимо, но это есть огрубление исходных данных и сопряжено с потерей информации. С вашими объёмами выборок лучше эту информацию не терять.
2. Попытки анализировать таблицы сопряжённости без учёта упорядоченного характера категорий - потеря информации. Т.е. здесь ни хи-квадрат, ни ТМФ не годятся.
3. Критерий Фишера - дедовский способ. Я не говорю, что им не работают; работают, но это от недостатка знания. В основе этого критерия лежит гипергеометрическое распределение, которое практически никогда не встречается в способе получения тех данных, которые пытаются с помощью этого критерия обсчитать. За неимением компьютеров это был неплохой вариант хоть как-то справиться со слабонасыщенными таблицами сопряжённости. Современный и технически грамотный подход - точный перестановочный метод (exact permutation test), основанный на биномиальном распредлении.
4. Кластеризация - мощный, но равно и опасный инструмент. При желании найти кластеры - они будут обнаружены по любому! Но не всегда за этими кластерами стоит что-то реальное. Применительно к Вашим данным крайне маловероятно, что кластеры удастся объяснить. Это - один ген. У одного экспрессируется сильно, у другого ещё сильнее, у третьего слабее и т.д. В другой группе такая-же чехарда, причём никаких различий в среднем уровне экспрессии нет даже на уровне тенденции. Полагаю, что единственное что можно сделать с вашими данными - попробовать доказать и просто констатировать различный характер распределения экспрессии в группах с помощью сериального критерия типа Вальда-Вольфовица.
1. Экспрессия - это очень обширное понятие, она бывает разная и измеряется по-разному. Вы можете ее оценивать с помощью ИФА вроде Elisa, с помощью Вестерн-блоттинга, еще много чем. В данном случае оценивается экспрессия на срезах с помощью ИГХ окрашивания. Есть разные методы ее квантификации (учитываются площадь окраски, интенсивность окраски и др.), но очень часто вообще применяют древнюю систему "три креста" - +, ++, +++. Уверяю вас, что так ее оценивают более чем в половине лабораторий России, что, наверное, не здорово, но так уж есть.
В данном случае баллы - это именно исходные данные, поступившие от гистопатолога (сам я этого не делал). Никаких "более первичных" цифр, к сожалению, нету.
2. А хи-квадрат для трендов? И потом, при работе с упорядоченными категориями мы делаем совсем что-то неправильное, или просто теряем в мощности критерия?
3. Понял, интересно, надо будет почитать. Кстати говоря, имеет ли это какое-то отношение к точным методам расчета, наподобие тех, что предлагает, скажем SPSS при расчете критерия Фишера?
4. Вот здесь скорее согласен с вами, чем с автором предыдущего коммента. Да и биологическая осмысленность таких кластеров, какие были предложены, под большим вопросом...
Большое спасибо за комментарии и вам, и
DoctorStat!