Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Статистическая задача
volchonok
сообщение 19.10.2013 - 16:21
Сообщение #1





Группа: Пользователи
Сообщений: 1
Регистрация: 19.10.2013
Пользователь №: 25454



Есть группа больных, 64 человека, которая делится по полу, на 4 группы по возрасту, и им ранее делали 2 разные операции. После операций у них 4 разных варианта анатомического строения глотки. Нужно доказать, что виды анатомического строения не зависят от пола, возраста и проведенного лечения.
Помогите решить. Ну или хотя бы в каком направлении копать...

Сообщение отредактировал volchonok - 3.03.2014 - 21:45
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 19.10.2013 - 18:53
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(volchonok @ 19.10.2013 - 19:21) *
Есть группа больных, 64 человека, которая делится по полу, на 4 группы по возрасту, и им ранее делали 2 разные операции. После операций у них 4 разных варианта анатомического строения глотки. Нужно доказать, что виды анатомического строения не зависят от пола, возраста и проведенного лечения.
Помогите решить. Ну или хотя бы в каком направлении копать...

К сожалению, простыми методами здесь не обойтись, т.к. помимо влияния на интересующий показатель факторов по отдельности возможно также влияние каких-то их сочетаний. Нужно анализировать весь комплекс данных одновременно. Копайте в направлении анализа таблиц сопряжённости и иерархического логлинейного анализа. Нужны пакеты, где он есть. Знаю как провести логлинейный анализ в Statistica, можно попробовать в R.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
docent
сообщение 21.10.2013 - 17:51
Сообщение #3





Группа: Пользователи
Сообщений: 16
Регистрация: 20.10.2013
Пользователь №: 25460



Цитата(nokh @ 19.10.2013 - 18:53) *
К сожалению, простыми методами здесь не обойтись, т.к. помимо влияния на интересующий показатель факторов по отдельности возможно также влияние каких-то их сочетаний. Нужно анализировать весь комплекс данных одновременно. Копайте в направлении анализа таблиц сопряжённости и иерархического логлинейного анализа. Нужны пакеты, где он есть. Знаю как провести логлинейный анализ в Statistica, можно попробовать в R.

А может начать с простого? Для начала проверить по таблицам сопряженности отсутствие влияния отдельно каждого фактора.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 21.10.2013 - 20:51
Сообщение #4





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(docent @ 21.10.2013 - 20:51) *
А может начать с простого? Для начала проверить по таблицам сопряженности отсутствие влияния отдельно каждого фактора.

Это приглашение к дискуссии? Хорошо.
(1) Вы предлагаете заменить один сложный анализ на три простых. Но каков смысл в проведении целых трёх анализов, если ни одни из них не в состоянии ответить на вопрос? Если после проведения этих трёх простых потом всё равно возможно придётся использовать более сложные подходы? Это нелогично с точки зрения решения любой проблемы вообще. Это как "давайте перекопаем поле лопатами, но поскольку на нужную глубину мы всё равно не вскопаем, то следом пустим плуг" smile.gif .
(2) Выявление эффектов взаимодействия между факторами возможно ТОЛЬКО при их совместном анализе. Если анализировать факторы отдельно, то в принципе нельзя обнаружить эффекта типа того, что для какого-то пола лечение влияет, а для какого-то нет, или что для одного пола оно влияет сильнее, чем для другого. Почитайте про взаимодействия факторов. В учебниках эта концепция традиционно излагается лучше при описании не анализа таблиц сопряжённости, а двухфакторного дисперсионного анализа.
(3) При объединении входов таблицы для простых анализов мы увеличиваем риск пасть жертвой парадокса Симпсона (= парадокса объединений) и сделать выводы с точностью до наоборот. Честно говоря, и при совместном анализе всех факторов мы от него не застрахованы, т.к. всегда есть вероятность не учесть чего-то важного, но зачем же эту вероятность сознательно увеличивать?
(4) Вы предлагаете заменить один анализ на три. А что при этом произойдёт с ошибкой первого рода? Поищите информацию о том, почему омнибусные критерии лучше поправок на множественность сравнений.
(5) Ну и наконец хи-квадрат. Многомерные задачи хи-квадратом не решить, т.к. в них хи-квадрат Пирсона теряет аддитивность. Поэтому их анализируют либо отношением (лог)правдоподобия G-квадрат, которое также асимптотически имеет теоретическое распределение хи-квадрат (это делается в ходе логлинейного анализа), либо вообще отказываются от любых асимтотик и считают ресэмплинг-техниками, типа той, что предложил р2004r.

Сообщение отредактировал nokh - 21.10.2013 - 21:23
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
docent
сообщение 21.10.2013 - 23:01
Сообщение #5





Группа: Пользователи
Сообщений: 16
Регистрация: 20.10.2013
Пользователь №: 25460



Цитата(nokh @ 21.10.2013 - 20:51) *
Это приглашение к дискуссии? Хорошо.

Я уже боюсь))
Я самоучка, поэтому вполне допускаю, что многого не знаю. Очень интересно пообщаться со знающими людьми. А на этом форуме дискуссии не приветствуются?

Цитата(nokh @ 21.10.2013 - 20:51) *
(1) Вы предлагаете заменить один сложный анализ на три простых. Но каков смысл в проведении целых трёх анализов, если ни одни из них не в состоянии ответить на вопрос? Если после проведения этих трёх простых потом всё равно возможно придётся использовать более сложные подходы? Это нелогично с точки зрения решения любой проблемы вообще. Это как "давайте перекопаем поле лопатами, но поскольку на нужную глубину мы всё равно не вскопаем, то следом пустим плуг" smile.gif .

Я вкладывала другой смысл. Я бы назвала это разведкой, а не копанием совочком гектара.

Цитата(nokh @ 21.10.2013 - 20:51) *
(2) Выявление эффектов взаимодействия между факторами возможно ТОЛЬКО при их совместном анализе. Если анализировать факторы отдельно, то в принципе нельзя обнаружить эффекта типа того, что для какого-то пола лечение влияет, а для какого-то нет, или что для одного пола оно влияет сильнее, чем для другого. Почитайте про взаимодействия факторов. В учебниках эта концепция традиционно излагается лучше при описании не анализа таблиц сопряжённости, а двухфакторного дисперсионного анализа.

А стоит ли тут вообще задача взаимодействия между факторами? И стоит ли задача определения влияния какого-то пола сильнее, чем другого? В стартпосте был задан вопрос "зависит/не зависит".

Цитата(nokh @ 21.10.2013 - 20:51) *
(3) При объединении входов таблицы для простых анализов мы увеличиваем риск пасть жертвой парадокса Симпсона (= парадокса объединений) и сделать выводы с точностью до наоборот. Честно говоря, и при совместном анализе всех факторов мы от него не застрахованы, т.к. всегда есть вероятность не учесть чего-то важного, но зачем же эту вероятность сознательно увеличивать?

не спорю))

Цитата(nokh @ 21.10.2013 - 20:51) *
(4) Вы предлагаете заменить один анализ на три. А что при этом произойдёт с ошибкой первого рода? Поищите информацию о том, почему омнибусные критерии лучше поправок на множественность сравнений.

Нет, заменять я ничего не предлагаю. С ошибкой при множественных сравнениях мне все понятно. Я пытаюсь понять постановку задачи. Стоит ли задача многофакторного анализа или есть 3 отдельные однофакторные задачи?

Цитата(nokh @ 21.10.2013 - 20:51) *
(5) Ну и наконец хи-квадрат. Многомерные задачи хи-квадратом не решить, т.к. в них хи-квадрат Пирсона теряет аддитивность. Поэтому их анализируют либо отношением (лог)правдоподобия G-квадрат, которое также асимптотически имеет теоретическое распределение хи-квадрат (это делается в ходе логлинейного анализа), либо вообще отказываются от любых асимтотик и считают ресэмплинг-техниками, типа той, что предложил р2004r.

Я не предлагаю решать многомерную задачу хи-квадратом. С теорией, которую предложил р2004r, еще не знакома. Буду изучать. Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 21.10.2013 - 23:24
Сообщение #6





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(docent @ 21.10.2013 - 23:01) *
Я не предлагаю решать многомерную задачу хи-квадратом. С теорией, которую предложил р2004r, еще не знакома. Буду изучать. Спасибо.


Вы её уже знаете smile.gif

Если назначенные измеренной в эксперименте величине уровни факторов перемешать, то все связи будут разрушены. Естественно если связи были smile.gif Это называют рандомизацией. Построив доверительные интервалы для интересующих нас статпоказателей (средних, дисперсий... да вообще практически любых) мы сравниваем их с полученными по исходным экспериментальных данных.

Если нас интересуют не проверка гипотезы о случайности факторов модели, а доверительные интервалы для статпараметров по уровням факторов, то пользуемся бутстрепом. Но для именно этого датасета будет трудновато, "вот так просто взять и построить сэмплер"(С)Боромир




Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему