Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Нерепрезентативность выборки. Что использовать?, что делать в случае нерепрезентативности выборки
venera51
сообщение 20.06.2008 - 09:53
Сообщение #1





Группа: Пользователи
Сообщений: 10
Регистрация: 7.09.2007
Пользователь №: 4351



День добрый. Очень часто в работах пишут, что выборки были репрезентативны по полу, возрасту и т.д. Пришла ко мне одна знакомая за советом, чуть ли не в слезах, что мол выборки не репрезентативны, сравнивать ничего нельзя, а работа уже написана. Если честно, немного растерялся, решил посоветоваться.
Итак, имеется 2 группы: исследуемая - 80 человек и контрольная - 40 человек. В возрасте от 3 до 7 лет Х человек исследуемой группы и Y человек контрольной группы (точные цифры не помню, но это и не важно). При анализе таблиц сопряженности (X и Y) по Пирсону кси-квадрат или по Фишеру, получается р<0,05.
Отсюда вопросы:
1. Можно ли сказать как вывод, что по возрасту группы не репрезентативны.
2. т.к. в исследовании анализируются количественные и качественные данные, можно ли для количественных данных в этом случае использовать непараметрические методы, а для качественных все тот же точный критерий Фишера? Имеется в виду для возрастной группы от 3 до 7 лет. Будет ли это правильно?
Лично мне кажется, что такие группы можно анализировать, однако хочется услышать что скажут более компетентные в этих вопросах люди.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 20.06.2008 - 11:03
Сообщение #2





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Репрезентативность = достаточная численность. Об этом уже говорилось в одной из тем форума данного http://forum.disser.ru/index.php?showtopic=1649.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 20.06.2008 - 13:41
Сообщение #3





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Здесь, мне кажется, речь идет не о репрезентативности, а о сбалансированности. Репрезентативность (другое определение, чаще ипользуемое в клинических испытаниях) - соответствие выборки исходной популяции (генеральной совокупности). Основным способом обеспечения репрезентативности выборки является случайность этой выборки - т.е. вопрос заходит о методике отбора пациентов для исследования.
В данном случае наблюдаются отличия групп по составу и, соответственно, несбалансированность групп по возрасту (они могли бы быть нерепрезентативными даже будучи сбалансированными).
Дисбаланс надо убирать, иначе группы несравнимы друг с другом. Убирать можно двумя способами:
1) Стратифицированный анализ (сравниваем отдельно лиц в возрасте 3-7 лет в обеих группах и отдельно лиц старше (или моложе)). Получаем резкую потерю мощности.
2) Статистическое моделирование ( в зависимости от типа зависимой переменной либо логистическая регрессия, либо модель пропорционального риска, либо общая линейная модель). Проблемы связаны с тем, что мы делаем допущения о характере влияния возраста на зависимую переменную.
Соответственно, анализ делается одним из описанных выше методов.
Дисбаланс факторов не имеет никакого отношения к непараметрике, выбор метода анализа для количественной зависимой переменной определяется типом ее распределения в популяции (т.е вопрос из другой оперы). Непараметрику удастся использовать только в стратифицированном анализе (соответственно, менее мощные метод сравнения + менее мощный статистический метод = проблемы). Статистические модели почти все параметрические (или полупараметрические, как модель пропорционального риска).
И небольшое замечание. Статистика Пирсона называется хи-квадрат.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
venera51
сообщение 21.06.2008 - 07:23
Сообщение #4





Группа: Пользователи
Сообщений: 10
Регистрация: 7.09.2007
Пользователь №: 4351



Спасибо всем, сейчас читаю дополнительно литературу по этому поводу, обдумываю вышесказанное.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
venera51
сообщение 23.06.2008 - 10:16
Сообщение #5





Группа: Пользователи
Сообщений: 10
Регистрация: 7.09.2007
Пользователь №: 4351



Огромнейшее спасибо за комментарии. Здесь действительно речь идет о не сбалансированности групп. Про термин «репрезентативность» почитал, он сюда не подходит. Но все же, я не до конца разобрался, так что извините за назойливость. Итак, основная группа - 40 человек, контрольная - 80. Детей 3-7 лет в основной группе - 24 (60 %), в контрольной группе - 21 (26 %). Остальным детям более 7 лет. При проведении анализа таблиц сопряженности с использованием точного критерия Фишера - р<0,05. Таким образом, группы не сбалансированы. Исследуются частота симптомов при определенной патологии и эффективность лечения с (основная группа) и без (контрольная группа) применения эпадола. Однако, как уже выяснилось, группы не сбалансированы по возрасту. Объединить детей 3-7 лет и старших невозможно. Какой оптимальный выход из данной ситуации?
1. Может, несколько уменьшить количество детей возрастной категории 3-7 лет в основной группе? (добор больных практически невозможен).
2. Не теряется ли мощность при применении точного критерия Фишера, логистической регрессии если группы не сбалансированы?
3. Речь о несбалансированности идет только когда р <0,05 (в данном случае точный критерий Фишера). А в других случаях , когда р >0,05 мы можем говорить, что выборки сбалансированы?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 23.06.2008 - 10:45
Сообщение #6





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(venera51 @ 23.06.2008 - 10:16) *
При проведении анализа таблиц сопряженности с использованием точного критерия Фишера - р<0,05. Таким образом, группы не сбалансированы.

Не совсем понятна логическая цепочка. Как из значимости ТМФ следует несбалансированность групп? Из значимости статистики критерия следует значимость различий групп.

Коль уж Вы используете хи-квадрат и ТМФ, то не применить ли лучше в данной задаче критерий Мантеля-Хензеля?

Метод описан на с. 87 достаточно новой книги "Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях ..." и применяется для стратифицированных групп. Первая страта, т.е. "слой", - дети до 7 лет, вторая страта - после 7 лет.

Опасения по поводу якобы малочисленности групп в данном случае не имеют оснований.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 23.06.2008 - 13:18
Сообщение #7





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Игорь @ 23.06.2008 - 11:45) *
Не совсем понятна логическая цепочка. Как из значимости ТМФ следует несбалансированность групп? Из значимости статистики критерия следует значимость различий групп.

Коль уж Вы используете хи-квадрат и ТМФ, то не применить ли лучше в данной задаче критерий Мантеля-Хензеля?

Метод описан на с. 87 достаточно новой книги "Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях ..." и применяется для стратифицированных групп. Первая страта, т.е. "слой", - дети до 7 лет, вторая страта - после 7 лет.

Опасения по поводу якобы малочисленности групп в данном случае не имеют оснований.


На самом деле группы различаются по возрасту, значит, они не сбалансированы по возрасту.
Уменьшать искусственно группы естественно, бессмысленно, однако расчитывать на серьезные результаты при такой численности групп так же вряд ли приходится. Итак, есть две группы - до 7 лет и старше 7 лет. В группе моложе 7 лет 24 ребенка получали препарат, 21 не получали. Эти группы по исходу делятся на две подгруппы и количество лиц в этих подгруппах будет мало. В частности, при делении группы из 21 ребенка по исходу я сомневаюсь, что группа будет репрезентативна для всей популяции не леченных препаратом детей.
Для детей старше 7 лет ситуация ничуть не чуть лучше - получали препарат 16 детей и не получали - 59. Тут мы уже делим по исходу группу из 16 детей, которая вряд ли будет репрезентативной для популяции детей старше 7 лет, получающих препарат.
Честно говоря, такие исследования относятся к группе не подлежащих спасению статистическими методами (особенно, если есть убеждение в том, что группы детей разного возраста принципиально отличны). Не совсем понятно, как этический комитет дал разрешение на проведение подобного исследования (а начиная с 2005 года все клинические испытания подлежат обязательному рассмотрению этическим комитетом). Строго говоря, исследователь должен начинать добор пациентов в группы. В противном случае, наличие в Совете или среди рецензентов хоть одного специалиста по организации клинических испытаний убьет любую публикацию/защиту. Это серьезно, поскольку речь идет о вмешательстве, а не прото изучении влияния фактора Х на течение заболевания Y.
Сказав это замечу, что наиболее оптимальным вариантом было бы считать эксперимент проведенным на группе пациентов в 120 человек с разделением 1:2 в группы контроля и лечения и последующим анализом либо логистической регрессией (с введением в модель переменной возраста, пола и т.п.), либо, если это было рандомизированное клиническое испытание - методом Мантеля-Ханзеля. Я бы предпочел в данном случае логистическую регрессию ибо не уверен, что другие факторы (пол, тяжесть заболевания и т.п.) были также сбалансированны. Даже если это было РКИ, то распределение по возрасту показывает (хотя оно показывает, что это, скорее всего, не было РКИ), что группы оказались не сбалансированными по как минимум одному фактору. Значит, для усиления мощности надо попытаться выявить влияющие факторы и сбалансировать их при помощи модели.


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему