Выбор статистического метода |
Здравствуйте, гость ( Вход | Регистрация )
Выбор статистического метода |
14.02.2016 - 14:52
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 11.02.2016 Пользователь №: 27979 |
Подскажите, пожалуйста, каким методом считать. В статистике новичок.
Данные следующие. Имеются 2 группы: 1 группа пациенты с ИБС, 2 ? без ИБС. В обеих группах проводилась операция. До и после операции смотрели ряд лабораторных показателей. Необходимо узнать есть ли динамика показателей в группах или нет. При этом распределение у показателей до операции - ненормальное, после операции - нормальное. Какой статистический метод лучше применить (Критерий парных выборок или критерий Уилкоксона)? И как описывать такие данные (среднее или медиана)? Сообщение отредактировал Maris - 14.02.2016 - 14:54 |
|
14.02.2016 - 15:25
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Критерий Уилкоксона - это и есть критерий для сравнения парных выборок. Соответственно, его и используйте. Проверять нужно распределение разностей в каждой группе, но если уже видно, что хотя бы в одном случае (до операции) оно далеко от нормального, то используем непараметрические методы.
Данные описываются показателями описательной статистики. Обычно это среднее, медиана, стандартное отклонение, минимум и максимум. Сообщение отредактировал ogurtsov - 14.02.2016 - 15:28 |
|
14.02.2016 - 22:06
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Подскажите, пожалуйста, каким методом считать. В статистике новичок. Данные следующие. Имеются 2 группы: 1 группа пациенты с ИБС, 2 ? без ИБС. В обеих группах проводилась операция. До и после операции смотрели ряд лабораторных показателей. Необходимо узнать есть ли динамика показателей в группах или нет. При этом распределение у показателей до операции - ненормальное, после операции - нормальное. Какой статистический метод лучше применить (Критерий парных выборок или критерий Уилкоксона)? И как описывать такие данные (среднее или медиана)? Если у каждого пациента определялось несколько показателей, то очень даже разумно использовать методы многомерной статистики- н-р, критерий Хотеллинга (для независимых и для зависимых выборок). Гуглится на ура. Непараметрический аналог - критерий Пури - Сена - Тамуры. А вообще-то здесь задача для двухфакторной МАНОВЫ - фактор "Группа", (тождественно равный фактору "Болячка" (ИБС/без ИБС)) - межгрупповой (between) и фактор "Время " (схема До-После) - внутригрупповой (within). Цитата Критерий Уилкоксона - это и есть критерий для сравнения парных выборок Огурцов, с именем Уилкоксона связано два критерия - для независимых выборок (Уилкоксона - Манна - Уитни) и для зависимых - критерий знаковых рангов Уилкоксона. Таки вы какой имеете в виду? Сообщение отредактировал 100$ - 14.02.2016 - 22:21 |
|
15.02.2016 - 20:34
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
|
|
16.02.2016 - 00:04
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 11.02.2016 Пользователь №: 27979 |
Ogurtsov, Спасибо! С данными описательной статистики знакома. Получается до операции (при ненормальном распределении) данные описывать медианой, после - среднее и стандартное отклонение?
100$, спасибо! Такие методы еще не рассматривали! Nokh, спасибо! Интересует динамика показателей в группах. Но буду благодарна, если подскажете как провести сравнение динамик! Это очень хорошая мысль) |
|
16.02.2016 - 10:59
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Nokh, спасибо! Интересует динамика показателей в группах. Но буду благодарна, если подскажете как провести сравнение динамик! Это очень хорошая мысль) Вопрос был почти шуточный, я думал вы просто неудачно сформулировали цель. Вообще, когда есть несколько групп (пусть 2) и несколько временных точек (пусть тоже 2: до и после операции), то обычно интересует как раз различие динамик состояния, т.е. что одна группа отреагировала иначе чем другая, например показатели быстрее пришли в норму. Слово "быстрее" уже предполагает сравнение. Смысл в том, чтобы проанализировать группы отдельно может быть, но это какой-то ущербный, "детский" дизайн, типа "смотрите - в первой группе есть динамика! А посмотрите - и во второй группе есть динамика! Надо же! Красота!" Любое научное исследование предполагает как обобщение ("везде есть динамика, красота!"), так и выявление специфики. С точки зрения доказательной медицины последнее особенно важно, т.к. вы должны ответить на вопрос что лучше для конкретной группы пациентов, для конкретного человека. А слово "лучше" (или "хуже" предполагает сравнение. Может люди с ИБС хуже переносят операцию - это нужно учесть в лечении. Ваши данные анализируют обычно двумя способами. 1). Часто используют некорректную схему из набора простых методов. Проводят сравнение независимых выборок отдельно "до операции", отдельно "после операции", и сравнение зависимых выборок "до-после" в каждой группе. Т.е. проводят целых 4 анализа, но отвечают не на все вопросы. В рамках такой схемы обнаружить различие динамик невозможно. 2). Грамотный подход: объединить все данные в одном анализе. Для этого используют обычно дисперсионный анализ (ANOVA). Здесь возможны 2 дизайна, которые приводят к идентичному результату, но по-разному задаются в пакетах и имеют различные требования к данным. а) Трёхфакторный дисперсионный анализ с группированными и пересекающимися факторами, смешанная модель. Факторы: Группа (фиксированный), Срок (фиксированный) и Пациент(Группа) (т.е. пациент внутри группы, случайный фактор). б) Двухфакторный дисперсионный анализ с повторными измерениями - типа того что предложил 100$, но я бы использовал не многопеременный (MANOVA), а обычный однопеременный (ANOVA)1. В обоих вариантах будут получены ответы на вопросы: 1. отличаются ли группы (при усреднении данных по срокам) - эффект фактора "Группа" 2. отличаются ли сроки (при усреднении по группам) - фактор "Срок" 3. отличаются ли группы динамикой - взаимодействие факторов "Группа х Срок". Про оба варианта много информации на этом форуме, ищите "повторные измерения, ANOVA, перекрёстно-иерархическая схема, смешанная модель". Общее требование - нормальность распределения ошибки всего дисперсионного комплекса. Если оно не выполняется - весь массив данных перед анализом нужно преобразовать, лучше по Боксу - Коксу. Для новичка звучит всё страшно, но делается за 5 мин. Ещё ваши данные с таким же результатом можно проанализировать в рамках подхода "Смешанных моделей" (Mixed models, Linear mixed-effects models и т.п). Результаты будут немного иными по форме, но должны быть такими же по-сути. В рамках такого подхода описательную статистику логично давать в виде среднего с 95% доверительным интервалом. PS 1 На форуме были раньше и есть сейчас сторонники многопеременного подхода, но я не нашёл его полезным для себя. Во-первых, речь всегда идёт не о различии групп вообще, а о различии по конкретному показателю - по конкретному показателю и считаем анову. Если показателей несколько, то ошибка первого рода при этом конечно растёт, но что поделаешь если MANOVA не нравится А во-вторых, если нужен многопеременный анализ, то уж лучше сразу либо дискриминантный (поиск особенностей), либо факторный (редукция данных с обобщением). |
|
17.02.2016 - 10:50
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 11.02.2016 Пользователь №: 27979 |
Да, действительно, не совсем корректно описала задачу..
Nokh, спасибо Вам большое за помощь и проведенный ликбез Трансформация Бокс-Кокса поддерживается в SPSS? Сообщение отредактировал Maris - 17.02.2016 - 11:48 |
|
17.02.2016 - 16:08
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Трансформация Бокс-Кокса поддерживается в SPSS? Когда это возможно, я стараюсь придерживаться канонических (ещё советских) переводов статистических терминов, поэтому квартиль у меня женского рода, гомоскедастичность - однородность дисперсий, а трансформация - преобразование. Преобразование Бокса - Кокса в SPSS есть, но во-первых неудобно реализровано, а во-вторых проводится не по стандартному алгоритму, а с опцией приведения к задаваемым пользователем значениям среднего и станд. отклонения (по умолчанию - соответственно 0 и 1), от которой нельзя отказаться. Путь: Преобразовать - Подготовка данных к построению моделей - Интерактивно (Или Автоматически) - Задать настройки самостоятельно - ... - Параметры - Масштабировать поля - Количественные целевые - Привести ... Бокса - Кокса. Короче, пусть сами разработчики ну или фанаты пакета тратят по полдня на настройку этого модуля... Я пользуюсь бесплатным пакетом PAST (http://folk.uio.no/ohammer/past/): Transform - Box-Cox. Преобразовывать нужно не отдельные группы, а весь массив сразу. Если лямбда близка к нулю проще использовать логарифмическое преобразование - в пакетах обычно можно задать логарифмический масштаб оси Y на графиках, а тогда автоматически построенные графики можно сразу давать в работу. Анализом повторных измерений в PAST лучше пока не пользоваться (не сходится с другими пакетами), а вот в SPSS - отличный модуль дисперсионного анализа повторных измерений: с учётом возможных отклонений от требования сферичности и т.д. |
|
19.02.2016 - 18:47
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 11.02.2016 Пользователь №: 27979 |
Nokh, спасибо! Спасибо Вам большое за подробные ответы!
|
|