![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 16.12.2008 Из: Санкт-Петербург Пользователь №: 5627 ![]() |
Добрый день! Помогите, пожалуйста, решить проблему. Только начала осваивать статистику и одновременно хочу научиться использовать для этих целей Excel.
Есть порядка 600 пар данных, подозреваю, что они должны быть взаимосвязаны, но как это обосновать - не знаю. Коэффициент корреляции Пирсона с помощью Excel расчитать могу, но он работает на нормальном распределении. Мои данные, боюсь, не имеют нормального. Выглядит это примерно так: 1 175 750 2 175 1225 3 45 350 4 125 350 5 125 500 6 175 1000 7 80 500 8 250 875 9 45 75 10 175 525 11 175 750 12 125 625 13 175 350 14 125 525 15 125 375 16 80 300 17 175 500 18 175 875 19 30 225 20 125 500 21 80 750 22 80 500 23 30 300 24 30 150 25 80 250 26 80 500 27 30 225 28 45 225 29 45 175 30 45 375 Начала оценивать нормальность распределения каждого из столбцов отдельно, чтобы хотя бы опровергнуть, но и этого даже не получилось. В общем запуталась:). Подскажите, пожалуйста, может, есть какой-то алгоритм? Скорее всего данные распределены не по нормальному закону (1), как это определить? Что выбрать для оценки корреляции? Спасибо заранее)) |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666 ![]() |
Всем добрый день.
Извините за вторжение в Ваш разговор. У меня тот же вопрос. Заранее прошу простить меня за мою некомпетентность в статистике. Вопрос вот какой. Я анализирую данные полученные в когортном исследовании. Исследуются исходы в одной выборке до и после операции. Например появилось ли недержание мочи после операции или исчезло. Насколько я понимаю, поскольку в данном случае речь идет о сравнении частот бинарного признак (есть недержание - 1; нет недержания -0) в двух связанных (зависимых группах). Таким образом для проверки гипотез следует применить Мак Немара хи квадрат с построением четырехпольной таблицы абсолютных частот. Далее мне нужно изучит корреляцию между двумя рядами. Один из которых построен из количественных признаков например (возраст или индекс массы тела а второй из бинарных (есть недержание - 1; нет недержания -0). Если я правильно понимаю в данном случае корреляцию следует анализировать методом Спирмена. Ответьте пожалуйста на вопрос. Все ли правильно ли в моих расчетах? Нет ли некорректно выбранного метода? И могу ли рассчитать корреляцию Спирмена таким образом - подставляя в первый ряд (например значение индекса массы тела - 29,5) а во второй ряд значение бинарного признака - 0 или 1 (что соответствует наличию или отсутствию заболевания). Заранее благодарен. Виктор |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Всем добрый день. Извините за вторжение в Ваш разговор. У меня тот же вопрос. Заранее прошу простить меня за мою некомпетентность в статистике. Вопрос вот какой. Я анализирую данные полученные в когортном исследовании. Исследуются исходы в одной выборке до и после операции. Например появилось ли недержание мочи после операции или исчезло. Насколько я понимаю, поскольку в данном случае речь идет о сравнении частот бинарного признак (есть недержание - 1; нет недержания -0) в двух связанных (зависимых группах). Таким образом для проверки гипотез следует применить Мак Немара хи квадрат с построением четырехпольной таблицы абсолютных частот. Далее мне нужно изучит корреляцию между двумя рядами. Один из которых построен из количественных признаков например (возраст или индекс массы тела а второй из бинарных (есть недержание - 1; нет недержания -0). Если я правильно понимаю в данном случае корреляцию следует анализировать методом Спирмена. Ответьте пожалуйста на вопрос. Все ли правильно ли в моих расчетах? Нет ли некорректно выбранного метода? И могу ли рассчитать корреляцию Спирмена таким образом - подставляя в первый ряд (например значение индекса массы тела - 29,5) а во второй ряд значение бинарного признака - 0 или 1 (что соответствует наличию или отсутствию заболевания). Заранее благодарен. Виктор Рассуждения не вполне оптимальны. Если у Вас есть две точки у одного и того же пациента, то тогда речь должна идти о смешанных моделях (моделях с повторными измерениями), которые неоднократно обсуждались ранее. Учитывая бинарность зависимого признака (есть/нет недержание) речь будет идти о логистической регрессии (с повторными измерениями). С ее помощью будет изучаться вопрос о влиянии группы (если есть два типа вмешательства) и индекса массы тела. Вместе с тем, анализ можно упростить, если анализировать только точку исхода. Вообще возможны следующие варианты до: было, после: осталось (0) до: было, после: исчезло (1) до: не было, после: нет (2) до: не было, после: появилось (3) Группы можно разделить по ситуации "до" (возможно, у Вас именно так, но я прописываю общий алгоритм). Тогда у нас есть группы до: было (1) после: осталось (0) после: исчезло (1) до: не было (0) после: нет (0) после: появилось (1) Анализируем отдельно группу "до: было" и "до: не было" Оценка частот (частота исчезновения недержания в группе, где оно было) оценивается одним из методов оценки ДИ частот (обсуждалось ранее - Клоппера-Пирсона, Агрести-Коула). Сам анализ выполняется при помощи обычной логистической регрессии. Примечание. Если у Вас была группа у которой исходно были одинаковые показатели "недержания" (например, было), то тест Мак-Немара не применим. Коэффициент корреляции Спирмена теоретически может использоваться на бинарных данных, но трудно интерпретируется и поэтому к использованию не рекомендуется. Показатель связи для бинарных переменных - отношение риска/отношение шансов и, если хочется корреляции - точечно-бисериальный коэффициент корреляции. |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666 ![]() |
[/left]
Рассуждения не вполне оптимальны. Если у Вас есть две точки у одного и того же пациента, то тогда речь должна идти о смешанных моделях (моделях с повторными измерениями), которые неоднократно обсуждались ранее. Учитывая бинарность зависимого признака (есть/нет недержание) речь будет идти о логистической регрессии (с повторными измерениями). С ее помощью будет изучаться вопрос о влиянии группы (если есть два типа вмешательства) и индекса массы тела. Вместе с тем, анализ можно упростить, если анализировать только точку исхода. Вообще возможны следующие варианты до: было, после: осталось (0) до: было, после: исчезло (1) до: не было, после: нет (2) до: не было, после: появилось (3) Группы можно разделить по ситуации "до" (возможно, у Вас именно так, но я прописываю общий алгоритм). Тогда у нас есть группы до: было (1) после: осталось (0) после: исчезло (1) до: не было (0) после: нет (0) после: появилось (1) Анализируем отдельно группу "до: было" и "до: не было" Оценка частот (частота исчезновения недержания в группе, где оно было) оценивается одним из методов оценки ДИ частот (обсуждалось ранее - Клоппера-Пирсона, Агрести-Коула). Сам анализ выполняется при помощи обычной логистической регрессии. Примечание. Если у Вас была группа у которой исходно были одинаковые показатели "недержания" (например, было), то тест Мак-Немара не применим. Коэффициент корреляции Спирмена теоретически может использоваться на бинарных данных, но трудно интерпретируется и поэтому к использованию не рекомендуется. Показатель связи для бинарных переменных - отношение риска/отношение шансов и, если хочется корреляции - точечно-бисериальный коэффициент корреляции. Большое спасибо за Ваш внятный и профессиональный ответ. Как профан в области статистики, прошу простить мою непонятливость. Я бы хотел пояснить дизайн исследования, для последующего вопроса. Имеется группа пациенток (все женщины),у всех один и тот же диагноз (опущение тазовых органов) все подверглись одной и той же операции Prolift, у 24 пациенток было недержание мочи (НМ) у 15 было скрыто недержание (два отдельных признака) (всего с недержанием 39). После операции у 14 женщин исчезло недержание, а у 10 осталось, а у пациенток с скрытым недержанием исчезло в 9 случаях а у 6 осталось. Кроме того, у 56 был ГАМП (гиперактивный мочевой пузырь) из которых после операции у 36 исчезло а у 20 осталось. А среди пациенток у которых не было ГАМП (49) он появился появилось у 4 пациенток. Я так понимаю расчеты в этих подгруппах должны выполнятся отдельно и аналогичными методами. Поэтому можно рассмотреть только группу НМ. Я думаю в данной ситуации критерий Мак-Немара для оценки различия отн частот до и после применим !? Далее известны другие показатели ИМТ, возраст, количество родов. Хотелось бы определить как эти факторы влияют на исход т.е. исчезнет НМ, останется или появиться. Мне представляется что в общей группе до операции следует привести коэф точечно-биссерной корреляции НМ - возраст, НМ-ИМТ, НМ-количество родов. Далее, следуя Вашей подсказке: следует провести расчет логистической регрессии НМ vs ИМТ, НМ vs возраст, НМ vs количество родов в группах до и после операции с последующим сравнением показателей Л-регресии, чтобы вынести суждение о том, что данный фактор влияет на появление или исчезновение симптомов?????? Это если я правильно понял Вашу подсказку. Или (опять если я правильно понял) можно построить таблицу:(примерно) (ПО)-постоперационно НМ возникло(ПО) - НМ не возникло(ПО) N женщин с ИМТ менш 30 A - B Т женщин с ИМТ бол 30 C - D Далее просто расчитать Odds Ratio = A/B = x C/D = y и просто отнести эти два показателя. x/y Последний метод прост до гениальности и соблазнителен. Однако применим ли он в данной ситуации и если да то требует ли он проверки гипотиз и какой метод оптимальнее всего для этого? Извините что извожу Вас,остался последний вопрос. Какой метод Вы бы посоветовали для анализа связь, частоты рецидива выраженного либо в процентах либо в абсолютных числах и степени выпадения? Заранее благодарен. [left] |
|
![]() |
![]() |
![]() ![]() |