Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Оценить корреляцию в Excel
Олик)
сообщение 16.12.2008 - 13:55
Сообщение #1





Группа: Пользователи
Сообщений: 13
Регистрация: 16.12.2008
Из: Санкт-Петербург
Пользователь №: 5627



Добрый день! Помогите, пожалуйста, решить проблему. Только начала осваивать статистику и одновременно хочу научиться использовать для этих целей Excel.
Есть порядка 600 пар данных, подозреваю, что они должны быть взаимосвязаны, но как это обосновать - не знаю.
Коэффициент корреляции Пирсона с помощью Excel расчитать могу, но он работает на нормальном распределении. Мои данные, боюсь, не имеют нормального.
Выглядит это примерно так:
1 175 750
2 175 1225
3 45 350
4 125 350
5 125 500
6 175 1000
7 80 500
8 250 875
9 45 75
10 175 525
11 175 750
12 125 625
13 175 350
14 125 525
15 125 375
16 80 300
17 175 500
18 175 875
19 30 225
20 125 500
21 80 750
22 80 500
23 30 300
24 30 150
25 80 250
26 80 500
27 30 225
28 45 225
29 45 175
30 45 375
Начала оценивать нормальность распределения каждого из столбцов отдельно, чтобы хотя бы опровергнуть, но и этого даже не получилось. В общем запуталась:).
Подскажите, пожалуйста, может, есть какой-то алгоритм?
Скорее всего данные распределены не по нормальному закону (1), как это определить?
Что выбрать для оценки корреляции?
Спасибо заранее))
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Victor1980
сообщение 10.08.2010 - 15:18
Сообщение #2





Группа: Пользователи
Сообщений: 11
Регистрация: 9.08.2010
Пользователь №: 22666



Я имел ввиду, то что учитывая необходимость в случае вычисления Odds Ratio потребуется перевод количественного признака ИМТ в бинарный т.е. (1)- ИМТ <30 (2) - ИМТ > 30, является такой подход целесообразным, оправданным и не снижает ли он чувствительность вычисления (с учетом того, что соблазн применения этого метода связан с тем что он гораздо более простой для понимания , в моем случае, чем та же самая логистическая ргрессия.

Еще раз спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 10.08.2010 - 20:40
Сообщение #3





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Victor1980 @ 10.08.2010 - 16:18) *
Я имел ввиду, то что учитывая необходимость в случае вычисления Odds Ratio потребуется перевод количественного признака ИМТ в бинарный т.е. (1)- ИМТ <30 (2) - ИМТ > 30, является такой подход целесообразным, оправданным и не снижает ли он чувствительность вычисления (с учетом того, что соблазн применения этого метода связан с тем что он гораздо более простой для понимания , в моем случае, чем та же самая логистическая ргрессия.

Еще раз спасибо!

Сразу на два поста. Итак у Вас группа НМ - 24 женщины (у всех недержание). После операции у 14 исчезло у 10 осталось. Соответственно, учитывая гомогенность по признаку недержания группы у Вас всего две цифры 14 и 10. Тест Мак-Немара требует 4 пары данных:
+- было исчезло
++ было осталось
-+ не было появилось
-- не было не появилось
Для расчетов используются численности групп (число пар) +- и -+. Второго типа данных у Вас просто нет, поэтому тест Мак-Немара не применим (его можно только использовать в случае ГАМП).
Соответственно, у Вас 24 женщины, которых можно закодировать 1 (исчезло), таких а человек и 0 (осталось), таких b человек. Описание этих значений сводится к расчету доли успешности операции a/(a+b) и определению 95% доверительного интервала по методам, указанным выше.
Теперь, на результат операции у Вас влияют вмешивающиеся значения. Насколько они важны можно было бы вначале проанализировать с помощью четырехпольных таблиц, но у Вас нет качественных, а тем более бинарных независимых переменных. Если бы они были, то таблица выглядела бы так
НМ/ Ф+ Ф-
1 m n
0 o p
, где m+n=a и o+p=b
Тогда OR=mp/no
и делается расчет 95%ДИ для OR.
В Вашем случае все показатели, повторюсь, количественные. Дихотомизировать количественные переменные, как Вы предлагаете - плохая практика, поскольку теряется значительная информация (тогда женщина с ИМТ 30.1 и 44.4 рассматриваются как имеющие одно значение ИМТ, а это разница для 150 см женщины в весе 67 и 100 кг). Соответственно, надо пользоваться методами, анализирующими зависимость качественной бинарной переменной от количественных - это логистическая регрессия.
Вначале делаете унивариантную логистическую регрессию (НМ-возраст, НМ-ИМТ, НМ-кол-во родов (тут надо посмотреть, если категорий мало, лучше их превратить в набо переменных-пустышек)), а затем - суммарную (не включая те показатели, которые в унивариантной регрессии оказались сильно незначимыми, например р>0,20).
После логистической регрессии также рассчитываете OR, только это буду шансы при росте, например ИМТ на 1 кг/м2 (можно и на 5 сделать).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Олик)   Оценить корреляцию в Excel   16.12.2008 - 13:55
- - DoctorStat   Цитата(Олик) @ 16.12.2008 - 13:5...   16.12.2008 - 15:30
- - Олик)   Спасибо большое!) еще небольшое уточнение: теп...   16.12.2008 - 17:12
- - Олик)   хотя, наверное, я уже и сама поняла, что лишнее, е...   16.12.2008 - 17:15
|- - плав   Цитата(Олик) @ 16.12.2008 - 17:1...   16.12.2008 - 21:34
- - Олик)   Correlations V2 ...   18.12.2008 - 15:41
|- - DoctorStat   Цитата(Олик) @ 18.12.2008 - 15:4...   18.12.2008 - 16:18
|- - плав   Цитата(DoctorStat @ 18.12.2008 - 16...   21.12.2008 - 12:10
- - Олик)   у меня продолжение того же вопроса: имею много дан...   19.12.2008 - 13:07
- - Олик)   кажется вышло)   19.12.2008 - 13:15
|- - DoctorStat   Цитата(Олик) @ 19.12.2008 - 13:1...   19.12.2008 - 14:07
- - Олик)   посчитала, спасибо за помощь, но вот получила как ...   19.12.2008 - 16:35
|- - DoctorStat   Цитата(Олик) @ 19.12.2008 - 16:3...   19.12.2008 - 17:23
|- - Игорь   Цитата(Олик) @ 19.12.2008 - 16:3...   20.12.2008 - 14:01
- - Олик)   Только начала осваивать статистику... Наверное, в...   21.12.2008 - 13:22
- - Олик)   Только начала осваивать статистику... Наверное, в...   21.12.2008 - 13:23
|- - DoctorStat   Цитата(Олик) @ 21.12.2008 - 13:2...   21.12.2008 - 15:48
- - плав   Множественные сравнения большая проблема, чем нено...   21.12.2008 - 19:38
- - Victor1980   Всем добрый день. Извините за вторжение в Ваш раз...   9.08.2010 - 23:31
|- - плав   Цитата(Victor1980 @ 10.08.2010 - 00...   10.08.2010 - 08:18
|- - Victor1980   [/left]Цитата(плав @ 10.08.2010 - 11...   10.08.2010 - 13:38
- - Victor1980   Я имел ввиду, то что учитывая необходимость в случ...   10.08.2010 - 15:18
|- - плав   Цитата(Victor1980 @ 10.08.2010 - 16...   10.08.2010 - 20:40
|- - Victor1980   Цитата(плав @ 10.08.2010 - 23:40) Ср...   12.08.2010 - 23:07
|- - плав   Цитата(Victor1980 @ 13.08.2010 - 00...   13.08.2010 - 15:05
|- - Игорь   Цитата(плав @ 13.08.2010 - 15:05) .....   13.08.2010 - 15:35
|- - Victor1980   Цитата(Игорь @ 13.08.2010 - 18:35) Т...   14.08.2010 - 00:21
|- - плав   Цитата(Victor1980 @ 14.08.2010 - 01...   14.08.2010 - 11:40
|- - Victor1980   [quote name='плав' post='10261' da...   14.08.2010 - 12:10
||- - плав   Цитата(Victor1980 @ 14.08.2010 - 13...   14.08.2010 - 12:38
|- - Victor1980   Цитата(плав @ 14.08.2010 - 14:40) Ва...   14.08.2010 - 17:17
|- - плав   Цитата(Victor1980 @ 14.08.2010 - 18...   14.08.2010 - 18:51
|- - Victor1980   Цитата(плав @ 14.08.2010 - 21:51) Да...   15.08.2010 - 18:00
|- - плав   Цитата(Victor1980 @ 15.08.2010 - 19...   31.08.2010 - 12:17
- - Victor1980   Учитывая вышесказанное, хочу сделать что то полезн...   14.08.2010 - 00:35
- - Victor1980   Спасибо за науку! Цитата(плав @ 14.08.20...   14.08.2010 - 19:11
|- - Victor1980   Цитата(Victor1980 @ 14.08.2010 - 22...   15.08.2010 - 15:21
- - Pinus   Наверно нет смысла писать в новую тему такой вопро...   25.08.2010 - 14:47
|- - Игорь   Цитата(Pinus @ 25.08.2010 - 14:47) М...   25.08.2010 - 15:56
- - DrgLena   Можно использовать ворд 1. Скопировать в ворд, акт...   25.08.2010 - 16:47
- - Pinus   Игорь, DrgLena, спасибо! Все получилось. Полез...   25.08.2010 - 23:53


Добавить ответ в эту темуОткрыть тему