Оценить корреляцию в Excel - Форум врачей-аспирантов

Оценить корреляцию в Excel

Олик) Просмотр профиля	16.12.2008 - 13:55 Сообщение #1
Группа: Пользователи Сообщений: 13 Регистрация: 16.12.2008 Из: Санкт-Петербург Пользователь №: 5627	Добрый день! Помогите, пожалуйста, решить проблему. Только начала осваивать статистику и одновременно хочу научиться использовать для этих целей Excel. Есть порядка 600 пар данных, подозреваю, что они должны быть взаимосвязаны, но как это обосновать - не знаю. Коэффициент корреляции Пирсона с помощью Excel расчитать могу, но он работает на нормальном распределении. Мои данные, боюсь, не имеют нормального. Выглядит это примерно так: 1 175 750 2 175 1225 3 45 350 4 125 350 5 125 500 6 175 1000 7 80 500 8 250 875 9 45 75 10 175 525 11 175 750 12 125 625 13 175 350 14 125 525 15 125 375 16 80 300 17 175 500 18 175 875 19 30 225 20 125 500 21 80 750 22 80 500 23 30 300 24 30 150 25 80 250 26 80 500 27 30 225 28 45 225 29 45 175 30 45 375 Начала оценивать нормальность распределения каждого из столбцов отдельно, чтобы хотя бы опровергнуть, но и этого даже не получилось. В общем запуталась:). Подскажите, пожалуйста, может, есть какой-то алгоритм? Скорее всего данные распределены не по нормальному закону (1), как это определить? Что выбрать для оценки корреляции? Спасибо заранее))

Ответов

Victor1980 Просмотр профиля	10.08.2010 - 15:18 Сообщение #2
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666	Я имел ввиду, то что учитывая необходимость в случае вычисления Odds Ratio потребуется перевод количественного признака ИМТ в бинарный т.е. (1)- ИМТ <30 (2) - ИМТ > 30, является такой подход целесообразным, оправданным и не снижает ли он чувствительность вычисления (с учетом того, что соблазн применения этого метода связан с тем что он гораздо более простой для понимания , в моем случае, чем та же самая логистическая ргрессия. Еще раз спасибо!

плав Просмотр профиля	10.08.2010 - 20:40 Сообщение #3
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(Victor1980 @ 10.08.2010 - 16:18) Я имел ввиду, то что учитывая необходимость в случае вычисления Odds Ratio потребуется перевод количественного признака ИМТ в бинарный т.е. (1)- ИМТ <30 (2) - ИМТ > 30, является такой подход целесообразным, оправданным и не снижает ли он чувствительность вычисления (с учетом того, что соблазн применения этого метода связан с тем что он гораздо более простой для понимания , в моем случае, чем та же самая логистическая ргрессия. Еще раз спасибо! Сразу на два поста. Итак у Вас группа НМ - 24 женщины (у всех недержание). После операции у 14 исчезло у 10 осталось. Соответственно, учитывая гомогенность по признаку недержания группы у Вас всего две цифры 14 и 10. Тест Мак-Немара требует 4 пары данных: +- было исчезло ++ было осталось -+ не было появилось -- не было не появилось Для расчетов используются численности групп (число пар) +- и -+. Второго типа данных у Вас просто нет, поэтому тест Мак-Немара не применим (его можно только использовать в случае ГАМП). Соответственно, у Вас 24 женщины, которых можно закодировать 1 (исчезло), таких а человек и 0 (осталось), таких b человек. Описание этих значений сводится к расчету доли успешности операции a/(a+b) и определению 95% доверительного интервала по методам, указанным выше. Теперь, на результат операции у Вас влияют вмешивающиеся значения. Насколько они важны можно было бы вначале проанализировать с помощью четырехпольных таблиц, но у Вас нет качественных, а тем более бинарных независимых переменных. Если бы они были, то таблица выглядела бы так НМ/ Ф+ Ф- 1 m n 0 o p , где m+n=a и o+p=b Тогда OR=mp/no и делается расчет 95%ДИ для OR. В Вашем случае все показатели, повторюсь, количественные. Дихотомизировать количественные переменные, как Вы предлагаете - плохая практика, поскольку теряется значительная информация (тогда женщина с ИМТ 30.1 и 44.4 рассматриваются как имеющие одно значение ИМТ, а это разница для 150 см женщины в весе 67 и 100 кг). Соответственно, надо пользоваться методами, анализирующими зависимость качественной бинарной переменной от количественных - это логистическая регрессия. Вначале делаете унивариантную логистическую регрессию (НМ-возраст, НМ-ИМТ, НМ-кол-во родов (тут надо посмотреть, если категорий мало, лучше их превратить в набо переменных-пустышек)), а затем - суммарную (не включая те показатели, которые в унивариантной регрессии оказались сильно незначимыми, например р>0,20). После логистической регрессии также рассчитываете OR, только это буду шансы при росте, например ИМТ на 1 кг/м2 (можно и на 5 сделать).

Victor1980 Просмотр профиля	12.08.2010 - 23:07 Сообщение #4
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666	Цитата(плав @ 10.08.2010 - 23:40) Сразу на два поста. Итак у Вас группа НМ - 24 женщины (у всех недержание). После операции у 14 исчезло у 10 осталось. Соответственно, учитывая гомогенность по признаку недержания группы у Вас всего две цифры 14 и 10. Тест Мак-Немара требует 4 пары данных: +- было исчезло ++ было осталось -+ не было появилось -- не было не появилось Для расчетов используются численности групп (число пар) +- и -+. Второго типа данных у Вас просто нет, поэтому тест Мак-Немара не применим (его можно только использовать в случае ГАМП). Соответственно, у Вас 24 женщины, которых можно закодировать 1 (исчезло), таких а человек и 0 (осталось), таких b человек. Описание этих значений сводится к расчету доли успешности операции a/(a+b) и определению 95% доверительного интервала по методам, указанным выше. Теперь, на результат операции у Вас влияют вмешивающиеся значения. Насколько они важны можно было бы вначале проанализировать с помощью четырехпольных таблиц, но у Вас нет качественных, а тем более бинарных независимых переменных. Если бы они были, то таблица выглядела бы так НМ/ Ф+ Ф- 1 m n 0 o p , где m+n=a и o+p=b Тогда OR=mp/no и делается расчет 95%ДИ для OR. В Вашем случае все показатели, повторюсь, количественные. Дихотомизировать количественные переменные, как Вы предлагаете - плохая практика, поскольку теряется значительная информация (тогда женщина с ИМТ 30.1 и 44.4 рассматриваются как имеющие одно значение ИМТ, а это разница для 150 см женщины в весе 67 и 100 кг). Соответственно, надо пользоваться методами, анализирующими зависимость качественной бинарной переменной от количественных - это логистическая регрессия. Вначале делаете унивариантную логистическую регрессию (НМ-возраст, НМ-ИМТ, НМ-кол-во родов (тут надо посмотреть, если категорий мало, лучше их превратить в набо переменных-пустышек)), а затем - суммарную (не включая те показатели, которые в унивариантной регрессии оказались сильно незначимыми, например р>0,20). После логистической регрессии также рассчитываете OR, только это буду шансы при росте, например ИМТ на 1 кг/м2 (можно и на 5 сделать). Спасибо! Несмотря на то, что мое знакомство со статистикой исчисляется днями метод дихтомизации мне то же показался грубоватым. Спасибо что дали экспертное мнение. Придется осваивать логистическу регрессию, метод который для дилетанта кажется зловеще загадочным и непостижимым. Вы так же советуете выразить эффективность в виде частот и построить для них ДИ. Дело в том, что как я уже говорил опыта и теоретических познаний в статистике у меня мягко говоря маловато. За это время я успел прочитать книгу Ребровой. Где говорится буквально следующее. Построение границ для бинарного признака сложная задача, поэтому мы приводим таблицы с их значениями в приложении 4. Таблицы в этом приложении явно не подходят для моего исследования, исходя из количества исследуемых пациентов. Вы говорили, что метод описан выше. Я прсмотрел почти весь форум и не нашел ничего, что (в моем понимании) описывает методику построения ДИ для долей. Не исключаю варианта, что я читал но не понял о чем речь. Не могли бы Вы дать мне ссылку на страницу где обсуждается данная тема? Заранее благодарен, Виктор

плав Просмотр профиля	13.08.2010 - 15:05 Сообщение #5
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(Victor1980 @ 13.08.2010 - 00:07) Таблицы в этом приложении явно не подходят для моего исследования, исходя из количества исследуемых пациентов. Вы говорили, что метод описан выше. Я прсмотрел почти весь форум и не нашел ничего, что (в моем понимании) описывает методику построения ДИ для долей. Не исключаю варианта, что я читал но не понял о чем речь. Не могли бы Вы дать мне ссылку на страницу где обсуждается данная тема? В теме http://forum.disser.ru/index.php?showtopic=1784 было обсуждение и я выкладывал экселевскую табличку для расчета ДИ, кроме того, ДИ считает AtteStat - посмотрите на форуме (поиском) или попросите Игоря дать ссылку - я быстро чего-то не нахожу (Игорь, пожалуйста, дайте ссылку на тему или на программу, спасибо)

Игорь Просмотр профиля	13.08.2010 - 15:35 Сообщение #6
Группа: Пользователи Сообщений: 1162 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(плав @ 13.08.2010 - 15:05) ... (Игорь, пожалуйста, дайте ссылку на тему или на программу, спасибо) Тут обсуждали http://forum.disser.ru/index.php?showtopic...%EE%EF%EF%E5%F0 Ссылка на программу http://attestatsoft.narod.ru Расчет ДИ в программе явился результатом обсуждений, в том числе и на данном сайте. Сообщение отредактировал Игорь - 13.08.2010 - 15:37 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Victor1980 Просмотр профиля	14.08.2010 - 00:21 Сообщение #7
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666	Цитата(Игорь @ 13.08.2010 - 18:35) Тут обсуждали http://forum.disser.ru/index.php?showtopic...%EE%EF%EF%E5%F0 Ссылка на программу http://attestatsoft.narod.ru Расчет ДИ в программе явился результатом обсуждений, в том числе и на данном сайте. Цитата(плав @ 13.08.2010 - 18:05) В теме http://forum.disser.ru/index.php?showtopic=1784 было обсуждение и я выкладывал экселевскую табличку для расчета ДИ, кроме того, ДИ считает AtteStat - посмотрите на форуме (поиском) или попросите Игоря дать ссылку - я быстро чего-то не нахожу (Игорь, пожалуйста, дайте ссылку на тему или на программу, спасибо) Господа спасибо Вам большое. Позволю себе несколько сентиментальных фраз. Когда я начал изучать статистику мои коллеги аспиранты хихикали надо мной и за спиной крутили пальцем у виска! Мол, зачем обсчитывать и так ведь прокатит. А хочешь быть знайкой найми статистика 12 штук и так все обсчитает!!! Мне же самому хотелось столкнутся с этим, чтоб разобраться. Благо есть такой форум и есть такие модераторы. Благодаря которым рядовой аспирант из самого захолустья имеет возможность получить квалифицированную консультацию профессионала. Не люблю громких напыщенных фраз, но это очевидным образом способствует развитию доказательной медицины в нашей стране. К сожалению должен констатировать, что мои оппоненты правы в одном, многие научные руководители порой находятся в своих познаниях от статистики дальше аспиранта. Таблица супер. Доступно, понятно, доходчиво. Если позволите (надеюсь, что это мой последний вопрос) хочу уточнить итак в моем случае (когортное исследование, 1 группа - до и после операции) 105 женщин, у 56 (53,3%) был ГАМП (гиперактивный мочевой пузырь) из которых после операции у 36 (34,2%) исчез а у 20 остался и появилось у 4 у которых не было. Итак вычисляем долю успешности операции a/(a+b) = 56/36 = 0,64 или 64,2% и определяем 95% доверительный интервал вычисленный по таблице Плава равен 50,36% 76,64%. Достаточен ли данный результат для утверждения о статистической значимости результата? Спасибо большое

Сообщений в этой теме

Олик) Оценить корреляцию в Excel 16.12.2008 - 13:55

DoctorStat Цитата(Олик) @ 16.12.2008 - 13:5... 16.12.2008 - 15:30

Олик) Спасибо большое!) еще небольшое уточнение: теп... 16.12.2008 - 17:12

Олик) хотя, наверное, я уже и сама поняла, что лишнее, е... 16.12.2008 - 17:15

плав Цитата(Олик) @ 16.12.2008 - 17:1... 16.12.2008 - 21:34

Олик) Correlations V2 ... 18.12.2008 - 15:41

DoctorStat Цитата(Олик) @ 18.12.2008 - 15:4... 18.12.2008 - 16:18

плав Цитата(DoctorStat @ 18.12.2008 - 16... 21.12.2008 - 12:10

Олик) у меня продолжение того же вопроса: имею много дан... 19.12.2008 - 13:07

Олик) кажется вышло) 19.12.2008 - 13:15

DoctorStat Цитата(Олик) @ 19.12.2008 - 13:1... 19.12.2008 - 14:07

Олик) посчитала, спасибо за помощь, но вот получила как ... 19.12.2008 - 16:35

DoctorStat Цитата(Олик) @ 19.12.2008 - 16:3... 19.12.2008 - 17:23

Игорь Цитата(Олик) @ 19.12.2008 - 16:3... 20.12.2008 - 14:01

Олик) Только начала осваивать статистику... Наверное, в... 21.12.2008 - 13:22

Олик) Только начала осваивать статистику... Наверное, в... 21.12.2008 - 13:23

DoctorStat Цитата(Олик) @ 21.12.2008 - 13:2... 21.12.2008 - 15:48

плав Множественные сравнения большая проблема, чем нено... 21.12.2008 - 19:38

Victor1980 Всем добрый день. Извините за вторжение в Ваш раз... 9.08.2010 - 23:31

плав Цитата(Victor1980 @ 10.08.2010 - 00... 10.08.2010 - 08:18

Victor1980 [/left]Цитата(плав @ 10.08.2010 - 11... 10.08.2010 - 13:38

Victor1980 Я имел ввиду, то что учитывая необходимость в случ... 10.08.2010 - 15:18

плав Цитата(Victor1980 @ 10.08.2010 - 16... 10.08.2010 - 20:40

Victor1980 Цитата(плав @ 10.08.2010 - 23:40) Ср... 12.08.2010 - 23:07

плав Цитата(Victor1980 @ 13.08.2010 - 00... 13.08.2010 - 15:05

Игорь Цитата(плав @ 13.08.2010 - 15:05) ..... 13.08.2010 - 15:35

Victor1980 Цитата(Игорь @ 13.08.2010 - 18:35) Т... 14.08.2010 - 00:21

плав Цитата(Victor1980 @ 14.08.2010 - 01... 14.08.2010 - 11:40

Victor1980 [quote name='плав' post='10261' da... 14.08.2010 - 12:10

плав Цитата(Victor1980 @ 14.08.2010 - 13... 14.08.2010 - 12:38

Victor1980 Цитата(плав @ 14.08.2010 - 14:40) Ва... 14.08.2010 - 17:17

плав Цитата(Victor1980 @ 14.08.2010 - 18... 14.08.2010 - 18:51

Victor1980 Цитата(плав @ 14.08.2010 - 21:51) Да... 15.08.2010 - 18:00

плав Цитата(Victor1980 @ 15.08.2010 - 19... 31.08.2010 - 12:17

Victor1980 Учитывая вышесказанное, хочу сделать что то полезн... 14.08.2010 - 00:35

Victor1980 Спасибо за науку! Цитата(плав @ 14.08.20... 14.08.2010 - 19:11

Victor1980 Цитата(Victor1980 @ 14.08.2010 - 22... 15.08.2010 - 15:21

Pinus Наверно нет смысла писать в новую тему такой вопро... 25.08.2010 - 14:47

Игорь Цитата(Pinus @ 25.08.2010 - 14:47) М... 25.08.2010 - 15:56

DrgLena Можно использовать ворд 1. Скопировать в ворд, акт... 25.08.2010 - 16:47

Pinus Игорь, DrgLena, спасибо! Все получилось. Полез... 25.08.2010 - 23:53

« Предыдущая тема · Медицинская статистика · Следующая тема »