![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 13 Регистрация: 16.12.2008 Из: Санкт-Петербург Пользователь №: 5627 ![]() |
Добрый день! Помогите, пожалуйста, решить проблему. Только начала осваивать статистику и одновременно хочу научиться использовать для этих целей Excel.
Есть порядка 600 пар данных, подозреваю, что они должны быть взаимосвязаны, но как это обосновать - не знаю. Коэффициент корреляции Пирсона с помощью Excel расчитать могу, но он работает на нормальном распределении. Мои данные, боюсь, не имеют нормального. Выглядит это примерно так: 1 175 750 2 175 1225 3 45 350 4 125 350 5 125 500 6 175 1000 7 80 500 8 250 875 9 45 75 10 175 525 11 175 750 12 125 625 13 175 350 14 125 525 15 125 375 16 80 300 17 175 500 18 175 875 19 30 225 20 125 500 21 80 750 22 80 500 23 30 300 24 30 150 25 80 250 26 80 500 27 30 225 28 45 225 29 45 175 30 45 375 Начала оценивать нормальность распределения каждого из столбцов отдельно, чтобы хотя бы опровергнуть, но и этого даже не получилось. В общем запуталась:). Подскажите, пожалуйста, может, есть какой-то алгоритм? Скорее всего данные распределены не по нормальному закону (1), как это определить? Что выбрать для оценки корреляции? Спасибо заранее)) |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666 ![]() |
Я имел ввиду, то что учитывая необходимость в случае вычисления Odds Ratio потребуется перевод количественного признака ИМТ в бинарный т.е. (1)- ИМТ <30 (2) - ИМТ > 30, является такой подход целесообразным, оправданным и не снижает ли он чувствительность вычисления (с учетом того, что соблазн применения этого метода связан с тем что он гораздо более простой для понимания , в моем случае, чем та же самая логистическая ргрессия.
Еще раз спасибо! |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Я имел ввиду, то что учитывая необходимость в случае вычисления Odds Ratio потребуется перевод количественного признака ИМТ в бинарный т.е. (1)- ИМТ <30 (2) - ИМТ > 30, является такой подход целесообразным, оправданным и не снижает ли он чувствительность вычисления (с учетом того, что соблазн применения этого метода связан с тем что он гораздо более простой для понимания , в моем случае, чем та же самая логистическая ргрессия. Еще раз спасибо! Сразу на два поста. Итак у Вас группа НМ - 24 женщины (у всех недержание). После операции у 14 исчезло у 10 осталось. Соответственно, учитывая гомогенность по признаку недержания группы у Вас всего две цифры 14 и 10. Тест Мак-Немара требует 4 пары данных: +- было исчезло ++ было осталось -+ не было появилось -- не было не появилось Для расчетов используются численности групп (число пар) +- и -+. Второго типа данных у Вас просто нет, поэтому тест Мак-Немара не применим (его можно только использовать в случае ГАМП). Соответственно, у Вас 24 женщины, которых можно закодировать 1 (исчезло), таких а человек и 0 (осталось), таких b человек. Описание этих значений сводится к расчету доли успешности операции a/(a+b) и определению 95% доверительного интервала по методам, указанным выше. Теперь, на результат операции у Вас влияют вмешивающиеся значения. Насколько они важны можно было бы вначале проанализировать с помощью четырехпольных таблиц, но у Вас нет качественных, а тем более бинарных независимых переменных. Если бы они были, то таблица выглядела бы так НМ/ Ф+ Ф- 1 m n 0 o p , где m+n=a и o+p=b Тогда OR=mp/no и делается расчет 95%ДИ для OR. В Вашем случае все показатели, повторюсь, количественные. Дихотомизировать количественные переменные, как Вы предлагаете - плохая практика, поскольку теряется значительная информация (тогда женщина с ИМТ 30.1 и 44.4 рассматриваются как имеющие одно значение ИМТ, а это разница для 150 см женщины в весе 67 и 100 кг). Соответственно, надо пользоваться методами, анализирующими зависимость качественной бинарной переменной от количественных - это логистическая регрессия. Вначале делаете унивариантную логистическую регрессию (НМ-возраст, НМ-ИМТ, НМ-кол-во родов (тут надо посмотреть, если категорий мало, лучше их превратить в набо переменных-пустышек)), а затем - суммарную (не включая те показатели, которые в унивариантной регрессии оказались сильно незначимыми, например р>0,20). После логистической регрессии также рассчитываете OR, только это буду шансы при росте, например ИМТ на 1 кг/м2 (можно и на 5 сделать). |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666 ![]() |
Сразу на два поста. Итак у Вас группа НМ - 24 женщины (у всех недержание). После операции у 14 исчезло у 10 осталось. Соответственно, учитывая гомогенность по признаку недержания группы у Вас всего две цифры 14 и 10. Тест Мак-Немара требует 4 пары данных: +- было исчезло ++ было осталось -+ не было появилось -- не было не появилось Для расчетов используются численности групп (число пар) +- и -+. Второго типа данных у Вас просто нет, поэтому тест Мак-Немара не применим (его можно только использовать в случае ГАМП). Соответственно, у Вас 24 женщины, которых можно закодировать 1 (исчезло), таких а человек и 0 (осталось), таких b человек. Описание этих значений сводится к расчету доли успешности операции a/(a+b) и определению 95% доверительного интервала по методам, указанным выше. Теперь, на результат операции у Вас влияют вмешивающиеся значения. Насколько они важны можно было бы вначале проанализировать с помощью четырехпольных таблиц, но у Вас нет качественных, а тем более бинарных независимых переменных. Если бы они были, то таблица выглядела бы так НМ/ Ф+ Ф- 1 m n 0 o p , где m+n=a и o+p=b Тогда OR=mp/no и делается расчет 95%ДИ для OR. В Вашем случае все показатели, повторюсь, количественные. Дихотомизировать количественные переменные, как Вы предлагаете - плохая практика, поскольку теряется значительная информация (тогда женщина с ИМТ 30.1 и 44.4 рассматриваются как имеющие одно значение ИМТ, а это разница для 150 см женщины в весе 67 и 100 кг). Соответственно, надо пользоваться методами, анализирующими зависимость качественной бинарной переменной от количественных - это логистическая регрессия. Вначале делаете унивариантную логистическую регрессию (НМ-возраст, НМ-ИМТ, НМ-кол-во родов (тут надо посмотреть, если категорий мало, лучше их превратить в набо переменных-пустышек)), а затем - суммарную (не включая те показатели, которые в унивариантной регрессии оказались сильно незначимыми, например р>0,20). После логистической регрессии также рассчитываете OR, только это буду шансы при росте, например ИМТ на 1 кг/м2 (можно и на 5 сделать). Спасибо! Несмотря на то, что мое знакомство со статистикой исчисляется днями метод дихтомизации мне то же показался грубоватым. Спасибо что дали экспертное мнение. Придется осваивать логистическу регрессию, метод который для дилетанта кажется зловеще загадочным и непостижимым. Вы так же советуете выразить эффективность в виде частот и построить для них ДИ. Дело в том, что как я уже говорил опыта и теоретических познаний в статистике у меня мягко говоря маловато. За это время я успел прочитать книгу Ребровой. Где говорится буквально следующее. Построение границ для бинарного признака сложная задача, поэтому мы приводим таблицы с их значениями в приложении 4. Таблицы в этом приложении явно не подходят для моего исследования, исходя из количества исследуемых пациентов. Вы говорили, что метод описан выше. Я прсмотрел почти весь форум и не нашел ничего, что (в моем понимании) описывает методику построения ДИ для долей. Не исключаю варианта, что я читал но не понял о чем речь. Не могли бы Вы дать мне ссылку на страницу где обсуждается данная тема? Заранее благодарен, Виктор |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Таблицы в этом приложении явно не подходят для моего исследования, исходя из количества исследуемых пациентов. Вы говорили, что метод описан выше. Я прсмотрел почти весь форум и не нашел ничего, что (в моем понимании) описывает методику построения ДИ для долей. Не исключаю варианта, что я читал но не понял о чем речь. Не могли бы Вы дать мне ссылку на страницу где обсуждается данная тема? В теме http://forum.disser.ru/index.php?showtopic=1784 было обсуждение и я выкладывал экселевскую табличку для расчета ДИ, кроме того, ДИ считает AtteStat - посмотрите на форуме (поиском) или попросите Игоря дать ссылку - я быстро чего-то не нахожу (Игорь, пожалуйста, дайте ссылку на тему или на программу, спасибо) |
|
![]() |
![]() |
![]()
Сообщение
#6
|
|
![]() Группа: Пользователи Сообщений: 1141 Регистрация: 10.04.2007 Пользователь №: 4040 ![]() |
... (Игорь, пожалуйста, дайте ссылку на тему или на программу, спасибо) Тут обсуждали http://forum.disser.ru/index.php?showtopic...%EE%EF%EF%E5%F0 Ссылка на программу http://attestatsoft.narod.ru Расчет ДИ в программе явился результатом обсуждений, в том числе и на данном сайте. Сообщение отредактировал Игорь - 13.08.2010 - 15:37 ![]() Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
![]() |
![]() |
![]()
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666 ![]() |
Тут обсуждали http://forum.disser.ru/index.php?showtopic...%EE%EF%EF%E5%F0 Ссылка на программу http://attestatsoft.narod.ru Расчет ДИ в программе явился результатом обсуждений, в том числе и на данном сайте. В теме http://forum.disser.ru/index.php?showtopic=1784 было обсуждение и я выкладывал экселевскую табличку для расчета ДИ, кроме того, ДИ считает AtteStat - посмотрите на форуме (поиском) или попросите Игоря дать ссылку - я быстро чего-то не нахожу (Игорь, пожалуйста, дайте ссылку на тему или на программу, спасибо) Господа спасибо Вам большое. Позволю себе несколько сентиментальных фраз. Когда я начал изучать статистику мои коллеги аспиранты хихикали надо мной и за спиной крутили пальцем у виска! Мол, зачем обсчитывать и так ведь прокатит. А хочешь быть знайкой найми статистика 12 штук и так все обсчитает!!! Мне же самому хотелось столкнутся с этим, чтоб разобраться. Благо есть такой форум и есть такие модераторы. Благодаря которым рядовой аспирант из самого захолустья имеет возможность получить квалифицированную консультацию профессионала. Не люблю громких напыщенных фраз, но это очевидным образом способствует развитию доказательной медицины в нашей стране. К сожалению должен констатировать, что мои оппоненты правы в одном, многие научные руководители порой находятся в своих познаниях от статистики дальше аспиранта. Таблица супер. Доступно, понятно, доходчиво. Если позволите (надеюсь, что это мой последний вопрос) хочу уточнить итак в моем случае (когортное исследование, 1 группа - до и после операции) 105 женщин, у 56 (53,3%) был ГАМП (гиперактивный мочевой пузырь) из которых после операции у 36 (34,2%) исчез а у 20 остался и появилось у 4 у которых не было. Итак вычисляем долю успешности операции a/(a+b) = 56/36 = 0,64 или 64,2% и определяем 95% доверительный интервал вычисленный по таблице Плава равен 50,36% 76,64%. Достаточен ли данный результат для утверждения о статистической значимости результата? Спасибо большое |
|
![]() |
![]() |
![]()
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Если позволите (надеюсь, что это мой последний вопрос) хочу уточнить итак в моем случае (когортное исследование, 1 группа - до и после операции) 105 женщин, у 56 (53,3%) был ГАМП (гиперактивный мочевой пузырь) из которых после операции у 36 (34,2%) исчез а у 20 остался и появилось у 4 у которых не было. Итак вычисляем долю успешности операции a/(a+b) = 56/36 = 0,64 или 64,2% и определяем 95% доверительный интервал вычисленный по таблице Плава равен 50,36% 76,64%. Достаточен ли данный результат для утверждения о статистической значимости результата? Спасибо большое Ваши расчеты отвечают на вопрос об эффективности операции у лиц с ГАМП, а не вообще (т.е. интерпретация Вашего варианта - среди лиц с ГАМП после проведения операции она исчезает у 64% (95%ДИ=50,4-76,6%)). И это ничего не говорит о возможности возникновения ГАМП в результате операции. Соответственно надо еще и сделать расчеты для 4/49 женщин без ГАМП исходно. Имеем - частота возникновения ГАМП 8,2% (95%ДИ=2,3-19,6%). Иными словами, у тех, у кого ГАМП есть операция значимо снижает частоту ГАМП, у кого нет - повышает (если в такой интерпретации есть смысл).
Причина редактирования: мак-немар тут не очень
|
|
![]() |
![]() |
![]()
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666 ![]() |
Ваши расчеты отвечают на вопрос об эффективности операции у лиц с ГАМП, а не вообще (т.е. интерпретация Вашего варианта - среди лиц с ГАМП после проведения операции она исчезает у 64% (95%ДИ=50,4-76,6%)). И это ничего не говорит о возможности возникновения ГАМП в результате операции. Соответственно надо еще и сделать расчеты для 4/49 женщин без ГАМП исходно. Имеем - частота возникновения ГАМП 8,2% (95%ДИ=2,3-19,6%). Иными словами, у тех, у кого ГАМП есть операция значимо снижает частоту ГАМП, у кого нет - повышает (если в такой интерпретации есть смысл). БОЛЬШОЕ СПАСИБО! Мне все понятно! Все сходится и подходит для моего исследования. Единственное о чем бы хотелось еще спросить, если интерпретация такова что: (у кого ГАМП есть операция значимо снижает частоту ГАМП, у кого нет - повышает) можно ли выдвинуть статистически обоснованное заключение о том, что (несмотря на то что операция способна провоцировать (вызывать de novo) ГАМП у женщин у которых исходно не было ГАМП, операция все равно целесообразна, так как исходное количество (доля) женщин с ГАМП 56 (53,3%) до операции и количество (доля)женщин без ГАМП 24(22,85%) после операции существенно различаются. Возможно ли такое заключение на основании сопоставления доли ГАМП до операции 56 (53,33%) (95% ДИ =43,34%-63,13%) и доли ГАМП после операции 24 (22,86%) (95% ДИ =15,23%-32,07%) или для этого следует вычислять ДИ для разности относительных частот ? Еще раз спасибо! |
|
![]() |
![]() |
![]()
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
БОЛЬШОЕ СПАСИБО! Мне все понятно! Все сходится и подходит для моего исследования. Единственное о чем бы хотелось еще спросить, если интерпретация такова что: (у кого ГАМП есть операция значимо снижает частоту ГАМП, у кого нет - повышает) можно ли выдвинуть статистически обоснованное заключение о том, что (несмотря на то что операция способна провоцировать (вызывать de novo) ГАМП у женщин у которых исходно не было ГАМП, операция все равно целесообразна, так как исходное количество (доля) женщин с ГАМП 56 (53,3%) до операции и количество (доля)женщин без ГАМП 24(22,85%) после операции существенно различаются. Возможно ли такое заключение на основании сопоставления доли ГАМП до операции 56 (53,33%) (95% ДИ =43,34%-63,13%) и доли ГАМП после операции 24 (22,86%) (95% ДИ =15,23%-32,07%) или для этого следует вычислять ДИ для разности относительных частот ? Еще раз спасибо! Да, такой вывод обоснован, поскольку доверительные интервалы не перекрываются, можно заключить, что частота возникновения ГАМП достоверно ниже, чем частота исчезновения (p<0,05 на самом деле много меньше). |
|
![]() |
![]() |
![]()
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 9.08.2010 Пользователь №: 22666 ![]() |
Да, такой вывод обоснован, поскольку доверительные интервалы не перекрываются, можно заключить, что частота возникновения ГАМП достоверно ниже, чем частота исчезновения (p<0,05 на самом деле много меньше). Здравствуйте Плав. Простите пожалуйста! Это уже чисто из любви к науке. Я тут с Ребровой переключился на книжку Statistical aspects of the design and analisis of clinical trials (Brian Everrit) и там не могу понять что такое (two tailed test) и (one tailed test) применительно в основном к корреляции Пирсона. К сожалению по ходу чтения термин употребляется повсеместно но внятного определения нигде не дается! Не просветите что сиё такое и как его подают на стол? P S И еще один вопрос в вдогонку. Хотелось бы уточнить если доверительные интервалы долей перекрываются частично скажем ДИ N1 = 44,28-64,04 а ДИ N2 = 35,96-55,72 то все равно следует считать, что различия статистически недостоверны. Я правильно понимаю? Спасибо Виктор |
|
![]() |
![]() |
![]()
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Здравствуйте Плав. Простите пожалуйста! Это уже чисто из любви к науке. Я тут с Ребровой переключился на книжку Statistical aspects of the design and analisis of clinical trials (Brian Everrit) и там не могу понять что такое (two tailed test) и (one tailed test) применительно в основном к корреляции Пирсона. К сожалению по ходу чтения термин употребляется повсеместно но внятного определения нигде не дается! Не просветите что сиё такое и как его подают на стол? P S И еще один вопрос в вдогонку. Хотелось бы уточнить если доверительные интервалы долей перекрываются частично скажем ДИ N1 = 44,28-64,04 а ДИ N2 = 35,96-55,72 то все равно следует считать, что различия статистически недостоверны. Я правильно понимаю? Спасибо Виктор На последний вопрос - да, на первый - two tailed test - альтернативная гипотеза заключается в том, что два средних не равны друг другу, при one-tailed предполагается, что направление различий известно (т.е. одно среднее не может быть меньше другого, поэтому альтернативная гипотеза заключается в том, что одно среднее больше другого). Это относится ко всем тестам, однако в медицине при сравении групп крайне редко точно известно направление различий, поэтому принято использовать двухсторонние тесты (хотя споры периодически вспыхивают, последний крупный был после публикации LRC CPPT, где использовали односторонний тест). |
|
![]() |
![]() |
![]() ![]() |