Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V  < 1 2 3 >  
Добавить ответ в эту темуОткрыть тему
> Как оценить различия в силе связи между переменными?
DrgLena
сообщение 21.03.2012 - 17:01
Сообщение #16





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Конкретно эти оценки я не называю баллами, это скорее скоринговая оценка. В логистической регрессии эта шкала участвует как количественная, для того она и была разработана
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.03.2012 - 17:18
Сообщение #17





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(DrgLena @ 21.03.2012 - 17:01) *
Конкретно эти оценки я не называю баллами, это скорее скоринговая оценка. В логистической регрессии эта шкала участвует как количественная, для того она и была разработана


А хрен редьки не слаще.
Что балльная, что скоринговая конструкция финитна по определению.
Вот, скажем, для 5-балльной шкалы (1-2-3-4-5) чел рассчитал разницу 5-4=1 и строит для нее ДИ только лишь для того, чтобы с 95%-ной уверенностью втиснуть эту величину между парой значений (нижней и верхней квантилями несуществующего распределения), в то время как в вероятностью 1 эта величина (разница) лежит в интервале max-min.

Сообщение отредактировал 100$ - 21.03.2012 - 17:26
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 21.03.2012 - 17:33
Сообщение #18





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(100$ @ 21.03.2012 - 17:22) *
Вообще-то ДА - это всего лишь способ множественного сравнения средних: по сути - тест Стьюдента для 3 и более групп.

Это вы зря так про ДА, ищите больше отличий smile.gif

не про школьные отметки идет речь
http://www.ncbi.nlm.nih.gov/pubmed/20219387

Сообщение отредактировал DrgLena - 21.03.2012 - 17:49
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.03.2012 - 17:52
Сообщение #19





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
Это вы зря так про ДА, ищите больше отличий smile.gif


Отличий по форме или по содержанию? confused.gif

Вообще-то все выборочные исследования сводятся к проверке гипотезы о средней и к проверке гипотезы о доле.

Сообщение отредактировал 100$ - 21.03.2012 - 18:01
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
YVR
сообщение 21.03.2012 - 20:13
Сообщение #20





Группа: Пользователи
Сообщений: 63
Регистрация: 20.03.2012
Из: Ташкент
Пользователь №: 23582



Цитата(100$ @ 21.03.2012 - 16:21) *
Чаще всего корреляционный анализ предшествует регрессионному: сначала устанавливается факт наличия связи между двумя явлениями: определили силу связи (абс. значение и стат. значимость к-та корр.), потом - направление (знак). Затем приступают к моделированию зависимостей.


Во первых, не чаще, а всегда, потому что сначала вычисляется коэффициент корреляции, а только потом по его значению вычисляются остальные коэффициенты регрессионной модели. Во вторых, никакие связи сначала не устанавливаются, а первым делом вычисляется коэффициент корреляции вместе со знаком, т.r. знак вычисляется не после того, как известно значение коэффициента корреляции, а до, поскольку значение со знаком в числителе формулы вычисления коэффициента корреляции, а с положительным значением в знаменателе. В третьих никакие статистические значимости коэффициента корреляции не определяются.

Прежде, чем сочинять отсебятину лучше бы взяли любой алгоритм вычисления регрессии (они не являются секретными и есть практически для любых общеизвестных и общеупотребительных языков программирования) и убедились бы, что Ваши выдумки не соответствуют действительности.

Цитата(100$ @ 21.03.2012 - 16:21) *
Давайте внесем ясность: человек в посте ?1 вывесил три регрессионные модели, отличающиеся разным количеством переменных: парную линейную, параболическую и кубическую ...


Давайте не будем Вашу отсебятину считать "ясностью". В модели всего две переменные: зависимая - тяжесть состояния и объясняющая - время. Т.е. во всех без исключения случаях мы имеем дело с функцией от одной переменной y = f(t). И что Вы бы там не сочиняли и не выдумывали, других переменных нет и быть не может и взяться им неоткуда, независимо от того, линейная функция, квадратная, кубическая или еще какая.


Цитата(100$ @ 21.03.2012 - 16:21) *
То есть по-вашему это принципиально?


Для эпигонов вообще ничего принципиального не существует, кроме собственного мнения, т.к. для них главное не результат, а процесс. Взял некий пакет по перемалыванию цифр, засунул одни цифры, получил другие. Зачем и для чего он их получил - не принципиально. Принципиально важно в процессе состряпать умную рожу и разбавить все это хозяйство наукообразными терминами, о смысле которых он и не догадывается, а также громкими именами, для пущей важности.

Цитата(100$ @ 21.03.2012 - 16:21) *
В этой связи предлагаю сократить вашу (интересную) лекцыю до единственного абзаца:


Поступлю гораздо проще. Поскольку с эпигонами нет вообще никакого смысла общаться, т.к. у них все точки зрения делятся на две категории: собственная и неправильная, то заношу Ваш ник в черный список.



Signature
Yury V. Reshetov

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.03.2012 - 20:25
Сообщение #21





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
Поступлю гораздо проще. Поскольку с эпигонами нет вообще никакого смысла общаться, т.к. у них все точки зрения делятся на две категории: собственная и неправильная, то заношу Ваш ник в черный список.


Ты мне, мил человек, только монитор своими физиологичскими жидкостями не забрызгивай. Все прочее я переживу.

P.S. Да, кстати, у меня - лицо. А рожа - это то, чем природа, желая развлечься, наградила тебя.

Сообщение отредактировал 100$ - 21.03.2012 - 21:11
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 22.03.2012 - 11:17
Сообщение #22





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Цитата(YVR @ 21.03.2012 - 21:13) *
В третьих никакие статистические значимости коэффициента корреляции не определяются.


Здравствуйте!

Вы могли бы более детально описать, почему статистическая значимость коэффициента корреляции не рассчитывается? Может быть пару источников на эту тему..

Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИкРИНКА
сообщение 30.04.2012 - 15:28
Сообщение #23





Группа: Пользователи
Сообщений: 7
Регистрация: 30.04.2012
Пользователь №: 23723



Помогите!Шарики за ролики уже зашли с этим диссером. Есть 2 группы больных циррозом печени и портальной гипертензией,одна группа без функционирующей пупочной вены,вторая С, т.е. практически одинаковые больные. Но при расчете корреляции УЗ показателей,получается что некоторые из этих показателей в одной группе имеют отрицательную корреляцию например - 0,5 а вдругой группе эти же показатели уже положительную, ну к примеру 0,6. Как такое может быть и что это может значить?

Сообщение отредактировал ИкРИНКА - 30.04.2012 - 15:30
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 30.04.2012 - 20:20
Сообщение #24





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(ИкРИНКА @ 30.04.2012 - 17:28) *
Помогите!Шарики за ролики уже зашли с этим диссером. Есть 2 группы больных циррозом печени и портальной гипертензией,одна группа без функционирующей пупочной вены,вторая С, т.е. практически одинаковые больные. Но при расчете корреляции УЗ показателей,получается что некоторые из этих показателей в одной группе имеют отрицательную корреляцию например - 0,5 а вдругой группе эти же показатели уже положительную, ну к примеру 0,6. Как такое может быть и что это может значить?

Помимо направления связи и её силы существует ещё статистическая значимость, про которую вы ничего не сказали. Поэтому если в одной группе коэффициент корреляции -0,5, а в другой +0,6, но они не значимы статистически - это ничего не значит, это - одно и то же. Если же они были значимыми, то возможны варианты.
1). Признак, по которому различаются группы прямо или опосредованно влияет на связь показателей, изменяя её знак на противоположный. Интерпретировать это должны вы с коллегами, т.к. если это входит в тему вашей диссертации, то вы разбираетесь в этом заведомо лучше, чем участники ветки по анализу данных.
2). Связь может быть ложной, т.е. "натянутой" внутренней неоднородностью групп. Здесь также возможны варианты, но принцип следующий. Например, группа пациентов у которых всё функционирует - однородна и связь между 2 показателями положительная. А группа более тяжёлых пациентов неоднородна и состоит из двух подгрупп, в одной из которых которых значения одного или сразу 2х исследуемых признаков сильно отличаются от первой. В каждой из этих подгрупп связь между показателями может быть положительной, но при их совместном анализе ?превращаться? в отрицательную из-за различий в средних. Посмотреть как подобная ситуация выглядит можно на рис. из сообщения #1 этой темы: http://forum.disser.ru/index.php?showtopic...&#entry7082
Чтобы понять, с чем вы имеете дело нужен графический анализ.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИкРИНКА
сообщение 30.04.2012 - 20:33
Сообщение #25





Группа: Пользователи
Сообщений: 7
Регистрация: 30.04.2012
Пользователь №: 23723



[quote name='nokh' date='30.04.2012 - 21:20' post='13479']
ох,спасибо.
У меня просто бешенный массив данных и надеялась по корреляции отсеять лишние,которые не отсеялись после достоверности( Соответсвенно сократить объем обсчета. Но видимо не удастся(
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 30.04.2012 - 21:53
Сообщение #26





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(ИкРИНКА @ 30.04.2012 - 22:33) *
[У меня просто бешенный массив данных и надеялась по корреляции отсеять лишние,которые не отсеялись после достоверности( Соответсвенно сократить объем обсчета. Но видимо не удастся(

А что объём? Весь объём уже оцифрован, а считает компьютер. Но если не хотите брать в работу всё - можно прибегнуть к методам редукции данных с обобщением, типа компонентного и факторного анализа. В принципе, можно разобраться с факторной структурой связей показателей в каждой из групп, а затем сравнить эти структуры. Можно целенаправленно искать именно те паттерны связей показателей, которые обусловлены межгрупповыми различиями (анализ избыточности), или паттерны тех особенностей групп, которые позволят их максимально разделить (дискриминантный анализ) и др. Основываясь на результатах такого анализа можно выделить ключевые показали, характеризующие разные стороны рассматриваемого явления, и классической одномерной статистикой сработать только по ним, подтвердив выводы многомерного анализа.
Но если идти этим путём, важно чтобы вам на первых порах кто-то из окружения показал и объяснил кухню многомерного анализа данных.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
stok1946
сообщение 23.05.2012 - 21:08
Сообщение #27





Группа: Пользователи
Сообщений: 27
Регистрация: 10.05.2012
Пользователь №: 23748



Цитата(100$ @ 21.03.2012 - 17:22) *
Тестировать балльную шкалу критерием Стьюдента-верный способ попасть к Леонову в его кунсткамеру. Правда, он уже устал над этим хохотать.
Поскольку баллы-это квазичисла (порядковая шкала), понятие среднего для них не определено. Так же как не определены арифметические операции в порядковой шкале. Следовательно, разность баллов - неинформативная галиматья: по жизни дистанция от двоечника до троечника не равна расстоянию от хорошиста до троечника, и уж тем более не равна расстоянию от хорошиста до отличника. А разность баллов везде одинакова: 3-2=4-3=5-4.
Единственный статистический объект по результатам применения балльной шкалы - ранжировка. Это-объект нечисловой природы. Так что все срочно читаем проф. Орлова.

За что Вы так баллы обругали? Есть себе вполне изячный способ обойти "проклятие порядковой шкалы". Предположим, что мы имеем совокупность оцененных баллов В1,В2, .... Вn. Рассмотрим выборку, измеренную в шкале отношений x [0,∞], такую, что Вi = [xi]. Далее преспокойно работаем с Х?ми, т.е. непрерывным аналогом порядковой шкалы: считаем среднее, Стьюдента и проч. и никакой уставший хохотать Леонов нам не указ. Как яхту назовете, так она и поплывет.
Это - теоретическая отмазка. Но ведь точно так делают высоколобые математики, пописывая : "Предположим, что случайная величина распределена нормально с параметрами....", нисколько не смущаясь, что нормального распределения в реальной природе не существует (есть только некоторая похожесть на него).
А какие аргументы против баллов на практике? Мол расстояние от троечника до двоечника не равно расстоянию от троечника до хорошиста... Отнюдь - это расстояние равно точно одному баллу. Но оказывается нужно оговаривать - по жизни ( rolleyes.gif).
А по жизни есть только несколько шкал (см. Палату эталонов мер и весов), которые измеряют действительные процессы. А все остальное - косвенное измерение неких латентных переменных. Например, температура - олицетворение кинетической энергии движения молекул вещества. И если вы скажете, что при температуре 10 град эта энергия в 2 раза меньше, чем при 20 град С, Больцман с Гиббсом перевернутся от негодования в гробу. 99% иных шкал тоже экспоненциально, нормально, потенциально или как-то иначе. Миром правит нелинейность и все реальные непрерывные шкалы напрочь деформированы.

А баллы по опыту вполне пригодны для включения в регрессионные модели, оценки статистических гипотез и проч. И почему это в кунст-камеру еще не попали судьи по фигурному катанию или художественной гимнастике, которые преспокойно рассчитывают средний балл?
Об успехах сообщайте. О неудачах - тоже.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.05.2012 - 14:39
Сообщение #28





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(stok1946 @ 23.05.2012 - 21:08) *
А баллы по опыту вполне пригодны для включения в регрессионные модели, оценки статистических гипотез и проч. И почему это в кунст-камеру еще не попали судьи по фигурному катанию или художественной гимнастике, которые преспокойно рассчитывают средний балл?
Об успехах сообщайте. О неудачах - тоже.


матожидание можно посчитать практически для всего, но вот все готовые приемы проверки матгипотез по таблицам уйдут рыдая smile.gif останется только бутстреп.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
stok1946
сообщение 24.05.2012 - 15:55
Сообщение #29





Группа: Пользователи
Сообщений: 27
Регистрация: 10.05.2012
Пользователь №: 23748



Цитата(p2004r @ 24.05.2012 - 15:39) *
матожидание можно посчитать практически для всего, но вот все готовые приемы проверки матгипотез по таблицам уйдут рыдая smile.gif останется только бутстреп.

1. Параметрические методы зависят исключительно от характера распределения выборок обрабатываемых данных, а не от того, как субъективно кем-то была названа шкала. Из данных в 12-бальной шкале вполне можно получить выборку, очень "похожую" на нормальное распределение, тогда как другая выборка из чудненькой метрической шкалы может оказаться совершенно неудобоваримой.
2. А чем Вас, собственно, не устраивает бутстреп и пермутационный тест. Я позволил себе перевести некоторые материалы по ресамплингу с сайта проф. Хауэлла (см. http://www.ievbras.ru/ecostat/Kiril/Article/A32/Stare.htm), и получил убеждение, что чем скорее "готовые приемы проверки матгипотез по таблицам уйдут рыдая", тем лучше.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.05.2012 - 23:59
Сообщение #30





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(stok1946 @ 24.05.2012 - 15:55) *
1. Параметрические методы зависят исключительно от характера распределения выборок обрабатываемых данных, а не от того, как субъективно кем-то была названа шкала. Из данных в 12-бальной шкале вполне можно получить выборку, очень "похожую" на нормальное распределение, тогда как другая выборка из чудненькой метрической шкалы может оказаться совершенно неудобоваримой.
2. А чем Вас, собственно, не устраивает бутстреп и пермутационный тест. Я позволил себе перевести некоторые материалы по ресамплингу с сайта проф. Хауэлла (см. http://www.ievbras.ru/ecostat/Kiril/Article/A32/Stare.htm), и получил убеждение, что чем скорее "готовые приемы проверки матгипотез по таблицам уйдут рыдая", тем лучше.


1. Собственно распределение для которого были построены таблицы критических значений и не соблюдается. А когда такие данные участвуют в более менее сложной схеме эксперимента это обстоятельство становится уже чревато неверными выводами.

2. Я против бутстрепа не имею ничего против, и сам его всячески (в том числе на данном форуме : ) пропагандирую.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

3 страниц V  < 1 2 3 >
Добавить ответ в эту темуОткрыть тему