Как оценить различия в силе связи между переменными? |
Здравствуйте, гость ( Вход | Регистрация )
Как оценить различия в силе связи между переменными? |
21.03.2012 - 17:01
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Конкретно эти оценки я не называю баллами, это скорее скоринговая оценка. В логистической регрессии эта шкала участвует как количественная, для того она и была разработана
|
|
21.03.2012 - 17:18
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Конкретно эти оценки я не называю баллами, это скорее скоринговая оценка. В логистической регрессии эта шкала участвует как количественная, для того она и была разработана А хрен редьки не слаще. Что балльная, что скоринговая конструкция финитна по определению. Вот, скажем, для 5-балльной шкалы (1-2-3-4-5) чел рассчитал разницу 5-4=1 и строит для нее ДИ только лишь для того, чтобы с 95%-ной уверенностью втиснуть эту величину между парой значений (нижней и верхней квантилями несуществующего распределения), в то время как в вероятностью 1 эта величина (разница) лежит в интервале max-min. Сообщение отредактировал 100$ - 21.03.2012 - 17:26 |
|
21.03.2012 - 17:33
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Вообще-то ДА - это всего лишь способ множественного сравнения средних: по сути - тест Стьюдента для 3 и более групп. Это вы зря так про ДА, ищите больше отличий не про школьные отметки идет речь http://www.ncbi.nlm.nih.gov/pubmed/20219387 Сообщение отредактировал DrgLena - 21.03.2012 - 17:49 |
|
21.03.2012 - 17:52
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата Это вы зря так про ДА, ищите больше отличий Отличий по форме или по содержанию? Вообще-то все выборочные исследования сводятся к проверке гипотезы о средней и к проверке гипотезы о доле. Сообщение отредактировал 100$ - 21.03.2012 - 18:01 |
|
21.03.2012 - 20:13
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 63 Регистрация: 20.03.2012 Из: Ташкент Пользователь №: 23582 |
Чаще всего корреляционный анализ предшествует регрессионному: сначала устанавливается факт наличия связи между двумя явлениями: определили силу связи (абс. значение и стат. значимость к-та корр.), потом - направление (знак). Затем приступают к моделированию зависимостей. Во первых, не чаще, а всегда, потому что сначала вычисляется коэффициент корреляции, а только потом по его значению вычисляются остальные коэффициенты регрессионной модели. Во вторых, никакие связи сначала не устанавливаются, а первым делом вычисляется коэффициент корреляции вместе со знаком, т.r. знак вычисляется не после того, как известно значение коэффициента корреляции, а до, поскольку значение со знаком в числителе формулы вычисления коэффициента корреляции, а с положительным значением в знаменателе. В третьих никакие статистические значимости коэффициента корреляции не определяются. Прежде, чем сочинять отсебятину лучше бы взяли любой алгоритм вычисления регрессии (они не являются секретными и есть практически для любых общеизвестных и общеупотребительных языков программирования) и убедились бы, что Ваши выдумки не соответствуют действительности. Давайте внесем ясность: человек в посте ?1 вывесил три регрессионные модели, отличающиеся разным количеством переменных: парную линейную, параболическую и кубическую ... Давайте не будем Вашу отсебятину считать "ясностью". В модели всего две переменные: зависимая - тяжесть состояния и объясняющая - время. Т.е. во всех без исключения случаях мы имеем дело с функцией от одной переменной y = f(t). И что Вы бы там не сочиняли и не выдумывали, других переменных нет и быть не может и взяться им неоткуда, независимо от того, линейная функция, квадратная, кубическая или еще какая. То есть по-вашему это принципиально? Для эпигонов вообще ничего принципиального не существует, кроме собственного мнения, т.к. для них главное не результат, а процесс. Взял некий пакет по перемалыванию цифр, засунул одни цифры, получил другие. Зачем и для чего он их получил - не принципиально. Принципиально важно в процессе состряпать умную рожу и разбавить все это хозяйство наукообразными терминами, о смысле которых он и не догадывается, а также громкими именами, для пущей важности. В этой связи предлагаю сократить вашу (интересную) лекцыю до единственного абзаца: Поступлю гораздо проще. Поскольку с эпигонами нет вообще никакого смысла общаться, т.к. у них все точки зрения делятся на две категории: собственная и неправильная, то заношу Ваш ник в черный список. Yury V. Reshetov |
|
21.03.2012 - 20:25
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата Поступлю гораздо проще. Поскольку с эпигонами нет вообще никакого смысла общаться, т.к. у них все точки зрения делятся на две категории: собственная и неправильная, то заношу Ваш ник в черный список. Ты мне, мил человек, только монитор своими физиологичскими жидкостями не забрызгивай. Все прочее я переживу. P.S. Да, кстати, у меня - лицо. А рожа - это то, чем природа, желая развлечься, наградила тебя. Сообщение отредактировал 100$ - 21.03.2012 - 21:11 |
|
22.03.2012 - 11:17
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
|
|
30.04.2012 - 15:28
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.04.2012 Пользователь №: 23723 |
Помогите!Шарики за ролики уже зашли с этим диссером. Есть 2 группы больных циррозом печени и портальной гипертензией,одна группа без функционирующей пупочной вены,вторая С, т.е. практически одинаковые больные. Но при расчете корреляции УЗ показателей,получается что некоторые из этих показателей в одной группе имеют отрицательную корреляцию например - 0,5 а вдругой группе эти же показатели уже положительную, ну к примеру 0,6. Как такое может быть и что это может значить?
Сообщение отредактировал ИкРИНКА - 30.04.2012 - 15:30 |
|
30.04.2012 - 20:20
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Помогите!Шарики за ролики уже зашли с этим диссером. Есть 2 группы больных циррозом печени и портальной гипертензией,одна группа без функционирующей пупочной вены,вторая С, т.е. практически одинаковые больные. Но при расчете корреляции УЗ показателей,получается что некоторые из этих показателей в одной группе имеют отрицательную корреляцию например - 0,5 а вдругой группе эти же показатели уже положительную, ну к примеру 0,6. Как такое может быть и что это может значить? Помимо направления связи и её силы существует ещё статистическая значимость, про которую вы ничего не сказали. Поэтому если в одной группе коэффициент корреляции -0,5, а в другой +0,6, но они не значимы статистически - это ничего не значит, это - одно и то же. Если же они были значимыми, то возможны варианты. 1). Признак, по которому различаются группы прямо или опосредованно влияет на связь показателей, изменяя её знак на противоположный. Интерпретировать это должны вы с коллегами, т.к. если это входит в тему вашей диссертации, то вы разбираетесь в этом заведомо лучше, чем участники ветки по анализу данных. 2). Связь может быть ложной, т.е. "натянутой" внутренней неоднородностью групп. Здесь также возможны варианты, но принцип следующий. Например, группа пациентов у которых всё функционирует - однородна и связь между 2 показателями положительная. А группа более тяжёлых пациентов неоднородна и состоит из двух подгрупп, в одной из которых которых значения одного или сразу 2х исследуемых признаков сильно отличаются от первой. В каждой из этих подгрупп связь между показателями может быть положительной, но при их совместном анализе ?превращаться? в отрицательную из-за различий в средних. Посмотреть как подобная ситуация выглядит можно на рис. из сообщения #1 этой темы: http://forum.disser.ru/index.php?showtopic...&#entry7082 Чтобы понять, с чем вы имеете дело нужен графический анализ. |
|
30.04.2012 - 20:33
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 30.04.2012 Пользователь №: 23723 |
[quote name='nokh' date='30.04.2012 - 21:20' post='13479']
ох,спасибо. У меня просто бешенный массив данных и надеялась по корреляции отсеять лишние,которые не отсеялись после достоверности( Соответсвенно сократить объем обсчета. Но видимо не удастся( |
|
30.04.2012 - 21:53
Сообщение
#26
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
[У меня просто бешенный массив данных и надеялась по корреляции отсеять лишние,которые не отсеялись после достоверности( Соответсвенно сократить объем обсчета. Но видимо не удастся( А что объём? Весь объём уже оцифрован, а считает компьютер. Но если не хотите брать в работу всё - можно прибегнуть к методам редукции данных с обобщением, типа компонентного и факторного анализа. В принципе, можно разобраться с факторной структурой связей показателей в каждой из групп, а затем сравнить эти структуры. Можно целенаправленно искать именно те паттерны связей показателей, которые обусловлены межгрупповыми различиями (анализ избыточности), или паттерны тех особенностей групп, которые позволят их максимально разделить (дискриминантный анализ) и др. Основываясь на результатах такого анализа можно выделить ключевые показали, характеризующие разные стороны рассматриваемого явления, и классической одномерной статистикой сработать только по ним, подтвердив выводы многомерного анализа. Но если идти этим путём, важно чтобы вам на первых порах кто-то из окружения показал и объяснил кухню многомерного анализа данных. |
|
23.05.2012 - 21:08
Сообщение
#27
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 10.05.2012 Пользователь №: 23748 |
Тестировать балльную шкалу критерием Стьюдента-верный способ попасть к Леонову в его кунсткамеру. Правда, он уже устал над этим хохотать. Поскольку баллы-это квазичисла (порядковая шкала), понятие среднего для них не определено. Так же как не определены арифметические операции в порядковой шкале. Следовательно, разность баллов - неинформативная галиматья: по жизни дистанция от двоечника до троечника не равна расстоянию от хорошиста до троечника, и уж тем более не равна расстоянию от хорошиста до отличника. А разность баллов везде одинакова: 3-2=4-3=5-4. Единственный статистический объект по результатам применения балльной шкалы - ранжировка. Это-объект нечисловой природы. Так что все срочно читаем проф. Орлова. За что Вы так баллы обругали? Есть себе вполне изячный способ обойти "проклятие порядковой шкалы". Предположим, что мы имеем совокупность оцененных баллов В1,В2, .... Вn. Рассмотрим выборку, измеренную в шкале отношений x [0,∞], такую, что Вi = [xi]. Далее преспокойно работаем с Х?ми, т.е. непрерывным аналогом порядковой шкалы: считаем среднее, Стьюдента и проч. и никакой уставший хохотать Леонов нам не указ. Как яхту назовете, так она и поплывет. Это - теоретическая отмазка. Но ведь точно так делают высоколобые математики, пописывая : "Предположим, что случайная величина распределена нормально с параметрами....", нисколько не смущаясь, что нормального распределения в реальной природе не существует (есть только некоторая похожесть на него). А какие аргументы против баллов на практике? Мол расстояние от троечника до двоечника не равно расстоянию от троечника до хорошиста... Отнюдь - это расстояние равно точно одному баллу. Но оказывается нужно оговаривать - по жизни ( ). А по жизни есть только несколько шкал (см. Палату эталонов мер и весов), которые измеряют действительные процессы. А все остальное - косвенное измерение неких латентных переменных. Например, температура - олицетворение кинетической энергии движения молекул вещества. И если вы скажете, что при температуре 10 град эта энергия в 2 раза меньше, чем при 20 град С, Больцман с Гиббсом перевернутся от негодования в гробу. 99% иных шкал тоже экспоненциально, нормально, потенциально или как-то иначе. Миром правит нелинейность и все реальные непрерывные шкалы напрочь деформированы. А баллы по опыту вполне пригодны для включения в регрессионные модели, оценки статистических гипотез и проч. И почему это в кунст-камеру еще не попали судьи по фигурному катанию или художественной гимнастике, которые преспокойно рассчитывают средний балл? Об успехах сообщайте. О неудачах - тоже. |
|
24.05.2012 - 14:39
Сообщение
#28
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
А баллы по опыту вполне пригодны для включения в регрессионные модели, оценки статистических гипотез и проч. И почему это в кунст-камеру еще не попали судьи по фигурному катанию или художественной гимнастике, которые преспокойно рассчитывают средний балл? Об успехах сообщайте. О неудачах - тоже. матожидание можно посчитать практически для всего, но вот все готовые приемы проверки матгипотез по таблицам уйдут рыдая останется только бутстреп. |
|
24.05.2012 - 15:55
Сообщение
#29
|
|
Группа: Пользователи Сообщений: 27 Регистрация: 10.05.2012 Пользователь №: 23748 |
матожидание можно посчитать практически для всего, но вот все готовые приемы проверки матгипотез по таблицам уйдут рыдая останется только бутстреп. 1. Параметрические методы зависят исключительно от характера распределения выборок обрабатываемых данных, а не от того, как субъективно кем-то была названа шкала. Из данных в 12-бальной шкале вполне можно получить выборку, очень "похожую" на нормальное распределение, тогда как другая выборка из чудненькой метрической шкалы может оказаться совершенно неудобоваримой. 2. А чем Вас, собственно, не устраивает бутстреп и пермутационный тест. Я позволил себе перевести некоторые материалы по ресамплингу с сайта проф. Хауэлла (см. http://www.ievbras.ru/ecostat/Kiril/Article/A32/Stare.htm), и получил убеждение, что чем скорее "готовые приемы проверки матгипотез по таблицам уйдут рыдая", тем лучше. |
|
24.05.2012 - 23:59
Сообщение
#30
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
1. Параметрические методы зависят исключительно от характера распределения выборок обрабатываемых данных, а не от того, как субъективно кем-то была названа шкала. Из данных в 12-бальной шкале вполне можно получить выборку, очень "похожую" на нормальное распределение, тогда как другая выборка из чудненькой метрической шкалы может оказаться совершенно неудобоваримой. 2. А чем Вас, собственно, не устраивает бутстреп и пермутационный тест. Я позволил себе перевести некоторые материалы по ресамплингу с сайта проф. Хауэлла (см. http://www.ievbras.ru/ecostat/Kiril/Article/A32/Stare.htm), и получил убеждение, что чем скорее "готовые приемы проверки матгипотез по таблицам уйдут рыдая", тем лучше. 1. Собственно распределение для которого были построены таблицы критических значений и не соблюдается. А когда такие данные участвуют в более менее сложной схеме эксперимента это обстоятельство становится уже чревато неверными выводами. 2. Я против бутстрепа не имею ничего против, и сам его всячески (в том числе на данном форуме : ) пропагандирую. |
|