Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Корректная корреляция
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
малой
Добрый день. Подскажите пожалуйста, как правильно будет ввести данные для выявления корреляции в следующем примере.

За период 1990-2010 годы совершается определённое количество краж, из них часть совершается рыжими женщинами (РЖ). Для установления корреляции между всеми кражами и кражами совершёнными РЖ нужно вводить в программу числовой ряд всех краж по годам (включая кражи совершённые РЖ) а в другой ряд кражи совершённые РЖ?

Или вводить в один ряд все кражи за вычетом краж совершённых РЖ а в другой ряд кражи совершённые только РЖ?


nokh
Цитата(малой @ 3.11.2015 - 18:34) *
Добрый день. Подскажите пожалуйста, как правильно будет ввести данные для выявления корреляции в следующем примере.

За период 1990-2010 годы совершается определённое количество краж, из них часть совершается рыжими женщинами (РЖ). Для установления корреляции между всеми кражами и кражами совершёнными РЖ нужно вводить в программу числовой ряд всех краж по годам (включая кражи совершённые РЖ) а в другой ряд кражи совершённые РЖ?

Или вводить в один ряд все кражи за вычетом краж совершённых РЖ а в другой ряд кражи совершённые только РЖ?

Непонятно что вы коррелируете и что хотите этим показать/доказать. Но в любом случае, нельзя коррелировать показатель (Х) с суммой, куда этот показатель входит частью (Х+У), т.к. в этом случае наличие ложной положительной связи гарантировано, а наличие статистической значимости при этом - это только вопрос объёма выборки.
То, что остальные группы свалены при таком подходе в кучу - очень плохо. Погуглите про парадокс Симпсона (парадокс объединений).
Но вот найдёте вы, допустим, что есть связь между числом краж РЖ и числом прочих краж, а о чём это скажет? О том, что есть годы с большим и с меньшим числом краж, и кражи РЖ примерно пропорциональны прочим. А не найдёте, это укажет на то, что кражи РЖ подчиняются какой-то непонятной иной закономерности. Короче, муть какая-то...

Мне представляется, что подход, который может извлечь, вероятно, полезную информацию: логлинейный анализ таблицы сопряжённости с тремя входами: год, пол, цвет волос. Проверив все взаимодействия можно остановиться на наиболее вероятной модели, построить соответствующую таблицу сопряжённости с меньшим числом входов и/или категорий внутри входов, а по ней уже посчитать отношения шансов или риски совершения краж какими-то группами относительно других или их (обоснованных) объединений. Корреляция - частный случай ассоциации, поэтому если важно получить результат не в терминах различий между группами по кражам, а в терминах связи краж с группами, то по той же итоговой таблице можно рассчитать коэффициенты ассоциации (Крамера, сопряжённости Пирсона, фи и пр).
малой
Спасибо большое
anserovtv
Задача мне кажется очень странной, но если анализировать формулировку очень строго с чисто математической точки зрения, речь идет о корреляции временных рядов.
Но в этом случае более важна коинтеграция временных рядов. http://www.algorithmist.ru/2011/08/time-se...y-measures.html

Топикстартер даже в лексике не разобрался!!!
В других подходах теряется ценная информация о динамике взаимосвязи.
100$
Цитата(anserovtv @ 4.11.2015 - 00:45) *
Но в этом случае более важна коинтеграция временных рядов. http://www.algorithmist.ru/2011/08/time-se...y-measures.html


Коинтеграция временных рядов - это существование долгосрочного взаимовлияния двух и более экономических сущностей.

Для оправджанных разговоров о коинтеграции необходимо убедиться в существовани причинности по Грейнджеру (Granger causality test) хотя бы в одном направлении. Понятно, что на данном в задаче временном интервале тестирование причинности по Грейнджеру - пустая трата времени.

Кроме того, установление факта коинтеграции с содержательной точки зрения оправдано лишь тогда, когда имеются априорные соображения о механизме коррекции долгосрочного поведения изучаемых феноменов. Здесь их два:

а) все воруют, в т.ч. и рыжие;
б) рыжие воруют, а мы чем хуже? (Альтернативная формулировка: "Рыжим, значит, можно, а нам, значит, нельзя?")

Так что про коинтеграцию в данном случае - не в тему.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.