![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 68 Регистрация: 21.01.2012 Пользователь №: 23436 ![]() |
Должность (категориальная величина) - Зарплата (количественная; руб):
вахтёр - 10 000 завхоз - 25 000 инженер - 20 000 директор - 300 000 Каким МЕТОДОМ показать, что зарплата директора отличается от других статзначимо? ![]() English is my hobby.
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
Самое забавное во всей этой истории заключается в том, что з/платы "работяг" и "управленцев" не являются одинаково распределенными случайными величинами. Есть в статистике, понимаете ли, термин "процесс, порождающий данные" (Data Generating Process (DGP)). Так вот в данном случае здесь два разных DGP. Можно назвать это табелью о рангах, можно-штатным расписанием со своей тарифной сеткой или как-то еще. Во всяком случае з/плата управленца не случайно больше: она по жизни больше (по определению, если хотите). Так что данная задача вообще не должна решаться статистическими методами (по причине отстствия именно фактора случайности), и если кому-то очень надо статистически "доказать", что зарплата директора не случайно на три порядка выше таковой у уборщицы, то флаг ему в руки, как грится...
P.S. Проверять нормальность при проверке гипотезы о средней - шаманизм (по причине существования ЦПТ (или теоремы Ляпунова)). Сообщение отредактировал 100$ - 28.06.2013 - 12:57 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 ![]() |
Самое забавное во всей этой истории заключается в том, что з/платы "работяг" и "управленцев" не являются одинаково распределенными случайными величинами. Есть в статистике, понимаете ли, термин "процесс, порождающий данные" (Data Generating Process (DGP)). Так вот в данном случае здесь два разных DGP. Можно назвать это табелью о рангах, можно-штатным расписанием со своей тарифной сеткой или как-то еще. Во всяком случае з/плата управленца не случайно больше: она по жизни больше (по определению, если хотите). Так что данная задача вообще не должна решаться статистическими методами (по причине отстствия именно фактора случайности), и если кому-то очень надо статистически "доказать", что зарплата директора не случайно на три порядка выше таковой у уборщицы, то флаг ему в руки, как грится... P.S. Проверять нормальность при проверке гипотезы о средней - шаманизм (по причине существования ЦПТ (или теоремы Ляпунова)). Это действительно забавно ![]() А если взять какой-то другой пример, скажем, у нас есть 2 группы людей - практически здоровые и группа с инфарктом миокарда и нам интересно узнать, стат. значимо ли изменяется какой-то там показатель. Мы ведь по определению знаем, что этот показатель будет больше (скажем ЛДГ) в группе инфарктников, а факторы случайности здесь тоже получается отсутствуют? Мы ведь по определению знаем, что при патологии какой-либо показатель будет отклоняться от "нормы" в ту или иную сторону.. Или зачем проводят процедуру Каплан-Майера с целью доказать, что выживаемость с 1 стадией опухолевого процесса лучше чем с 4? Мы и так это все пракрасно знаем.. P.S. я работаю в гос. учреждении и уверен на 100%, что получаю меньше чем уборщица в какой-то коммерческой компании ![]() Сообщение отредактировал TheThing - 28.06.2013 - 13:33 |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
Это действительно забавно ![]() А если взять какой-то другой пример, скажем, у нас есть 2 группы людей - практически здоровые и группа с инфарктом миокарда и нам интересно узнать, стат. значимо ли изменяется какой-то там показатель. Мы ведь по определению знаем, что этот показатель будет больше (скажем ЛДГ) в группе инфарктников, а факторы случайности здесь тоже получается отсутствуют? Мы ведь по определению знаем, что при патологии какой-либо показатель будет отклоняться от "нормы" в ту или иную сторону.. Или зачем проводят процедуру Каплан-Майера с целью доказать, что выживаемость с 1 стадией опухолевого процесса лучше чем с 4? Мы и так это все пракрасно знаем.. P.S. я работаю в гос. учреждении и уверен на 100%, что получаю меньше чем уборщица в какой-то коммерческой компании ![]() 1. Про зарплаты: вот если бы при трудоустройстве и директора, и уборщицы наугад вынимали бы из барабана бумажку со своей будущей зарплатой, то тогда бы фактор случайности наличествовал, и в природе существовала хотя бы одна фирма, где уборщица (весело напевая) моет пол за 300 тыс., а директор (проклиная судьбу) потеет за 25. Мы же имеем диапазон зарплат, устанавливаемых волевым решением человека: скажем диапазон зарплат уборщицы, инженера и т.д. 10-40 тыс., а топов - 300 тыс.-21 млн. Как вы думаете: случайно ли, что эти два множества не пересекаются? 2. Про инфаркты: в международном класификаторе болезней отсутствует понятие "случайный инфаркт". Поэтому, либо динамика показателя(-ей) такова, что дело неминуемо закончится инфарктом, либо в результате инфаркта показатель отклоняется от физиологически нормальной величины. В любом случае мы имеем дело с причиной и следствием. Если же таких причин много, то вот вам бытовая трактовка закона больших чисел (ЗБЧ): при одновременном действии множества случайных факторов результат не зависит от случая. Но самое забавное заключается в том, что статистика не дает ответа на вопрос о причинах и следствиях. Поясню: например в статистическом анализе временных рядов существует тема о совместном поведении случайных величин, генереруемых разными DGP, так называемая теория коинтеграции временных рядов. В этой теории краеугольным камнем является понятие причинности по Грейнджеру (Granger's causality). При этом настойчиво подчеркивается, что причинность по Грейнджеру не является причиной в философском понимании категорий "причина-следствие". Просто текущие значения одного временного ряда можно прогнозировать при помощи прошлых значений другого. 3.1 Про статистику в медицине: далеко не все имеет смысл усреднять , дабы не получить ту самую среднюю температуру по больнице. 3.2. Сама градация любой патологии (постадийная) отражает степень разрушенности организма. Это вам любой хирург скажет, просто разрезав пациента. Не отвлекая Каплана и Майера. Сообщение отредактировал 100$ - 28.06.2013 - 15:07 |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
Но самое забавное заключается в том, что статистика не дает ответа на вопрос о причинах и следствиях. ну а что тогда показывает http://en.wikipedia.org/wiki/Partial_correlation на достаточно полной группе показателей? PS ну или когда восстанавливается структура в http://en.wikipedia.org/wiki/Bayesian_network ? Сообщение отредактировал p2004r - 28.06.2013 - 21:12 ![]() |
|
![]() |
![]() |
![]()
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
ну а что тогда показывает http://en.wikipedia.org/wiki/Partial_correlation на достаточно полной группе показателей? PS ну или когда восстанавливается структура в http://en.wikipedia.org/wiki/Bayesian_network ? Цепочка рассуждений проста, как мычание: философская связка "причина-следствие" характеризуется направленностью: причина предшествует следствию. Предшествование обусловлено однонаправленностью (т.н."стрелой") времени. Ни вероятность, ни время не определяются друг через друга: в колмогоровскую "тройку" время не входит, в определение вероятности не входит, так что вероятность функцией времени уж точно не является. Соответственно корреляция (в т.ч. частная) двух с.в. просто по опредеоению ничего не говорит о том, какая из них причина, а какая-следствие. Что же касается условной вероятности, то как говаривали старики римляне: "после того, не значит вследствие того". |
|
![]() |
![]() |
![]()
Сообщение
#7
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
Соответственно корреляция (в т.ч. частная) двух с.в. просто по опредеоению ничего не говорит о том, какая из них причина, а какая-следствие. Что же касается условной вероятности, то как говаривали старики римляне: "после того, не значит вследствие того". 1) итак возможность измерить истинную силу связи мы признаем, хорошо ![]() 2) что касается направления --- не понимаю чем определение структуры байесовской сети, включающей в себя более менее полную группу переменных описывающих систему, не дает нам основание разрешить "после чего" действительно "вследствии его" ![]() ![]() ![]() |
|
![]() |
![]() |
![]()
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
Цитата 1) итак возможность измерить истинную силу связи мы признаем, хорошо ![]() Не понимаю природы вашей радости: я вроде бы не отрицал существования феномена стохастической связи (то бишь корреляции), однако корреляция-понятие симметричное (к перестановкам переменных инвариантное), в отличие от связки "причина-следствие". Кроме того, корреляция может быть ложной: http://en.wikipedia.org/wiki/Spurious_relationship Цитата 2) что касается направления --- не понимаю чем определение структуры байесовской сети, включающей в себя более менее полную группу переменных описывающих систему, не дает нам основание разрешить "после чего" действительно "вследствии его" ![]() ![]() Вижу, что не понимаете: теорема Байеса- это способ рассортировать (уже готовые) причины по вероятности их действия. Н-р, если у вас не заводится машина (такое вот грустное событие-следствие), то еще до обращения к статистике (в т.ч. теореме Байеса, о существовании которой вы можете вообще не подозревать) вы сформируете перечень наиболее вероятных причин (на основе житейского опыта): 1. Отсутствует бензин 2. Сел аккумулятор 3. Накрылся стартер 4. Образовался нагар на свечах 5. Сдохла корова у соседа 6. Происки мировой закулисы ... 115. Взорвалась Фукусима 116. В далеком созвездии Тау Кита родилась сверхновая. Именно поэтому работники автосервиса могут позволить себе зарабатывать деньги, не апеллируя к теореме Байеса и всему, что с ней связано. А теперь запишите домашнее задание: погуглить насчет теоремы Байеса и доложить условие ее "работоспособности". Избегая обсуждения (скромного) меня. Об успехах сообщайте. О неудачах-тоже. До связи. |
|
![]() |
![]() |
![]()
Сообщение
#9
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
1) ну конечно ложная корреляция тоже "не познаваема"
![]() 2) эрго --- условная вероятность ничем не отличается от причинности как её понимает человек. или агностицизм так косит наши ряды? ![]() PS не надо распространять замшелые агностические представления. то что кто то когда то сказал по поводу парного коэффициента корреляции не заслуживает такого обобщения. PPS а да, раз советы погуглить это традиция, --- погуглите про байесовские сети и методы восстановления их структуры Сообщение отредактировал p2004r - 30.06.2013 - 23:48 ![]() |
|
![]() |
![]() |
![]()
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
Цитата 1) ну конечно ложная корреляция тоже "не познаваема" ![]() На подобные неорганизованные выкрики с места я не реагирую, но пока "Correlation does not imply causation is a phrase used in science and statistics to emphasize that a correlation between two variables does not necessarily imply that one causes the other." Цитата 2) эрго --- условная вероятность ничем не отличается от причинности как её понимает человек. Не надо вещать от лица человечества: оно в курсе, что формула Байеса-симметрична, и что условная вероятность не выходит за рамки частотного определения вероятности (по фон Мизесу). Цитата PS не надо распространять замшелые агностические представления. то что кто то когда то сказал по поводу парного коэффициента корреляции не заслуживает такого обобщения. Это вы о чем? Цитата PPS а да, раз советы погуглить это традиция, --- погуглите про байесовские сети и методы восстановления их структуры То есть за без малого две сотни моих сообщений единичная просьба -это традиция? И потом, чего мне гуглить-вы же сами ссылку кидали. Сообщение отредактировал 100$ - 1.07.2013 - 01:25 |
|
![]() |
![]() |
![]() ![]() |