Здравствуйте, гость ( Вход | Регистрация )
24.06.2013 - 14:04
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 68 Регистрация: 21.01.2012 Пользователь №: 23436 |
Должность (категориальная величина) - Зарплата (количественная; руб):
вахтёр - 10 000 завхоз - 25 000 инженер - 20 000 директор - 300 000 Каким МЕТОДОМ показать, что зарплата директора отличается от других статзначимо? ![]() English is my hobby.
|
|
|
![]() |
![]() |
![]() |
28.06.2013 - 12:49
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Самое забавное во всей этой истории заключается в том, что з/платы "работяг" и "управленцев" не являются одинаково распределенными случайными величинами. Есть в статистике, понимаете ли, термин "процесс, порождающий данные" (Data Generating Process (DGP)). Так вот в данном случае здесь два разных DGP. Можно назвать это табелью о рангах, можно-штатным расписанием со своей тарифной сеткой или как-то еще. Во всяком случае з/плата управленца не случайно больше: она по жизни больше (по определению, если хотите). Так что данная задача вообще не должна решаться статистическими методами (по причине отстствия именно фактора случайности), и если кому-то очень надо статистически "доказать", что зарплата директора не случайно на три порядка выше таковой у уборщицы, то флаг ему в руки, как грится...
P.S. Проверять нормальность при проверке гипотезы о средней - шаманизм (по причине существования ЦПТ (или теоремы Ляпунова)). Сообщение отредактировал 100$ - 28.06.2013 - 12:57 |
|
|
![]() |
![]() |
28.06.2013 - 13:21
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
Самое забавное во всей этой истории заключается в том, что з/платы "работяг" и "управленцев" не являются одинаково распределенными случайными величинами. Есть в статистике, понимаете ли, термин "процесс, порождающий данные" (Data Generating Process (DGP)). Так вот в данном случае здесь два разных DGP. Можно назвать это табелью о рангах, можно-штатным расписанием со своей тарифной сеткой или как-то еще. Во всяком случае з/плата управленца не случайно больше: она по жизни больше (по определению, если хотите). Так что данная задача вообще не должна решаться статистическими методами (по причине отстствия именно фактора случайности), и если кому-то очень надо статистически "доказать", что зарплата директора не случайно на три порядка выше таковой у уборщицы, то флаг ему в руки, как грится... P.S. Проверять нормальность при проверке гипотезы о средней - шаманизм (по причине существования ЦПТ (или теоремы Ляпунова)). Это действительно забавно А если взять какой-то другой пример, скажем, у нас есть 2 группы людей - практически здоровые и группа с инфарктом миокарда и нам интересно узнать, стат. значимо ли изменяется какой-то там показатель. Мы ведь по определению знаем, что этот показатель будет больше (скажем ЛДГ) в группе инфарктников, а факторы случайности здесь тоже получается отсутствуют? Мы ведь по определению знаем, что при патологии какой-либо показатель будет отклоняться от "нормы" в ту или иную сторону.. Или зачем проводят процедуру Каплан-Майера с целью доказать, что выживаемость с 1 стадией опухолевого процесса лучше чем с 4? Мы и так это все пракрасно знаем.. P.S. я работаю в гос. учреждении и уверен на 100%, что получаю меньше чем уборщица в какой-то коммерческой компании Сообщение отредактировал TheThing - 28.06.2013 - 13:33 |
|
|
![]() |
![]() |
28.06.2013 - 14:54
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Это действительно забавно А если взять какой-то другой пример, скажем, у нас есть 2 группы людей - практически здоровые и группа с инфарктом миокарда и нам интересно узнать, стат. значимо ли изменяется какой-то там показатель. Мы ведь по определению знаем, что этот показатель будет больше (скажем ЛДГ) в группе инфарктников, а факторы случайности здесь тоже получается отсутствуют? Мы ведь по определению знаем, что при патологии какой-либо показатель будет отклоняться от "нормы" в ту или иную сторону.. Или зачем проводят процедуру Каплан-Майера с целью доказать, что выживаемость с 1 стадией опухолевого процесса лучше чем с 4? Мы и так это все пракрасно знаем.. P.S. я работаю в гос. учреждении и уверен на 100%, что получаю меньше чем уборщица в какой-то коммерческой компании 1. Про зарплаты: вот если бы при трудоустройстве и директора, и уборщицы наугад вынимали бы из барабана бумажку со своей будущей зарплатой, то тогда бы фактор случайности наличествовал, и в природе существовала хотя бы одна фирма, где уборщица (весело напевая) моет пол за 300 тыс., а директор (проклиная судьбу) потеет за 25. Мы же имеем диапазон зарплат, устанавливаемых волевым решением человека: скажем диапазон зарплат уборщицы, инженера и т.д. 10-40 тыс., а топов - 300 тыс.-21 млн. Как вы думаете: случайно ли, что эти два множества не пересекаются? 2. Про инфаркты: в международном класификаторе болезней отсутствует понятие "случайный инфаркт". Поэтому, либо динамика показателя(-ей) такова, что дело неминуемо закончится инфарктом, либо в результате инфаркта показатель отклоняется от физиологически нормальной величины. В любом случае мы имеем дело с причиной и следствием. Если же таких причин много, то вот вам бытовая трактовка закона больших чисел (ЗБЧ): при одновременном действии множества случайных факторов результат не зависит от случая. Но самое забавное заключается в том, что статистика не дает ответа на вопрос о причинах и следствиях. Поясню: например в статистическом анализе временных рядов существует тема о совместном поведении случайных величин, генереруемых разными DGP, так называемая теория коинтеграции временных рядов. В этой теории краеугольным камнем является понятие причинности по Грейнджеру (Granger's causality). При этом настойчиво подчеркивается, что причинность по Грейнджеру не является причиной в философском понимании категорий "причина-следствие". Просто текущие значения одного временного ряда можно прогнозировать при помощи прошлых значений другого. 3.1 Про статистику в медицине: далеко не все имеет смысл усреднять , дабы не получить ту самую среднюю температуру по больнице. 3.2. Сама градация любой патологии (постадийная) отражает степень разрушенности организма. Это вам любой хирург скажет, просто разрезав пациента. Не отвлекая Каплана и Майера. Сообщение отредактировал 100$ - 28.06.2013 - 15:07 |
|
|
![]() |
![]() |
28.06.2013 - 21:05
Сообщение
#5
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Но самое забавное заключается в том, что статистика не дает ответа на вопрос о причинах и следствиях. ну а что тогда показывает http://en.wikipedia.org/wiki/Partial_correlation на достаточно полной группе показателей? PS ну или когда восстанавливается структура в http://en.wikipedia.org/wiki/Bayesian_network ? Сообщение отредактировал p2004r - 28.06.2013 - 21:12 ![]() |
|
|
![]() |
![]() |
29.06.2013 - 20:12
Сообщение
#6
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
ну а что тогда показывает http://en.wikipedia.org/wiki/Partial_correlation на достаточно полной группе показателей? PS ну или когда восстанавливается структура в http://en.wikipedia.org/wiki/Bayesian_network ? Цепочка рассуждений проста, как мычание: философская связка "причина-следствие" характеризуется направленностью: причина предшествует следствию. Предшествование обусловлено однонаправленностью (т.н."стрелой") времени. Ни вероятность, ни время не определяются друг через друга: в колмогоровскую "тройку" время не входит, в определение вероятности не входит, так что вероятность функцией времени уж точно не является. Соответственно корреляция (в т.ч. частная) двух с.в. просто по опредеоению ничего не говорит о том, какая из них причина, а какая-следствие. Что же касается условной вероятности, то как говаривали старики римляне: "после того, не значит вследствие того". |
|
|
![]() |
![]() |
30.06.2013 - 10:12
Сообщение
#7
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Соответственно корреляция (в т.ч. частная) двух с.в. просто по опредеоению ничего не говорит о том, какая из них причина, а какая-следствие. Что же касается условной вероятности, то как говаривали старики римляне: "после того, не значит вследствие того". 1) итак возможность измерить истинную силу связи мы признаем, хорошо 2) что касается направления --- не понимаю чем определение структуры байесовской сети, включающей в себя более менее полную группу переменных описывающих систему, не дает нам основание разрешить "после чего" действительно "вследствии его" ![]() |
|
|
![]() |
![]() |
Liz Сравнение частот ОДНОГО и ТОГО ЖЕ распределения(?) 24.06.2013 - 14:04
p2004r Цитата(Liz @ 24.06.2013 - 14:04) Дол... 24.06.2013 - 20:51
DoctorStat Цитата(Liz @ 24.06.2013 - 15:04) Как... 25.06.2013 - 11:36
Liz <p2004r: любым методом детектирующим "выпа... 25.06.2013 - 19:25
anserovtv Можно применять различные методы. хотя данных у ва... 25.06.2013 - 21:08
DoctorStat Цитата(anserovtv @ 25.06.2013 - 22:0... 25.06.2013 - 21:24
anserovtv Цитата(DoctorStat @ 25.06.2013 - 22... 25.06.2013 - 22:26
anserovtv Нормальность по критерию Шапиро-Уилкса также выпо... 25.06.2013 - 21:15
nokh t-критерий для сравнения единственного наблюдения ... 25.06.2013 - 23:29
Liz <anserovtv: Проверяется гипотеза о равенстве ср... 26.06.2013 - 00:14
anserovtv Логичнее все-таки применять одновыборочный критери... 26.06.2013 - 07:46
100$ Цитата(anserovtv @ 26.06.2013 - 07:4... 26.06.2013 - 10:31
anserovtv Цитата(100$ @ 26.06.2013 - 11:3... 26.06.2013 - 11:44
100$ Цитата(anserovtv @ 26.06.2013 - 11:4... 26.06.2013 - 12:15
anserovtv Цитата(100$ @ 26.06.2013 - 13:1... 26.06.2013 - 12:32
100$ Цитата(anserovtv @ 26.06.2013 - 12:3... 26.06.2013 - 13:04
DrgLena Цитата(anserovtv @ 26.06.2013 - 07:4... 26.06.2013 - 10:36
DrgLena Student's test
Shapiro-Wilk's test
Пробле... 26.06.2013 - 12:37
100$ Вспоминается (здешняя) форумная баталия, где ряд в... 26.06.2013 - 13:55
TheThing Интересная тема развивается
1. Я считаю, что про... 26.06.2013 - 18:50
nokh Цитата(TheThing @ 26.06.2013 - 21:50... 27.06.2013 - 18:46
TheThing Цитата(nokh @ 27.06.2013 - 18:46) Вс... 27.06.2013 - 19:51
nokh Цитата(TheThing @ 27.06.2013 - 22:51... 27.06.2013 - 20:22
p2004r откуда вообще уверенность что распределение унимод... 26.06.2013 - 19:49
Liz БОЛЬШОЕ СПАСИБО за подходы по ИСХОДНОМУ вопросу... 26.06.2013 - 23:02
100$ Цитата(Liz @ 26.06.2013 - 23:02) БОЛ... 27.06.2013 - 01:01
100$ Цитата1) итак возможность измерить истинную силу с... 30.06.2013 - 13:47
p2004r 1) ну конечно ложная корреляция тоже "не позн... 30.06.2013 - 23:40
100$ Цитата1) ну конечно ложная корреляция тоже "н... 1.07.2013 - 01:23
TheThing Цитата(100$ @ 1.07.2013 - 01:23... 1.07.2013 - 02:48

100$ Цитата(TheThing @ 1.07.2013 - 02:48)... 1.07.2013 - 11:13

TheThing Цитата(100$ @ 1.07.2013 - 11:13... 1.07.2013 - 16:07

100$ Цитатано я попробую..
Спасибо,TheThing, теперь к ... 1.07.2013 - 20:45
p2004r Вы милейший (тут раз пошли эпитеты значит надо соо... 3.07.2013 - 09:15
Liz Вариант г) тоже не является правильным ответом... 1.07.2013 - 22:42
100$ Ба! Какие люди! Топикстартер собственной п... 2.07.2013 - 00:10
p2004r вас ткнули носом в вашу же "промашку" пр... 3.07.2013 - 09:25
100$ Как там у Дюма: "Д'Артаньян был не так гл... 3.07.2013 - 16:19
p2004r Цитата(100$ @ 3.07.2013 - 16:19... 3.07.2013 - 18:02
Liz <nokh: t-критерий для сравнения единственного н... 4.07.2013 - 17:30
nokh Цитата(Liz @ 4.07.2013 - 20:30) ... 4.07.2013 - 19:14![]() ![]() |