Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V  < 1 2 3  
Добавить ответ в эту темуОткрыть тему
> Абсцисса пересечения двух гауссиан, для разных N
100$
сообщение 4.03.2022 - 19:18
Сообщение #31





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Диагностик @ 4.03.2022 - 04:28) *
Работал с исходными данными замеров (непреобразованными). Отсекал подозрительные на выброс крайние элементы выборки. По ММП находил параметры исходного распределения (ограниченный нормальный закон). Проверял эту гипотезу. ПДК находил через предикционные интервалы по ГОСТ Р ИСО 16269-8-2005. Получил следущие значения:

никель - 94,5; выбросов 21 шт.
медь - 49,0; выбросов 21 шт.
цинк - 235,2; выбросов 5 шт.
свинец - 60,7; выбросов нет.


Подведем некоторые промежуточные итоги.

Как известно, "для того, чтобы отвлечь пятерых афроамериканцев, насилующих белую женщину, необходимо бросить им баскетбольный мяч"(с).

Для того, чтобы прервать размещение юзером "Диагностик" зубодробительной чуши, необходимо произнести заклинание "Раз,два,три - горшочек, больше не вари".

Позвольте пояснить.

1. Во-первых, понятие "выброс" не существует само по себе вне привязки к соответствующему гипотетическому распределению.

Поэтому существуют методы для (априорно) нормального распределения, экспоненциального, Вейбулла - Гнеденко.

В качестве исключения могу вспомнить разве что критерий Дарлинга, детектирующий по одному выпадающему наблюдению (max или min) в случае, если про распределение известно лишь то, что оно непрерывно.

2. Если есть подозрение, что выбросов несколько, то их число должно быть заранее известно. Тогда можно воспользоваться критерием Титьена - Мура (Tietjen G., Moore H.,1972).

Если же число выбросов заранее неизвестно, и применяется некоторая последовательная процедура детектирования выбросов, то необходимо заранее знать ее статистические свойства: прежде всего, способность удерживать фактический уровень значимости вблизи заявленного номинального. Единственная известная мне процедура, удовлетворяющая данному требованию, - критерий Роснера (Rosner B., 1975, 1977).

Бесчисленное применение к одной и той же выборке одного и того же метода детектирования выпадающих наблюдений - грубая ошибка.

Поэтому, вместо того, чтобы с упорством, достойным лучшего применения, детектировать выпадающие наблюдения методами, для этого непригодными, проще принять одну из существующих моделей засорения выборки и определять выборочные статистики (параметры), устойчивые к засорению.

2. Здесь не может быть никакого разглагольствования о ПДК, поскольку

а) понятие ПДК неотделимо от событийного ряда, отвечающего на вопрос "Что будет, если..."
б) Существует дискретный параметр - "Класс загрязненности воды" (5 классов). Поскольку nokh упомянул, что есть загрязненные озера, надо учитывать эту информацию.
в) ГОСТ Р 59 054 - 2020 вводит дискретный параметр - "Классификация водных объектов по целям водопользования" (п. 4.2., табл. 2). И для озер хозяйственно-питьевого назначения ПДК будут иными, нежели для рыбопромысловых, etc.
г) необходимо учитывать антропогенную нагрузку на водоем (и много чего еще).

Поскольку неизвестно, что представляют собой эти 59 озер (сплошное наблюдение или выборочное обследование), попытки отделить мух от котлет "фоновое от нефонового" при такой постановке вопроса - несостоятельны. Особливо принимая во внимание, что представленные данные
- вообще-то многомерные, ergo надо проверять многомерную нормальность, применять многомерного Бокса-Кокса, детектировать многомерные выбросы и т.д.
- вообще-то пространственно-распределенные.

Сообщение отредактировал 100$ - 4.03.2022 - 19:34
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Диагностик
сообщение 5.03.2022 - 02:32
Сообщение #32





Группа: Пользователи
Сообщений: 143
Регистрация: 4.09.2012
Пользователь №: 24146



Я не детектировал последовательно каждый выброс, а совсем наоборот. Цензурировал исходную выборку, отбросив с запасом подозрительные на выброс значения.
Пусть в ней осталось n элементов. По ним находил параметры гипотетического распределения (нормального, ограниченного) и проверял максимально возможное расчетное значение крайнего (n+1)-го элемента. Если это значение оказывалась больше реального, возвращал этот элемент в выборку. И т.д. для следующего (n+2)-го.

Сообщение отредактировал Диагностик - 5.03.2022 - 09:10
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Олег Кравец
сообщение 13.03.2022 - 08:00
Сообщение #33





Группа: Модераторы
Сообщений: 286
Регистрация: 1.02.2005
Из: Воронеж
Пользователь №: 93



Moderator on

Коллеги, уважайте себя и собеседников. Свалок сейчас и так в Инете полно.

Тема маленько расчищена.


Signature
О.Я.Кравец, д.т.н., проф.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

3 страниц V  < 1 2 3
Добавить ответ в эту темуОткрыть тему