Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Подобрать теоретическое распределение экспериментальному
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Диагностик
Имеются практически собранные данные на реально работающих электрических машинах. Экспериментальное распределение параметра нормальному распределению не принадлежит. Проверено по критерию коэффициента асимметрии. Отличие более чем на 4-ре стандартных отклонений. Какое теоретическое распределение подобрать? Асимметрия правая, имеется тяжёлый правый хвост в последнем интервале. Критерий хи-квадрат гипотезу о нормальности не подтверждает. Гистограмма прилагается. Спасибо.

Stefa
Добрый день, в сети есть бесплатная пробная 30-ти дневная версия программы EasyFit 5.5, которая как раз и определяет какому распределению подчиняются данные.
100$
А чем вас не устраивает консультация проф. Орлова?
DrgLena
А для чего были собраны данные ?, вряд ли для выяснения вопроса, к какому распределению из известных ближе эти данные. Проводился ли предварительно анализ выскакивающих вариант, какие методы для этого использовались? И можно ли выложить этот ряд в удобном для копирования формате, чтобы таки увидеть тяжелый правый хвост и посмотреть имеющимися у форумчан средствами к какому распределению ближе эти данные. Типа гимнастика ума, но что это дает практически, это знание. При анализе у нас есть только параметрика и непараметрика
Диагностик
Цитата(Stefa @ 24.10.2012 - 07:40) *
Добрый день, в сети есть бесплатная пробная 30-ти дневная версия программы EasyFit 5.5, которая как раз и определяет какому распределению подчиняются данные.

Добрый и Вам! Набор перечислнных в статпакетах распределений мне и так хорошо известен, там такого нет, зачем время зря портить? К тому же я делаю всё руками и не доверяю автоматам в решении уникальной задачи. Вот если-бы выборки ко мне поступали со скоростью несколько десятков в день, то деваться было бы просто некуда. Ну и конечно же в ущерб качеству. Ну клиент платит, и не потому что ему нужно получит результаты близкии к истинным, а чтобы формально аккредитироваться в той области, где он фактически не бельмесит.
Диагностик
Цитата(100$ @ 24.10.2012 - 15:31) *
А чем вас не устраивает консультация проф. Орлова?

Профессор Орлов осудил антинаучность моего подхода к обработке зкспериментальных данных и отослал к изучению современной парадигмы. Вас бы самого устроила бы такая консультация?
Диагностик
Цитата(DrgLena @ 25.10.2012 - 02:44) *
А для чего были собраны данные ?, вряд ли для выяснения вопроса, к какому распределению из известных ближе эти данные.

В мощных электрогенераторах тепло от активных элементов обмотки статора отводится водой, циркулирующей по полым проводникам стержней которые соединяются между собой при помощи патрубков, образуя группы последовательно соединённых стержней.
Каждая группа (гидравлическая ветвь) состоит из 4-х стержней, и все группы подключаются параллельно к напорному и сливному коллекторам. На последнем стержне гидравлической ветви установлены термометры сопротивления для контроля проходимости дистиллята через полые проводники стержней ветви. Таких точек измерения -276. В связи с множеством случайно влияющих на нагрев факторов температуру нагрева можно считать случайной величиной распределённой по какому-то закону. Для определения закона распределения этой случайной величины были проведены измерения на 10-ти генераторах и объёдинены в общую выборку.
Знание функции распределения температуры позволит определить максимальное
значение температуры стержня для бездефектного состояния ветви. Если наблюдаемая температура окажется выше предельного значения, следует искать причину не в случайности естественного разброса, а в появлении на самом деле влияющего фактора.
Диагностик
Цитата(DrgLena @ 25.10.2012 - 02:44) *
И можно ли выложить этот ряд в удобном для копирования формате, чтобы таки увидеть тяжелый правый хвост и посмотреть имеющимися у форумчан средствами к какому распределению ближе эти данные. Типа гимнастика ума, но что это дает практически, это знание. При анализе у нас есть только параметрика и непараметрика

Да не вопрос!
DrgLena
Подробности работы генератора не обязательны, важна постановка задачи, она ясна.
Меня как раз устроил ответ проф. Орлова.
Для решения вашей задачи не обязательно знать функцию распределения, пороговое значение может быть найдено, используя методологию ROC анализа. В ваших наблюдениях должен быть к каждой измеренной температуре статус состояния ? в терминах этого форума ? больной- здоровый. Выша задача найти такую точку разделения, где соотношение чувствительности и специфичности будет максимальным. Но вероятности отказа вы получите для каждого значения температуры.
Объединение данных могло привести к нарушению симметрии распределения, а также измерение температуры в различных точках также может влиять на температуру. Перед объединением нужно убедиться в отсутствии различий.
Диагностик
Цитата(DrgLena @ 26.10.2012 - 18:21) *
Для решения вашей задачи не обязательно знать функцию распределения, пороговое значение может быть найдено, используя методологию ROC анализа.

Я не знаю что это такое, буду очень рад если вы меня в это просветите. Задачу эту решил, исходя из расщепления смеси двух нормальных распределений.
DoctorStat
Цитата(Диагностик @ 26.10.2012 - 13:25) *
Знание функции распределения температуры позволит определить максимальное
значение температуры стержня
Вот и исследуйте влияние функции распределения (при заданных среднем значении и дисперсии) на максимальную температуру стержня. В качестве примера возьмите параметризованную нормальную функцию распределения. Для крайнего значения параметра, например =0, эта функция распределения должна совпадать с нормальной, для другого крайнего значения параметра, например =1, ф.р. должна иметь максимально тяжелый хвост. На всем интервале изменения параметра от 0 до 1, статистические тесты должны давать равное отличие экспериментальной от теоретической кривой распределения. Подставьте параметризированную функцию в формулу для максимальной температуры, чтобы понять, насколько наличие тяжелых хвостов влияет на температуру. Возможно, что влияние формы распределения мало, и можно обойтись нормальным приближением.
DrgLena
Цитата(Диагностик @ 26.10.2012 - 15:29) *
Я не знаю что это такое, буду очень рад если вы меня в это просветите.

Так прямо и наберите ?ROC анализ?, познакомитесь близко.
Но для его применения нужна еще информация о том, при каких температурах было все ок, а при каких наблюдались отказы.

Но у вас задача не анализ температуры отказа, а предотвращение выхода температуры за границы штатной ситуации, когда возможен отказ, я так поняла. А потому - модуль индустриальная статистика, контроль качества
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.