Цитата(Leonov)
Программа Fisher's Exact Test реализует единственный тест, и не может использоваться в других целях. Так что пример явно неудачный. Но тот же результат можно получить и в больших стат. пакетах, где кроме Fisher's Exact Test есть и много других и необходимых процедур. Например, когда я проверял коррекность этой программы несколько раз, то использовал сложные программы и после этого указывал Х. Хану на ошибки.
Пример вполне удачный. Поскольку речь шла о том, могут ли программы-самоделки конкурировать с проприетарными статистическими пакетами или нет, а вовсе не о том, можно лих использовать в иных целях, кроме тех, для которых они предназначены. В той области применения, для которой она создавалась (расчёт точного критерия Фишера) программа д-ра Хана вполне конкурентоспособна, невзирая на то, имеют ли "большие стат. пакеты" другие процедуры или нет. Т.е. Вы в дискуссии совершаете логическую ошибку ignoratio elenchi (подмена тезиса), заменяя утверждение, которое нужно доказать, на другое, внешне на него похожее или как-то с ним связанное.
По поводу проверки корректности программы д-ра Хана с использованием "сложных программ": это грубая методическая ошибка тестирования бета-версий программного обеспечения. Поскольку в проприетарном софте, наряду со свободным, регулярно обнаруживают ошибки, то a priori отдавать предпочтение тому или другому нельзя. Принцип тестирования прост и общеизвестен: все программные расчёты проверяются исключительно вручную на разных вариантах задачи.
Что же до использования факта применения "сложных программ" Вами для проверки программы-самоделки как доказательства неконкурентоспособности последней, то это ещё одна логическая ошибка, известная как petitio principii (предвосхищение основания), когда некоторое утверждение доказывается с использованием (явным или неявным) другого утверждения, которое само ещё нуждается в доказательстве.
Цитата(Leonov)
Конечно не должны! Кто же Вас заставляет это делать! Можно использовать и свои самоделки, если считать то, о чём Вы пишете. Если эта самоделка корректна. Что в большинстве случаев не так. Я уже проверял много таких самоделок и все они давали неверный результат.
Ну, это кому как повезло. Как я писал ранее, одним из направлений моей работы является участие в разработке и внедрении АСУ (автоматизированных систем управления) эпиднадзором. И хотя сейчас существует очень большое число АРМ-оа (автоматизированных рабочих мест), ни одно из проверенных коммерческих решений (не буду давать ни рекламы, ни антирекламы, лишь упомяну географию: фирмы из США, Франции, Германии) не было свободно от ошибок. В том числе и орфографических. Вот вам и хвалёный продукт, "создаваемый коллективами из сотен и тысяч специалистов". В конечном итоге АСУ, работающая на уровне республики (Казахстан) - это также самоделка, сляпанная на коленке двумя товарищами.
Естественно, что валидность программы-самоделки, которую планируется использовать, нужно оценить, причём, желательно, до скачивания. Алгоритм прост:
1. Смотрим страничку "об авторе" сайта программы. Наличие орфографических ошибок должно насторожить (в равной степени и при оценке коммерческого софта): тринадцатый удар часов вызывает недоверие не только к самому удару, но и к каждому из предыдущих двенадцати.
2. Ключевой момент:
а) обладает ли автор программы достаточной квалификацией для понимания сути алгоритма, заложенного в основу программы, а если нет, то привлёк ли к работе над нею компетентных консультантов;
б) главное! использует ли он эту программу в своей практической деятельности.
3. Первые расчёты программы обязательно перепроверяем вручную с использованием хотя бы учебника "Социальная гигиена и организация здравоохранения" за 3-й курс.
Цитата(Leonov)
Конечно, если программа выполняет несколько несложных арифметических действий, то вполне возможно, что всё в порядке. Но такие программы недостаточно универсальны
Для справки. Даже проприетарный ("профессиональный", коммерческий) софт не состоит из одних лишь универсальных стат. пакетов. Выделяют:
1. Специализированные - содержат методы из одного-двух разделов статистики (например, DataScope) или методы, используемые в конкретной предметной области (например, EpiInfo);
2. Общего назначения или универсальные - не ориентированы на специфическую предметную область (например, всё та же Statistica);
3. Профессиональные - ориентированы на обработку сверхбольших объёмов данных и узкоспециализированные методы (например, SAS).
Почему-то Вами универсальность статистической программы подчёркивается как достоинство. На деле это недостаток. Я об этом уже писал, но повторюсь:
1. Наличие в программе большого количества функций "про запас", которые могут понадобиться или нет - это труд программистов, который Вы оплачиваете из своего кармана (при сравнении ценового диапазона специализированных и универсальных статистических пакетов - 200-1500$ и 500-5000$, соответственно - я остановлю выбор, естественно, на программе за 200 у.е., нежели за 500, поскольку зарплата врача обычно 200 у.е. не превышает). Свободный же софт бесплатен по определению.
2. Наличие в программе большого количества функций "про запас", которые могут понадобиться или нет - это место на жёстком диске, которое забивается ненужным хламом. А этого места никогда слишком много не бывает.
3. Наличие в программе большого количества функций "про запас", которые могут понадобиться или нет - это избыточно сложный интерфейс, необходимость для освоения программы времени (в то время как у врача-специалиста и других дел по горло), оплаты курсов, покупки толстых справочников и т.п. Софт (неважно, свободный или коммерческий), ориентированный на один метод (группу методов) обычно имеет интуитивно понятный интерфейс и не требует много времени на освоение (пример - всё та же программа д-ра Хана).
Кроме того, не стоит забывать, что в топике-основе речь шла именно о СПЕЦИАЛИЗИРОВАННОМ применении статистических программ, во врачебной деятельности. А основная задача использования статистики в медицине - это проверка достоверности априорно формулируемых выводов. Для решения этой задачи набор статистических методов ограничен и, насколько мне известно, не менялся последние лет 30. Поэтому для её решения гораздо УДОБНЕЕ применять специализированные, а не универсальные статистические пакеты, которые в большой массе представлены свободным софтом (программами-самоделками). Что до второй задачи статистики - обнаружение ранее неизвестных закономерностей - то здесь по сравнению с другими методами научной медицины: описательный, описательно-исторический, сравнительно-исторический, метод анализа официальных и архивных документов, клинико-лабораторный, метод экспертных оценок и т.д. и т.п. статистический метод имеет вспомогательное значение. Лично я не встречал научной или практической задачи, которая требовала бы применения более 3 статистических методов одновременно. Может, Вы пример приведёте? В любом случае, каждый метод расчёта удобнее реализовать в отдельном программном решении, как с точки зрения разработки, так и применения.
Практика свидетельствует о популярности в биомедицинских исследованиях именно специализированных пакетов по сравнению с универсальными: так, если из универсальных стат. пакетов, используемых в медицине, я "навскидку" могу вспомнить только 4 (Statgraphics, SPSS, Statistica, STADIA), то число только коммерческих специализированных пакетов давно превалило за 2 десятка, а с учётом "самоделок", счёт, пожалуй, пойдёт и на тысячи.
Цитата(Leonov)
Эх-х-х-х! Товарищ-товарищ.... Так полагаю, что к высшей школе Вы имеете не самое непосредственное отношение, и тем более к студентам-программистам... Вчера умер один мой знакомый, который пошёл на обследование в клиники. И такие же недоучки, как те студенты-программисты, что пишут обильно разные программы, "залечили" его. Как выяснилось, не ту дозу лекарств дали...
Я так полагаю, что это продолжение темы ошибок в программном обеспечении, разрабатываемом community. Об этом я писал уже выше.
Что до моего отношения к высшей школе, то я имел и имею к ней непосредственное отношение: будучи аспирантом, вёл группы с различных факультетов мед. академии (это входит в программу подготовки аспиранта), в настоящее время читаю лекции как гражданским, так и военным курсантам. Более того, я имел дело с такой специфической категорией студентов, как будущие "врачи-кибернетики" медико-биологического факультета Карагандинской гос. мед. академии. Что до студентов-программистов, то из 6 участников программного проекта, менеджером которого я являюсь, 3 - именно студенты-программисты, пожаловаться не могу. По поводу "залечили": конкретнее надо быть, товарищ!

Диагноз, препарат, доза? А то обвинять легко, но ведь тут не бабушки с базара собрались, а Вы - представитель точных наук.
Да и вообще, попытка "прилепить" это "залечили" как аргумент дискуссии - это уже упоминавшаяся логическая ошибка подмены тезиса (ignoratio elenchi). А попытка использовать как аргумент не относящегося по сути к делу факта, имел я или не имел отношение к высшей школе, это уже другая - argumentum ad hominem - попытка привнести в рассуждения эмоциональную составляющую, когда суждение об истинности утверждения ставится в зависимость от суждения о личных качествах человека (субъективируется). Формальная логика учит, что так происходит, когда в рассуждение вмешиваются эмоции – напр., когда человек подсознательно боится сделать выводы из известных ему фактов, потому что эти выводы были бы ему неприятны. И в нашем случае (активная защита Вами так называемого "профессионального" софта вообще и программы Statistica в частности) причины этого очевидны:
1. Экономическая составляющая: Вы являетесь преподавателем курсов по применению статистического пакета Statistica, т.е. зарабатываете на этой программе, поэтому для Вас она самая хорошая. Нет ничего плохого в том, чтобы зарабатывать, но нельзя же иметь одну правду для всх, а вторую - для внутреннего использоваия!
2. Эмоциональная составляющая: упоминавшаяся сложность применения всё тех же универсальных коммерческих стат. пакетов превращает специалиста по их применению в некого непогрешимого гуру, судящего с высоты своего величия о том, что должно или нет, т.е. вполне подходит для самоутверждения ("профессиональный биостатистик и отличается от любителя", "наивные медики" и т.п.). Плюс - статьи, книги, курсы, консультации - см. пункт 1 (экономическая составляющая).
Цитата(Leonov)
Ваша уверенность в разумности этого подхода говорит о том, что Вам не приходится анализировать реальные массивы данных используя одновременно различные методы. Да. если использовать 2-3 метода, то можно пойти по этому пути. Если же речь идёт о том, что необходимы разные методы, а чаще всего именно так и бывает в реальных исследованиях, то необходим программный комплекс.
Опять логическая ошибка - argumentum ad hominem - попытка увязать дискуссию уже с моей профессиональной деятельностью. Ну откуда Вам знать, с чем мне приходится иметь дело?

И что Вы понимаете под "реальными массивами данных"? Регистрация заболеваемости чумой в Казахстане ведётся с 1905 года, впервые диагностированным бруцеллёзом человека - с 1952-го. Это "реальные" массивы? И эта заболеваемость, уж поверьте, анализируется различными методами, об этом ниже. Кстати, используемых нами методов в универсальных статистических пакетах нет, об этом опять-таки ниже.
Что до моей уверенности в разумности этого подхода, то она проистекает из а) моего опыта разработки программ; б) моего опыта применения прикладных программ (не только статистических).
По "а": модульный принцип используется в объектно-ориентированном программировании, программа собирается из кирпичиков-классов, каждый из которых реализует собственные методы обработки данных. Не нужно говорить, какой подход (объектно-ориентированный или процедурный) одержал верх в настоящее время. Компонентный принцип построения программ также не нуждается в комментариях.
По "б": сравним коммерческую чрезвычайно удобную (кто бы спорил!) среду разработки Borland C++ Builder и коллекцию компиляторов GCC (GNU Compilers Collection). Сколько "весит" инсталлятор в первом случае? 500-600 Мб. Буду ли я использовать все возможности программы? Вряд ли более 11%. Могу ли я добавить новые языки программирования, если возникнет нужда? Нет. Во втором случае. Сколько "весит" непосредственно инсталлятор? 150 Кб. При этом я могу выбирать из множества предложенных модулей лишь те, которые мне действительно нужны. И добавлять новые / удалять ненужные, экономя место на жёстком диске. Могу я использовать модули / библиотеки, разработанные другими производителями, совместно с GCC? Да сколько угодно. Коллекция модулей, "подогнанная" под конкретные запросы, работает лучше, нежели неизменный единый коммерческий программный пакет. Это факт.
Цитата(Leonov)
Для "элементарных" процедур достаточно использовать даже не программы, а просто калькулятор. Но сложные истины чаще всего извлекаются столь же сложными методами. И для их реализации необходимы сложные пакеты
.
И опять логическая ошибка - предвосхищение основания (petitio principii) - для доказательства используется утверждение, которое само ещё необходимо доказать. Хотя бы ОДИН КОНКРЕТНЫЙ пример???
Цитата(Leonov)
Вы сами себе ответили. Действительно, программа должна соответствовать цели. Подобная эйфория от того, что сделанная небольшая программа работает, мешает осознать, что профессиональный биостатистики отличается от любителя тем, что он решает поливариантные задачи, получая в результате десятки, а иногда и сотни решений, причём взаимосвязанных различных методов. И лишь анализ этих сотен вариантов даёт серьёзные заключения. Говорю так по собственному опыту. И вижу как наивные медики получив один вариант решения начинают строить ЕДИНСТВЕННУЮ гипотезу интерпретируя этот результат.
Ну, вообще-то я сам себе ответить не мог, т.к. себе я вопроса не задавал.

Я задавал его Вам: "чем вызван Ваш афронт в отношении программ-самоделок, хотя Вы сами их выкладываете на своём сайте"? Из длинного ответа удалось выловить лишь один разумный аргумент: "там бывают ошибки" (хотя где их нет?). Но впрочем, ТЕПЕРЬ я на этот вопрос ответил (см. экономическую и эмоциональную составляющую).
Цитата(Leonov)
Наконец-то разобрались! Действительно, в "практическом здравоохранении" достаточно не только Excel, но даже простого калькулятора, благо надо лишь умножать, складывать, делить и вычитать...
Это гипербола или Вы в этом действительно уверены? Вот Вам классическая практическая и одновременно научная задача: необходимо спрогнозировать заболеваемость людей чумой на данной территории (краткосрочный и долгосрочный прогноз). Учитывается зарегистрированная заболеваемость за 60 лет (предварительно разбираемся с "выскакивающими" величинами). Учитываются демографические показатели (миграция, естественный прирост и т.п.). Учитывается солнечная активность (числа Вольфа). Учитывается гидродинамический коэффициент. Учитывается ареал и миграция большой песчанки (хотя бы, а желательно - серой крысы, суслика и сурка) на данной территории. Учитываются колебания среднемесячной температуры. Учитывается блошиный индекс. Учитывается эпидемический потенциал участка очага для первичного района (степень контакта населения с источником инфекции + комплекс социальных условий). Ошибиться нельзя: если завысить прогноз - это миллионы лишних денег на профилактические реботы, занизить - недостаточное выделение средств на профилактику - вспышка, а то и эпидемия чумы. Так вот, если Вы мне это дело посчитаете на калькуляторе (хотя бы в течение полугода

), то я перед Вами не только капюшон защитного костюма сниму, но и шапочку...
Цитата(Leonov)
Но кроме "практического здравоохранения" есть ещё и медицинская наука, в частности, доказательная медицина. И там-то этих инструментов уже недостаточно. Наши подходы разные потому, что мы с Вами делаем разное дело
Опять petitio principii... Ну да мы уж привыкли...

См. топик
http://forum.disser.ru/index.php?showtopic=397 как пример...
А почему Вы думаете, что старший НАУЧНЫЙ сотрудник не имеет отношения к медицинской науке и доказательной медицине? Что, опять argumentum ad hominem, а?
Цитата(Leonov)
Профессиональный статистик использующий интегрированный стат. пакет, отличается от работника"практического здравоохранения не только решаемыми задачами, но и производительностью их решения с помощью такого пакета.
Итог. Кесарю - кесарево и т.д.
Т.е. в своём рассуждении Вы опять-таки допускаете логическую ошибку ignoratio elenchi (подмена тезиса). Речь шла не о том, какие программы нужны статистику, а о том, как лучше обработать свои результаты врачу. И в результате длительных рассуждений мы таки пришли к выводу, очевидному изначально: каждый для стат. обработки пользуется теми программами, что представляются наиболее удобными. Нет "должных" и "недолжных" программ, если они выдают корректный результат. И программы-самоделки в этом ряду не на последнем месте. Особенно в свете борьбы за копирайт.