Версия для печати темы
Форум врачей-аспирантов _ Медицинская статистика _ Бесплатные программы по статистике
Автор: Игорь 9.10.2007 - 12:55
Даю ссылку на бесплатные программы по статистике. http://freestatistics.altervista.org/en/stat.php Приглашаю высказаться об их полезности.
Автор: плав 11.10.2007 - 22:13
Очень интересный сайт, спасибо!
по-моему самая интересная страничка - это сравнение программ по возможностям (http://freestatistics.altervista.org/en/comp.php) - сразу видно, кто лидирует - R
Автор: amphipole 14.10.2007 - 01:25
Программа Tanagra французского производства, интересная штука, множество моделей реализовано, полно руководств на французском (на английском на порядок меньше), но руководства слишком примитивные в духе "кликни сюда, кликни туда", но для понятия логики программы достаточно, программа не гибкая, с начала многие функции сверял с СПСС, если чесно до сих пор нет особого доверия к чености , уж сильно легко она все делает.
Удобна для новичков. Но есть очень большая вероятность понасчитать черти че из-за простоты выполнения и непонимания смысла многих модулей, ето приходит у многих, просто тыкают и смотрят какой результат выйдет...а далее пытаются интерпретировать...
Для грамотного применения хороша, опяттаки изза множества модулей и бесплатности, изза легкости импорта-экспорта данных не думаю что какая нить другая программа сможет сделать быстрее.
Мне лично она нравится очень.
Автор: nokh 31.10.2008 - 01:34
Встал вопрос выбора пакета анализа данных для обучения биостатистике в ВУЗе. После долгих поисков удалось найти вполне подходящий пакет, чем и спешу поделится. Критерии выбора были такими.
1. Бесплатность. Сразу отпали все известные коммерческие пакеты и их поломанные версии.
2. Платформа - Windows XP. Я не смог полюбить линукс; все что с ним связано мне незнакомо и неинтересно.
3. Как можно более широкий спектр статистических методов: от описательной статистики до многомерных методов. Отпало много полезных узкоспециализирванных программ.
4. Стандартный для Windows-среды графический инерфейс. Отпало много хорошего софта, включая Simfit ( http://www.simfit.man.ac.uk/ ) и R. Для R есть попытки прикрутить GUI типа R-commander (библитека Rcmdr), но работать все равно не удобно, а учитывая абсолютно иную философию, заложенную в среду R, можно уверенно прогнозировать, что ничего хорошего из таких затей и не выйдет. Учить R можно и даже нужно, но не в 36-часовом курсе. Фактически остались только процессоры электронных таблиц с присадками к ним да тройка программ - старая версия KyPlot, OpenStat и PAST.
5. Интерфейс программы должен быть схож с основными коммерческими пакетами. Во-первых, он удобен, а во-вторых предполагает легкость дальнейшего перехода на другие пакеты. Отпали присадки к процессорам электронных таблиц и даже столь любимый мной KyPlot. Кстати, я качал эту гениальную программу еще с сайта автора (японский нейрофизиолог) более 5 лет назад, но затем он продал права на нее фирме, страничка стала недоступной и сейчас старая бесплатная версия выложена в других местах (см. ссылку в первом посте Игоря). Я пробовал демо-версии коммерческих КyPlot 3, 4 и 5 версий. Какой-то прогресс наметился только в последней версии - доработали интерфейс и устранили парочку небольших багов, которые мне удалось найти в исходной версии. Короче барыги, а не разработчики .
6. Полученную в пакете графику должно быть не стыдно вставить в студенческие и аспирантские публикации и презентации. Отпали OpenStat и PAST. Всё, пакеты кончились!
Пошел по урезанным версиям коммерческих программ и быстро вышел на MYSTAT. Это - урезанная версия SYSTAT - программы с долгой историей и грамотными разработчиками. В DOS-овские времена GUI у нее вообще отсутствовал, сейчас есть, но страдает недостаточной гибкостью в кнопочном интерфейсе - типа SPSS. Если графические возможности КyPlot2 и Prizm5 оценить в 5 баллов, Statistica6,8 - в 4-5-, то MYSTAT12=SYSTAT12 балла 3 набирает. В принципе нормально. Вроде если писать скрипты будет полный функционал, но мы пошли по пути выбора кнопочного интерфейса. Немного поигрался с MYSTAT - очень неплохо. Есть и логлинейное моделирование и анализ главных компонент и многое другое. Сохранена вкладка resampling: во многих модулях можно пользоваься бутстрэпом, складным ножом или выборкой без возврата. В отличие от всех остальных урезанных коммерческих программ абсолютно бесплатна и основные модули сохранены:
http://www.statcon.de/statconshop/product_info.htm?products_id=704&language=en&PHPSESSID=521b85a808dc306fddfae8df9bf80735
Есть глюк с «копировать в MYSTAT - вставить в другое Windows-приложение», но нашел как его обойти. В остальном пока доволен
Автор: Игорь 31.10.2008 - 11:32
Цитата(nokh @ 31.10.2008 - 01:34)
http://www.statcon.de/statconshop/product_info.htm?products_id=704&language=en&PHPSESSID=521b85a808dc306fddfae8df9bf80735
Программу MyStat лучше загружать с сайта производителя http://www.systat.com/Downloads.aspx. Программа MyStat - это бесплатная студенческая версия SYSTAT. На указанном сайте есть список отличий данного продукта от SYSTAT. Программа SYSTAT хотя и известная, но распространена мало. Интерфейс оригинальный. Информация на русском по ней может и есть, но не встречалась. А потому не лучше ли взять бесплатную русскоязычную надстройку к Excel?
Еще вот тут обзор есть интересный http://en.wikipedia.org/wiki/Comparison_of_statistical_packages.
Автор: nokh 2.11.2008 - 14:00
Естественно, загружать нужно с официального сайта, не знаю почему сохранил ту ссылку. AtteStat, конечно, был в списке. И студентам нужен русскоязычный пакет. "О-ой , а нет чего-нибудь на русском?" - звучит частенько. Во-многом решило отсутствие графики. Получается нужно искать и осваивать еще пакет (для создания профессиональной графики Эксель неудобен). В этом отношении жутковатый "русский Statgraphics" - STADIA Кулаичева оказывается более универсальным, но он отсеялся еще на этапе 1 как платный.
Спасибо за ссылку. Посмотрел сайты незнакомых проектов. Есть неточности и похоже много. Давно следил за проектом PSPP - типа open source - альтернатива SPSS, так там не то что GLM-подхода к anova нет, а вообще только описательная статистика. Про Mac-версию Statistica в Компьютерре еще года 2 назад читал, IRRISTAT делает далеко не то, что заявлено на сайте и представлено в таблицах. Еще буду лазить...
Автор: Игорь 2.11.2008 - 17:28
Цитата(nokh @ 2.11.2008 - 14:00)
Получается нужно искать и осваивать еще пакет (для создания профессиональной графики Эксель неудобен).
Для меня непонятно, что тут имеется в виду под наименованием "профессиональная графика". Уж куда профессиональнее? Если нужен графический дизайн, берут CorelDRAW или иной специфический пакет. А для любой научной статьи представления результатов статистики с помощью графики Excel более чем достаточно (хотя многие оправдывают свое неумение использовать данные возможности якобы непрофессиональной графикой - см. известную монографию Чекотовского по данной проблеме).
Кстати, AtteStat использует 100%-у графику Excel. И с каждой версией и Excel, и AtteStat графических возможностей добавляется. В последних версиях AtteStat замечены: ROC анализ, логистическая регрессия, анализ Бланда-Альтмана, графики параметров положения (средние, медианы, доли) с ДИ, гистограммы и другие методы, результаты которых особено наглядны в графике. И все это добро выполнено средствами Excel.
Откройте любой научно-медицинский журнал и спросите себя - можно ЭТО нарисовать в Excel? - Да без проблем. Другое дело, что стандартный (пусть и несколько ограниченный) набор графиков призывает - нет, не мыслить стандартно, а стандартно представлять результаты исследований.
Цитата(nokh @ 2.11.2008 - 14:00)
В этом отношении жутковатый "русский Statgraphics" - STADIA Кулаичева оказывается более универсальным, но он отсеялся еще на этапе 1 как платный.
Тут неточность. Для обучения выпускается бесплатная версия STADIA. Другое дело, что программой лет 15 никто не занимался. Поэтому проект производит впечатление удручающее по сравнению с любыми прочими программами. Основная проблема - автор программы, видимо, не желает проводить работу по "осовремениванию" программы.
Цитата(nokh @ 2.11.2008 - 14:00)
Спасибо за ссылку. Посмотрел сайты незнакомых проектов. Есть неточности и похоже много. Давно следил за проектом PSPP - типа open source - альтернатива SPSS, так там не то что GLM-подхода к anova нет, а вообще только описательная статистика. Про Mac-версию Statistica в Компьютерре еще года 2 назад читал, IRRISTAT делает далеко не то, что заявлено на сайте и представлено в таблицах. Еще буду лазить...
Любой обзор отражает предпочтения и заблуждения составителя и/или заказчика обзора. Например, в упомянутом обзоре не нашел StatXact! А где украинский StatPlus?
Автор: Игорь 1.02.2010 - 07:09
Цитата(nokh @ 2.11.2008 - 15:00)
... жутковатый "русский Statgraphics" - STADIA Кулаичева оказывается более универсальным ...
"Жутковатый" - это смотря с чем сравнивать. Вот тут предлагается бесплатное ПО STATAN: http://gashevsn.narod.ru/statan.html
Пусть уважаемый коллега автор STATAN-а (если прочитает данный пост) воспримет это как продуктивную критику и не обижается - но интерфейс надо переделать.
Ссылка на TANAGRA http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html
Автор: Константин 27.02.2010 - 21:47
R- это действительно, классика. И ссылаться на нее можно. Правда, работаю из командной строки и провожу не очень сложные анализы. Должны быть графические интерфейсные добавки, но не пытался ставить. Если есть опыт использования, поделитесь результатами апробации.
Для регрессионныго анализа и временных рядов есть
http://en.wikipedia.org/wiki/Gretl
Если позволительна хитрость, то работу R можно проверить в S от Sigma Plot. У последней есть хороший графический интерфейс
Автор: Pinus 28.02.2010 - 00:07
А где можно скачать R?
Автор: nokh 28.02.2010 - 00:22
Цитата(Константин @ 27.02.2010 - 23:47)
Должны быть графические интерфейсные добавки, но не пытался ставить. Если есть опыт использования, поделитесь результатами апробации.
http://ru.wikipedia.org/wiki/R_Commander
Но через этот интерфейс доступно очень ограниченное число методов, поэтому без строки - никуда. Спецы по R есть здесь - http://molbiol.ru/forums/index.php?showtopic=102724 .
>Pinus. http://cran.gis-lab.info/ Если под Windows, то в папке Windows - base. Огромное число отдельных пакетов - в папке Packages.
Автор: nokh 23.10.2010 - 07:54
Интересная программа с уникальными возможностями по анализу данных с цензурированными наблюдениями -
Scout: http://www.epa.gov/nerlesd1/databases/scout/abstract.htm .
В медицинской практике наиболее известны цензурированные данные (ЦН) типа "более чем", т.е. с усечением распределения справа как в анализе выживаемости. Но в химико-аналитических работах очень часто есть ЦН типа "менее чем", когда количества определяемого вещества оказываются менее предела обнаружения для данного метода (н.ч.м., н/о, n.d. - nondetect). Ясно, что учёт таких наблюдений как нулей или как половины предела обнаружения некорректно. Программа Scout позволяет грамотно работать с такими данными: находить средние и доверительные интервалы, проводить сравнения средних, регрессионный, дискриминантный и компонентный анализ. Полноценные руководства картинками и формулами.
Автор: nokh 20.10.2018 - 21:26
Последняя версия пакета KyPlot, ещё недавно стоившая 1000$, стала бесплатной. Слава Коичи Йошиоке!
http://www.kyenslab.com/en/index.html
Автор: 100$ 20.10.2018 - 21:58
Цитата(nokh @ 20.10.2018 - 21:26)
Последняя версия пакета KyPlot, ещё недавно стоившая 1000$, стала бесплатной. Слава Коичи Йошиоке!
http://www.kyenslab.com/en/index.html
Да, галерея графики - няшная, из статистических "фенечек" впечатлился наличием процедуры Двасса - Стила в качестве пост хоков в дисперсионном анализе. Впрочем, имея перед глазами Холлендера и Вульфа (1999) не так это все сложно запрогать и самому... В общем, миленько, но не более того...
Автор: nokh 20.10.2018 - 22:31
Цитата(100$ @ 20.10.2018 - 23:58)
Да, галерея графики - няшная, из статистических "фенечек" впечатлился наличием процедуры Двасса - Стила в качестве пост хоков в дисперсионном анализе. Впрочем, имея перед глазами Холлендера и Вульфа (1999) не так это все сложно запрогать и самому... В общем, миленько, но не более того...
Пакет очень хорош как конструктор для научной графики: этакий мини Origin (OriginLab Corp.). Я сейчас всю графику в отчёты и статьи строю в KyPLot и R. Планирую несколько роликов по KyPLot сделать - надоело одно и то же показывать людям.
А статистических фенек в нём больше. Например можно факторный анализ проводить методом главных факторов с итерациями по общностям и использовать в качестве начальных значений таковые, вычисленные по Йореско - именно как в "Факторный, дискриминантый и кластерный анализ" рекомендуется (+ другие методы факторного анализа с разными как ортогональными, так и косоугольными вращениями). Также если подать на вход матрицу сходства, можно кластеризацию методом Уорда делать для любых расстояний (досчитывал так за PAST). Ну а встроенных функций нелинейных зависимостей там просто больше, чем где-либо (центральное меню двойным кликом на рисунке и далее Fit)...
Автор: 100$ 20.10.2018 - 23:27
Цитата
Я сейчас всю графику в отчёты и статьи строю в KyPLot... Пакет очень хорош как конструктор для научной графики: этакий мини Origin (OriginLab Corp.)
Да, я помню, вы неоднократно об этом говорили. Заметно, что разработчики любят годные картинки и не жалеют на это сил.
Цитата
А статистических фенек в нём больше. Например можно факторный анализ проводить методом главных факторов с итерациями по общностям и использовать в качестве начальных значений таковые, вычисленные по Йореско - именно как в "Факторный, дискриминантый и кластерный анализ" рекомендуется (+ другие методы факторного анализа с разными как ортогональными, так и косоугольными вращениями). Также если подать на вход матрицу сходства, можно кластеризацию методом Уорда делать для любых расстояний(досчитывал так за PAST).
Если я еще не до конца забыл, что такое факторный анализ, и с чем его едят, то методов оценки общностей придумано бесчисленное количество, методов экстракции факторов - и того больше, а уж количество вращений и вовсе зашкаливает за все мыслимые пределы. Все это 100 лет назад реализовано в том же SPSS. Сказать, что это изобилие сильно помогает понять, как устроен мир, не могу. Это примерно как с 15-тью методами рандомизации.
В общем, как человек, способный запрограммировать статистический метод любой сложности и не имеющий к тому никакой мотивации, не могу назвать ни KyPlot, ни PAST программами своей мечты.
Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)