Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ R language

Автор: PantheraBagira 1.04.2010 - 21:18

Дорогие коллеги!
Подскажите, пожалуйста, есть ли какой-нибудь самоучитель по программированию в языке R, кроме того, который зашит в самой программе. Например на русском языке или с примерами медицинской статистики?...

Автор: DoctorStat 2.04.2010 - 16:09

Цитата(PantheraBagira @ 1.04.2010 - 21:18) *
самоучитель по программированию в языке R на русском языке?...
Сам я не разбирался, но вот тут:
http://herba.msu.ru/shipunov/software/r/r-ru.htm
есть документы и статьи про R.


Автор: Игорь 3.04.2010 - 10:04

Основная часть материалов по R, как и по всем остальным свободным проектам (Linux etc), это - 99% непродуктивных перекрестных ссылок и ссылок на какую-нибудь чушь (типа на форуме задают вопрос, а в ответ получают ссылку на книгу или на тот же сайт R), в чем апологеты свободного ПО далеко превзошли даже Microsoft.

Во всех материалах по R (из того 1%, который достоин, чтобы с ним ознакомиться) есть пара существенных, по моему мнению, недостатков, которые роднят его с коммерческими ударно-нажимными пакетами:

1. Отсутствие вменяемых описаний алгоритмов абсолютно со всеми формулами (т.е. повторить программу по данному описанию, не привлекая иных источников, нельзя). Все сделано для того, чтобы максимально затруднить проверку программ на их адекватность. Даже до библиотеки NAG не дотягивает.
2. Отсутствие ссылок на доступные научные исходные ресурсы (статьи и т.п.). Т.е., все ссылки - на статьи, доступные только за большие деньги исключительно в издательствах или коммерческих хранилищах, на книги, описание попыток ознакомиться с которыми - целая отдельная история.

Первого свойства лишены только SAS и StatXact. Пакет AtteStat близок к решению данной проблемы, но по ряду модулей работы еще много - есть хотя бы стремление.

Второе свойство подтверждает, что R - не совсем свободная и совсем не бесплатная затея - это типичный насос для выкачивания денег, причем гораздо более циничный, чем любое коммерческое предприятие, искажающий саму прекрасную идею свободности ПО. Вот решили мы, например, посчитать (и исследовать) критерий Дарбина-Уотсона в R. Нам предлагается идиотское скромное описание и только одна ссылка на себя любимого: Fox J. Applied Regression Analysis, Linear Models, and Related Methods. - Sage, 1997. Книги, естественно, нет в свободном доступе (но есть куча ссылок на коммерческие издания по R данного автора). Нет ее и в файлообменных сетях. Ее можно только купить. Причем очень дорого. Похоже на то, что вам дают бесплатно ручку для бритвы, а потом за чудовищные деньги предлагают купить лезвия для нее.

Так что весьма странно видеть все эти "залипухи" в якобы свободном пакете для гурманов. Почему гурманов? У нас уже в 1989 году для расчетных программ был, хотя и самодельный, но какой-никакой текстовый пользовательский интерфейс с меню, полями ввода данных, поддержкой мыши. А в 1990 году - даже и графический (на смеси Фортрана, Ассемблера и Си!). Работать из текстовой строки в 2010 году разумно ли? Этот метод общения с программой никогда не получит широкого распространения среди пользователей. Хотя один положительный момент имеется - на дальних подступах отсекается "халява".

Вот, например, как считают критерий Дарбина-Уотсона в R: http://hosho.ees.hokudai.ac.jp/~kubo/Rdoc/library/car/html/durbin.watson.html Неслабо?

Так что, уважаемые, купите для конторы SAS и забудьте все остальное как дурной сон.

Автор: PantheraBagira 8.04.2010 - 19:31

Спасибо, Игорь! За очень пространный и аргументированный ответ на мой вопрос. До сегодня я все рассчеты проводила (большую их часть) в Statistica. Но некоторый ажиотаж вокруг R заставил меня чувствовать некоторую ущербность. В связи с этим, я бы хотела разобраться в нем, чтобы понимать суть. Как позиционируют его любители - что он очень гибкий, и ты сам задаешь порядок рассчетов. что-то вроде крутого калькулятора получается. В то время как, в стат пакетах зашиты только конкретные жесткие алгоритмы, и если ты в них не вписываешься, то извиняйте. Это так?

Автор: DoctorStat 8.04.2010 - 21:09

Цитата(PantheraBagira @ 8.04.2010 - 20:31) *
Но некоторый ажиотаж вокруг R заставил меня чувствовать некоторую ущербность
Чем отличается R от других стат.пакетов - взгляд дилетанта. Представьте себе, что вам нужно подарить на день рождения подруги (тоже пантеры) какой-нибудь модный гаджет (это такая электронная штуковина). Что вам делать, куда идти за покупкой? Есть два варианта решения этой проблемы:
1. Метаться по маленьким магазинчикам на рынке, выспрашивая продавцов о достоинствах того или иного товара. В отдельном павильончике-закуточке будет в наличии лишь ограниченный набор электроники. Чтобы получить полное представление об ассортименте, Вам придется полдня бегать по рынку, но в конце концов вы так и не сможете найти прибор, удовлетворяющий всем вашим требованиям . Но есть лучший способ:
2. Зайти в большой супер-маркет (программа R). Там лежит огромное количество отобранного, качественного товара (методов) на любой вкус по сниженным ценам. Вы всегда найдете то, что Вам нужно в одном месте!

Автор: nokh 9.04.2010 - 04:41

Цитата(DoctorStat @ 9.04.2010 - 00:09) *
2. Зайти в большой супер-маркет (программа R). Там лежит огромное количество отобранного, качественного товара (методов) на любой вкус по сниженным ценам. Вы всегда найдете то, что Вам нужно в одном месте!

Огромное количество - да, качественное - не всегда, на любой вкус - нет, всегда найдёте нужное - нет.
Мой опыт "нет" касается в первую очередь графического представления результатов. Если речь идёт не о простеньких гистограммах и скаттерграммах - дела плохи. Что авторы пакета закрепили за командой - то и получайте. Да и с гистограммами всё нужно описать руками: толщину линий, цвета, шрифты. Мне удобнее это делать кликая мышкой. Во-вторых, я долго искал аналог нелинейного анализа главных компонент по алгоритму CatPCA из SPSS и не нашёл, нашёл только брошенную на пол-пути библиотеку Gifi ещё для первой версии R в которую автор планировал его вставить. Искал метод обработки данных с цензурированными наблюдениями типа "менее чем" и нашёл только один крупный и авторитетный пакет, но результаты которого по этому методу не совпали с результатами старой DOS-овской программы и с моим ручным расчётом. Поэтому, в-третьих, пусть и не столь категорично как Игорь, имею претензии к качеству пакетов или к неполноте их описания (возможно, если бы искал там формулы - претензий было бы гораздо больше).

>Panthera
Теперь о плюсах.
(1) Все распространённые методы включены в большое количество программ, где зачастую расчёты по ним проводить удобнее чем в R либо выдача результата качественнее. Но зато почти вся экзотика - в R. "Почти" - т.к. кое-что программируется энтузиастами SAS и SPSS и эти коды можно найти в сети. Среди этой экзотики встречаются перлы, которые хотелось бы "взять на вооружение", но незнание языка R не позволяет свободно с ними обращаться. В этом случае действительно некоторая ущербность ощущается.
(2) Комбинация методов. Ни один кнопочный интерфейс никогда не предоставит возможности комбинировать методы. А уж если учиться их программировать на каком-то языке - то лучше на бесплатном. О популярности R говорит хотя бы то, что последние версии SPSS поддерживают код R. Из личного. Хотел провести анализ главных компонент с бутстрепом - оказалось есть подводные камни в виде смены знаков в биполярных факторах и изменения порядка следования главных компонент. Получается, что в анализ нужно включать прокрустово преобразование. Т.к. сделать это в R можно, а я не умею - есть уже явное чувство ущербности. Если в студенчестве и аспирантуре такие задачи брались многодневным штурмом, то сейчас всё время что-то мешает: лень, усталость, другие дела... Если чувствуете в себе силы - штурмуйте! По сугубо личному опыту - есть какое-то качественное отличие самообразования примерно до 25-30 лет и после. Если бы знал это - постарался бы побольше тогда в себя впихнуть.

Задать вопросы по R знающим людям и лично нашему главному её популяризатору Шипунову (plantago) можно здесь:
http://molbiol.ru/forums/index.php?showtopic=102724

Автор: Игорь 9.04.2010 - 13:28

Цитата(DoctorStat @ 8.04.2010 - 22:09) *
... лежит огромное количество отобранного, качественного ...

Может, и лежит. Может, и огромное количество. И даже отобранное у кого-то. Но вот непонятно, откуда взялся миф о непревзойденном качестве этого огромного количества?

С подачи уважаемого Н.Н. Хромова-Борисова мы тестировали на данном форме ДИ для отношения что-то типа 1 млн. мальчиков к 2 млн. мальчиков+девочек. И с тестом справилась только одна программа (знаем, какая), и то после небольшой доработки. Если SAS и SPSS тестируют десятки лет сотни тысяч профессионалов, а в разработке участвуют сотни докторов наук, не может собранная на коленке студенческая поделка быть лучше. Не верю.

Автор: DrgLena 9.04.2010 - 22:16

PantheraBagira, задала вполне конкретный вопрос о русскоязычных источниках обучения работы на R, получила чисто одесские ответы типа, а оно вам надо? Есть же AtteStat и SAS. Могу ответить участникам дискуссии НАМ это надо. Обычно мы любим те программы, которые хорошо знаем и не любим то, что не знаем. Но по мере познания и любовь появляется. Могу предложить англоязычный источник, который сопровождает лицензионную программу Statistica 9, мне он помог и эта программа c интеграцией R (версии выше 2.8.1) нравится мне все больше и больше.
Вопросы возникли к участникам дискуссии, какая именно версия SPSS работает с R и какие конкретные глюки имеет R?


 R_Integration_White_Paper.pdf ( 1,31 мегабайт ) : 1009
 

Автор: nokh 10.04.2010 - 09:41

Цитата(DrgLena @ 10.04.2010 - 01:16) *
PantheraBagira, задала вполне конкретный вопрос о русскоязычных источниках обучения работы на R, получила чисто одесские ответы типа, а оно вам надо?

Вопрос, конечно, конкретный, но уж больно чудной. 1) на русском, 2) с медицинскими примерами и 3) и ещё чтобы сразу вшит был. И чтобы ещё симпатичный преподаватель приезжал на дом в удобное время и консультировал бесплатно laugh.gif
Ну а если только конкретный ответ, то: нет таких самоучителей! и ТЕМУ МОЖНО ЗАКРЫВАТЬ!
Цитата(DrgLena @ 10.04.2010 - 01:16) *
Вопросы возникли к участникам дискуссии, какая именно версия SPSS работает с R и какие конкретные глюки имеет R?

Говорят с 16-ой: http://insideout.spss.com/2009/01/13/spss-statistics-and-r/
Про глюки не особо в теме, т.к. мало использую. Но, скажем, бутстреп-оценки 95%-ных ДИ для одного своего набора данных (около 15-20 наблюдений, ничего особенного) смог получить почему-то только в одном пакете из 3 опробованных, с тех пор его и использую (библиотека boot, модуль boot.ci). С цензурированными наблюдениями (см. выше) использовал пакет NADA, почему не сошлось не разбирался, использую программу с которой сошлось.

Автор: Игорь 10.04.2010 - 09:56

Мы же не садисты, а ученые. Ну поиронизировали, а потом дело скажем.

Изучать новое для себя, конечно, полезно. С R злую шутку сыграло его имя - поисковые машины отказываются искать источники - слишком мало букв, надо чем-то дополнять. Яндекс дает ссылки по поиску на "язык R" (без кавычек).

Начать можно с Википедии, хотя часть ссылок с нее - битые. Источников мало. Вот этот, вроде, содержательный. И примеры, и картинки: http://zoonek2.free.fr/UNIX/48_R/all.html

Также тут: http://www.machinelearning.ru/wiki/index.php?title=R

Неожиданно (для себя) нашел очень неплохие материалы (на русском языке) на сайте компании IBM. А именно - 3 душевные статьи:
Часть 1: http://www.ibm.com/developerworks/ru/library/l-r1/index.html
Часть 2: http://www.ibm.com/developerworks/ru/library/l-r2/index.html
Часть 3: http://www.ibm.com/developerworks/ru/library/l-r3/index.html

См. также ссылки из всех материалов. Так можно "накрутить" порядочное количество содержательных материалов.

Плотно погрузившись в R, конечно, через n-е количество времени можно достичь значимых результатов (мне с 30-летним опытом программирования это удалось бы - не сразу, т.к. все сложно, но дней через 4-5). Но, если честно, не думаю, что это нужно человеку, задающему вопрос: "Подскажите, пожалуйста, есть ли какой-нибудь самоучитель".

Автор: DrgLena 10.04.2010 - 10:04

Nokh, спасибо большое, я не знала про эти возможности SPSS, хотя эта версия есть.
Игорь, спасибо, хорошее продолжение тамы.

Автор: Игорь 10.04.2010 - 10:11

Цитата(DrgLena @ 10.04.2010 - 10:04) *
Nokh, Спасибо большое, я не знала про эти возможности SPSS, хотя эта версия есть.

Уважаемая DrgLena, я думаю, что общественности интересным было бы использование R из Excel. Или не прав?

Такая возможность есть

Обзор http://en.wikipedia.org/wiki/RExcel
Сайт для загрузки http://rcom.univie.ac.at/
Еще тут: http://www.r-project.org/useR-2006/Slides/BaierEtAl.pdf
И тут: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.13.7364&rep=rep1&type=pdf
Кино тут http://www.statconn.com/

Обратим внимание - оно также и для OpenOffice.org. Хороший аргумент против покупки коммерческих программ за бюджетные деньги.

Совсем прекрасно - в электронном виде встречается книга Heiberger R., Neuwirth E. R Through Excel, Springer Verlag 2009.

Автор: DrgLena 10.04.2010 - 11:36

Да, общественности, конечно, можно и exel (но его тоже нужно купить).
Я полный профан в exel, но AtteStat осилила. Так получилось, что статистикой я стала заниматься с досовских времен. А не так давно, институт купил мне однопользовательскую версию Statistica 9, а там R, нужно идти вперед. Но, как справедливо заметил Nokh, с возрастом процесс обучения тормозится, и это несмотря на увеличение ресурсов для обучения.
И я совсем не против, чтобы институты покупали коммерческие программы в том числе и статистические, это становится уже правилом хорошего тона (или многолетней борьбы). Но в рамках выполнения квалификационной работы необходимо освоить доступные средства анализа собственных данных, даже крутым хирургам, а не спрашивать на форуме, как посчитать достоверность в SPSS.

Автор: Игорь 10.04.2010 - 16:48

Нет, я не понимаю. Есть могучий R с дурацким простым текстовым интерфейсом. По сути имеется мощная библиотека программ, для широкого использования народом недоступная. Мы премся от осознания величия данного факта. С другой, разработали бесплатную надстройку для Excel, которая путь ко всей этой могучести для широких масс открывает (даже для тех, кто честно Excel не имеет - есть версия для OpenOffice.org). Мы не приветствуем данного факта, полны скепсиса и Openoffice.org + R даже не замечаем. Нормальные герои всегда идут в обход?

Автор: DrgLena 10.04.2010 - 19:05

Цитата(Игорь @ 10.04.2010 - 16:48) *
Нет, я не понимаю.

Жаль.
Цитата(Игорь @ 10.04.2010 - 16:48) *
По сути имеется мощная библиотека программ,

Это верно. И можно лично ее расширить.
Цитата(Игорь @ 10.04.2010 - 16:48) *
Мы премся от осознания величия данного факта.

Глагол не понятен.
Цитата(Игорь @ 10.04.2010 - 16:48) *
С другой, разработали бесплатную надстройку для Excel, которая путь ко всей этой могучести для широких масс открывает.

Я очень приветствую данный факт. Но широкие массы имеют право выбора, кто то может отдать предпочтение и Openoffice.org + R.


Автор: PantheraBagira 16.04.2010 - 17:09

Мда... даже не знаю с чего начать комментировать все мною вышепрочитанное. Наверное, начну с благодарностей за ссылки. Я их просмотрю. К "программисткому юмору" я привыкла и отношусь спокойно. И как показывает практика программисты сами редко что дельное советуют, а только кичатся своей уникальностью. А ощутимая помощь приходит, как правило, не от них. Что и требовалось доказать.
Я специально создала тему, чтобы понять кто что думает об этом способе (язык R) статистической обработки данных, чтобы в итоге понять насколько имеет смысл в нем разбираться. Кстати, глумеж над моей "блондинистостью" как-то неуместен, так как иногда на такие запросы (самоучитель на русском) приходят положительные, как ни странно, ответы.

Автор: bubnilkin 7.05.2010 - 12:44

http://molbiol.ru/forums/index.php?showtopic=102724

Автор: Игорь 7.05.2010 - 16:15

Цитата(PantheraBagira @ 16.04.2010 - 18:09) *
Мда... даже не знаю с чего начать комментировать все мною вышепрочитанное. Наверное, начну с благодарностей за ссылки. Я их просмотрю. К "программисткому юмору" я привыкла и отношусь спокойно. И как показывает практика программисты сами редко что дельное советуют, а только кичатся своей уникальностью.

А потому что от программистов часто требуют того, что они знать и делать, вообще говоря, не обязаны. Все, связанное с компьютерами, программисты якобы обязаны знать. Ничего подобного. Не обязаны. Универсальность - это середина прошлого века. В современном программировании специализаций не меньше, если не больше, чем в медицине.

А если вы полагаете, что вашему программисту для написания расчетной программы достаточно сказать: "Иди делай", и он делает, попутно выполнив обязанности библиографа, математика, постановщика задачи, кодировщика, тестера, технического писателя, специалиста по внедрению и сопровождению, преподавателя, а часто еще и маркетолога и менеджера, скажите ему хотя бы спасибо, ибо он за одну зарплату сработал за десятерых.

При этом, как правило, тот же программист в наших медучреждениях чинит компьютеры, администрирует 1C и прокладывает локальные сети, заправляет принтеры и ксероксы. А это тоже - отдельные специальности. Были случаи, когда руководство учреждений посчитало, что все перечисленное делается само собой. Программист, часто единственный, в результате увольнялся, а руководство огребало проблем "на всю катушку". Да и поделом ему.
Цитата(PantheraBagira @ 16.04.2010 - 18:09) *
Кстати, глумеж над моей "блондинистостью" как-то неуместен, так как иногда на такие запросы (самоучитель на русском) приходят положительные, как ни странно, ответы.

Просмотрел тему. Не нашел не только глумления, но и каких-либо упоминаний о цвете волос. Так что данное замечание лишь отражает негативные несбывшиеся ожидания.
Цитата(bubnilkin @ 7.05.2010 - 13:44) *
http://molbiol.ru/forums/index.php?showtopic=102724

"Отлично". Кто-то после такого захочет R?

Автор: плав 2.06.2010 - 09:30

Цитата(Игорь @ 7.05.2010 - 17:15) *
"Отлично". Кто-то после такого захочет R?

На самом деле, людям, которые давно "сидят" в процедурных языках R достаточно непривычен. Это ведь действительно большой калькулятор, к которому все, кто могут, пишут свои функции. Кто-то лучше, кто-то хуже. Ориентироваться надо на автора - сейчас многие (если не все) при разработке статистических алгоритмов делают реализацию на R (точнее, на языке S в диалекте R). Кстати, часто код функции можно увидеть если ввести ее имя без скобок - так что посмотреть авторский код несложно (если его не скомпилировали).
Многие вещи удобны, даже для преподавателя (например, написал функцию clopper.ci() и пожалуйста, все, что надо для расчета доверительного интервала Клоппера-Пирсона - ввести, например, clopper.ci(15,40).
Чтобы не мучаться с библиотеками загнал такие функции в автостарт и можно быстро объяснять, как оценивать статьи. Многие графики реализованы в R лучше, чем в других программах и их больше - например мешочный график (bagplot), диаграмма-сито и мозаичная диаграмма (использовать проще, чем в SAS, с которого были портированы).
Для любителей щелкать по всему, что движется мышью - есть R Commander (библиотека Rcmdr) - кстати, на русском.
По поводу литературы, у меня чувство, что книг по R сейчас больше, чем по любому другому статистическому языку (естественно, на английском). Начать можно с официальной документации по R http://cran.r-project.org/doc/manuals/, есть книги, для пересаживающихся с других программ (stata, SAS). Очень хороший сайт для начинающих
http://www.statmethods.net/ - там все по задачам и ориентировано на "пересаживающихся".
Вообще тот факт, что сейчас почти все крупные производители (SAS, SPSS, Statistica) сделали интерфейс с R говорит о многом. А если учитывать, что тот же DCOM модуль, который используется Statistica для связи с R используется для передачи таблиц и результатов в Word, то понятно, что R можно использовать и как генератор отчетов (либо использовать его возможности генерации HTML).

Автор: Игорь 9.04.2011 - 08:21

Для R есть интересная оболочка (frontend). Называется RKWard. В Mandriva Linux легко устанавливается через репозитории. Несколько непривычно только, что модули подгружаются по мере необходимости через Интеренет (автоматически), хотя и достаточно быстро. С другой стороны, через определенное время работы формируется набор только нужных модулей.

Так что учить язык R обычному пользователю вовсе необязательно.

Автор: p2004r 28.04.2011 - 11:33

Цитата(Игорь @ 10.04.2010 - 15:48) *
Нет, я не понимаю. Есть могучий R с дурацким простым текстовым интерфейсом. По сути имеется мощная библиотека программ, для широкого использования народом недоступная. Мы премся от осознания величия данного факта. С другой, разработали бесплатную надстройку для Excel, которая путь ко всей этой могучести для широких масс открывает (даже для тех, кто честно Excel не имеет - есть версия для OpenOffice.org). Мы не приветствуем данного факта, полны скепсиса и Openoffice.org + R даже не замечаем. Нормальные герои всегда идут в обход?


1. я понимаю, что автор сего уже поменял свое мнение, но!

ну это же маразм такую дичь говорить frown.gif

2. R это свервысокоуровневый язык обработки данных (см. APL семейство. J, K.). Никакой графический интерфейс _никогда_ не сравнится с эффективностью языка созданного для конкретной предметной области (DSL). Кроме того в R есть возможность работать с графическим интерфейсом.

3. Инвестиции в изучение R (в отличие от изучения "чёрных ящиков" от коммерсантов, работоспособность которых доказывается в виде тестов. Это отдельный большой вопрос как можно использовать в науке непрозрачно работающие вещи) оправданы в любом возрасте. Ценность полученных знаний не подвержена девальвации, полученные навыки сохранят ценность и риск невостребованности сведен к минимуму какой только можно представить.

4. Скорость работы над документами-отчетами благодаря литературному программированию (Sweave, odfWeave) возрастает _на_порядок_.

5. Насчет построения графиков тоже неправда. ggplot, lattice делают построение сложнейших графиков простым процессом. Но если кто то хочет "как в экселе", можно написать самому сколь угодно низкоуровнево любой некорректный график.

Автор: p2004r 28.04.2011 - 11:41

Цитата(Игорь @ 7.05.2010 - 15:15) *
"Отлично". Кто-то после такого захочет R?



А что имелось ввиду?

по теме топика перевод на русский Введения в R http://m7876.wiki.zoho.com/Introduction-to-R.html?pid=78912000000002015

Автор: Pinus 2.09.2011 - 06:09

Часто ли встречаются статьи в серьезных зарубежных журналах, в которых статобработка сделана в R? Мне что-то все время попадаются с SAS. Может у кого есть опыт публикаций в журналах, входящих в международные базы цитирования? Как там статьи с R? Принимают?
Подходит вроде к концу моя эпопея с диссером, и вот на досуге стал задумываться о том, что дальше. Думаю уходить от всяких Statistica, и в общем хочется за что-то уцепиться, чтобы на далекую-далекую перспективу. Как говаривает мой отец: чтобы потолка не было. Короче говоря, прошу совета.

Автор: Игорь 2.09.2011 - 13:10

Просмотрел еще раз тему. Интересно побеседовали. Посетил ссылку (была выше) http://rcom.univie.ac.at/. Разработчики это время на месте не стояли. Очень занятно. Был такой проект - AtteStat. Использовал электронные таблицы как базу для ввода-вывода. Авторы сделали то же для R, причем, по их утверждению, поддерживаются все значимые проприетарные и бесплатные электронные таблицы для всех операционных систем. Похоже, это не единственный, но правильный подход.

Потестирую в LibreOffice под Ubuntu.

Автор: Игорь 7.09.2011 - 06:28

Цитата(Игорь @ 2.09.2011 - 14:10) *
Потестирую в LibreOffice под Ubuntu.

Протестировал. В результате прошу дезавуировать все вышеприведенные мои рассуждения (иногда не в меру эмоциональные), ибо все разработки означенных авторов либо в принципе неработоспособны (OpenOffice etc под всеми ОС), либо никакого практического смысла не имеют, хотя и интересны как теоретические изыскания по передаче данных между программами и как реализация фронт-энд решений.

Автор: p2004r 28.09.2011 - 11:55

Цитата(Игорь @ 7.09.2011 - 05:28) *
Протестировал. В результате прошу дезавуировать все вышеприведенные мои рассуждения (иногда не в меру эмоциональные), ибо все разработки означенных авторов либо в принципе неработоспособны (OpenOffice etc под всеми ОС), либо никакого практического смысла не имеют, хотя и интересны как теоретические изыскания по передаче данных между программами и как реализация фронт-энд решений.


1) всё это очень интересно, но почему Вас не устроил обычный способ встраивания R в эксель и ворд? все страждущие "графического интерфейса" полностью удовлетворены таким вариантом.


2) что за обобщения на основании что Вам не удалось разобраться в работе какой то там свободной программы? как это могло свидетельствовать о самом R? никакой логики я не вижу.

3) язык R крайне прост и крайне эффективен в использовании. доступен любому человеку которому по силам осознанно пользоваться статметодами. если человек не способен написать одну строчку (больше не надо в 99% случаев) на R, то это так же уверенно свидетельствует о неспособности его разобраться в применении статметода который ему надо посчитать.

Все что нужно что бы начать пользоваться R прочитать руководство пользователя (и оно есть на русском).

Автор: p2004r 28.09.2011 - 11:57

Цитата(Pinus @ 2.09.2011 - 05:09) *
Мне что-то все время попадаются с SAS.


... ну так R встроен в последние версии всех коммерческих пакетов. Это по моему является достаточным аргументом.

Автор: Pinus 30.09.2011 - 10:48

Цитата(p2004r @ 28.09.2011 - 19:57) *
... ну так R встроен в последние версии всех коммерческих пакетов. Это по моему является достаточным аргументом.

Ничего не имею против R. Я несколько о другом. Положим некто захотел опубликовать статью в серьезном зарубежном журнале, входящем в международные базы цитирования. Не будет ли использование R (а не, скажем, SAS) являться минусом, и не повлияет ли это на решение редакции журнала о принятии статьи к публикации.

Автор: p2004r 30.09.2011 - 11:08

Цитата(Pinus @ 30.09.2011 - 09:48) *
Ничего не имею против R. Я несколько о другом. Положим некто захотел опубликовать статью в серьезном зарубежном журнале, входящем в международные базы цитирования. Не будет ли использование R (а не, скажем, SAS) являться минусом, и не повлияет ли это на решение редакции журнала о принятии статьи к публикации.


Например существуют такие ресурсы http://sas-and-r.blogspot.com/ из которых очевидно что повлияет только положительно.

Все же попробую сформулировать еще раз --- R уже _интегрирован_ в SAS http://support.sas.com/rnd/app/studio/Rinterface2.html. Так что вопрос безоснователен, используя последнюю версию SAS фактически используешь и встроенный R.

Вот что говорит представитель SAS на странице официальной поддержки

?R is a leading language for developing new statistical methods,? said Bob Rodriguez, Senior Director of Statistical Development at SAS. ?Our new PhD developers learned R in their graduate programs and are quite versed in it.?

?This is just the first step,? said Radhika Kulkarni, Vice President of Advanced Analytics. ?We are busy working on an R interface that can be surfaced in the SAS server or via other SAS clients. In the future, users will be able to interface with R through the IML procedure.?

Автор: Pinus 3.10.2011 - 02:55

Спасибо за ссылки, p2004r. Убеждаюсь.

Автор: TheThing 27.11.2011 - 00:26

Лично мне очень нравится RStudio - интегрированная среда разработки (IDE), бесплатная. Все пишется ручками как и в консоли оригинала, только очень удобная подсветка синтаксиса, подсказки по командам и т.д. Для тех, кто желает попробовать, есть неплохая книга на англ. - Getting started with RStudio, погуглите.



Автор: p2004r 27.11.2011 - 11:35

Цитата(TheThing @ 27.11.2011 - 00:26) *
Лично мне очень нравится RStudio - интегрированная среда разработки (IDE), бесплатная. Все пишется ручками как и в консоли оригинала, только очень удобная подсветка синтаксиса, подсказки по командам и т.д. Для тех, кто желает попробовать, есть неплохая книга на англ. - Getting started with RStudio, погуглите.




да, для виндовс хороший вариант... у неё есть килер фича работы в качестве веб сервера, установив на 64 битный линукс с хорошим райд массивом R студию с любого другого компьютера можно добираться до него через интернет и обрабатывать тяжелые данные (дополнительный плюс: не надо поддерживать R в актуальном состоянии на всех компьютерах на которых приходится работать, например ситуация дисплейного класса).

но дополнение команд лучшее чем есть в _любом_ IDE, это клавиша TAB в консоли R. она дополняет/показывает варианты практически везде. по крайней мере те из сред которые пытаются формировать дополнение внутри себя проигрывают встроенному.

Автор: TheThing 27.11.2011 - 11:48

Цитата(p2004r @ 27.11.2011 - 11:35) *
да, для виндовс хороший вариант...


Мне кажется, что это неплохой вариант и для Mac и для Ubuntu smile.gif

Автор: p2004r 27.11.2011 - 12:05

Цитата(TheThing @ 27.11.2011 - 11:48) *
Мне кажется, что это неплохой вариант и для Mac и для Ubuntu smile.gif


там где нетрудно поддерживать среду разработки emacs надо ставить emacs.

компромиссы неуместны smile.gif

а серьезно: 1) код R интегрируется не только в Sweave, но и в org-mode 2) в код R приходится вставлять код других инструментов.

все это в сумме дает только emacs, и профессионально имеет смысл тратить время только на него.

Автор: chadin 13.02.2013 - 16:54

Не смог удержаться от своих 5 копеек в вашу рублевую беседу.

1. На вопрос PantheraBagira "Есть ли какой-нибудь самоучитель по программированию в языке R"
Короткий ответ: Шипунов "Наглядная статистика. Используем R!" - можно купить на Озоне. Не дорого.
Более развернутый ответ по литературе можно найти здесь: http://r-analytics.blogspot.ru/p/blog-page_20.html

2. Не верьте тем, кто говорит о запредельной, недосягаемой сложности интерфейса командной строки в R. Это брехня. После того, как поймешь основные принципы (1-2 дня работы с учебником), то освоить любой вид статистических расчетов в R будет делом 5-10 минут. Это при условии наличия знаний по этим статистическим методам. Если есть пробелы в понимании статистики, то освоение займет больше времени, но зато одновременно подтянешь и теоретические знания и освоишь практический навык.

3. Попал на этот форум когда искал как рассчитать незивестную для меня статистику - критерий Дарбина-Уотсона. Читаю на форуме:

Цитата
Вот, например, как считают критерий Дарбина-Уотсона в R: http://hosho.ees.hokudai.ac.jp/~kubo/Rdoc/...bin.watson.html Неслабо?

Человек сам себя пугает выдержками из технической документации. Для чтения такого типа текстов нужны навык и привычка. Многие обходятся без этого. Читают только учебные пособия или спрашивают у коллег.

Вот сколькоо букв мне понадобилось набрать, чтобы рассчитать этот критерий для моей модели:
Код
install.packages("car")
library(car)
durbinWatsonTest(my.model)

Первую строчку нужно набрать один раз за все время пользования программой R на конкретной машине
Вторую строчку нужно набрать один раз за сеанс работы
Третья строка собственно рассчитывает критерий Дарбина-Уотсона

Вот что мне ответил R:

Код
lag Autocorrelation D-W Statistic p-value
   1       0.1174143      1.739768   0.296
Alternative hypothesis: rho != 0


Ребята, "Используйте R!"

Автор: DrgLena 13.02.2013 - 18:04

Цитата(chadin @ 13.02.2013 - 17:54) *
Не смог удержаться от своих 5 копеек в вашу рублевую беседу.
Ребята, "Используйте R!"

Так никто и не против, только зачем нужен этот пламенный призыв и демонстрация своего кода в теме годичной давности. Свои 5 коп можно внести в более свежую ветку aspir_h и продемонстрировать свой код к задачке из учебника, когда данные задаются как табличка 2хk

Автор: nokh 24.07.2013 - 14:23

Наткнулся на разработку оставившего нас на произвол судьбы уважаемого модератора, которая осталась незамеченной на форуме. Набор функций R для быстрого решения наиболее востребованных задач медицинской статистики.
Статья: http://medobr.ru/jarticles/142.html?SSr=4101332ba4144edbb9c627c__4eda3979
Разработка (методический материал): http://osdm.org/instrumenty/

Автор: user973 3.08.2013 - 14:11

написал код - все работает, создаю окружение, в которое гружу свой код. При вызове функции - ошибка
> my_env <- new.env(parent=baseenv())
> sys.source(file='my_code.R',envir=my_env)
> evalq(my_function(fileIn='dateIn.log', fileOut='dataOut.log'), envir = my_env)
Ошибка в8345231(expr, envir, enclos) : не могу найти функцию "model.frame"

Сравнивал search(), searchpaths(), loadedNamespaces() - все одинаково. Правда в созданном окружении нужно дописывать stats::predict(model,data), иначе predict(model,data) не хочет работать и падает с ошибкой что не может найти функцию predict.

Автор: user973 3.08.2013 - 15:00

добавил require(), чтобы загрузить пакеты, но это не изменило ситуацию.

Автор: user973 4.08.2013 - 09:19

хорошие новости: в среде R - код работает, при вызове R из тестовой проги - работает.
плохие: в боевом проекте не работает :(

что делал? выключал комп на ночь :) больше изменений нет.

Автор: user973 4.08.2013 - 10:41

в итоге: надо читать мануалы, они рулез.
e1 <- new.env(parent = baseenv()) # this one has enclosure package:base.
боевом проекте переделал на
e1 <- new.env()
и все взлетело, даже не сразу заметил что в R и тестовом проекте уже использовал только new.env().

ну и еще вопрос, который можно неспешно обсудить: как у R с многопоточностью под виндой? интересно как для центрального процессора (CPU), так и для графических мультипроцессоров (или шейдерные процы или GPU). Не, я понимаю что на линуксах оно все работает, но чего-то лениво портировать эту беду на венду.

Автор: nokh 6.08.2013 - 10:19

Цитата(user973 @ 4.08.2013 - 13:41) *
в итоге: надо читать мануалы, они рулез.
e1 <- new.env(parent = baseenv()) # this one has enclosure package:base.
боевом проекте переделал на
e1 <- new.env()
и все взлетело, даже не сразу заметил что в R и тестовом проекте уже использовал только new.env().

ну и еще вопрос, который можно неспешно обсудить: как у R с многопоточностью под виндой? интересно как для центрального процессора (CPU), так и для графических мультипроцессоров (или шейдерные процы или GPU). Не, я понимаю что на линуксах оно все работает, но чего-то лениво портировать эту беду на венду.

Вопрос не имеет отношения к тематике сайта, а также спецов здесь не много: раз быстро не ответили, значит пока заняты. Лучше переспросите здесь:
http://r-statistics.livejournal.com/
или здесь:
http://molbiol.ru/forums/index.php?showtopic=102724

Автор: user973 6.08.2013 - 13:32

1) оповещение на почту по факту ответа не пришло, странно, вроде подписывался на ответы,
2) а отквоченный вопрос не требует спешного обсуждения, так что могу подождать.

upd1: теперь пришло

Автор: p2004r 10.08.2013 - 18:23

Цитата(user973 @ 3.08.2013 - 14:11) *
написал код - все работает, создаю окружение, в которое гружу свой код. При вызове функции - ошибка
> my_env <- new.env(parent=baseenv())
> sys.source(file='my_code.R',envir=my_env)
> evalq(my_function(fileIn='dateIn.log', fileOut='dataOut.log'), envir = my_env)
Ошибка в8345231(expr, envir, enclos) : не могу найти функцию "model.frame"

Сравнивал search(), searchpaths(), loadedNamespaces() - все одинаково. Правда в созданном окружении нужно дописывать stats::predict(model,data), иначе predict(model,data) не хочет работать и падает с ошибкой что не может найти функцию predict.


зачем этот "закат солнца вручную"?

Автор: user973 11.08.2013 - 07:48

т.е. почему код выполняется в окружении? а в самописной программе происходит однократный запуск R, а потом вызов нужных функций из разных мест. Чтобы данные не пересекались, заворачиваю в окружения.

Автор: p2004r 11.08.2013 - 11:36

Цитата(user973 @ 11.08.2013 - 07:48) *
т.е. почему код выполняется в окружении? а в самописной программе происходит однократный запуск R, а потом вызов нужных функций из разных мест. Чтобы данные не пересекались, заворачиваю в окружения.


А что, Rserve порождает оверхед при использовании?

и почему не ?with используется? он вроде именно для этого случая предназначен.

Автор: user973 12.08.2013 - 19:19

Про Rserve ничего не знал, теперь надо будет перебросить не срочные расчеты. Спасибо за инфу про полезную фичу.
А with не используется потому что evalq нашел первым - работает и ладно.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)