Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V   1 2 3 > »   
Добавить ответ в эту темуОткрыть тему
> R language
PantheraBagira
сообщение 1.04.2010 - 21:18
Сообщение #1





Группа: Пользователи
Сообщений: 8
Регистрация: 11.05.2009
Пользователь №: 6122



Дорогие коллеги!
Подскажите, пожалуйста, есть ли какой-нибудь самоучитель по программированию в языке R, кроме того, который зашит в самой программе. Например на русском языке или с примерами медицинской статистики?...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 2.04.2010 - 16:09
Сообщение #2





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(PantheraBagira @ 1.04.2010 - 21:18) *
самоучитель по программированию в языке R на русском языке?...
Сам я не разбирался, но вот тут:
http://herba.msu.ru/shipunov/software/r/r-ru.htm
есть документы и статьи про R.



Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 3.04.2010 - 10:04
Сообщение #3





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Основная часть материалов по R, как и по всем остальным свободным проектам (Linux etc), это - 99% непродуктивных перекрестных ссылок и ссылок на какую-нибудь чушь (типа на форуме задают вопрос, а в ответ получают ссылку на книгу или на тот же сайт R), в чем апологеты свободного ПО далеко превзошли даже Microsoft.

Во всех материалах по R (из того 1%, который достоин, чтобы с ним ознакомиться) есть пара существенных, по моему мнению, недостатков, которые роднят его с коммерческими ударно-нажимными пакетами:

1. Отсутствие вменяемых описаний алгоритмов абсолютно со всеми формулами (т.е. повторить программу по данному описанию, не привлекая иных источников, нельзя). Все сделано для того, чтобы максимально затруднить проверку программ на их адекватность. Даже до библиотеки NAG не дотягивает.
2. Отсутствие ссылок на доступные научные исходные ресурсы (статьи и т.п.). Т.е., все ссылки - на статьи, доступные только за большие деньги исключительно в издательствах или коммерческих хранилищах, на книги, описание попыток ознакомиться с которыми - целая отдельная история.

Первого свойства лишены только SAS и StatXact. Пакет AtteStat близок к решению данной проблемы, но по ряду модулей работы еще много - есть хотя бы стремление.

Второе свойство подтверждает, что R - не совсем свободная и совсем не бесплатная затея - это типичный насос для выкачивания денег, причем гораздо более циничный, чем любое коммерческое предприятие, искажающий саму прекрасную идею свободности ПО. Вот решили мы, например, посчитать (и исследовать) критерий Дарбина-Уотсона в R. Нам предлагается идиотское скромное описание и только одна ссылка на себя любимого: Fox J. Applied Regression Analysis, Linear Models, and Related Methods. - Sage, 1997. Книги, естественно, нет в свободном доступе (но есть куча ссылок на коммерческие издания по R данного автора). Нет ее и в файлообменных сетях. Ее можно только купить. Причем очень дорого. Похоже на то, что вам дают бесплатно ручку для бритвы, а потом за чудовищные деньги предлагают купить лезвия для нее.

Так что весьма странно видеть все эти "залипухи" в якобы свободном пакете для гурманов. Почему гурманов? У нас уже в 1989 году для расчетных программ был, хотя и самодельный, но какой-никакой текстовый пользовательский интерфейс с меню, полями ввода данных, поддержкой мыши. А в 1990 году - даже и графический (на смеси Фортрана, Ассемблера и Си!). Работать из текстовой строки в 2010 году разумно ли? Этот метод общения с программой никогда не получит широкого распространения среди пользователей. Хотя один положительный момент имеется - на дальних подступах отсекается "халява".

Вот, например, как считают критерий Дарбина-Уотсона в R: http://hosho.ees.hokudai.ac.jp/~kubo/Rdoc/...bin.watson.html Неслабо?

Так что, уважаемые, купите для конторы SAS и забудьте все остальное как дурной сон.

Сообщение отредактировал Игорь - 4.04.2010 - 09:16


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
PantheraBagira
сообщение 8.04.2010 - 19:31
Сообщение #4





Группа: Пользователи
Сообщений: 8
Регистрация: 11.05.2009
Пользователь №: 6122



Спасибо, Игорь! За очень пространный и аргументированный ответ на мой вопрос. До сегодня я все рассчеты проводила (большую их часть) в Statistica. Но некоторый ажиотаж вокруг R заставил меня чувствовать некоторую ущербность. В связи с этим, я бы хотела разобраться в нем, чтобы понимать суть. Как позиционируют его любители - что он очень гибкий, и ты сам задаешь порядок рассчетов. что-то вроде крутого калькулятора получается. В то время как, в стат пакетах зашиты только конкретные жесткие алгоритмы, и если ты в них не вписываешься, то извиняйте. Это так?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 8.04.2010 - 21:09
Сообщение #5





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(PantheraBagira @ 8.04.2010 - 20:31) *
Но некоторый ажиотаж вокруг R заставил меня чувствовать некоторую ущербность
Чем отличается R от других стат.пакетов - взгляд дилетанта. Представьте себе, что вам нужно подарить на день рождения подруги (тоже пантеры) какой-нибудь модный гаджет (это такая электронная штуковина). Что вам делать, куда идти за покупкой? Есть два варианта решения этой проблемы:
1. Метаться по маленьким магазинчикам на рынке, выспрашивая продавцов о достоинствах того или иного товара. В отдельном павильончике-закуточке будет в наличии лишь ограниченный набор электроники. Чтобы получить полное представление об ассортименте, Вам придется полдня бегать по рынку, но в конце концов вы так и не сможете найти прибор, удовлетворяющий всем вашим требованиям . Но есть лучший способ:
2. Зайти в большой супер-маркет (программа R). Там лежит огромное количество отобранного, качественного товара (методов) на любой вкус по сниженным ценам. Вы всегда найдете то, что Вам нужно в одном месте!

Сообщение отредактировал DoctorStat - 8.04.2010 - 21:12


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 9.04.2010 - 04:41
Сообщение #6





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(DoctorStat @ 9.04.2010 - 00:09) *
2. Зайти в большой супер-маркет (программа R). Там лежит огромное количество отобранного, качественного товара (методов) на любой вкус по сниженным ценам. Вы всегда найдете то, что Вам нужно в одном месте!

Огромное количество - да, качественное - не всегда, на любой вкус - нет, всегда найдёте нужное - нет.
Мой опыт "нет" касается в первую очередь графического представления результатов. Если речь идёт не о простеньких гистограммах и скаттерграммах - дела плохи. Что авторы пакета закрепили за командой - то и получайте. Да и с гистограммами всё нужно описать руками: толщину линий, цвета, шрифты. Мне удобнее это делать кликая мышкой. Во-вторых, я долго искал аналог нелинейного анализа главных компонент по алгоритму CatPCA из SPSS и не нашёл, нашёл только брошенную на пол-пути библиотеку Gifi ещё для первой версии R в которую автор планировал его вставить. Искал метод обработки данных с цензурированными наблюдениями типа "менее чем" и нашёл только один крупный и авторитетный пакет, но результаты которого по этому методу не совпали с результатами старой DOS-овской программы и с моим ручным расчётом. Поэтому, в-третьих, пусть и не столь категорично как Игорь, имею претензии к качеству пакетов или к неполноте их описания (возможно, если бы искал там формулы - претензий было бы гораздо больше).

>Panthera
Теперь о плюсах.
(1) Все распространённые методы включены в большое количество программ, где зачастую расчёты по ним проводить удобнее чем в R либо выдача результата качественнее. Но зато почти вся экзотика - в R. "Почти" - т.к. кое-что программируется энтузиастами SAS и SPSS и эти коды можно найти в сети. Среди этой экзотики встречаются перлы, которые хотелось бы "взять на вооружение", но незнание языка R не позволяет свободно с ними обращаться. В этом случае действительно некоторая ущербность ощущается.
(2) Комбинация методов. Ни один кнопочный интерфейс никогда не предоставит возможности комбинировать методы. А уж если учиться их программировать на каком-то языке - то лучше на бесплатном. О популярности R говорит хотя бы то, что последние версии SPSS поддерживают код R. Из личного. Хотел провести анализ главных компонент с бутстрепом - оказалось есть подводные камни в виде смены знаков в биполярных факторах и изменения порядка следования главных компонент. Получается, что в анализ нужно включать прокрустово преобразование. Т.к. сделать это в R можно, а я не умею - есть уже явное чувство ущербности. Если в студенчестве и аспирантуре такие задачи брались многодневным штурмом, то сейчас всё время что-то мешает: лень, усталость, другие дела... Если чувствуете в себе силы - штурмуйте! По сугубо личному опыту - есть какое-то качественное отличие самообразования примерно до 25-30 лет и после. Если бы знал это - постарался бы побольше тогда в себя впихнуть.

Задать вопросы по R знающим людям и лично нашему главному её популяризатору Шипунову (plantago) можно здесь:
http://molbiol.ru/forums/index.php?showtopic=102724

Сообщение отредактировал nokh - 9.04.2010 - 05:24
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 9.04.2010 - 13:28
Сообщение #7





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DoctorStat @ 8.04.2010 - 22:09) *
... лежит огромное количество отобранного, качественного ...

Может, и лежит. Может, и огромное количество. И даже отобранное у кого-то. Но вот непонятно, откуда взялся миф о непревзойденном качестве этого огромного количества?

С подачи уважаемого Н.Н. Хромова-Борисова мы тестировали на данном форме ДИ для отношения что-то типа 1 млн. мальчиков к 2 млн. мальчиков+девочек. И с тестом справилась только одна программа (знаем, какая), и то после небольшой доработки. Если SAS и SPSS тестируют десятки лет сотни тысяч профессионалов, а в разработке участвуют сотни докторов наук, не может собранная на коленке студенческая поделка быть лучше. Не верю.

Сообщение отредактировал Игорь - 9.04.2010 - 13:28


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 9.04.2010 - 22:16
Сообщение #8





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



PantheraBagira, задала вполне конкретный вопрос о русскоязычных источниках обучения работы на R, получила чисто одесские ответы типа, а оно вам надо? Есть же AtteStat и SAS. Могу ответить участникам дискуссии НАМ это надо. Обычно мы любим те программы, которые хорошо знаем и не любим то, что не знаем. Но по мере познания и любовь появляется. Могу предложить англоязычный источник, который сопровождает лицензионную программу Statistica 9, мне он помог и эта программа c интеграцией R (версии выше 2.8.1) нравится мне все больше и больше.
Вопросы возникли к участникам дискуссии, какая именно версия SPSS работает с R и какие конкретные глюки имеет R?

Прикрепленные файлы
Прикрепленный файл  R_Integration_White_Paper.pdf ( 1,31 мегабайт ) Кол-во скачиваний: 1007
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 10.04.2010 - 09:41
Сообщение #9





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(DrgLena @ 10.04.2010 - 01:16) *
PantheraBagira, задала вполне конкретный вопрос о русскоязычных источниках обучения работы на R, получила чисто одесские ответы типа, а оно вам надо?

Вопрос, конечно, конкретный, но уж больно чудной. 1) на русском, 2) с медицинскими примерами и 3) и ещё чтобы сразу вшит был. И чтобы ещё симпатичный преподаватель приезжал на дом в удобное время и консультировал бесплатно laugh.gif
Ну а если только конкретный ответ, то: нет таких самоучителей! и ТЕМУ МОЖНО ЗАКРЫВАТЬ!
Цитата(DrgLena @ 10.04.2010 - 01:16) *
Вопросы возникли к участникам дискуссии, какая именно версия SPSS работает с R и какие конкретные глюки имеет R?

Говорят с 16-ой: http://insideout.spss.com/2009/01/13/spss-statistics-and-r/
Про глюки не особо в теме, т.к. мало использую. Но, скажем, бутстреп-оценки 95%-ных ДИ для одного своего набора данных (около 15-20 наблюдений, ничего особенного) смог получить почему-то только в одном пакете из 3 опробованных, с тех пор его и использую (библиотека boot, модуль boot.ci). С цензурированными наблюдениями (см. выше) использовал пакет NADA, почему не сошлось не разбирался, использую программу с которой сошлось.

Сообщение отредактировал nokh - 10.04.2010 - 09:51
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 10.04.2010 - 09:56
Сообщение #10





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Мы же не садисты, а ученые. Ну поиронизировали, а потом дело скажем.

Изучать новое для себя, конечно, полезно. С R злую шутку сыграло его имя - поисковые машины отказываются искать источники - слишком мало букв, надо чем-то дополнять. Яндекс дает ссылки по поиску на "язык R" (без кавычек).

Начать можно с Википедии, хотя часть ссылок с нее - битые. Источников мало. Вот этот, вроде, содержательный. И примеры, и картинки: http://zoonek2.free.fr/UNIX/48_R/all.html

Также тут: http://www.machinelearning.ru/wiki/index.php?title=R

Неожиданно (для себя) нашел очень неплохие материалы (на русском языке) на сайте компании IBM. А именно - 3 душевные статьи:
Часть 1: http://www.ibm.com/developerworks/ru/library/l-r1/index.html
Часть 2: http://www.ibm.com/developerworks/ru/library/l-r2/index.html
Часть 3: http://www.ibm.com/developerworks/ru/library/l-r3/index.html

См. также ссылки из всех материалов. Так можно "накрутить" порядочное количество содержательных материалов.

Плотно погрузившись в R, конечно, через n-е количество времени можно достичь значимых результатов (мне с 30-летним опытом программирования это удалось бы - не сразу, т.к. все сложно, но дней через 4-5). Но, если честно, не думаю, что это нужно человеку, задающему вопрос: "Подскажите, пожалуйста, есть ли какой-нибудь самоучитель".

Сообщение отредактировал Игорь - 10.04.2010 - 10:05


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 10.04.2010 - 10:04
Сообщение #11





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Nokh, спасибо большое, я не знала про эти возможности SPSS, хотя эта версия есть.
Игорь, спасибо, хорошее продолжение тамы.

Сообщение отредактировал DrgLena - 10.04.2010 - 10:08
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 10.04.2010 - 10:11
Сообщение #12





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DrgLena @ 10.04.2010 - 10:04) *
Nokh, Спасибо большое, я не знала про эти возможности SPSS, хотя эта версия есть.

Уважаемая DrgLena, я думаю, что общественности интересным было бы использование R из Excel. Или не прав?

Такая возможность есть

Обзор http://en.wikipedia.org/wiki/RExcel
Сайт для загрузки http://rcom.univie.ac.at/
Еще тут: http://www.r-project.org/useR-2006/Slides/BaierEtAl.pdf
И тут: http://citeseerx.ist.psu.edu/viewdoc/downl...p1&type=pdf
Кино тут http://www.statconn.com/

Обратим внимание - оно также и для OpenOffice.org. Хороший аргумент против покупки коммерческих программ за бюджетные деньги.

Совсем прекрасно - в электронном виде встречается книга Heiberger R., Neuwirth E. R Through Excel, Springer Verlag 2009.

Сообщение отредактировал Игорь - 10.04.2010 - 10:37


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 10.04.2010 - 11:36
Сообщение #13





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Да, общественности, конечно, можно и exel (но его тоже нужно купить).
Я полный профан в exel, но AtteStat осилила. Так получилось, что статистикой я стала заниматься с досовских времен. А не так давно, институт купил мне однопользовательскую версию Statistica 9, а там R, нужно идти вперед. Но, как справедливо заметил Nokh, с возрастом процесс обучения тормозится, и это несмотря на увеличение ресурсов для обучения.
И я совсем не против, чтобы институты покупали коммерческие программы в том числе и статистические, это становится уже правилом хорошего тона (или многолетней борьбы). Но в рамках выполнения квалификационной работы необходимо освоить доступные средства анализа собственных данных, даже крутым хирургам, а не спрашивать на форуме, как посчитать достоверность в SPSS.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 10.04.2010 - 16:48
Сообщение #14





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Нет, я не понимаю. Есть могучий R с дурацким простым текстовым интерфейсом. По сути имеется мощная библиотека программ, для широкого использования народом недоступная. Мы премся от осознания величия данного факта. С другой, разработали бесплатную надстройку для Excel, которая путь ко всей этой могучести для широких масс открывает (даже для тех, кто честно Excel не имеет - есть версия для OpenOffice.org). Мы не приветствуем данного факта, полны скепсиса и Openoffice.org + R даже не замечаем. Нормальные герои всегда идут в обход?

Сообщение отредактировал Игорь - 10.04.2010 - 16:49


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 10.04.2010 - 19:05
Сообщение #15





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Игорь @ 10.04.2010 - 16:48) *
Нет, я не понимаю.

Жаль.
Цитата(Игорь @ 10.04.2010 - 16:48) *
По сути имеется мощная библиотека программ,

Это верно. И можно лично ее расширить.
Цитата(Игорь @ 10.04.2010 - 16:48) *
Мы премся от осознания величия данного факта.

Глагол не понятен.
Цитата(Игорь @ 10.04.2010 - 16:48) *
С другой, разработали бесплатную надстройку для Excel, которая путь ко всей этой могучести для широких масс открывает.

Я очень приветствую данный факт. Но широкие массы имеют право выбора, кто то может отдать предпочтение и Openoffice.org + R.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V   1 2 3 > » 
Добавить ответ в эту темуОткрыть тему