Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Анализ медицинских данных в R и SAS
hot_assay
сообщение 26.03.2014 - 17:47
Сообщение #1





Группа: Пользователи
Сообщений: 5
Регистрация: 26.03.2014
Пользователь №: 26244



Здравствуйте!
Буду благодарен за рекомендации по использованию R и SAS в анализе данных клинических исследований (хотя бы минимальные, общего характера, с учётом того, что пользователю, привыкшему к Graphical user interface, нужно въехать в специфику рассматриваемо ПО laugh.gif )) . Интересуют преимущества данных систем по сравнению с другими (например, Statsoft STATISTICA). Какие модули необходимо иметь для решения медицинских задач? Заменяют ли R и SAS друг друга в плане фукционала? Отдельное спасибо за ссылки с практическими примерами по рассматриваемому вопросу.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 26.03.2014 - 18:56
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(hot_assay @ 26.03.2014 - 17:47) *
Здравствуйте!
Буду благодарен за рекомендации по использованию R и SAS в анализе данных клинических исследований (хотя бы минимальные, общего характера, с учётом того, что пользователю, привыкшему к Graphical user interface, нужно въехать в специфику рассматриваемо ПО laugh.gif )) . Интересуют преимущества данных систем по сравнению с другими (например, Statsoft STATISTICA). Какие модули необходимо иметь для решения медицинских задач? Заменяют ли R и SAS друг друга в плане фукционала? Отдельное спасибо за ссылки с практическими примерами по рассматриваемому вопросу.


Вы забыли описать что за медицинские задачи предполагается решать.

Что за готовые расширения среды имеются в R лучше всего читать вот тут
http://cran.r-project.org/web/views/

Медицина представлена например http://cran.r-project.org/web/views/ClinicalTrials.html . Хотя есть и фармакокинетика и анализ медицинских изображений различной природы и .... многое другое, вплоть до отдельного репозитария по биоинформатике smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
hot_assay
сообщение 27.03.2014 - 05:34
Сообщение #3





Группа: Пользователи
Сообщений: 5
Регистрация: 26.03.2014
Пользователь №: 26244



Цитата(p2004r @ 26.03.2014 - 19:56) *
Вы забыли описать что за медицинские задачи предполагается решать.

Спасибо за ссылки!
В том-то и дело, что не хотелось акцентировать внимание на каких-то частных задачах, меня интересует универсальность указанного выше ПО. Навскидку - стандартный набор инструментов (описательная статистика, таблицы сопряжённости, дисперсионный анализ, непараметрика и т.п.), многомерные методы, биоэквивалентность и фармакокинетическое моделирование (+графические возможности в плане построения кинетических кривых). И всё-таки: что лучше - R или SAS? (по совокупности критериев - универсальность, удобство работы и т.д.)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 27.03.2014 - 09:59
Сообщение #4





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(hot_assay @ 27.03.2014 - 06:34) *
И всё-таки: что лучше - R или SAS? (по совокупности критериев - универсальность, удобство работы и т.д.)
SAS - всеми признанный пакет для статистических расчетов, а R - пакет программ, написанный студентами в перерыве между лекциями.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 27.03.2014 - 10:44
Сообщение #5





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251




1) Первая и, наверное, самая главная причина, почему люди предпочитают SAS - это история, традиция и привычка. SAS работает начиная с 1970 года, R - значительно моложе. За эти годы в фармацевтических компаниях и банках было написано столько кода, что придется потратить десятилетия, чтобы переписать это на R. Никто этого делать не будет, поэтому все "серьезные" организации и конторы с историей работали и будут работать в SAS.

2) Качество литературы все таки на голову выше в SAS - про R в последние годы вышло довольно много хороших книг, однако в целом, еще не дотягивает до SAS - если в R отдельные книги хороши, то в SAS каждая книга - шедевр.

3) Функционал R поразительно возрастает с помощью пакетов, однако есть обалденные пакеты, а есть - откровенная лажа, поэтому Вам необходимо искать и хорошо искать, чтобы быть уверенным в корректном анализе. За качество функционала SAS отвечает SAS Institute - монстр с многолетней историей.

4) Для анализа данных за последние 15 лет, которые могут занимать несколько десятков гигабайт, в SAS можно обработать на машине с 4 Гб памяти, R - все данные хранит в ОЗУ, поэтому здесь могут возникнуть проблемы. И хотя есть обходные пути, которые позволяют обработать данные в R, которые занимают больше памяти, чем имеется на машине, над этим приходится шаманить, а в SAS все работает out-of-the-box.

5) Если в R что-то полетит или однажды он сойдет с ума у Вас на компе, разруливать эту ситуацию и форматировать жесткий диск будете Вы сами, а в SAS Вам всегда окажут техническую помощь в любое время суток SAS Institute.

6) SAS имеет несколько корявый синтаксис, но это дело привычки - за 30 лет пользования Вы этого не заметите.

7) Вы в курсе про стоимость SAS?

Не сочтите за рекламу SAS - сам пользуюсь и буду сидеть на R laugh.gif

Сообщение отредактировал TheThing - 27.03.2014 - 10:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.03.2014 - 10:52
Сообщение #6





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(DoctorStat @ 27.03.2014 - 09:59) *
SAS - всеми признанный пакет для статистических расчетов, а R - пакет программ, написанный студентами в перерыве между лекциями.
Наращивание мозгов бесплатно => http://doctorstat.narod.ru


Похоже когда количество мозгов превышает некий критический уровень и становится так просторно, что заводятся виртуалы smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.03.2014 - 10:53
Сообщение #7





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(TheThing @ 27.03.2014 - 10:44) *
1) Первая и, наверное, самая главная причина, почему люди предпочитают SAS - это история, традиция и привычка. SAS работает начиная с 1970 года, R - значительно моложе. За эти годы в фармацевтических компаниях и банках было написано столько кода, что придется потратить десятилетия, чтобы переписать это на R. Никто этого делать не будет, поэтому все "серьезные" организации и конторы с историей работали и будут работать в SAS.

2) Качество литературы все таки на голову выше в SAS - про R в последние годы вышло довольно много хороших книг, однако в целом, еще не дотягивает до SAS - если в R отдельные книги хороши, то в SAS каждая книга - шедевр.

3) Функционал R поразительно возрастает с помощью пакетов, однако есть обалденные пакеты, а есть - откровенная лажа, поэтому Вам необходимо искать и хорошо искать, чтобы быть уверенным в корректном анализе. За качество функционала SAS отвечает SAS Institute - монстр с многолетней историей.

4) Для анализа данных за последние 15 лет, которые могут занимать несколько десятков гигабайт, в SAS можно обработать на машине с 4 Гб памяти, R - все данные хранит в ОЗУ, поэтому здесь могут возникнуть проблемы. И хотя есть обходные пути, которые позволяют обработать данные в R, которые занимают больше памяти, чем имеется на машине, над этим приходится шаманить, а в SAS все работает out-of-the-box.

5) Если в R что-то полетит или однажды он сойдет с ума у Вас на компе, разруливать эту ситуацию и форматировать жесткий диск будете Вы сами, а в SAS Вам всегда окажут техническую помощь в любое время суток SAS Institute.

6) SAS имеет несколько корявый синтаксис, но это дело привычки - за 30 лет пользования Вы этого не заметите.

7) Вы в курсе про стоимость SAS?

Не сочтите за рекламу SAS - сам пользуюсь и буду сидеть на R laugh.gif


"Дед Мороз существует!" ТМ


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.03.2014 - 10:57
Сообщение #8





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(hot_assay @ 27.03.2014 - 05:34) *
Спасибо за ссылки!
В том-то и дело, что не хотелось акцентировать внимание на каких-то частных задачах, меня интересует универсальность указанного выше ПО. Навскидку - стандартный набор инструментов (описательная статистика, таблицы сопряжённости, дисперсионный анализ, непараметрика и т.п.), многомерные методы, биоэквивалентность и фармакокинетическое моделирование (+графические возможности в плане построения кинетических кривых). И всё-таки: что лучше - R или SAS? (по совокупности критериев - универсальность, удобство работы и т.д.)


R универсален настолько насколько универсален язык программирования. Все упомянутые баззворд присутствуют по ссылке, Вам надо только прочитать эти 15 страниц реферата текущих возможностей R. Даже если я прочитаю их ещё раз в слух, это вряд ли Вам поможет smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 27.03.2014 - 12:45
Сообщение #9





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Цитата(p2004r @ 27.03.2014 - 11:53) *
"Дед Мороз существует!" ТМ


Вы не согласны с моими аргументами? Если нет, объясните, пжста, почему smile.gif

А вообще, в русскоязычном комьюнити подобные темы размножаются на многие страницы - это такие же холивары, как какой язык лучше С++ или C#? И пока наши умельцы будут спорить, что лучше R или SAS, профи на западе выучат R+SAS+mysql+немного Perl'a + разбавят Python - это стандартная солянка data scientist за бугром. А если человеку этого всего не нужно в ежедневной работе, то достаточно будет и Экселя.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 27.03.2014 - 12:53
Сообщение #10





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(TheThing @ 27.03.2014 - 11:44) *
Не сочтите за рекламу SAS - сам пользуюсь и буду сидеть на
Ваш комментарий лучший. К сожалению на этом сайте нет "лайков". Вместо лайка прикрепляю сердечко.
Теперь немного негатива про SAS. Это ее цена, на которую обращал внимание участник под ником Игорь, который почему-то перестал появляться на форуме. Купить лицензию SAS можно только на 1 год, потом ее можно продлевать за дополнительную плату. Грубо говоря, через год ваша программа перестает работать и просит денег. Вам это понравится ?

Сообщение отредактировал DoctorStat - 27.03.2014 - 13:26


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
hot_assay
сообщение 27.03.2014 - 16:34
Сообщение #11





Группа: Пользователи
Сообщений: 5
Регистрация: 26.03.2014
Пользователь №: 26244



Всем большое спасибо за информацию!
Возникает резонный вопрос - а какова стоимость R?
Или это free software?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 27.03.2014 - 18:04
Сообщение #12





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Ответ есть не только в сети, но и на этом форуме!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.03.2014 - 22:33
Сообщение #13





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(TheThing @ 27.03.2014 - 12:45) *
Вы не согласны с моими аргументами? Если нет, объясните, пжста, почему smile.gif

А вообще, в русскоязычном комьюнити подобные темы размножаются на многие страницы - это такие же холивары, как какой язык лучше С++ или C#? И пока наши умельцы будут спорить, что лучше R или SAS, профи на западе выучат R+SAS+mysql+немного Perl'a + разбавят Python - это стандартная солянка data scientist за бугром. А если человеку этого всего не нужно в ежедневной работе, то достаточно будет и Экселя.


0. Имея в руках фактически Схему вспоминать о Питоне и прочих перлах просто неприлично (а регексы и так доступны в самом R) smile.gif Потребность в любой базе данных тоже сильно преувеличенна ввиду наличия куда более эффективных возможностей самого R (plyr, reshape & company), скорее понадобится использование mapreduce, чем окаменелого SQL

1. "S is one of several statistical computing languages that were designed at Bell Laboratories, and first took form between 1975?1976." © smile.gif Ну а потыренные возможности из APL представляют собой вообще первые диалоговые многопользовательские системы анализа данных.

2. Что касается размера обрабатываемых данных. а) В R есть возможность не только отправить на обработку данные _любого_ размера, но и дождаться результата данной обработки --- это реализация SPMD. б) вариант "просто запустить на обработку" тоже доступен -- ff: memory-efficient storage of large data on disk and fast access functions и куча аналогов (в этом случае даже синтаксис несколько усложниться, хотя SAS догнать не удастся smile.gif )

3. Что касается вообще идеи проприетарного неизвестного полностью в подробностях своей реализации алгоритма анализа в научной работе... Ну у меня нет слов smile.gif круче только делать ссылки на учебники smile.gif

4. Я _очень_ быстро читаю, но дочитать всю литературу о использовании R я просто физически не в состоянии smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.03.2014 - 22:36
Сообщение #14





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(hot_assay @ 27.03.2014 - 16:34) *
Всем большое спасибо за информацию!
Возникает резонный вопрос - а какова стоимость R?
Или это free software?


это как захочется Вам, все пути открыты smile.gif

или по выше приведенной ссылке на сайт проекта, или http://www.revolutionanalytics.com/


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 28.03.2014 - 11:17
Сообщение #15





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Цитата(p2004r @ 27.03.2014 - 22:33) *
0. Имея в руках фактически Схему вспоминать о Питоне и прочих перлах просто неприлично (а регексы и так доступны в самом R) smile.gif Потребность в любой базе данных тоже сильно преувеличенна ввиду наличия куда более эффективных возможностей самого R (plyr, reshape & company), скорее понадобится использование mapreduce, чем окаменелого SQL

1. "S is one of several statistical computing languages that were designed at Bell Laboratories, and first took form between 1975?1976." © smile.gif Ну а потыренные возможности из APL представляют собой вообще первые диалоговые многопользовательские системы анализа данных.

2. Что касается размера обрабатываемых данных. а) В R есть возможность не только отправить на обработку данные _любого_ размера, но и дождаться результата данной обработки --- это реализация SPMD. б) вариант "просто запустить на обработку" тоже доступен -- ff: memory-efficient storage of large data on disk and fast access functions и куча аналогов (в этом случае даже синтаксис несколько усложниться, хотя SAS догнать не удастся smile.gif )

3. Что касается вообще идеи проприетарного неизвестного полностью в подробностях своей реализации алгоритма анализа в научной работе... Ну у меня нет слов smile.gif круче только делать ссылки на учебники smile.gif

4. Я _очень_ быстро читаю, но дочитать всю литературу о использовании R я просто физически не в состоянии smile.gif


0. Питон + Pandas могут обрабатывать огромные массивы данных значительно быстрее и эффективнее чем R, грустно, но факт. Я привел эту солянку не из своих собственных размышлений, а после просмотра многих требований по вакансии data scientist на западе. Вы можете (и я могу) использовать только R в своей работе, этого никто не запрещает, но этого недостаточно, чтобы получить data analytics например в google, а я все таки всегда ориентировался на западные тенденции, поскольку они лет на 200 впереди наших. К тому же на западе, Вы найдете намного быстрее и более оплачиваемую работу, если Вы знаете SAS, а не R (грустно, но тоже факт). Нужна кому-то эта вакансия или не нужна - это след. вопрос, может у нас (или у Вас) в стране data scientis и так жируют..

1. R и S - это ведь не на 100% одно и тоже (хотя даже S вышел позже SAS). В своем 1 пункте я писал, что огромные институты использовали SAS и написали кучу кода, которую не будут переводить на R. Разве это не объясняет, почему люди не будут переходить на R? Вы пишите про S, но это ведь не объясняет почему люди используют SAS smile.gif

2. Я также написал, что есть обходные пути обработки - можно дождаться (а можно и не дождаться) - но это все доп. пакеты, доп. функции, в SAS это работает по-умолчанию, просто разные модели хранения данных.

3. Иногда, наверное, лучше выбрать неизвестный проприетарный алгоритм от SAS, который был апробирован в течении 30 лет, чем известный open source от дяди Васи (Вы же согласны с тем, что среди 5000 пакетов есть и пакеты от Васей? smile.gif )

4. Всю и не нужно, я говорю о тенденциях, в общем, литература по SAS более качественная. Возьмите рандомную выборку того и другого и проведите анализ - это уже сделали люди (не из SAS) и пришли к выводу, что документация лучше в SAS. По своим собственным наблюдениям я тоже так считаю.

Я уважаю Вашу любовь к R (сам его очень люблю smile.gif ), но Вы подаете информацию так, как-будто в R нет недостатков и это единственное, что нужно знать data scientist. Это ведь не так..

Сообщение отредактировал TheThing - 28.03.2014 - 12:21
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему