Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Выбор статистического пакета

Автор: cardio70 27.05.2017 - 20:26

Здравствуйте! help.gif выбрать статистический пакет для анализа большого массива данных. Моему отцу удалось достать за рубежом для своей докторской диссертации массив данных объемом порядка 400 тысяч наблюдений с примерно в 500 признаками. И он хочет получить результаты не только простых методов анализа, но и многомерных методов. Вопрос: каким пакетом лучше всего попытаться пользоваться?

Автор: ogurtsov 27.05.2017 - 20:38

R.

Автор: p2004r 28.05.2017 - 10:06

Цитата(cardio70 @ 27.05.2017 - 20:26) *
Здравствуйте! help.gif выбрать статистический пакет для анализа большого массива данных. Моему отцу удалось достать за рубежом для своей докторской диссертации массив данных объемом порядка 400 тысяч наблюдений с примерно в 500 признаками. И он хочет получить результаты не только простых методов анализа, но и многомерных методов. Вопрос: каким пакетом лучше всего попытаться пользоваться?


Да, R. И это по нынешним временам данные обычного размера.

PS надеюсь, что в компьютере у Вас ОЗУ хотя бы 16 ГБ есть?
(хотя по нынешним временам у исследователя должно быть в ноуте "бытовом" 32 гиг, а в "стационарном" ПК 64 гиг ОЗУ)

Автор: leo_biostat 29.05.2017 - 08:14

Цитата(cardio70 @ 27.05.2017 - 20:26) *
Здравствуйте! help.gif выбрать статистический пакет для анализа большого массива данных. Моему отцу удалось достать за рубежом для своей докторской диссертации массив данных объемом порядка 400 тысяч наблюдений с примерно в 500 признаками. И он хочет получить результаты не только простых методов анализа, но и многомерных методов. Вопрос: каким пакетом лучше всего попытаться пользоваться?


cardio70, hi.gif!

Рекомендую MATLAB и SAS. В последнем пакете анализирую массивы более млн. наблюдений и более 1000 признаков.

Успеха!

Автор: nokh 31.05.2017 - 21:50

Де-факто стандарт статистических вычислений - среда R: https://ru.wikipedia.org/wiki/R_(язык_программирования)

Автор: cardio70 1.07.2017 - 14:17

Цитата(leo_biostat @ 29.05.2017 - 08:14) *
cardio70, hi.gif!

Рекомендую MATLAB и SAS. В последнем пакете анализирую массивы более млн. наблюдений и более 1000 признаков.

Успеха!


leo_biostat! Попробовал анализировать в MATLAB. Очень сложно. А надо заканчивать анализ. Можно я напишу на Ваш мэйл свою просьбу о помощи в выполнении этого анализа?

Автор: leo_biostat 3.07.2017 - 17:43

Цитата(cardio70 @ 1.07.2017 - 14:17) *
leo_biostat! Попробовал анализировать в MATLAB. Очень сложно. А надо заканчивать анализ. Можно я напишу на Ваш мэйл свою просьбу о помощи в выполнении этого анализа?


cardio70, hi.gif!

Понимаю эту ситуацию. Да, чтобы хорошо использовать MATLAB, надо очень хорошо его изучать. Что доступно профессионалу.
Можете выслать мне подробное описание Вашего исследования, и сам массив, оформленный по примерам, которые доступны по адресу http://biometrica.tomsk.ru/DATA%20PRIMER.rar
Детали специфики анализа Вашего массива опишу подробно а ответном письме. Ну а что мы с коллегами сможем Вам сделать, можете прочитать в отзывах Ваших коллег.

Успеха!

Автор: p2004r 8.07.2017 - 23:09

А так хотелось увидеть это в ластах и гамаке матлабе smile.gif

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)