Автор: cardio70 27.05.2017 - 20:26
Здравствуйте! выбрать статистический пакет для анализа большого массива данных. Моему отцу удалось достать за рубежом для своей докторской диссертации массив данных объемом порядка 400 тысяч наблюдений с примерно в 500 признаками. И он хочет получить результаты не только простых методов анализа, но и многомерных методов. Вопрос: каким пакетом лучше всего попытаться пользоваться?
Автор: p2004r 28.05.2017 - 10:06
Цитата(cardio70 @ 27.05.2017 - 20:26)
Здравствуйте!
выбрать статистический пакет для анализа большого массива данных. Моему отцу удалось достать за рубежом для своей докторской диссертации массив данных объемом порядка 400 тысяч наблюдений с примерно в 500 признаками. И он хочет получить результаты не только простых методов анализа, но и многомерных методов. Вопрос: каким пакетом лучше всего попытаться пользоваться?
Да, R. И это по нынешним временам данные обычного размера.
PS надеюсь, что в компьютере у Вас ОЗУ хотя бы 16 ГБ есть?
(хотя по нынешним временам у исследователя должно быть в ноуте "бытовом" 32 гиг, а в "стационарном" ПК 64 гиг ОЗУ)
Автор: leo_biostat 29.05.2017 - 08:14
Цитата(cardio70 @ 27.05.2017 - 20:26)
Здравствуйте!
выбрать статистический пакет для анализа большого массива данных. Моему отцу удалось достать за рубежом для своей докторской диссертации массив данных объемом порядка 400 тысяч наблюдений с примерно в 500 признаками. И он хочет получить результаты не только простых методов анализа, но и многомерных методов. Вопрос: каким пакетом лучше всего попытаться пользоваться?
cardio70,
!
Рекомендую MATLAB и SAS. В последнем пакете анализирую массивы более млн. наблюдений и более 1000 признаков.
Успеха!
Автор: nokh 31.05.2017 - 21:50
Де-факто стандарт статистических вычислений - среда R: https://ru.wikipedia.org/wiki/R_(язык_программирования)
Автор: cardio70 1.07.2017 - 14:17
Цитата(leo_biostat @ 29.05.2017 - 08:14)
cardio70,
!
Рекомендую MATLAB и SAS. В последнем пакете анализирую массивы более млн. наблюдений и более 1000 признаков.
Успеха!
leo_biostat! Попробовал анализировать в MATLAB. Очень сложно. А надо заканчивать анализ. Можно я напишу на Ваш мэйл свою просьбу о помощи в выполнении этого анализа?
Автор: leo_biostat 3.07.2017 - 17:43
Цитата(cardio70 @ 1.07.2017 - 14:17)
leo_biostat! Попробовал анализировать в MATLAB. Очень сложно. А надо заканчивать анализ. Можно я напишу на Ваш мэйл свою просьбу о помощи в выполнении этого анализа?
cardio70,
!
Понимаю эту ситуацию. Да, чтобы хорошо использовать MATLAB, надо очень хорошо его изучать. Что доступно профессионалу.
Можете выслать мне подробное описание Вашего исследования, и сам массив, оформленный по примерам, которые доступны по адресу http://biometrica.tomsk.ru/DATA%20PRIMER.rar
Детали специфики анализа Вашего массива опишу подробно а ответном письме. Ну а что мы с коллегами сможем Вам сделать, можете прочитать в отзывах Ваших коллег.
Успеха!
Автор: p2004r 8.07.2017 - 23:09
А так хотелось увидеть это в ластах и гамаке матлабе