Подскажите с нейросетью - Форум врачей-аспирантов

Подскажите с нейросетью

Fedor_Petuhov Просмотр профиля	10.02.2017 - 17:49 Сообщение #1
Группа: Пользователи Сообщений: 29 Регистрация: 10.02.2017 Пользователь №: 29307	Здравствуйте, проконсультируйте, пожалуйста. Надеюсь здесь кто-нибудь знает R. 1. Какое минимальное количество наблюдений нужно, чтобы построить нейросеть? У меня 7 независимых переменных и 3 зависимых (все метрические). Между ними надо найти закономерности. Регрессия не вариант. Что-то КМД слабый. 2. Дело в том, что я работаю на производстве, где добывать данные крайне сложно, вернее дорого, там по-минимуму наблюдений. У меня в наборе всего 5 наблюдений. Есть ли какие-то хитрые способы грамотно и математически обосновано сгенерировать наблюдения для переменных, а уже потом строить нейросеть на них. Спасибо всем за помощь.

Ответов

Fedor_Petuhov Просмотр профиля	11.03.2017 - 15:12 Сообщение #2
Группа: Пользователи Сообщений: 29 Регистрация: 10.02.2017 Пользователь №: 29307	Коллеги, я стал работать с pls регрессией, с интерпретацией результатов plsr(formula = y1 + y2 + y3 + y4 ~ ., ncomp = 2, data = reg, method = "oscorespls", scale = TRUE, validation = "CV", segments = 9, segment.type = "consecutive", length.seg = 3) > summary(plsFit) Data: X dimension: 70 3 Y dimension: 70 1 Fit method: oscorespls Number of components considered: 2 VALIDATION: RMSEP Cross-validated using 24 consecutive segments. (Intercept) 1 comps 2 comps CV 17.15 8.794 8.082 adjCV 17.15 8.785 8.067 TRAINING: % variance explained 1 comps 2 comps X 78.12 94.41 y1 + y2 + y3 + y4 75.56 .99 что значит CV и что значит adjCV какое вывод по этим цифрам я могу сделать? И что значит понятие компоненты в этой регрессии? nokh, вопрос к Вам, поскольку Вы прогали эту регрессию, возможно сможете дать небольшой ликбез.

nokh Просмотр профиля	12.03.2017 - 07:38 Сообщение #3
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(Fedor_Petuhov @ 17.02.2017 - 19:52) nokh, а такой R^2 может быть вызван малым кол-вом наблюдений? Для других показателей число наблюдений также мало, но тем не менее этого числа хватило. Поэтому вряд-ли, хотя доказать этого пока нельзя. Вы находитесь в более выгодном положении, поскольку имеете не один набор данных, а много. Их анализ позволит уже более конкретно определиться с причиной. Возможно, какие-то показатели всегда "шумят" сильнее, например, в силу меньшей концентрации или влияния на них других факторов. Цитата(Fedor_Petuhov @ 11.03.2017 - 17:12) Коллеги, я стал работать с pls регрессией, с интерпретацией результатов ... И что значит понятие компоненты в этой регрессии? nokh, вопрос к Вам, поскольку Вы прогали эту регрессию, возможно сможете дать небольшой ликбез. Про компоненты нужно почитать. Если не знакомы с PLS, то можно и даже проще начать с анализа главных компонент - это базовая техника для целого семейства методов. Если кратко, то не вся информация в наборе данных важна и/или отлична от случайного шума. Главные компоненты - ряд убывающих по важности (доле объясняемой дисперсии) новых переменных, скомбинированных из исходных переменных. Они обобщают данные и позволяют представить их в пространстве меньшей размерности, поэтому такие методы называют иногда методами редукции данных с обобщением. Работу методов типа анализа избыточности (RDA) можно представить себе так: одно гипероблако облако независимых переменных неподвижно, а второе гипероблако зависимых пременных поворачивается относительно первого так, чтобы такая проекция объяснила максимум дисперсии второго. Первая такая проекция и является первой компонентой. Далее ищется вторая, ортогональная первой, третья, ортогональная перым двум и т.д., но в выложенном вами наборе 2 и 3 ничтожно малы. PLS-регрессия - смещённый вариант RDA, с акцентом не на объяснение дисперсии, а на прогноз. К сожалению, не было времени разобраться с PLS в R, я тренировался с PLS в пакете tanagra ( http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html ), который уже был у меня установлен и для которого нашёл в сети понятную мне инструкцию. Как я писал выше, один пакет R мне не понравился и хотя часть вопросов ушла, моя "конфигурация" не позволила сделать прогноз, используя его выкладки на экране и калькулятор в руках, тогда как для tanagra - позволила и результат сошёлся с выдаваемыми пакетом прогнозными значениями. Опробую chemometrics - отпишусь. По поводу CV вам ответили. Кроссвалидация более популярна в Machine Learning, тогда как в традиционной прикладной статистике наработаны другие, включая чисто графические подходы. Я этим способом выявлять надёжные предикторы не пользуюсь, польскольку работаю обычно с небольшими наборами данных, а в них - всё не особо надёжно Полагаю, у вас - та же ситуация, поэтому с числом необходимых и достаточных для прогноза компонент проще определиться по графику каменистой осыпи (scree plot). Число компонент равно числу предикторов, поэтому в вашем случае начальное решение должно содержать не 2, а 3 компоненты. Сообщение отредактировал nokh - 12.03.2017 - 08:17

Сообщений в этой теме

Fedor_Petuhov Подскажите с нейросетью 10.02.2017 - 17:49

passant Цитата(Fedor_Petuhov @ 10.02.2017 - 16... 11.02.2017 - 19:59

Fedor_Petuhov 1. Виноват. Второпях перепутал. 3 независ , 7 зав... 12.02.2017 - 13:18

passant Цитата(Fedor_Petuhov @ 12.02.2017 - 12... 12.02.2017 - 15:14

nokh Цитата(Fedor_Petuhov @ 12.02.2017 - 15... 12.02.2017 - 18:13

Fedor_Petuhov Без экстрасенсов и прочих жуликов:) Только чистые ... 12.02.2017 - 20:08

p2004r Цитата(Fedor_Petuhov @ 12.02.2017 - 20... 13.02.2017 - 11:37

nokh Цитата(p2004r @ 13.02.2017 - 13:37) ... 14.02.2017 - 08:14

p2004r Цитата(nokh @ 14.02.2017 - 08:14) Не... 14.02.2017 - 08:37

Fedor_Petuhov Для химических смесей бывают исключения, когда дан... 14.02.2017 - 15:26

Fedor_Petuhov и да приветствуются любые варианты кода, может из ... 14.02.2017 - 15:27

p2004r Цитата(Fedor_Petuhov @ 14.02.2017 - 15... 15.02.2017 - 10:07

Fedor_Petuhov Тех задание не нужно. Непосредственно по программи... 15.02.2017 - 21:32

ogurtsov Цитата(Fedor_Petuhov @ 15.02.2017 - 22... 15.02.2017 - 21:49

p2004r Цитата(Fedor_Petuhov @ 15.02.2017 - 21... 16.02.2017 - 13:47

nokh Цитата(nokh @ 14.02.2017 - 10:14) Ра... 17.02.2017 - 00:01

p2004r Цитата(nokh @ 17.02.2017 - 00:01) C ... 18.02.2017 - 00:30

Fedor_Petuhov Да, я на stackoverflow почитал про нее, но не все ... 17.02.2017 - 16:41

Fedor_Petuhov nokh, а такой R^2 может быть вызван малым кол-вом ... 17.02.2017 - 17:52

100$ NIPALS 1966 г.р. {pls} v. 2.6-0 датируется 18/12/2... 18.02.2017 - 02:03

Fedor_Petuhov as.numeric(mydata$classvar)+1 показал, что де... 18.02.2017 - 12:40

Fedor_Petuhov закрываю вопрос) стаковерфлёу в помощь был)) вот т... 4.03.2017 - 18:28

Fedor_Petuhov Коллеги, я стал работать с pls регрессией, с инте... 11.03.2017 - 15:12

p2004r Цитата(Fedor_Petuhov @ 11.03.2017 - 15... 11.03.2017 - 23:52

nokh Цитата(Fedor_Petuhov @ 17.02.2017 - 19... 12.03.2017 - 07:38

« Предыдущая тема · Медицинская статистика · Следующая тема »