![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 107 Регистрация: 27.12.2015 Пользователь №: 27815 ![]() |
Всем доброго времени суток.
Существуют два опросника. Результаты одного опросника X1 могут принимать значение от 1 до 100, результаты другого опросника X2 - от 57 до 285. Естественно, баллы относятся к порядковой шкале. Из них нужно сконструировать |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 ![]() |
Всем доброго времени суток. Существуют два опросника. Результаты одного опросника X1 могут принимать значение от 1 до 100, результаты другого опросника X2 - от 57 до 285. Естественно, баллы относятся к порядковой шкале. Из них нужно сконструировать Мне одному кажется, что вопрос задан, мягко говоря "небрежно"? А небрежно заданный вопрос может расчитывать только на небрежный ответ. Ну да ладно. Попробуем разобраться. Про Y известно только то, что при X1=100 и X2=285 должно получаться максимальное значение, например, 153, а при X1=100 и X2=285 должно получаться минимальное значение, например, 62. Это, простите, как? Автор не пробовал сам понять, что сие означает? Как при ОДИНАКОВЫХ значениях параметров Х в первом и втором случаях может получаться РАЗНЫЕ значения Y ![]() Ну, предположим, автор "небрежно" ошибся и надо читать примерно так "при X1=100 и X2=285 должно получаться максимальное значение, например, 153, а при X1=1 и X2=57 должно получаться минимальное значение, например, 62. " Сразу возникает вопрос, слова "например" в этой фразе что-то значат, или так, "прикручены" для красоты? В зависимости от ответа на эту "небрежность" получаем разные варианты ответа. Если слова "например 153" и "например 62"в данном случае это "слова-паразиты", то автор очевидно хочет, что-бы при X1=1 и X2=57 получалось минимальное возможное значение, а при X1=100 и X2=285 - максимально возможное значение. Что мешает в таком случае применить элементарное отображение Y= X1+X2 ?? Получим 1+57=58 и меньшее значение Y не получиться ни при каких других значениях X1 и X2 и 100+285=385 и большего значения тоже не получить. Если же автор имел ввиду, что минимальным возможным значением у него должно быть именно число 62, а максимальным - именно число 153 (т.е. те числа, которые фигурируют в фразе после требования минимальности/максимальности), то отображение может быть несколько другим, НАПРИМЕР: Y = A*X1 + B*X2, где A=-1.65263, B=+1.116713. Можно обсуждать, а корректно-ли выполнять указанное отображение для признаков, измеренных в ранговых шкалах. Но в таком случае, автор должен был как минимум указать, сколько градаций должен иметь признак Y. И в такой постановке, кстати, задача однозначного решения не имеет. А вот причем здесь обучение без учителя и случайные деревья - вообще не понятно. О кластеризации можно что-то вразумительное говорить в контексте выборки и распределения ее значений, а не в терминах минимальных-максимальных значений шкал измерений признаков. Прошу поделиться советом/соображениями/пакетами/примерами. Самый простой и очевидный пример - суммарная оценка выпускников школ по результатам внешнего независимого оценивания. От вашей задача отличается только количеством признаков и тем, что у школьников шкалы признаков (оценки по предметам) имеют одинаковые градации. И- как обычно. Если хотите более аккуратных и точных советов - попробуйте свой вопрос переформулировать более точно и аккуратно. Сообщение отредактировал passant - 26.05.2016 - 23:15 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 107 Регистрация: 27.12.2015 Пользователь №: 27815 ![]() |
"при X1=100 и X2=285 должно получаться максимальное значение, например, 153, а при X1=1 и X2=57 должно получаться минимальное значение, например, 62. " Прошу прощения, максимальное значение соответствует одновременному X1=100 и X2=285, минимальное - X1=1 и X2=57. Предположим, людей просили заполнить опросники. Вероятнее всего, они будут отвечать так, что более высокие значения по одному опроснику будут соответствовать более высокому значению по другому опроснику и наоборот. После использования randomForest мы, допустим, получим минимум две группы и можно будет утверждать, что при таких-то X1 и X2 человек относится к такой-то группе, а при других - к другой. Это понятно. Y, гипотетически, должен отображать тоже самое числом, на основе которого можно сказать "при таком-то Y человек относится к такой-то группе". Как конструировать такой Y неясно. Суммировать баллы смысла не имеет - "измеряется" не одно и тоже. |
|
![]() |
![]() |
![]() ![]() |