Преобразование результатов опросников

Преобразование результатов опросников

comisora Просмотр профиля	26.05.2016 - 21:30 Сообщение #1
Группа: Пользователи Сообщений: 109 Регистрация: 27.12.2015 Пользователь №: 27815	Всем доброго времени суток. Существуют два опросника. Результаты одного опросника X₁ могут принимать значение от 1 до 100, результаты другого опросника X₂ - от 57 до 285. Естественно, баллы относятся к порядковой шкале. Из них нужно сконструировать ~~никому не нужный~~ Y. Про Y известно только то, что при X₁=100 и X₂=285 должно получаться максимальное значение, например, 153, а при X₁=100 и X₂=285 должно получаться минимальное значение, например, 62. Я подумал в сторону режима unsupervised из randomUniformForest, но слабо представляю решение данной задачи. Прошу поделиться советом/соображениями/пакетами/примерами.

Ответов

passant Просмотр профиля	26.05.2016 - 22:52 Сообщение #2
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223	Цитата(comisora @ 26.05.2016 - 21:30) Всем доброго времени суток. Существуют два опросника. Результаты одного опросника X₁ могут принимать значение от 1 до 100, результаты другого опросника X₂ - от 57 до 285. Естественно, баллы относятся к порядковой шкале. Из них нужно сконструировать ~~никому не нужный~~ Y. Про Y известно только то, что при X₁=100 и X₂=285 должно получаться максимальное значение, например, 153, а при X₁=100 и X₂=285 должно получаться минимальное значение, например, 62. Я подумал в сторону режима unsupervised из randomUniformForest, но слабо представляю решение данной задачи. Прошу поделиться советом/соображениями/пакетами/примерами. Мне одному кажется, что вопрос задан, мягко говоря "небрежно"? А небрежно заданный вопрос может расчитывать только на небрежный ответ. Ну да ладно. Попробуем разобраться. Цитата(comisora @ 26.05.2016 - 21:30) Про Y известно только то, что при X₁=100 и X₂=285 должно получаться максимальное значение, например, 153, а при X₁=100 и X₂=285 должно получаться минимальное значение, например, 62. Это, простите, как? Автор не пробовал сам понять, что сие означает? Как при ОДИНАКОВЫХ значениях параметров Х в первом и втором случаях может получаться РАЗНЫЕ значения Y ??? Ну, предположим, автор "небрежно" ошибся и надо читать примерно так "при X₁=100 и X₂=285 должно получаться максимальное значение, например, 153, а при X₁=1 и X₂=57 должно получаться минимальное значение, например, 62. " Сразу возникает вопрос, слова "например" в этой фразе что-то значат, или так, "прикручены" для красоты? В зависимости от ответа на эту "небрежность" получаем разные варианты ответа. Если слова "например 153" и "например 62"в данном случае это "слова-паразиты", то автор очевидно хочет, что-бы при X₁=1 и X₂=57 получалось минимальное возможное значение, а при X₁=100 и X₂=285 - максимально возможное значение. Что мешает в таком случае применить элементарное отображение Y= X₁+X₂ ?? Получим 1+57=58 и меньшее значение Y не получиться ни при каких других значениях X₁ и X₂ и 100+285=385 и большего значения тоже не получить. Если же автор имел ввиду, что минимальным возможным значением у него должно быть именно число 62, а максимальным - именно число 153 (т.е. те числа, которые фигурируют в фразе после требования минимальности/максимальности), то отображение может быть несколько другим, НАПРИМЕР: Y = AX₁ + BX₂, где A=-1.65263, B=+1.116713. Можно обсуждать, а корректно-ли выполнять указанное отображение для признаков, измеренных в ранговых шкалах. Но в таком случае, автор должен был как минимум указать, сколько градаций должен иметь признак Y. И в такой постановке, кстати, задача однозначного решения не имеет. А вот причем здесь обучение без учителя и случайные деревья - вообще не понятно. О кластеризации можно что-то вразумительное говорить в контексте выборки и распределения ее значений, а не в терминах минимальных-максимальных значений шкал измерений признаков. Цитата(comisora @ 26.05.2016 - 21:30) Прошу поделиться советом/соображениями/пакетами/примерами. Самый простой и очевидный пример - суммарная оценка выпускников школ по результатам внешнего независимого оценивания. От вашей задача отличается только количеством признаков и тем, что у школьников шкалы признаков (оценки по предметам) имеют одинаковые градации. И- как обычно. Если хотите более аккуратных и точных советов - попробуйте свой вопрос переформулировать более точно и аккуратно. Сообщение отредактировал passant - 26.05.2016 - 23:15

comisora Просмотр профиля	27.05.2016 - 02:07 Сообщение #3
Группа: Пользователи Сообщений: 109 Регистрация: 27.12.2015 Пользователь №: 27815	Цитата(passant @ 26.05.2016 - 22:52) "при X₁=100 и X₂=285 должно получаться максимальное значение, например, 153, а при X₁=1 и X₂=57 должно получаться минимальное значение, например, 62. " Прошу прощения, максимальное значение соответствует одновременному X₁=100 и X₂=285, минимальное - X₁=1 и X₂=57. Предположим, людей просили заполнить опросники. Вероятнее всего, они будут отвечать так, что более высокие значения по одному опроснику будут соответствовать более высокому значению по другому опроснику и наоборот. После использования randomForest мы, допустим, получим минимум две группы и можно будет утверждать, что при таких-то X₁ и X₂ человек относится к такой-то группе, а при других - к другой. Это понятно. Y, гипотетически, должен отображать тоже самое числом, на основе которого можно сказать "при таком-то Y человек относится к такой-то группе". Как конструировать такой Y неясно. Суммировать баллы смысла не имеет - "измеряется" не одно и тоже.

Сообщений в этой теме

comisora Преобразование результатов опросников 26.05.2016 - 21:30

passant Цитата(comisora @ 26.05.2016 - 21:30... 26.05.2016 - 22:52

comisora Цитата(passant @ 26.05.2016 - 22:52)... 27.05.2016 - 02:07

comisora Подумал на счёт ближайшей задачи. Нужно найти Y, к... 27.05.2016 - 09:39

passant Простите, но опять несоответствие. Цитата(comisora... 27.05.2016 - 16:33

comisora 2 passant Нет противоречия. Пока это предположение... 27.05.2016 - 19:19

passant Я, кажется, начинаю понимать, что Вы имели ввиду. ... 27.05.2016 - 23:14

comisora 2 passant Спасибо, вторая статья особенно в тему, ... 28.05.2016 - 00:17

p2004r Цитата(comisora @ 26.05.2016 - 21:30... 28.05.2016 - 11:44

comisora 2 p2004r 1) Не будет ли целесообразней использова... 29.05.2016 - 13:21

p2004r Цитата(comisora @ 29.05.2016 - 13:21... 29.05.2016 - 18:04

passant Цитата(p2004r @ 29.05.2016 - 18:04) ... 30.05.2016 - 17:23

comisora 2 all Спасибо за высказанные мнения 1.06.2016 - 19:42

comisora Всем доброго дня. Возник вопрос про использование ... 30.09.2017 - 13:35

100$ А что такое rsmax2 в этой истории? Просто помню, ч... 30.09.2017 - 17:25

comisora Цитата(100$ @ 30.09.2017 - 18:2... 30.09.2017 - 23:15

« Предыдущая тема · Медицинская статистика · Следующая тема »