multifactor dimensionality reduction |
Здравствуйте, гость ( Вход | Регистрация )
multifactor dimensionality reduction |
14.11.2011 - 13:19
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
всем привет. очень нуждаюсь в помощи и советах.... кто то знаком с multifactor dimensionality reduction??? что можно почитать о том как работать в этой среде? для каких видов данных она предназначена??? а то мне все что встречалось касается генной информации. можно ли применять другие выборки? спасибо
|
|
14.11.2011 - 18:01
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
всем привет. очень нуждаюсь в помощи и советах.... кто то знаком с multifactor dimensionality reduction??? что можно почитать о том как работать в этой среде? для каких видов данных она предназначена??? а то мне все что встречалось касается генной информации. можно ли применять другие выборки? спасибо А что за данные Вы собираетесь обрабатывать? И какой результат ожидаете? |
|
14.11.2011 - 22:28
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
есть данные по кардиологии. предоперационных набор параметров и постоперационных.планирую применить логистическую регрессиюю для определения риска того или иного вмешатальства и ислледования влияния пороков. посоветовали воспользоваться multifactor dimensionality reduction и permutation test.пока понятия не имею с чего начать и к чему приступить
|
|
15.11.2011 - 21:55
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
есть данные по кардиологии. предоперационных набор параметров и постоперационных.планирую применить логистическую регрессиюю для определения риска того или иного вмешатальства и ислледования влияния пороков. посоветовали воспользоваться multifactor dimensionality reduction и permutation test.пока понятия не имею с чего начать и к чему приступить Пермутация это просто, Вы лишаете данных корреляции. Вход и выход модели проверяется для перемешанных данных, когда парные значения вход-выход разрушены (что приятно прочие свойства данных сохраняются). Параллельно полезно проводить бутстреп (перевыборку) пар вход-выход модели, корреляция сохраняется, но состав выборки меняется за счет выборки с возвращением. Практически у Вас получится облако значений параметра модели для данных бутстрепа, и облако (некая базовая точка отсчета) значений параметра модели когда связи заведомо нет. Применимо это к любой процедуре обработки данных полезность которой хочется доказать, а теория еще для неё не разработана. Метод multifactor dimensionality reduction интерполяционный, без перечисленных выше мер проверки его бесполезно использовать для экстраполяции. Как всякий интерполяционный метод он будет находить "зависимости" везде, даже в чисто случайных данных. Откровенно говоря логистическая регрессия выглядит предпочтительнее (и к ней можно смело применять бутстреп и пермутацию Сообщение отредактировал p2004r - 16.11.2011 - 15:15 |
|
16.11.2011 - 10:40
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
ого го... чувствую себя вообще стерильной.... наверно надо чтоб вы мне посоветовали вообще с чего начать так как ниразу не проводила такого рода анализа... скажем так у меня есть база с кучей данных, а что теперь с ними делать - без понятия... то что вы сказали для меня совсем туго... и на ряду с пермишин тестом и MDR также советовал руководитель ознакомится с лог регрессией.. я только начала рассмотрение этой темы
|
|
16.11.2011 - 10:43
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
если я правильно поняла мне нужно начать с логрегрессии??? как тогда ее применять на практике???
|
|
16.11.2011 - 11:45
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
ого го... чувствую себя вообще стерильной.... наверно надо чтоб вы мне посоветовали вообще с чего начать так как ниразу не проводила такого рода анализа... скажем так у меня есть база с кучей данных, а что теперь с ними делать - без понятия... то что вы сказали для меня совсем туго... и на ряду с пермишин тестом и MDR также советовал руководитель ознакомится с лог регрессией.. я только начала рассмотрение этой темы не сдаваться! вот например бутстреп и пермутация для графика собственных значений анализа принципиальных компонент http://p2004r.blogspot.com/2011/04/blog-post.html вместо анализа принципиальных компонент может быть _любой_ другой метод анализа данных, принцип от этого не меняется посмотрите только на рисунок ---- вместо одной линии (на самом деле это точки соединенные линией) собственных значений мы получили их 1000 штук. естественно они точно не совпали. мы 1000 раз случайно _копировали_ (не извлекали!, тоесть у объекта оставалась возможность быть скопированным повторно!) объекты наблюдения (строки в таблице данных). Каждый раз из 1000 мы копировали случайно столько объектов сколько составлял размер исходной анализируемой выборки. Это бутстреп. Таким образом у нас получилась первая группа линий (похожая на экспоненциальный распад). хм и почему я вывел обе группы не разным цветом ? ) Пермутацией получена более пологая группа линий. Там мы только перемешивали 1000 раз _отдельно_ каждую из переменных описывающих объект наблюдения. Тем самым мы разрушали корреляционные связи. Таким образом мы получили распределение интересующего нас параметра с сохранением корреляционной связи (бутстреп) и с разрушением (пермутация) и теперь можем гордо ответить на вопрос сколько главных компонент достоверно составляют простую структуру. В случае другой методики анализа данных смысл остается тот же --- мы уверены что показатель вычисленный нами не случаен. Сообщение отредактировал p2004r - 16.11.2011 - 11:59 |
|
16.11.2011 - 11:58
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
если я правильно поняла мне нужно начать с логрегрессии??? как тогда ее применять на практике??? давайте на примере каких то Ваших данных (в соседней ветке в принципе я делал пример этой регрессии на примере данных о метастазах) нужно набор переменных "до" и переменная типа да-нет (или которую можно сделать такой) "после" вмешательства. |
|
16.11.2011 - 12:25
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
давайте на примере каких то Ваших данных (в соседней ветке в принципе я делал пример этой регрессии на примере данных о метастазах) нужно набор переменных "до" и переменная типа да-нет (или которую можно сделать такой) "после" вмешательства. ну в какой то степени понятно... что касается данных - вас интересуют все параметры которые есть в таблице или просто несколько для обьяснения работы??? и в каком виде? а не сможете ли вы дать мне ссылочку на ту тему где рассматривался пример? |
|
16.11.2011 - 15:12
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
ну в какой то степени понятно... что касается данных - вас интересуют все параметры которые есть в таблице или просто несколько для обьяснения работы??? и в каком виде? а не сможете ли вы дать мне ссылочку на ту тему где рассматривался пример? вот с этого сообщения начинается http://forum.disser.ru/index.php?showtopic...ost&p=12230 "до" можно несколько, можно все (на сложности демонстрации это практически не скажется) "после" лучше выбрать одну две самые интересные (иначе Вам ничего не останется для самостоятельной работы ) |
|
20.11.2011 - 17:48
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
здравствуйте, решила попытаться сделать вот что. задача пока не поставлена передо мной конкретная поэтому сама думаю что можно делать... попытаться сравнить диеагностическую эффективность Euroscor и данных полученных мною при логрегрессии. возможно бред. тогда остановите меня заранее.
мои данные. решила брать те параметры которые применяются в евроскоре. проблема что их еще всех у меня на сегодняшний день нету. но как вы сказали мне главное суть понять... "до" ID - Familia - Vozrast - Data_operatsii - Pol - HronichZabol_Legkih - Nevrolgiya - PerenOperatsii - Stenokardiya - Vremya_posle_posled_IM - Gipertrof_L_ZH IM "после" жив - мертв пока наверное так хотя хочется привязаться к патологии |
|
20.11.2011 - 18:11
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
здравствуйте, решила попытаться сделать вот что. задача пока не поставлена передо мной конкретная поэтому сама думаю что можно делать... попытаться сравнить диеагностическую эффективность Euroscor и данных полученных мною при логрегрессии. возможно бред. тогда остановите меня заранее. мои данные. решила брать те параметры которые применяются в евроскоре. проблема что их еще всех у меня на сегодняшний день нету. но как вы сказали мне главное суть понять... "до" ID - Familia - Vozrast - Data_operatsii - Pol - HronichZabol_Legkih - Nevrolgiya - PerenOperatsii - Stenokardiya - Vremya_posle_posled_IM - Gipertrof_L_ZH IM "после" жив - мертв пока наверное так хотя хочется привязаться к патологии а сам файл с данными? по названиям не очень понятно... ну и вот дата например, само по себе понятно, но возникает вопрос: будем на день недели преобразовывать? или лето-зима-осень весна? |
|
20.11.2011 - 18:58
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
|
|
20.11.2011 - 20:35
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
вот с этого сообщения начинается http://forum.disser.ru/index.php?showtopic...ost&p=12230 в чем пишутся все эти коды??? я думала нужно будет в каком то пакете типа статистика или спсс делать |
|
20.11.2011 - 20:41
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
|
|