Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

5 страниц V   1 2 3 > »   
Добавить ответ в эту темуОткрыть тему
> multifactor dimensionality reduction
_alena_
сообщение 14.11.2011 - 13:19
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



всем привет. очень нуждаюсь в помощи и советах.... кто то знаком с multifactor dimensionality reduction??? что можно почитать о том как работать в этой среде? для каких видов данных она предназначена??? а то мне все что встречалось касается генной информации. можно ли применять другие выборки? спасибо
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 14.11.2011 - 18:01
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(_alena_ @ 14.11.2011 - 12:19) *
всем привет. очень нуждаюсь в помощи и советах.... кто то знаком с multifactor dimensionality reduction??? что можно почитать о том как работать в этой среде? для каких видов данных она предназначена??? а то мне все что встречалось касается генной информации. можно ли применять другие выборки? спасибо


А что за данные Вы собираетесь обрабатывать? И какой результат ожидаете?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
_alena_
сообщение 14.11.2011 - 22:28
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



есть данные по кардиологии. предоперационных набор параметров и постоперационных.планирую применить логистическую регрессиюю для определения риска того или иного вмешатальства и ислледования влияния пороков. посоветовали воспользоваться multifactor dimensionality reduction и permutation test.пока понятия не имею с чего начать и к чему приступить
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 15.11.2011 - 21:55
Сообщение #4


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(_alena_ @ 14.11.2011 - 21:28) *
есть данные по кардиологии. предоперационных набор параметров и постоперационных.планирую применить логистическую регрессиюю для определения риска того или иного вмешатальства и ислледования влияния пороков. посоветовали воспользоваться multifactor dimensionality reduction и permutation test.пока понятия не имею с чего начать и к чему приступить


Пермутация это просто, Вы лишаете данных корреляции. Вход и выход модели проверяется для перемешанных данных, когда парные значения вход-выход разрушены (что приятно прочие свойства данных сохраняются). Параллельно полезно проводить бутстреп (перевыборку) пар вход-выход модели, корреляция сохраняется, но состав выборки меняется за счет выборки с возвращением.

Практически у Вас получится облако значений параметра модели для данных бутстрепа, и облако (некая базовая точка отсчета) значений параметра модели когда связи заведомо нет.


Применимо это к любой процедуре обработки данных полезность которой хочется доказать, а теория еще для неё не разработана.

Метод multifactor dimensionality reduction интерполяционный, без перечисленных выше мер проверки его бесполезно использовать для экстраполяции. Как всякий интерполяционный метод он будет находить "зависимости" везде, даже в чисто случайных данных.

Откровенно говоря логистическая регрессия выглядит предпочтительнее (и к ней можно смело применять бутстреп и пермутацию smile.gif

Сообщение отредактировал p2004r - 16.11.2011 - 15:15


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
_alena_
сообщение 16.11.2011 - 10:40
Сообщение #5


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



weep.gif ого го... чувствую себя вообще стерильной.... наверно надо чтоб вы мне посоветовали вообще с чего начать так как ниразу не проводила такого рода анализа... скажем так у меня есть база с кучей данных, а что теперь с ними делать - без понятия... то что вы сказали для меня совсем туго... frown.gif и на ряду с пермишин тестом и MDR также советовал руководитель ознакомится с лог регрессией.. я только начала рассмотрение этой темы
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
_alena_
сообщение 16.11.2011 - 10:43
Сообщение #6


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



если я правильно поняла мне нужно начать с логрегрессии??? как тогда ее применять на практике???
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 16.11.2011 - 11:45
Сообщение #7


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(_alena_ @ 16.11.2011 - 09:40) *
weep.gif ого го... чувствую себя вообще стерильной.... наверно надо чтоб вы мне посоветовали вообще с чего начать так как ниразу не проводила такого рода анализа... скажем так у меня есть база с кучей данных, а что теперь с ними делать - без понятия... то что вы сказали для меня совсем туго... frown.gif и на ряду с пермишин тестом и MDR также советовал руководитель ознакомится с лог регрессией.. я только начала рассмотрение этой темы


не сдаваться! smile.gif

вот например бутстреп и пермутация для графика собственных значений анализа принципиальных компонент http://p2004r.blogspot.com/2011/04/blog-post.html

вместо анализа принципиальных компонент может быть _любой_ другой метод анализа данных, принцип от этого не меняется

посмотрите только на рисунок ---- вместо одной линии (на самом деле это точки соединенные линией) собственных значений мы получили их 1000 штук. естественно они точно не совпали. мы 1000 раз случайно _копировали_ (не извлекали!, тоесть у объекта оставалась возможность быть скопированным повторно!) объекты наблюдения (строки в таблице данных).

Каждый раз из 1000 мы копировали случайно столько объектов сколько составлял размер исходной анализируемой выборки. Это бутстреп.

Таким образом у нас получилась первая группа линий (похожая на экспоненциальный распад). хм и почему я вывел обе группы не разным цветом ? smile.gif)


Пермутацией получена более пологая группа линий. Там мы только перемешивали 1000 раз _отдельно_ каждую из переменных описывающих объект наблюдения. Тем самым мы разрушали корреляционные связи.


Таким образом мы получили распределение интересующего нас параметра с сохранением корреляционной связи (бутстреп) и с разрушением (пермутация) и теперь можем гордо ответить на вопрос сколько главных компонент достоверно составляют простую структуру. В случае другой методики анализа данных смысл остается тот же --- мы уверены что показатель вычисленный нами не случаен.

Сообщение отредактировал p2004r - 16.11.2011 - 11:59


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 16.11.2011 - 11:58
Сообщение #8


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(_alena_ @ 16.11.2011 - 09:43) *
если я правильно поняла мне нужно начать с логрегрессии??? как тогда ее применять на практике???


давайте на примере каких то Ваших данных (в соседней ветке в принципе я делал пример этой регрессии на примере данных о метастазах)

нужно набор переменных "до" и переменная типа да-нет (или которую можно сделать такой) "после" вмешательства.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
_alena_
сообщение 16.11.2011 - 12:25
Сообщение #9


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



Цитата(p2004r @ 16.11.2011 - 10:58) *
давайте на примере каких то Ваших данных (в соседней ветке в принципе я делал пример этой регрессии на примере данных о метастазах)

нужно набор переменных "до" и переменная типа да-нет (или которую можно сделать такой) "после" вмешательства.


ну в какой то степени понятно...
что касается данных - вас интересуют все параметры которые есть в таблице или просто несколько для обьяснения работы??? и в каком виде?
а не сможете ли вы дать мне ссылочку на ту тему где рассматривался пример?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 16.11.2011 - 15:12
Сообщение #10


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(_alena_ @ 16.11.2011 - 11:25) *
ну в какой то степени понятно...
что касается данных - вас интересуют все параметры которые есть в таблице или просто несколько для обьяснения работы??? и в каком виде?
а не сможете ли вы дать мне ссылочку на ту тему где рассматривался пример?


вот с этого сообщения начинается http://forum.disser.ru/index.php?showtopic...ost&p=12230


"до" можно несколько, можно все (на сложности демонстрации это практически не скажется)

"после" лучше выбрать одну две самые интересные (иначе Вам ничего не останется для самостоятельной работы smile.gif )


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
_alena_
сообщение 20.11.2011 - 17:48
Сообщение #11


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



здравствуйте, решила попытаться сделать вот что. задача пока не поставлена передо мной конкретная поэтому сама думаю что можно делать... попытаться сравнить диеагностическую эффективность Euroscor и данных полученных мною при логрегрессии. возможно бред. тогда остановите меня заранее.

мои данные.
решила брать те параметры которые применяются в евроскоре. проблема что их еще всех у меня на сегодняшний день нету. но как вы сказали мне главное суть понять...
"до"
ID - Familia - Vozrast - Data_operatsii - Pol - HronichZabol_Legkih - Nevrolgiya - PerenOperatsii - Stenokardiya - Vremya_posle_posled_IM - Gipertrof_L_ZH IM
"после"
жив - мертв

пока наверное так хотя хочется привязаться к патологии
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 20.11.2011 - 18:11
Сообщение #12


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(_alena_ @ 20.11.2011 - 17:48) *
здравствуйте, решила попытаться сделать вот что. задача пока не поставлена передо мной конкретная поэтому сама думаю что можно делать... попытаться сравнить диеагностическую эффективность Euroscor и данных полученных мною при логрегрессии. возможно бред. тогда остановите меня заранее.

мои данные.
решила брать те параметры которые применяются в евроскоре. проблема что их еще всех у меня на сегодняшний день нету. но как вы сказали мне главное суть понять...
"до"
ID - Familia - Vozrast - Data_operatsii - Pol - HronichZabol_Legkih - Nevrolgiya - PerenOperatsii - Stenokardiya - Vremya_posle_posled_IM - Gipertrof_L_ZH IM
"после"
жив - мертв

пока наверное так хотя хочется привязаться к патологии


а сам файл с данными?

по названиям не очень понятно...

ну и вот дата например, само по себе понятно, но возникает вопрос: будем на день недели преобразовывать? или лето-зима-осень весна?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
_alena_
сообщение 20.11.2011 - 18:58
Сообщение #13


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



креплю
Прикрепленные файлы
Прикрепленный файл  файл_с_данными.rar ( 4,09 килобайт ) Кол-во скачиваний: 194
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
_alena_
сообщение 20.11.2011 - 20:35
Сообщение #14


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



Цитата(p2004r @ 16.11.2011 - 14:12) *
вот с этого сообщения начинается http://forum.disser.ru/index.php?showtopic...ost&p=12230


в чем пишутся все эти коды??? я думала нужно будет в каком то пакете типа статистика или спсс делать
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
_alena_
сообщение 20.11.2011 - 20:41
Сообщение #15


Дух форума
*

Группа: Пользователи
Сообщений: 42
Регистрация: 14.11.2011
Пользователь №: 23301



Цитата(_alena_ @ 20.11.2011 - 19:35) *
в чем пишутся все эти коды??? я думала нужно будет в каком то пакете типа статистика или спсс делать

а все я поняла.... язык и среда для статистических вычислений и графики R.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

5 страниц V   1 2 3 > » 
Добавить ответ в эту темуОткрыть тему