Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> О классическом линейном регрессионном анализе
Green
сообщение 11.02.2010 - 18:16
Сообщение #1





Группа: Пользователи
Сообщений: 120
Регистрация: 27.08.2009
Пользователь №: 6284



Существует книга на русском языке.

Вучков, Бояджиева, Салаков. Прикладной линейный регресионный анализ. Москва, 1987. (перевод Адлера Ю.П.)

В книге рассмотрены

1. Что такое линейная регрессия
2. Классическая модель линейной регрессии и условия
3. Отдельно главы, повященные анализу нарушений условий проведения классического регресионного анализа.


Книга написана так, что ее может понять неспециалист в математике.
Книга не дидактична, не накладывает жестких запретов, а достаточно грамотно объясняет, как проводить классический регресионный анализ и находить оценки параметров, как изменяются оценки в случае нарушений условий проведения, как этого избежать, какими процедурами пользоваться в случае нарушений условий.

Гугл в помощь в поиске.
Р.S. Pinus, Вы на нее ссылались несколько месяцев назад. Следовательно - читали.
Не увидели обсуждения условий нормальности отклика?

Сообщение отредактировал Green - 11.02.2010 - 18:36


Signature
Это не кованализ :)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 11.02.2010 - 20:27
Сообщение #2





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Green @ 11.02.2010 - 18:16) *
... линейный регресионный ...

В одной из тем я уже пытался предостеречь уважаемых собеседников от чрезмерного зацикливания на линейном анализе, которому посвящена масса литературы, особенно в области эконометрики. Поэтому повторюсь, что считаю все источники, в которых на 300-500 страницах "обсасывается" линейная регрессия, просто макулатурой. Авторов этих опусов тоже, впрочем, можно понять, но к науке это не имеет никакого отношения.

Понимание, что должно быть нормальным, приходит в результате изучения общей - нелинейной модели, причем все выкладки должны быть сделаны для модели, вид которой совершенно общий. Линейная модель в данном случае является тривиальным, примитивным частным случаем.

Итак, что должно быть нормальным? Нормальными должны быть остатки. Например, модель - парабола. Нормально должны быть распределены остатки Y-ов относительно этой модели. При этом X-ы (которые в общем случае представляет собой вектор, в простейшем - скаляр, хотя для анализа это не имеет никакого значения) контролируются, и, в принципе, случайными величинами не являются. На анализе остатков как раз и построены все методы регрессионного анализа.

Примерный порядок выводов дан в Справке к новому модулю AtteStat "Аппроксимация и регрессионный анализ".

Сообщение отредактировал Игорь - 11.02.2010 - 20:30


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Green
сообщение 12.02.2010 - 21:13
Сообщение #3





Группа: Пользователи
Сообщений: 120
Регистрация: 27.08.2009
Пользователь №: 6284



Игорь,
1. книга не по эконометрике.

2.
Любая модель имеет свои допущения и ограничения, следствия из них.

Вы не станете запихивать в отклик линейной рег. модели переменную с Пуассоновским распределением. А медики - запросто ( Видела неоднократно). Требовать от них тех знаний, которые дают с технических ВУЗах невозможно.

Поэтому нужен промежуточный слой литературы. Прикладной, а не теоретической, где все начинается с доказательств теорем.
Прикладной, где четко прописано, что можно, а что нельзя.
Потому что жать кнопки в пакете Statistica и получать "красненькую строчку" - это легче, и этот процесс не остановить.

3. Тема была написана не в противовес или дополнение Вашей по литературе, а Pinus предложил обсудить в отдельной теме лин. регрессию. Обсуждение было о требовании к нормальности отклика. http://forum.disser.ru/index.php?showtopic...post&p=9444
Просто получилось одновременно.

4. Спасибо за новый AtteStat smile.gif




Signature
Это не кованализ :)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 13.02.2010 - 18:42
Сообщение #4





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Предложу дикие и парадоксальные соображения о нормальности. smile.gif

Нормальное распределение, как известно, характеризуется НЕПРЕРЫВНОЙ функцией [плотности] распределения, вид которой общеизвестен. Поэтому перед ответом на вопрос, распределение нормальное или ненормальное, хочется спросить: "А с какой точностью вы измеряете?" И вот тут начинаются чудеса. Например, измеряя давление, мы получаем результат с точность до единиц рт.ст., а измеряя рост, мы получаем результат с точностью до мм. И мы нашими приборами не можем (другими приборами сможем, но тогда все рассуждения нетрудно повторить на новом уровне точности) получить десятые рт.ст. и десятые мм при наших измерениях, ибо используемые приборы не позволяют это сделать. Следовательно, ВСЕ реальные измерения мы производим ДИСКРЕТНО. Ни при каких измерениях мы не получаем НЕПРЕРЫВНЫХ количественных величин. Можно лишь вести речь о дробности шкалы. Для роста, например, мы получаем, скажем, от 1500 до 2000 мм - всего лишь 500 значений, для давления и температуры тела на порядок меньше! От 35 до 42 градусов Цельсия с десятыми всего лишь 70 возможных значений - и это непрерывная величина? Из-за ограничения приборов все имеющиеся в природе распределения ДИСКРЕТНЫ. Более того, и значения контролируемой переменной дискретны. Вызвано это тем, что никогда не изучается "объект исследования", а изучается совокупность "объект исследования + измерительное устройство", причем измерительным устройством может быть как прибор, как человек (лаборант), так и совокупность "прибор + лаборант". Параметрами измерительного устройства определяется точность наших знаний об объекте.

Хотя центральные предельные теоремы нам говорят, что при большом числе измерений распределение стремится к нормальному, речь идет о том, что действительно "стремится" - асимптотически, а не является, что и подчеркивают авторы. Нормального распределения принципиально не существует в природе, как и любых непрерывных распределений. Природа, отображаемая на наши органы чувств, дискретна благодаря дискретности измерительных устройств.

Тут еще один момент. Раз меряем дискретные величины, имеет место уже ограничение шкалы измерения (по математическим действиям, допустимым в данной шкале). Измерив, скажем рост - 1700, 1710 и 1800 мм - и подсчитав среднее значение - примерно 1736,7 мм, мы обнаруживаем, что такого значения мы не получим ни в каком измерении, т.к. наши приборы не позволят измерить такую величину. Такой величины просто не может быть получено в эксперименте! Может быть 1736 и 1737, а вот 1736,7 - это ложь, такого не бывает в эксперименте. Мы можем лишь предполагать, что у кого-то рост 1736,7 мм, возможно, и существует. Но доказать инструментально это нельзя. Тут уж, извините, не наука, а религия.

Каков выход? - Непараметрика. Медиана множества. И т.п.

Можно относиться к данным рассуждениям как к шутке. smile.gif

Сообщение отредактировал Игорь - 4.03.2010 - 12:01


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Green
сообщение 13.02.2010 - 20:03
Сообщение #5





Группа: Пользователи
Сообщений: 120
Регистрация: 27.08.2009
Пользователь №: 6284



Шутка хорошая smile.gif

Меня мучает другой парадокс, в головах в общем-то грамотного народа.

Тут на форуме неоднократно говорилось о том, что для дисперсионного анализа нужно проверять нормальность всей выборки. Все сошлись на этом. Никто не отрицает.

Мы знаем, что и дисперсионный и лин. рег анализ работает в рамках одной линейной модели

У=B*X + e
где матрица X для ДА состоит из нулей и единиц.

Тогда почему, соглашаясь с тем, что для ДА нужна нормальность отклика (ОБЩАЯ), начинаются утверждения о том, что не нужна проверка, нужна на уровнях...
Или есть одна общая модель и нет.

Для меня мир един smile.gif

А вот как рассуждают остальные? Загадка, однако.
--------
Насчет нормальности, и вообще статистики. Как говаривал Черчиль? "Есть три вида лжи: ложь, наглая ложь и статистика".
Поэтому в любом случае, я за здравый смысл smile.gif




Signature
Это не кованализ :)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему