Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Теория статистического анализа данных в вопросах, Разбираем вопросы по теории методов статистического анализа данных
Black Jack
сообщение 30.11.2010 - 21:07
Сообщение #1





Группа: Пользователи
Сообщений: 2
Регистрация: 29.11.2010
Пользователь №: 22968



Здравствуйте!
Есть странные вопросы, на которые мне не ответил преподаватель. Сославшись, что это классическая теория, нужно только запоминать.
Вопросы:
1.Почему при расчете несмещенной дисперсии ее находят по формуле деля на (n-1). Откуда берется ?-1?. Прочитав про разные степени свободы, я так и не понял, почему так, а не просто на ?n?. Разница в результатах расчета смещенной и несмещенной дисперсии при малом количестве данных значительна. Почему так сделано, зачем?
2.На лекциях мы применяем таблицы Фишера и Стьюдента для проверки гипотез. После расчетов сравниваем с табличным значением и делаем выводы. Объясните мне, пожалуйста, что это за таблицы, как они появились, почему я сравниваю с какими-то цифрами, как их рассчитали?

Расскажите как чайнику, так что бы бабушке было понятно. Очень нужно, скоро зачет, а преподаватель явно будет валить меня за мои вопросы.


Signature
Student
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 26.12.2010 - 20:30
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Ancha @ 26.12.2010 - 17:32) *
100$, Вы же понимаете, надеюсь, что 2500 проб - это невозможно сделать (по одному объекту), даже 100 невозможно.
По примерным подсчетам это я только морковку за 5-6 лет обработаю, а еще где-то полторы сотни параметров... По вашему получается что вообще 20-30 проб статистически обрабатывать нельзя?

Пока вынужден относиться как к флуду не к Вашим сообщениям, а к сообщениям 100$ , поскольку в них нет дельных советов, а люди обращаются на форум именно в поисках советов, а не для того чтобы кто-то грузил не по делу. О проверки на нормальность распределения речь вообще не шла. Речь шла о способе представления описательной статистики в случае малых выборок неизвестного распределения. Но в посте #24 100$ сам поднимает вопрос об объёме выборки для проверки нормальности, а в посте #27 сам же на него отвечает, только как будто проверять нормальность на малых выборках собирались Вы. Короче, громко и сам с собою. Тем более не считаю его компетенцию сколь либо достаточной для критического обзора рекомендаций, выданных вам другими участниками обсуждения и мной в частности. И 2500 проб - тоже флуд. На выборках такого объёма можно скорее доказать, что ни один известный тип распределения не подходит к данным, чем подтвердить нормальность или логнормальность распределения. 20-З0 проб - уже может быть достаточно не только для характеристики центральной тенденции в данных, но и для попыток их многомерного обобщения в вариантах факторного анализа, а также для геостатистического анализа с последующим построением карт распределения загрязнённости. По личному опыту для металлов в воде воде этого может быть недостаточно, а вот для почв, рыбы и особенно донных отложений - вполне.

Цитата(DrgLena @ 26.12.2010 - 20:30) *
... Меня никак не убедила мысль, что на одной грядке растут нормальные по содержанию свинца объекты и монстры с превышением предельно допустимые концентрации. Нужно искать причину такой вариабельности, а не приводить кучу статистических обобщений для 5 объектов. Впрочем, могу ошибаться в предметной области, поэтому не помешала бы статья из надежного источника с описанием подобных исследований.

Я в предыдущем посте специально обратил внимание на иммунологические показатели, Игорь далее - на биохимические. Т.е. дело скорее не в предметной области, пожалуй в любой области находятся такие показатели. Скажем в гидрохимии также принято приводить усреднённый химический состав воды, хотя ни о какой нормальности речи не идёт, т.к. каждая часть и уровень водоёма имеют свою специфику - если в каждой делать по 30 измерений будет отчётливое полимодальное распределение. Если говорить о металлах, то главный источник изменчивости - мозаичный характер загрязнения и тренды загрязнения, т.е. также имеем полимодальность, поскольку одни участки территории подвергаются микроэлементной нагрузке от специфических источников загрязнения, другие - практически нет, или подвергаются, но от других источников. Я бы заострил вопрос именно на способе представления усреднённых характеристик гетерогенных выборок. Как, например, Вы представляете описательную статистику по иммунологическим, биохимическим и прочим сильно варьирующим показателям?

Сообщение отредактировал nokh - 26.12.2010 - 21:10
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Black Jack   Теория статистического анализа данных в вопросах   30.11.2010 - 21:07
- - Игорь   Цитата(Black Jack @ 30.11.2010 - 22...   1.12.2010 - 07:05
- - Black Jack   .... чайник вскипел, а бабушка в больнице Спаси...   1.12.2010 - 15:38
|- - DoctorStat   Цитата(Black Jack @ 1.12.2010 - 15:3...   1.12.2010 - 16:41
|- - Игорь   Цитата(Black Jack @ 1.12.2010 - 16:3...   1.12.2010 - 17:46
- - Ancha   Здравствуйте, помогите, пожалуйста, разобраться. ...   23.12.2010 - 22:51
|- - 100$   Цитата(Ancha @ 23.12.2010 - 23:51) ....   23.12.2010 - 23:55
|- - плав   Цитата(100$ @ 23.12.2010 - 23:5...   25.12.2010 - 13:11
- - Ancha   спасибо ))   24.12.2010 - 18:25
- - Ancha   А кто даст гарантию, что в СанПиНе тоже медиана ра...   25.12.2010 - 17:57
|- - Игорь   Цитата(Ancha @ 25.12.2010 - 17:57) А...   25.12.2010 - 18:30
|- - DoctorStat   Цитата(Ancha @ 25.12.2010 - 17:57) А...   25.12.2010 - 19:44
- - Ancha   прийдется видимо продукты (и т.п.) пересчитывать (...   25.12.2010 - 19:06
- - Ancha   Вы такими словами пишете - я ничего не понимаю. Мо...   25.12.2010 - 19:55
- - Ancha   С медианой расчеты получаются не корректные. Допус...   25.12.2010 - 20:05
|- - Игорь   Цитата(Ancha @ 25.12.2010 - 21:05) С...   25.12.2010 - 20:24
- - nokh   Поделюсь своим мнением, т.к. тоже приходится приво...   25.12.2010 - 20:27
- - Ancha   Игорь, в том то и дело что расчитано правильно. Са...   25.12.2010 - 20:38
- - nokh   Цитата(Ancha @ 25.12.2010 - 22:38) И...   25.12.2010 - 21:01
- - Ancha   Не понимаю почему они цензурированные? Вот данные:...   25.12.2010 - 21:06
- - nokh   Я не вижу в этих данных значения "или 0 (невы...   25.12.2010 - 22:10
- - Ancha   Вот, вот, данные не цензурированные, а медиана не ...   25.12.2010 - 22:28
- - nokh   Учитывая, что значения различаются на порядки в да...   25.12.2010 - 23:57
- - 100$   А чтой-то никто не спросит девушку про объем выбор...   26.12.2010 - 02:10
- - Ancha   Гы. ) А по скольким ж морковкам я должна считать? ...   26.12.2010 - 12:11
|- - Игорь   Цитата(Ancha @ 26.12.2010 - 12:11) Г...   26.12.2010 - 13:51
- - 100$   To Ancha: Вот хотите - верьте, хотите-проверьте, ...   26.12.2010 - 14:45
- - Ancha   100$, Вы же понимаете, надеюсь, что 2500 проб...   26.12.2010 - 15:32
|- - 100$   Цитата(Ancha @ 26.12.2010 - 16:32) 1...   26.12.2010 - 16:14
- - DrgLena   Цитата(100$ @ 26.12.2010 - 17:1...   26.12.2010 - 18:30
- - Ancha   Почитайте журнал ?Гигиена и санитария?, бесчисленн...   26.12.2010 - 19:22
- - nokh   Цитата(Ancha @ 26.12.2010 - 17:32) 1...   26.12.2010 - 20:30
- - 100$   Nokh, первая часть поста #32 не удалась И вааще н...   26.12.2010 - 23:33
- - DrgLena   Цитата(Ancha @ 26.12.2010 - 20:22) D...   27.12.2010 - 02:23
- - Ancha   DrgLena, надеюсь, Вы не приняли за правду число мо...   27.12.2010 - 19:43
- - DrgLena   Цитата(Ancha @ 27.12.2010 - 19:43) О...   27.12.2010 - 19:59
|- - DoctorStat   Цитата(DrgLena @ 27.12.2010 - 19:59)...   27.12.2010 - 22:43
- - DrgLena   Не важно сколько нарисовано морковок, расчет Dmax ...   28.12.2010 - 00:00


Добавить ответ в эту темуОткрыть тему