![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
![]() Группа: Пользователи Сообщений: 2 Регистрация: 29.11.2010 Пользователь №: 22968 ![]() |
Здравствуйте!
Есть странные вопросы, на которые мне не ответил преподаватель. Сославшись, что это классическая теория, нужно только запоминать. Вопросы: 1.Почему при расчете несмещенной дисперсии ее находят по формуле деля на (n-1). Откуда берется ?-1?. Прочитав про разные степени свободы, я так и не понял, почему так, а не просто на ?n?. Разница в результатах расчета смещенной и несмещенной дисперсии при малом количестве данных значительна. Почему так сделано, зачем? 2.На лекциях мы применяем таблицы Фишера и Стьюдента для проверки гипотез. После расчетов сравниваем с табличным значением и делаем выводы. Объясните мне, пожалуйста, что это за таблицы, как они появились, почему я сравниваю с какими-то цифрами, как их рассчитали? Расскажите как чайнику, так что бы бабушке было понятно. Очень нужно, скоро зачет, а преподаватель явно будет валить меня за мои вопросы. ![]() Student
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Поделюсь своим мнением, т.к. тоже приходится приводить данные по металлам. Отношусь к среднему арифметическому просто как к одной из мер положения. Действительно, для распределений, отличных от нормального, она не является оптимальной. Но неоптимальность - одно, а стат. некорректность - другое. Я специально анализировал типы распределения металлов в некоторых наборах своих данных (вода, снег, почвы) и пришёл к выводу о столь же надуманном логарифмическом преобразовании таких данных, т.е. расчёте не арифметического, а геометрического среднего. Хотя тоже, в геологических работах - сплошное простое логарифмирование. Медиана является хорошей мерой положения, но в публикациях не встречается такая форма представления данных как медиана с 95% ДИ, а обычные в таких случаях коробчатые графики не позволяют сравнивать медианы графически. Я принял для себя следующую стратегию предоставления данных по металлам.
(1) Если объём публикации это позволяет - даю и среднее, и медианы, и нижнюю с верхней квартили (в наших классических учебниках по статистике квартиль женского рода). Но не даю стандартную ошибку среднего ввиду её полной бессмысленности. (2) Если данных много (десятки наблюдений) - преобразую их по Боксу-Коксу, нахожу среднее арифметическое и 95%-ные ДИ для него, и полученные значения ретрансформирую к исходной шкале. Т.о. получается, что для нормально распределённых данных (лямбда = 1) привожу среднее арифметическое с ДИ для него, для логнормально распредённых данных (лямбда = 0) - среднее геометрическое с ДИ для него, а для промежуточных вариантов (у меня часто лямбда в районе 0,2-0,3) - среднее, оптимальное для таких данных и ДИ для него. (3) Если данных мало (до 20, доверия к получаемому в ходе преобразования по Боксу-Коксу значению лямбды нет) и объём публикации не позволяет дать описательную статистику развёрнуто - соглашаюсь с тем, что ничего не знаю о типе распределения, но не отказываюсь от среднего арифметического. Всё-таки это - самая простая и распространённая мера положения. Привожу среднее и 95%-ные доверительные интервалы для него, полученные бутстрепом. Чем сильнее скошено распределение данных, тем асимметричнее получаются ДИ. Эти же значения и откладываю на графиках, если места для таблицы с описательной статистикой совсем нет. |
|
![]() |
![]() |
![]() ![]() |