Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Нормальность
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
shaman
Здравствуйте. Я новичок в статистике. разбираюсь, как вначале научной деятельности формируются гипотезы (нулевая и противоположная ей) и т.д.
Корифеи, подскажите доступным языком, что такое "нормальность распределения" и "статистические данные нормально распределены". А то в Википедии очень сложным математическим языком отмечено, я ничего не понял.
плав
Цитата(shaman @ 19.10.2010 - 20:37) *
Здравствуйте. Я новичок в статистике. разбираюсь, как вначале научной деятельности формируются гипотезы (нулевая и противоположная ей) и т.д.
Корифеи, подскажите доступным языком, что такое "нормальность распределения" и "статистические данные нормально распределены". А то в Википедии очень сложным математическим языком отмечено, я ничего не понял.

Нормально распределены, значит распределение подчиняется нормальному закону, его можно описать формулой, которая есть в любом учебнике. Ничего сложного в формуле нет, если тяжело, возьмите и причитайте для начала Гланца.
shaman
Спасибо, Плав, за очень подробный ответ
DoctorStat
Цитата(shaman @ 19.10.2010 - 20:37) *
подскажите доступным языком, что такое "нормальность распределения" и "статистические данные нормально распределены". А то в Википедии очень сложным математическим языком отмечено, я ничего не понял.
Сходите в осенний лес и наберите там 100 упавших листьев дерева одного вида. У клена, например, сейчас очень красивые листья желтого цвета. Измерьте размер каждого листочка. Он будет колебаться в диапазоне приблизительно от 5 до 15 см. Разбейте весь диапазон на несколько интервалов по 1 или 2 см и посчитайте количество листьев, попавших в каждый интервал. Затем на бумаге начертите график. По горизонтали отложите номер интервала, а по вертикали - количество листьев, попавших в данный интервал. Нарисованная вами кривая и будет называться кривой нормального распределения. Или другими словами, размер листьев будет нормально распределен.
docanton
Перед тем, как описывать количественные данные, всегда необходимо проверять нормальность распределения. под видом распределения понимают функцию, связывающую значение переменной случайной величины с вероятностью их появления в совокупности. в медицинских исследованиях чаще всего применяют "проверку распределения на нормальность". Под нормальным распределением понимают симметричное распределение колокообразной формы, при котором около 68% данных отличается от среднего арифметического не более чем на одно, а примерно 95% - не более чем на два стандартных отклонения в каждую сторону.
Проверку нормальности распределения можно провести 3-мя способами: с помощью описательной статистики, графически, и с использованием статистических критериев.
При нормальном распределении, которое симметрично, значение медианы и среднего арифметического равны, а значение асимметрии и эксцесса равны нулю. Если средняя арифметическая больше медианы, а коэффициент асимметрии больше нуля, то распределение имеет правосторонюю асимметрию (скошена вправо). При левосторонней асимметрии средняя арифметическая меньше медианы, а коэффициент асимметрии меньше нуля.


Внизу прикреплена табличка, в которой приведён результат распределения, посчитанный в программе SPSS Statistic 17 версия. По тестам Шапиро-Уилко и Колмогорова-Смирнова в графе Sig. результат меньше 0,001. Следовательно, медиана не равна средней арифметической. Значит применяем непараметрические критерии, например. для двух связанных выборок - критерий Колмогорова, двух несвязанных выборок - Манна-Уитни. Если значение было бы больше 0,05, то применяли бы критерний Стьюдента.

Достигнутый уровень значимости для переменной "доход" представляет собой малую величину меньше 0,001 и позволяет отвергнуть нулевую гипотезу о подчинении данных закону нормального распределения.
Гистограмма показывает, что распределение переменной "доход" смещено вправо, что соответствует результатам описательной статистики. Непрерывная линия на рисунке показывает нормальное распределение при значениях средней арифметической и стандартного отклонения. Таким образом, гистограмма наглядно показывает, что распределение доходов в семьях не подчиняется закону нормального распределения, а значение средней арифметической больше медианы из-за более высоких доходов небольшого количество семей (олигархов).

Игорь
Цитата(docanton @ 2.12.2010 - 20:39) *
Значит применяем непараметрические критерии, например. для двух связанных выборок - критерий Колмогорова

Это ошибочное мнение. Критерий Колмогорова (иначе, Смирнова или Колмогорова-Смирнова) применяется для двух несвязанных выборок.
плав
Цитата(docanton @ 2.12.2010 - 19:39) *
Перед тем, как описывать количественные данные, всегда необходимо проверять нормальность распределения. под видом распределения понимают функцию, связывающую значение переменной случайной величины с вероятностью их появления в совокупности. в медицинских исследованиях чаще всего применяют "проверку распределения на нормальность".

Не стоит писать ответ в случае, если сами не очень разбираетесь в проблеме. Повтор мантры "всегда необходимо проверять нормальность распределения" демонстрирует глубокое непонимание основ теории статистики, а именно разницу между популяционными параметрами (которые должны иметь нормальное распределение в случае неизвестного значения популяционной дисперсии) и выборочными. Еще лишее проверять гистограммой гипотезу о соответствии выборочного распределения нормальному. Хочется графических методов - используйте QQ графики или график на вероятностной бумаге, там хотя бы отклоняющиеся наблюдения видны.
100$
Цитата(docanton @ 2.12.2010 - 20:39) *
Перед тем, как описывать количественные данные, всегда необходимо проверять нормальность распределения...

Проверку нормальности распределения можно провести 3-мя способами: с помощью описательной статистики, графически...



Боже милосердный, неужели человек все это где-то прочитал, или это - его личный вклад в науку?
Olga44
Цитата(shaman @ 19.10.2010 - 20:37) *
Здравствуйте. Я новичок в статистике. разбираюсь, как вначале научной деятельности формируются гипотезы (нулевая и противоположная ей) и т.д.
Корифеи, подскажите доступным языком, что такое "нормальность распределения" и "статистические данные нормально распределены". А то в Википедии очень сложным математическим языком отмечено, я ничего не понял.


1. Банальный ответ - лучше почитать учебник. Без базовых знаний ответы на форуме пользы не принесут.
2. Согласна с Плавом о "мантрах" :-))
3. А гистограммы, на мой взгляд, дают очень наглядное представление об асимметрии распределения, полимодальности, что часто бывает полезно на практике. А уж каким методом потом проверять номальность - ваш выбор.
4. Если же распределение отличается от нормального, тоже не повод для расстройства, так как помимо статистических критериев, основанных на предположении о нормальности распределения совокупности, есть и непараметрические критерии, свободные от предположения о каком-либо конкретном виде распределения.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.