Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: каким методом лучше посчитать достоверность различий
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Sozdanie
доброго времени суток. У меня возникла следующая проблема.
Если кратко, проведено исследование акустической коммуникации 8 домовых мышей. Вокализации оценивались по ряду параметров (всего 12). Один из параметров - основная частота (в кГц). Так вот, количество сигналов у разных мышей разное (у одной 30, у другой 120 и т.д.), тест на нормальность распределения весьма туманен - у одной мыши распределение соответствует нормальному, у другой - нет. необходимо определить, различаются ли показатели основной частоты у Всех мышей. Пыталась решить через хи-квадрат. Там попарное сравнение. И получается, что эти две мыши не различаются, а эти различаются. Помогите решить данную проблему, статья горит.
С уважением.
p2004r
Цитата(Sozdanie @ 27.02.2012 - 14:29) *
доброго времени суток. У меня возникла следующая проблема.
Если кратко, проведено исследование акустической коммуникации 8 домовых мышей. Вокализации оценивались по ряду параметров (всего 12). Один из параметров - основная частота (в кГц). Так вот, количество сигналов у разных мышей разное (у одной 30, у другой 120 и т.д.), тест на нормальность распределения весьма туманен - у одной мыши распределение соответствует нормальному, у другой - нет. необходимо определить, различаются ли показатели основной частоты у Всех мышей. Пыталась решить через хи-квадрат. Там попарное сравнение. И получается, что эти две мыши не различаются, а эти различаются. Помогите решить данную проблему, статья горит.
С уважением.


как то очень сумбурно изложено у Вас frown.gif

пытаюсь понять:

1. измерение заключается в регистрации сигнала подаваемого мышью. Регистрируется частота на которой издается сигнал.
2. таких измерений проведено много
2. для каждого измерения известно какая из 8ми мышей его издала

если именно так, тогда делайте таблицу в 2 столбика

"частота сигнала", "номер мыши его издавшей"

и анализируйте значит ли что то фактор мышь (чем конкретно надо смотреть какие остатки даст анализ, начните с ANOVA). Если фактор мышь играет роль и его нельзя отвергнуть, тогда у всех мышей частота не может быть одинаковой. У каких то мышей частоты могут и совпадать.

если еще и разные эксперименты вводите второй фактор "эксперимент".
100$
Цитата(Sozdanie @ 27.02.2012 - 14:29) *
Один из параметров - основная частота (в кГц). Так вот, количество сигналов у разных мышей разное (у одной 30, у другой 120 и т.д.), тест на нормальность распределения весьма туманен - у одной мыши распределение соответствует нормальному, у другой - нет.


Количество сигналов - 30, 120 и т.д. - это дискретная величина. Зачем проверять ее на нормальность?
Sozdanie
Постраюсь объяснить подробней. )
8 мышей. Количество сделанных измерений: 1 мышь - 25, 2- 40, 3- 120, 4- 30.... Разброс примерно такой. Показатели основной частоты - 3.5 кГц, 3.3 кГц 2.7 кГц и т.д. На нормальность проверяли показатели основной частоты у каждой из 8 мышей. У трех мышей распределение отличалось от нормального. У пяти - нет. Нам необходимо узнать, различается ли основная частота у всех 8 мышей.
Sozdanie
Цитата(p2004r @ 27.02.2012 - 21:16) *
как то очень сумбурно изложено у Вас frown.gif

пытаюсь понять:

1. измерение заключается в регистрации сигнала подаваемого мышью. Регистрируется частота на которой издается сигнал.
2. таких измерений проведено много
2. для каждого измерения известно какая из 8ми мышей его издала

если именно так, тогда делайте таблицу в 2 столбика

"частота сигнала", "номер мыши его издавшей"

и анализируйте значит ли что то фактор мышь (чем конкретно надо смотреть какие остатки даст анализ, начните с ANOVA). Если фактор мышь играет роль и его нельзя отвергнуть, тогда у всех мышей частота не может быть одинаковой. У каких то мышей частоты могут и совпадать.

если еще и разные эксперименты вводите второй фактор "эксперимент".


Спасибо, постараюсь посчитать.
100$
Цитата(Sozdanie @ 28.02.2012 - 14:09) *
Постраюсь объяснить подробней. )
8 мышей. Количество сделанных измерений: 1 мышь - 25, 2- 40, 3- 120, 4- 30.... Разброс примерно такой. Показатели основной частоты - 3.5 кГц, 3.3 кГц 2.7 кГц и т.д. На нормальность проверяли показатели основной частоты у каждой из 8 мышей. У трех мышей распределение отличалось от нормального. У пяти - нет. Нам необходимо узнать, различается ли основная частота у всех 8 мышей.


Вы делаете 2 небольших ошибки:

1. если вы поймали мышь и сделали на ней 25 замеров, то полученные величины не будут независимыми в статистическом смысле: мышь -то одна и та же. На нормальность можно проверять только независимые случайные величины. Следовательно, данные 25 замеров необходимо не на нормальность проверять, а тупо усреднить. То же самое проделать со второй мышью: усреднить 40 замеров, у третьей мыши-усреднить 120 замеров и т.д. На выходе - выборка из 8 мышей и 8 цифр основной частоты. На нормальность надо проверять вот эти 8 цифр (что само по себе бессмысленно: по 8 случайным величинам нормальность не проверишь). Далее проверяете гипотезу о средней.

2. Герц - это количество колебаний в секунду. Количество это может быть только числом из натурального ряда: 1 2 3 ..., т.е. дискретной величиной. Она по определению распределена не нормально. Незачем и время тратить на проверку, тем более, что по 25 величинам доказательно проверить нормальность нереально.

Кстати, почему количество замеров у каждой мыши так отличается? Некоторые мыши сильно брыкались?


Sozdanie
[quote name='100$' date='28.02.2012 - 16:31' post='13032']
Вы делаете 2 небольших ошибки:

1. если вы поймали мышь и сделали на ней 25 замеров, то полученные величины не будут независимыми в статистическом смысле: мышь -то одна и та же. На нормальность можно проверять только независимые случайные величины. Следовательно, данные 25 замеров необходимо не на нормальность проверять, а тупо усреднить. То же самое проделать со второй мышью: усреднить 40 замеров, у третьей мыши-усреднить 120 замеров и т.д. На выходе - выборка из 8 мышей и 8 цифр основной частоты. На нормальность надо проверять вот эти 8 цифр (что само по себе бессмысленно: по 8 случайным величинам нормальность не проверишь). Далее проверяете гипотезу о средней.

2. Герц - это количество колебаний в секунду. Количество это может быть только числом из натурального ряда: 1 2 3 ..., т.е. дискретной величиной. Она по определению распределена не нормально. Незачем и время тратить на проверку, тем более, что по 25 величинам доказательно проверить нормальность нереально.

Кстати, почему количество замеров у каждой мыши так отличается? Некоторые мыши сильно брыкались?
[/quo

Спасибо огромное!
Эксперименты проводились при имитации различных форм поведения. У разных мышей, разная акустическая активность, каждая по разному переносит стресс, поэтому количество полученных сигналов различно.
А тест на достоверность различий возможно провести какой либо?
100$
Цитата(Sozdanie @ 28.02.2012 - 17:01) *
Цитата(100$ @ 28.02.2012 - 16:31) *

Вы делаете 2 небольших ошибки:

1. если вы поймали мышь и сделали на ней 25 замеров, то полученные величины не будут независимыми в статистическом смысле: мышь -то одна и та же. На нормальность можно проверять только независимые случайные величины. Следовательно, данные 25 замеров необходимо не на нормальность проверять, а тупо усреднить. То же самое проделать со второй мышью: усреднить 40 замеров, у третьей мыши-усреднить 120 замеров и т.д. На выходе - выборка из 8 мышей и 8 цифр основной частоты. На нормальность надо проверять вот эти 8 цифр (что само по себе бессмысленно: по 8 случайным величинам нормальность не проверишь). Далее проверяете гипотезу о средней.

2. Герц - это количество колебаний в секунду. Количество это может быть только числом из натурального ряда: 1 2 3 ..., т.е. дискретной величиной. Она по определению распределена не нормально. Незачем и время тратить на проверку, тем более, что по 25 величинам доказательно проверить нормальность нереально.

Кстати, почему количество замеров у каждой мыши так отличается? Некоторые мыши сильно брыкались?


Спасибо огромное!
Эксперименты проводились при имитации различных форм поведения. У разных мышей, разная акустическая активность, каждая по разному переносит стресс, поэтому количество полученных сигналов различно.
А тест на достоверность различий возможно провести какой либо?


Итак, имеем 8 мышей, т.е. выборку. Вариация изучаемого признака должна идти от объекта к объекту (т.е. от мыши к мыши). При этом мы понимаем, что эти 8 мышей - выборка из некоторой генеральной совокупности. Следовательно, необходимо ответить на вопрос, в какой мере выводы по выборке можно распространить на генеральную совокупность. Это и называется проверкой гипотезы о средней.
Для этого достаточно вычислить выборочную среднюю (по 8 мышам) и построить для нее 95%-ный доверительный интервал. Если все значения по всем мышам окажутся внутри этого интервала - мыши статистически неразличимы (пищат на одной частоте).
Sozdanie
Цитата(100$ @ 28.02.2012 - 17:44) *
Спасибо огромное!
Эксперименты проводились при имитации различных форм поведения. У разных мышей, разная акустическая активность, каждая по разному переносит стресс, поэтому количество полученных сигналов различно.
А тест на достоверность различий возможно провести какой либо?


Итак, имеем 8 мышей, т.е. выборку. Вариация изучаемого признака должна идти от объекта к объекту (т.е. от мыши к мыши). При этом мы понимаем, что эти 8 мышей - выборка из некоторой генеральной совокупности. Следовательно, необходимо ответить на вопрос, в какой мере выводы по выборке можно распространить на генеральную совокупность. Это и называется проверкой гипотезы о средней.
Для этого достаточно вычислить выборочную среднюю (по 8 мышам) и построить для нее 95%-ный доверительный интервал. Если все значения по всем мышам окажутся внутри этого интервала - мыши статистически неразличимы (пищат на одной частоте).


Спасибо за доступное объяснение.. действительно, посмотрела статьи немецких коллег - на нормальность никто не считал )
А с такими параметрами, как длительность (мс), наличие модуляции, шумового компонента и разрывов (все в %), считать подобным образом?
p2004r
Цитата(100$ @ 28.02.2012 - 16:31) *
1. если вы поймали мышь и сделали на ней 25 замеров, то полученные величины не будут независимыми в статистическом смысле: мышь -то одна и та же. На нормальность можно проверять только независимые случайные величины. Следовательно, данные 25 замеров необходимо не на нормальность проверять, а тупо усреднить. То же самое проделать со второй мышью: усреднить 40 замеров, у третьей мыши-усреднить 120 замеров и т.д. На выходе - выборка из 8 мышей и 8 цифр основной частоты. На нормальность надо проверять вот эти 8 цифр (что само по себе бессмысленно: по 8 случайным величинам нормальность не проверишь). Далее проверяете гипотезу о средней.


а если так? мы поймали 8 мышей с сбрасывали их с останкинской телебашни регистрируя время падения. независимость надо доказывать по моему.
100$
Цитата(Sozdanie @ 1.03.2012 - 13:08) *
Спасибо за доступное объяснение.. действительно, посмотрела статьи немецких коллег - на нормальность никто не считал )
А с такими параметрами, как длительность (мс), наличие модуляции, шумового компонента и разрывов (все в %), считать подобным образом?


Аналогично
p2004r
Цитата(Sozdanie @ 1.03.2012 - 13:08) *
А с такими параметрами, как длительность (мс), наличие модуляции, шумового компонента и разрывов (все в %), считать подобным образом?


все таки эти показатели почти наверняка связаны друг с другом. надо строить PCA пространство по сигналам и характеристикам, в котором случаи одной мыши обозначены одним типом маркера (есть варианты PCA которые группы наносят в пространство PCA в виде графов или эллипсов рассеяния). Можно строить LDA решающий разделение сигналов разных мышей друг от друга.

но все это надо строить по самим сигналам без ненужной агрегации, компьютер уже изобретен smile.gif
nokh
Цитата(Sozdanie @ 27.02.2012 - 16:29) *
доброго времени суток. У меня возникла следующая проблема.
Если кратко, проведено исследование акустической коммуникации 8 домовых мышей. Вокализации оценивались по ряду параметров (всего 12). Один из параметров - основная частота (в кГц). Так вот, количество сигналов у разных мышей разное (у одной 30, у другой 120 и т.д.), тест на нормальность распределения весьма туманен - у одной мыши распределение соответствует нормальному, у другой - нет. необходимо определить, различаются ли показатели основной частоты у Всех мышей. Пыталась решить через хи-квадрат. Там попарное сравнение. И получается, что эти две мыши не различаются, а эти различаются. Помогите решить данную проблему, статья горит.
С уважением.

Не понятно что вы проверяете. Соответственно не понятно что сравнивать. Количественные показатели можно сравнить по:
1) мерам положения, оценивающим центральную тенденцию: среднее, медиана, мода
2) по мерам рассеяния значений относительно центральной тенденции, которые иногда называют мерами масштаба: дисперсия, квартили, минимум-максимум, размах.
3) по форме распределения показателя. Т.е., при одинаковых средних и дисперсии форма распределения может существенно разниться, например в одном случае распределение будет симметричное и примерно нормальное, в другом - скошенное в правую сторону, в третьем - скошенное в левую сторону, в четвёртом - бимодальное (двухвершинное), а в пятом полимодальное.

Непонятно также что такое количество сигналов - какая-то самостоятельная характеристика, или просто вы выполнили разное количество замеров для разных животных. Если это самостоятельная характеристика она указывает, вероятно, на некий набор вокализаций, который у одних животных беднее чем у других. Например, у моего директора в последнее время появилась новая вокализация - орать на своих сотрудников, а у сотрудников такая вокализация в межличностных отношениях отсутствует. Если же количество сигналов зависело от количества замеров, то результаты сравнений могут не быть адекватными, т.к. возможно вы просто не застали другие вокализации.
Larina Tatjana
Цитата(Sozdanie @ 27.02.2012 - 20:59) *
доброго времени суток. У меня возникла следующая проблема.
Если кратко, проведено исследование акустической коммуникации 8 домовых мышей. Вокализации оценивались по ряду параметров (всего 12). Один из параметров - основная частота (в кГц). Так вот, количество сигналов у разных мышей разное (у одной 30, у другой 120 и т.д.), тест на нормальность распределения весьма туманен - у одной мыши распределение соответствует нормальному, у другой - нет. необходимо определить, различаются ли показатели основной частоты у Всех мышей. Пыталась решить через хи-квадрат. Там попарное сравнение. И получается, что эти две мыши не различаются, а эти различаются. Помогите решить данную проблему, статья горит.
С уважением.



Привет! Полностью присоединяюсь к ответу "nokh". Молодец, коллега, всё расставил "по полочкам". Продолжу его ответ.
Начну с того, что нет такого понятия, как "достоверность различий". Читайте умные книги и статьи по статистике. Особенно мне понравилась статья Зорина на тему нелепости термина "достоверность различий". Сам факт использования этого термина уже говорит о том, что тот, кто его использует, "не копенгаген" в основных понятиях статистики. Вы пишете: "тест на нормальность распределения весьма туманен". Но при этом не пишите о том, какой конкретно ТЕСТ ПРОВЕРКИ НОРМАЛЬНОСТИ Вы использовали? А ведь этих тестов не 1-2, а гораздо больше. Т.е. "туманный" не тест, а Ваше описание проблемы.

Уважаемый (ая) 'Sozdanie' ! На форумах можно найти полезный совет о том, как лучше сделать тот, или иной анализ. Но для этого нужно описать проблему достаточно полно, ясно, и понятно. Ваше же описание не позволяет участникам форума дать Вам конкретные советы. Так что переформулируйте свой вопрос, сопроводив его подробным описанием самого массива данных, описанием признаков, описанием ЗАДАЧ и ЦЕЛЕЙ исследования и т.п. Лишь тогда компетентные участники форума смогут помочь.

Желаю успеха!
YVR
Цитата(Sozdanie @ 28.02.2012 - 16:09) *
Постраюсь объяснить подробней. )
8 мышей. Количество сделанных измерений: 1 мышь - 25, 2- 40, 3- 120, 4- 30.... Разброс примерно такой. Показатели основной частоты - 3.5 кГц, 3.3 кГц 2.7 кГц и т.д. На нормальность проверяли показатели основной частоты у каждой из 8 мышей. У трех мышей распределение отличалось от нормального. У пяти - нет. Нам необходимо узнать, различается ли основная частота у всех 8 мышей.


У животных, птиц и у людей, кстати тоже, параметры вокализации зависят от пола и возраста. Мыши не исключение. Т.е. Вам нужно разбить мышей по половым и возрастным категориям и искать основные частоты в этих самых категориях. Всех постричь под одну гребенку не получится.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.