Критерий для анализа сверхмалых выборок

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Критерий для анализа сверхмалых выборок, выборки из 3 значений. Применение стат. анализа

Vitek_22 Просмотр профиля	25.05.2022 - 12:45 Сообщение #1
Группа: Пользователи Сообщений: 30 Регистрация: 7.12.2012 Пользователь №: 24440	Салют! Столкнулся с проблемой сравнения двух выборок, в каждой из которых по 3 значения. Это результаты иммуноблоттинга (определение концентрации целевого белка в пробе) очень ценных образцов, полученных от трансгенных животных. Но их - образцов, было всего 3 для каждой из групп (2 группы: интактная и подвергнутая воздействию исследуемого фактора). Покопавшись в литературе, нашёл статьи, где есть такие выборки и авторы как ни в чём не бывало используют t-критерий Стьюдента для сравнения средних. Нашёл статьи, где используют U-критерий Манна-Уитни... Скажем так, в биологии 3 образца - это нормально для публикации, если речь идёт об особо ценном и сложнополучаемом биоматериале (к примеру как у меня, когда животные практически не дают потомства). Т.е. представить эти данные можно и не стыдно. Но вот как сравнить, как показать, что эти выборки отличаются статистически значимо, иными словами, что наш исследуемый фактор значимо повлиял на концентрацию целевого белка? Почитал ещё о таком методе, как ресамплинг или бутстреп, когда объём выборки искусственно увеличивают. Ну, не знаю насколько это правильно... также не нашёл софт и чёткого понимания как это сделать у меня нет. Работаю в проге Statistica 12 Посоветуйте, как всё же обработать эти данные. Вот пример исходных цифр: Выборка 1: 221,60112 305,217725 295,251684 Выборка 2: 371,3313 397,452722 437,212724

Ответов

ИНО Просмотр профиля	9.06.2022 - 22:28 Сообщение #2
Группа: Пользователи Сообщений: 290 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632	Цитата Грубо говоря - одно и то же. Исправлять нечего. Следовало бы, конечно, пояснить, что такое p в листинге. Однак ж... У Вашей новой программы какая-то альтернативная трактовка p, отличная от общепринятой? Посчитал и понял: StatAnt для Стьюдента выдает 1-p (одностороннее). Понять бы еще зачем. Для конспирации? Особо интересует, почему в случае с Пагуровой прога ведет себя наоборот, то есть, как и положено во всем остальном мире Студентов, которым приходится тайну сию объяснять, как-то жалко стало. Версия Аттестата у меня была 13.1. Скачал с этого нехорошего Сорсефоржа версию 13.2. Нехорошего, потому что он сначала подверг обидной дискриминации мой айпишник со словами: "Your request is being denied as it appears to be coming from a location banned by our Terms of Use", поэтому пришлось пользовать прокси. Вдвойне обидно, что все было зря: новая версия не отличается от предыдущей: Леман-Розенблатт без предварительной сортировки выборок по возрастанию все так же показывает погоду на Луне. Барнарда уж проверять не стал. В общем, спасибо за с пользой проведенное время! P.S. Последние несколько лет единственное, для чего безбоязненно использую Аттестат - транспонирование таблиц. Уж больно оно штатными средствами Экселя муторно делается. Если б Аттестат принимал не только числовые данные, цен б ему не было. А вот для статанализа без предварительных проверок стрёмно - х. з., что он там насчитает. А уж после проверок, если результат сошелся, то уже особого смысла в Аттестате, как легкой кнопочной надстройки Экселя вместо R (кодинг - не мое) особого смысла-то и не остается. Не в обиду будь сказано - просто констатация суровой реальности. Сообщение отредактировал ИНО - 9.06.2022 - 22:44

Игорь Просмотр профиля	10.06.2022 - 13:15 Сообщение #3
Группа: Пользователи Сообщений: 1162 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(ИНО @ 9.06.2022 - 22:28) Однак ж... У Вашей новой программы какая-то альтернативная трактовка p, отличная от общепринятой? Это результат подстановки значения критерия в обратную функцию распределения. Из-за особенности вычисления нужно смотреть, что именно вычисляется (p, 1-p, 2p и т.п.) и выдавать правильное значение. В AtteStat это сделано. Здесь нет. В-общем это можно сделать в самих функциях распределения, но такого рода промежуточные вычисления используются в других алгоритмах. Резюмируя - считается правильно, выводится не то (не проблема - всё-равно никто не пользуется). Еще один момент - формулировка гипотезы: в общем случае (не для всех тестов) две односторонних и одна двусторонняя. Результат тоже нужно правильно интерпретировать. По идее нужны редизайн приложения и хорошее тестирование. Просто взяться и аккуратно сделать. Цитата(ИНО @ 9.06.2022 - 22:28) Леман-Розенблатт без предварительной сортировки выборок по возрастанию все так же показывает погоду на Луне. Посмотрел, согласился, подправил (пара строчек кода) библиотеку, но исправлять AtteStat не буду - поздно уже. Опять же нет качественно просчитанных примеров для сравнения. Цитата(ИНО @ 9.06.2022 - 22:28) Барнарда уж проверять не стал. В общем, спасибо за с пользой проведенное время! Посмотрел свои записи. Там считается оптимальное значение параметра сначала глобальным поиском, потом уточняется. Не думаю, что в этом месте ошибка, но проверять нужно на хороших данных. Цитата(ИНО @ 9.06.2022 - 22:28) Не в обиду будь сказано - просто констатация суровой реальности. Да согласен абсолютно - давно собирался прикрыть проект, но некоторым он зачем-то нужен. Проверять некому, а это главное. Что-то протестировано неплохо, если кого-то интересовали определенные методы. Создавать новый проект тоже смысла не вижу. Не окупится из-за малой востребованности. Попутно при нашем обсуждении проблемы пару моментов хотелось упомянуть. Первое - на столь малых выборках будет дикая ошибка второго рода. Достаточно посмотреть функции мощности. Так что результат вычислений можно смело считать чепухой. Интересно, что малые выборки возникают достаточно часто. Например, биохимики мне такие данные приносили, причем в выборке численностью 3-4-5 варианты отличались на 3 порядка. Говорят, что такие данные у них - норма. Второе (апологетов прошу не обижаться). Если статистику (встроенную) в Excel еще как-то можно посчитать - ну чепуха в документации, да не считаются некоторые распределения - черт с ними, то статистика в Gnumeric и LibreOffice Calc - полный атас. Первый пакет сразу удалил, в статистику во втором сам заходить не буду и другим не посоветую. Сообщение отредактировал Игорь - 10.06.2022 - 13:22 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Сообщений в этой теме

Vitek_22 Критерий для анализа сверхмалых выборок 25.05.2022 - 12:45

Игорь В принципе любая непараметрика. Можно посмотреть к... 26.05.2022 - 08:42

salm Цитата(Игорь @ 26.05.2022 - 08:42) В... 24.02.2023 - 13:32

ИНО В указанных критериях объемы выборок, учитывается ... 24.02.2023 - 14:47

salm Цитата(ИНО @ 24.02.2023 - 14:47) В у... 24.02.2023 - 20:55

100$ > Спасибо. А в принципе, такое выражение ... 24.02.2023 - 23:32

Игорь Цитата(salm @ 24.02.2023 - 14:32) Зд... 24.02.2023 - 17:37

salm Цитата(Игорь @ 24.02.2023 - 17:37) Е... 24.02.2023 - 20:47

ИНО Цитата(salm @ 24.02.2023 - 20:47) А ... 25.02.2023 - 05:37

Игорь Удалено автором поста. 1.03.2023 - 10:25

Vitek_22 Игорь, спасибо. А как обосновать использование это... 26.05.2022 - 10:41

100$ Цитата(Vitek_22 @ 26.05.2022 - 10:41... 26.05.2022 - 17:46

Игорь Цитата(Vitek_22 @ 26.05.2022 - 10:41... 31.05.2022 - 07:07

ИНО Вот-только при помощи перестановок Вы никогда не д... 5.06.2022 - 23:55

Игорь Цитата(Vitek_22 @ 25.05.2022 - 13:45... 9.06.2022 - 13:53

100$ Цитата(Игорь @ 9.06.2022 - 13:53) Кр... 9.06.2022 - 16:17

ИНО Цитата(100$ @ 9.06.2022 - 16:17... 9.06.2022 - 23:21

100$ Цитата(ИНО @ 9.06.2022 - 23:21) Поче... 10.06.2022 - 10:08

ИНО Сдается мне, Ваше творение нагло врет, по крайней ... 9.06.2022 - 16:05

Игорь Спасибо коллегам за подробный разбор. Проверил. Сн... 9.06.2022 - 20:08

ИНО ЦитатаГрубо говоря - одно и то же. Исправлять нече... 9.06.2022 - 22:28

Игорь Цитата(ИНО @ 9.06.2022 - 22:28) Одна... 10.06.2022 - 13:15

ИНО Очевидно, сии подделки экселя прозрачно намекают, ... 10.06.2022 - 14:00

ИНО Почитал мануал ПАСТа, относительно "permutati... 11.06.2022 - 15:09

100$ Цитата(ИНО @ 11.06.2022 - 15:09) Пол... 12.06.2022 - 12:43

ИНО ЦитатаА это разовое значение (в смысле, полученное... 13.06.2022 - 19:29

nokh Цитата(Vitek_22 @ 25.05.2022 - 14:45... 17.06.2022 - 07:34

ИНО Цитата(nokh @ 17.06.2022 - 07:34) Мо... 17.06.2022 - 13:17

100$ Цитата(ИНО @ 17.06.2022 - 13:17) ...... 17.06.2022 - 13:26

100$ ЦитатаНе знаю почему уважаемые участники форума не... 17.06.2022 - 12:13

ИНО Хороший вопрос! Документация пакета boot (свер... 17.06.2022 - 17:12

100$ Цитата(ИНО @ 17.06.2022 - 17:12) Выв... 18.06.2022 - 01:12

ИНО Ну что поделать, я не умею толком ни программирова... 18.06.2022 - 01:54

comisora Добрый день. Предлагаю рассмотреть на жизнеспособн... 18.06.2022 - 17:49

ИНО ИМХО бета тут как бы совсем за уши притянута, огра... 18.06.2022 - 18:17

comisora 2ИНО Ошибки исправил, результат тоже, спасибо. По... 18.06.2022 - 19:12

100$ >comisora, а вы можете откомментировать констр... 18.06.2022 - 21:26

comisora 2 100$ Конечно. Это я усложнил код, так как ... 18.06.2022 - 23:53

100$ Цитата(comisora @ 18.06.2022 - 23:53... 19.06.2022 - 00:16

100$ Подведем некоторые промежуточные итоги. В соответ... 19.06.2022 - 22:20

comisora 2 100$ У меня опыта создания пакетов нет (да... 20.06.2022 - 00:42

ИНО Цитата(100$ @ 19.06.2022 - 22:2... 20.06.2022 - 04:56

100$ "Я проснулся сегодня рано..." (Исполняет... 20.06.2022 - 13:01

ИНО Нет, на той гистограмме - распределение при нулево... 20.06.2022 - 17:10

100$ ЦитатаНет, на той гистограмме - распределение при ... 20.06.2022 - 23:24

ИНО Да все в порядке изначально было с гистограммой ст... 21.06.2022 - 03:31

100$ ЦитатаС этим не спорю. Заметьте, здесь порядок циф... 21.06.2022 - 12:21

ИНО Ну, результаты моделирования как бы намекают, что ... 21.06.2022 - 21:00

100$ Цитата(ИНО @ 21.06.2022 - 21:00) А в... 23.06.2022 - 00:19

comisora Цитата(100$ @ 21.06.2022 - 12:2... 22.06.2022 - 10:42

ИНО Этот ответ справедлив только для критериев рандоми... 23.06.2022 - 04:56

100$ Но, если уж на то пошло, для желаемого соотношения... 23.06.2022 - 11:10

salm Добрый день. пожалуйста, у меня есть парные измер... 12.01.2023 - 11:51

100$ Цитата(salm @ 12.01.2023 - 11:51) До... 12.01.2023 - 13:39

salm Цитата(100$ @ 12.01.2023 - 13:3... 12.01.2023 - 16:09

ИНО Проблема множественных сравнений отнюдь не исчерпы... 1.03.2023 - 12:35

Игорь Удалено автором поста. 1.03.2023 - 20:24

ИНО Пример 1. Почему у Смирнова мощность значительно м... 2.03.2023 - 07:16

Игорь Удалено автором поста. 2.03.2023 - 07:39

ИНО Так-то оно так, вот только для перестраховки приня... 2.03.2023 - 10:06

ИНО Причем тут смежные области? Вопрос лежит сугубо в ... 2.03.2023 - 11:51

Vitek_22 Господа, я что-то совсем позабыл выложить пример. ... 8.08.2025 - 00:33

Игорь Цитата(Vitek_22 @ 8.08.2025 - 01:33)... 8.08.2025 - 07:38

ИНО Если я правильно понял задачу, то получить p<0... 8.08.2025 - 18:26

Vitek_22 тов. Игорь, можете привести эти две выборки по 3 з... 8.08.2025 - 20:53

Игорь Цитата(Vitek_22 @ 8.08.2025 - 21:53)... 9.08.2025 - 10:01

ИНО Признаю свою неправоту. Хотя она не столкьо моя, с... 8.08.2025 - 21:21

Vitek_22 Тов. Игорь, в статье. что я приложил объём выборок... 9.08.2025 - 13:02

Игорь Цитата(Vitek_22 @ 9.08.2025 - 14:02)... 9.08.2025 - 15:58

ИНО Дело не в мощности. Мощность критерия - функция, з... 9.08.2025 - 17:51

ИНО RE: Критерий для анализа сверхмалых выборок 9.08.2025 - 18:24

ИНО Один неприятный технический момент, который можно ... 9.08.2025 - 18:34

Игорь Удалено автором поста. 10.08.2025 - 18:41

ИНО Я выложил распределение статистики. Постройте гист... 11.08.2025 - 12:32

Игорь Удалено автором поста. 11.08.2025 - 19:16

ИНО То есть слово "exact" в выдаче Вы в упор... 11.08.2025 - 20:52

ИНО ЦитатаStudent test (location): two sided p = 0.019... 11.08.2025 - 21:06

Игорь Удалено автором поста. 11.08.2025 - 21:56

ИНО Скачал Руниона этого. Алгоритм, который он предлаг... 11.08.2025 - 22:13

ИНО Цитата(Игорь @ 11.08.2025 - 21:56) У... 11.08.2025 - 22:25

Игорь Удалено автором поста. 12.08.2025 - 13:29

ИНО R правильно считает. StatXact, наверное, тоже счи... 12.08.2025 - 21:52

Игорь Удалено автором поста. 13.08.2025 - 11:44

ИНО Вы неверно считаете двустороннее. Что есть односто... 13.08.2025 - 13:55

Игорь Удалено автором поста. 14.08.2025 - 07:10

ИНО Вот именно двустороннее и неверное, к односторонни... 14.08.2025 - 17:40

Игорь Удалено автором поста 15.08.2025 - 09:21

ИНО Только что совершенно случайно в процессе чтения с... 14.08.2025 - 18:01

ИНО Игорь, полагаю, откуда и как установить R или еще ... 15.08.2025 - 13:48

Игорь Удалено автором поста. 15.08.2025 - 14:31

ИНО Если Вы считаете слово "творения" оскорб... 16.08.2025 - 13:13

Игорь Думаю, что мы немного погорячились. Да и я, винова... 26.08.2025 - 19:58

ИНО Тогда и меня простите. Но это касается исключитель... 26.08.2025 - 23:54

Игорь Цитата(ИНО @ 27.08.2025 - 00:54) Во-... 27.08.2025 - 08:09

ИНО Ну все ж хотелось бы докопаться до истины - какой ... 27.08.2025 - 16:26

Игорь В комментариях исходников coin есть названия источ... 4.09.2025 - 19:12

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум