Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Критерий для анализа сверхмалых выборок, выборки из 3 значений. Применение стат. анализа
Vitek_22
сообщение 25.05.2022 - 12:45
Сообщение #1





Группа: Пользователи
Сообщений: 27
Регистрация: 7.12.2012
Пользователь №: 24440



Салют! Столкнулся с проблемой сравнения двух выборок, в каждой из которых по 3 значения. Это результаты иммуноблоттинга (определение концентрации целевого белка в пробе) очень ценных образцов, полученных от трансгенных животных. Но их - образцов, было всего 3 для каждой из групп (2 группы: интактная и подвергнутая воздействию исследуемого фактора). Покопавшись в литературе, нашёл статьи, где есть такие выборки и авторы как ни в чём не бывало используют t-критерий Стьюдента для сравнения средних. Нашёл статьи, где используют U-критерий Манна-Уитни... Скажем так, в биологии 3 образца - это нормально для публикации, если речь идёт об особо ценном и сложнополучаемом биоматериале (к примеру как у меня, когда животные практически не дают потомства). Т.е. представить эти данные можно и не стыдно. Но вот как сравнить, как показать, что эти выборки отличаются статистически значимо, иными словами, что наш исследуемый фактор значимо повлиял на концентрацию целевого белка?
Почитал ещё о таком методе, как ресамплинг или бутстреп, когда объём выборки искусственно увеличивают. Ну, не знаю насколько это правильно... также не нашёл софт и чёткого понимания как это сделать у меня нет.
Работаю в проге Statistica 12

Посоветуйте, как всё же обработать эти данные. Вот пример исходных цифр:
Выборка 1:
221,60112
305,217725
295,251684

Выборка 2:
371,3313
397,452722
437,212724
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
ИНО
сообщение 9.06.2022 - 22:28
Сообщение #2





Группа: Пользователи
Сообщений: 262
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Цитата
Грубо говоря - одно и то же. Исправлять нечего. Следовало бы, конечно, пояснить, что такое p в листинге.

Однак ж... У Вашей новой программы какая-то альтернативная трактовка p, отличная от общепринятой?

Посчитал и понял: StatAnt для Стьюдента выдает 1-p (одностороннее). Понять бы еще зачем. Для конспирации? Особо интересует, почему в случае с Пагуровой прога ведет себя наоборот, то есть, как и положено во всем остальном мире unknw.gif Студентов, которым приходится тайну сию объяснять, как-то жалко стало.

Версия Аттестата у меня была 13.1. Скачал с этого нехорошего Сорсефоржа версию 13.2. Нехорошего, потому что он сначала подверг обидной дискриминации мой айпишник со словами: "Your request is being denied as it appears to be coming from a location banned by our Terms of Use", поэтому пришлось пользовать прокси. Вдвойне обидно, что все было зря: новая версия не отличается от предыдущей: Леман-Розенблатт без предварительной сортировки выборок по возрастанию все так же показывает погоду на Луне. Барнарда уж проверять не стал. В общем, спасибо за с пользой проведенное время!

P.S. Последние несколько лет единственное, для чего безбоязненно использую Аттестат - транспонирование таблиц. Уж больно оно штатными средствами Экселя муторно делается. Если б Аттестат принимал не только числовые данные, цен б ему не было. А вот для статанализа без предварительных проверок стрёмно - х. з., что он там насчитает. А уж после проверок, если результат сошелся, то уже особого смысла в Аттестате, как легкой кнопочной надстройки Экселя вместо R (кодинг - не мое) особого смысла-то и не остается. Не в обиду будь сказано - просто констатация суровой реальности.

Сообщение отредактировал ИНО - 9.06.2022 - 22:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 10.06.2022 - 13:15
Сообщение #3





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(ИНО @ 9.06.2022 - 22:28) *
Однак ж... У Вашей новой программы какая-то альтернативная трактовка p, отличная от общепринятой?

Это результат подстановки значения критерия в обратную функцию распределения. Из-за особенности вычисления нужно смотреть, что именно вычисляется (p, 1-p, 2p и т.п.) и выдавать правильное значение. В AtteStat это сделано. Здесь нет. В-общем это можно сделать в самих функциях распределения, но такого рода промежуточные вычисления используются в других алгоритмах. Резюмируя - считается правильно, выводится не то (не проблема - всё-равно никто не пользуется). Еще один момент - формулировка гипотезы: в общем случае (не для всех тестов) две односторонних и одна двусторонняя. Результат тоже нужно правильно интерпретировать. По идее нужны редизайн приложения и хорошее тестирование. Просто взяться и аккуратно сделать.
Цитата(ИНО @ 9.06.2022 - 22:28) *
Леман-Розенблатт без предварительной сортировки выборок по возрастанию все так же показывает погоду на Луне.

Посмотрел, согласился, подправил (пара строчек кода) библиотеку, но исправлять AtteStat не буду - поздно уже. Опять же нет качественно просчитанных примеров для сравнения.
Цитата(ИНО @ 9.06.2022 - 22:28) *
Барнарда уж проверять не стал. В общем, спасибо за с пользой проведенное время!

Посмотрел свои записи. Там считается оптимальное значение параметра сначала глобальным поиском, потом уточняется. Не думаю, что в этом месте ошибка, но проверять нужно на хороших данных.
Цитата(ИНО @ 9.06.2022 - 22:28) *
Не в обиду будь сказано - просто констатация суровой реальности.

Да согласен абсолютно - давно собирался прикрыть проект, но некоторым он зачем-то нужен. Проверять некому, а это главное. Что-то протестировано неплохо, если кого-то интересовали определенные методы. Создавать новый проект тоже смысла не вижу. Не окупится из-за малой востребованности.

Попутно при нашем обсуждении проблемы пару моментов хотелось упомянуть. Первое - на столь малых выборках будет дикая ошибка второго рода. Достаточно посмотреть функции мощности. Так что результат вычислений можно смело считать чепухой. Интересно, что малые выборки возникают достаточно часто. Например, биохимики мне такие данные приносили, причем в выборке численностью 3-4-5 варианты отличались на 3 порядка. Говорят, что такие данные у них - норма.

Второе (апологетов прошу не обижаться). Если статистику (встроенную) в Excel еще как-то можно посчитать - ну чепуха в документации, да не считаются некоторые распределения - черт с ними, то статистика в Gnumeric и LibreOffice Calc - полный атас. Первый пакет сразу удалил, в статистику во втором сам заходить не буду и другим не посоветую.

Сообщение отредактировал Игорь - 10.06.2022 - 13:22


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Vitek_22   Критерий для анализа сверхмалых выборок   25.05.2022 - 12:45
- - Игорь   В принципе любая непараметрика. Можно посмотреть к...   26.05.2022 - 08:42
|- - salm   Цитата(Игорь @ 26.05.2022 - 08:42) В...   24.02.2023 - 13:32
|- - ИНО   В указанных критериях объемы выборок, учитывается ...   24.02.2023 - 14:47
||- - salm   Цитата(ИНО @ 24.02.2023 - 14:47) В у...   24.02.2023 - 20:55
||- - 100$   > Спасибо. А в принципе, такое выражение ...   24.02.2023 - 23:32
|- - Игорь   Цитата(salm @ 24.02.2023 - 14:32) Зд...   24.02.2023 - 17:37
|- - salm   Цитата(Игорь @ 24.02.2023 - 17:37) Е...   24.02.2023 - 20:47
|- - ИНО   Цитата(salm @ 24.02.2023 - 20:47) А ...   25.02.2023 - 05:37
|- - Игорь   Цитата(ИНО @ 25.02.2023 - 05:37) Кон...   1.03.2023 - 10:25
- - Vitek_22   Игорь, спасибо. А как обосновать использование это...   26.05.2022 - 10:41
|- - 100$   Цитата(Vitek_22 @ 26.05.2022 - 10:41...   26.05.2022 - 17:46
|- - Игорь   Цитата(Vitek_22 @ 26.05.2022 - 10:41...   31.05.2022 - 07:07
- - ИНО   Вот-только при помощи перестановок Вы никогда не д...   5.06.2022 - 23:55
- - Игорь   Цитата(Vitek_22 @ 25.05.2022 - 13:45...   9.06.2022 - 13:53
|- - 100$   Цитата(Игорь @ 9.06.2022 - 13:53) Кр...   9.06.2022 - 16:17
|- - ИНО   Цитата(100$ @ 9.06.2022 - 16:17...   9.06.2022 - 23:21
|- - 100$   Цитата(ИНО @ 9.06.2022 - 23:21) Поче...   10.06.2022 - 10:08
- - ИНО   Сдается мне, Ваше творение нагло врет, по крайней ...   9.06.2022 - 16:05
- - Игорь   Спасибо коллегам за подробный разбор. Проверил. Сн...   9.06.2022 - 20:08
- - ИНО   ЦитатаГрубо говоря - одно и то же. Исправлять нече...   9.06.2022 - 22:28
|- - Игорь   Цитата(ИНО @ 9.06.2022 - 22:28) Одна...   10.06.2022 - 13:15
- - ИНО   Очевидно, сии подделки экселя прозрачно намекают, ...   10.06.2022 - 14:00
- - ИНО   Почитал мануал ПАСТа, относительно "permutati...   11.06.2022 - 15:09
|- - 100$   Цитата(ИНО @ 11.06.2022 - 15:09) Пол...   12.06.2022 - 12:43
- - ИНО   ЦитатаА это разовое значение (в смысле, полученное...   13.06.2022 - 19:29
- - nokh   Цитата(Vitek_22 @ 25.05.2022 - 14:45...   17.06.2022 - 07:34
|- - ИНО   Цитата(nokh @ 17.06.2022 - 07:34) Мо...   17.06.2022 - 13:17
|- - 100$   Цитата(ИНО @ 17.06.2022 - 13:17) ......   17.06.2022 - 13:26
- - 100$   ЦитатаНе знаю почему уважаемые участники форума не...   17.06.2022 - 12:13
- - ИНО   Хороший вопрос! Документация пакета boot (свер...   17.06.2022 - 17:12
|- - 100$   Цитата(ИНО @ 17.06.2022 - 17:12) Выв...   18.06.2022 - 01:12
- - ИНО   Ну что поделать, я не умею толком ни программирова...   18.06.2022 - 01:54
- - comisora   Добрый день. Предлагаю рассмотреть на жизнеспособн...   18.06.2022 - 17:49
- - ИНО   ИМХО бета тут как бы совсем за уши притянута, огра...   18.06.2022 - 18:17
- - comisora   2ИНО Ошибки исправил, результат тоже, спасибо. По...   18.06.2022 - 19:12
- - 100$   >comisora, а вы можете откомментировать констр...   18.06.2022 - 21:26
- - comisora   2 100$ Конечно. Это я усложнил код, так как ...   18.06.2022 - 23:53
|- - 100$   Цитата(comisora @ 18.06.2022 - 23:53...   19.06.2022 - 00:16
- - 100$   Подведем некоторые промежуточные итоги. В соответ...   19.06.2022 - 22:20
- - comisora   2 100$ У меня опыта создания пакетов нет (да...   20.06.2022 - 00:42
- - ИНО   Цитата(100$ @ 19.06.2022 - 22:2...   20.06.2022 - 04:56
|- - 100$   "Я проснулся сегодня рано..." (Исполняет...   20.06.2022 - 13:01
- - ИНО   Нет, на той гистограмме - распределение при нулево...   20.06.2022 - 17:10
|- - 100$   ЦитатаНет, на той гистограмме - распределение при ...   20.06.2022 - 23:24
- - ИНО   Да все в порядке изначально было с гистограммой ст...   21.06.2022 - 03:31
|- - 100$   ЦитатаС этим не спорю. Заметьте, здесь порядок циф...   21.06.2022 - 12:21
- - ИНО   Ну, результаты моделирования как бы намекают, что ...   21.06.2022 - 21:00
|- - 100$   Цитата(ИНО @ 21.06.2022 - 21:00) А в...   23.06.2022 - 00:19
- - comisora   Цитата(100$ @ 21.06.2022 - 12:2...   22.06.2022 - 10:42
- - ИНО   Этот ответ справедлив только для критериев рандоми...   23.06.2022 - 04:56
- - 100$   Но, если уж на то пошло, для желаемого соотношения...   23.06.2022 - 11:10
- - salm   Добрый день. пожалуйста, у меня есть парные измер...   12.01.2023 - 11:51
|- - 100$   Цитата(salm @ 12.01.2023 - 11:51) До...   12.01.2023 - 13:39
|- - salm   Цитата(100$ @ 12.01.2023 - 13:3...   12.01.2023 - 16:09
- - ИНО   Проблема множественных сравнений отнюдь не исчерпы...   1.03.2023 - 12:35
|- - Игорь   Цитата(ИНО @ 1.03.2023 - 12:35) Проб...   1.03.2023 - 20:24
- - ИНО   Пример 1. Почему у Смирнова мощность значительно м...   2.03.2023 - 07:16
|- - Игорь   Цитата(ИНО @ 2.03.2023 - 08:16) А ве...   2.03.2023 - 07:39
- - ИНО   Так-то оно так, вот только для перестраховки приня...   2.03.2023 - 10:06
|- - Игорь   Цитата(ИНО @ 2.03.2023 - 10:06) Так-...   2.03.2023 - 11:10
- - ИНО   Причем тут смежные области? Вопрос лежит сугубо в ...   2.03.2023 - 11:51


Добавить ответ в эту темуОткрыть тему