Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Критерий для анализа сверхмалых выборок, выборки из 3 значений. Применение стат. анализа
Vitek_22
сообщение 25.05.2022 - 12:45
Сообщение #1





Группа: Пользователи
Сообщений: 30
Регистрация: 7.12.2012
Пользователь №: 24440



Салют! Столкнулся с проблемой сравнения двух выборок, в каждой из которых по 3 значения. Это результаты иммуноблоттинга (определение концентрации целевого белка в пробе) очень ценных образцов, полученных от трансгенных животных. Но их - образцов, было всего 3 для каждой из групп (2 группы: интактная и подвергнутая воздействию исследуемого фактора). Покопавшись в литературе, нашёл статьи, где есть такие выборки и авторы как ни в чём не бывало используют t-критерий Стьюдента для сравнения средних. Нашёл статьи, где используют U-критерий Манна-Уитни... Скажем так, в биологии 3 образца - это нормально для публикации, если речь идёт об особо ценном и сложнополучаемом биоматериале (к примеру как у меня, когда животные практически не дают потомства). Т.е. представить эти данные можно и не стыдно. Но вот как сравнить, как показать, что эти выборки отличаются статистически значимо, иными словами, что наш исследуемый фактор значимо повлиял на концентрацию целевого белка?
Почитал ещё о таком методе, как ресамплинг или бутстреп, когда объём выборки искусственно увеличивают. Ну, не знаю насколько это правильно... также не нашёл софт и чёткого понимания как это сделать у меня нет.
Работаю в проге Statistica 12

Посоветуйте, как всё же обработать эти данные. Вот пример исходных цифр:
Выборка 1:
221,60112
305,217725
295,251684

Выборка 2:
371,3313
397,452722
437,212724
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
ИНО
сообщение 9.08.2025 - 18:24
Сообщение #2





Группа: Пользователи
Сообщений: 290
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Я тоже посчитал этот пример из Руниона с 5 и 5, при помощи оригинальных функций на R. Первая использует разность средних, вторая - статистику Уэлча (может быть предпочтительнее в случае выборок разных объемов с разными дисперсиями). В выдаче первый элемент списка - наблюдаемая статистика, второй - стастистика при всех сочетаниях (обратите внимание что первая и последнее числа всегда равны по модулю, это и есть та самая ранее мною упомянутая паразитическая пара, ограничивающая минимальный достигаемый уровень значимости), третий - p. В данном примерe в обоих тестах p равны, и больше минимально возможного 2/252, следовательно упор в "технический порог" не произошел, и результаты адекватно отражают ошибку первого рода (хотя и в довольно грубом приближении, поскольку в вычислении опирается на ступенчатую эмпирическую функцию распределения). Это же можно понять, видя что в середине второго элемента списка есть числа, большие или равные по модулю первому и последнему. В противном случае можно было бы котировать что p-значение теста вследствие принципиального изъяна алгоритма его вычисления отражает не реальную ситуацию с данными, а погоду на Луне smile.gif

Код
exactmeandifftest<-function(x, y) #Тестовая статистика - разность средних арифметических
{
  if(length(y)>length(x))
  {
    x_<-y
    y_<-x}
  else
  {
    x_<-x
    y_<-y
  }
  k<-length(x_)
  xy<-c(x_, y_)
  n<-length(xy)
  id<-1:n
  combmat<-combn(id, k)
  recmeandiff<-function(X, xy)
  {
    x<-xy[X]
    y<-xy[-X]
    meandiff<-mean(x)-mean(y)
    return(meandiff)
  }
  diffobs<-mean(x_)-mean(y_)
  diffsim<-apply(combmat, 2, recmeandiff, xy=xy)
  absdiffobs<-abs(diffobs)
  absdiffsim<-abs(diffsim)
  res<-as.numeric(round(absdiffsim[2:length(absdiffsim)], digits=6)>=round(absdiffobs, digits=6))
  p<-(1+sum(res))/(ncol(combmat))
  return(list(diffobs, diffsim, p))
}
__________________________________________

exactwelchtest<-function(x, y) #Тестовая статистика - статистика Уэлча
{
  if(length(y)>length(x))
  {
    x_<-y
    y_<-x}
  else
  {
    x_<-x
    y_<-y
  }
  k<-length(x_)
  xy<-c(x_, y_)
  n<-length(xy)
  id<-1:n
  combmat<-combn(id, k)
  recmeandiff<-function(X, xy)
  {
    x<-xy[X]
    y<-xy[-X]
    t<-(mean(x)-mean(y))/sqrt((var(x)/length(x))+(var(y)/length(y)))
    return(t)
  }
  tobs<-(mean(x_)-mean(y_))/sqrt((var(x_)/length(x_))+(var(y_)/length(y_)))
  tsim<-apply(combmat, 2, recmeandiff, xy=xy)
  abstobs<-abs(tobs)
  abstsim<-abs(tsim)
  res<-as.numeric(round(abstsim[2:length(abstsim)], digits=6)>=round(abstobs, digits=6))
  p<-(1+sum(res))/(ncol(combmat))
  return(list(tobs, tsim, p ))
}

x<-c(0.18, 0.27, 0.19, 0.36, 0.43)
y<-c(0.41, 0.38, 0.73, 0.49, 0.58)

exactmeandifftest(x, y)


[[1]]
[1] -0.232

[[2]]
[1] -0.232 -0.240 -0.252 -0.112 -0.208 -0.172 -0.212 -0.224 -0.084 -0.180 -0.144 -0.232
[13] -0.092 -0.188 -0.152 -0.104 -0.200 -0.164 -0.060 -0.024 -0.120 -0.144 -0.156 -0.016
[25] -0.112 -0.076 -0.164 -0.024 -0.120 -0.084 -0.036 -0.132 -0.096 0.008 0.044 -0.052
[37] -0.136 0.004 -0.092 -0.056 -0.008 -0.104 -0.068 0.036 0.072 -0.024 -0.016 -0.112
[49] -0.076 0.028 0.064 -0.032 0.016 0.052 -0.044 0.096 -0.176 -0.188 -0.048 -0.144
[61] -0.108 -0.196 -0.056 -0.152 -0.116 -0.068 -0.164 -0.128 -0.024 0.012 -0.084 -0.168
[73] -0.028 -0.124 -0.088 -0.040 -0.136 -0.100 0.004 0.040 -0.056 -0.048 -0.144 -0.108
[85] -0.004 0.032 -0.064 -0.016 0.020 -0.076 0.064 -0.100 0.040 -0.056 -0.020 0.028
[97] -0.068 -0.032 0.072 0.108 0.012 0.020 -0.076 -0.040 0.064 0.100 0.004 0.052
[109] 0.088 -0.008 0.132 0.048 -0.048 -0.012 0.092 0.128 0.032 0.080 0.116 0.020
[121] 0.160 0.072 0.108 0.012 0.152 0.140 -0.140 -0.152 -0.012 -0.108 -0.072 -0.160
[133] -0.020 -0.116 -0.080 -0.032 -0.128 -0.092 0.012 0.048 -0.048 -0.132 0.008 -0.088
[145] -0.052 -0.004 -0.100 -0.064 0.040 0.076 -0.020 -0.012 -0.108 -0.072 0.032 0.068
[157] -0.028 0.020 0.056 -0.040 0.100 -0.064 0.076 -0.020 0.016 0.064 -0.032 0.004
[169] 0.108 0.144 0.048 0.056 -0.040 -0.004 0.100 0.136 0.040 0.088 0.124 0.028
[181] 0.168 0.084 -0.012 0.024 0.128 0.164 0.068 0.116 0.152 0.056 0.196 0.108
[193] 0.144 0.048 0.188 0.176 -0.096 0.044 -0.052 -0.016 0.032 -0.064 -0.028 0.076
[205] 0.112 0.016 0.024 -0.072 -0.036 0.068 0.104 0.008 0.056 0.092 -0.004 0.136
[217] 0.052 -0.044 -0.008 0.096 0.132 0.036 0.084 0.120 0.024 0.164 0.076 0.112
[229] 0.016 0.156 0.144 0.120 0.024 0.060 0.164 0.200 0.104 0.152 0.188 0.092
[241] 0.232 0.144 0.180 0.084 0.224 0.212 0.172 0.208 0.112 0.252 0.240 0.232

[[3]]
[1] 0.03174603

Код
exactwelchtest (x, y)


[[1]]
[1] -2.909105

[[2]]
[1] -2.90910520 -3.12771621 -3.51153439 -1.04349839 -2.37346442 -1.77498894 -2.45287581
[8] -2.71320887 -0.76031333 -1.89337368 -1.40556386 -2.90910520 -0.83879342 -2.01905570
[15] -1.50502427 -0.96000454 -2.22387014 -1.66294052 -0.53371828 -0.21036451 -1.12946492
[22] -1.40556386 -1.55642433 -0.14002801 -1.04349839 -0.68343776 -1.66294052 -0.21036451
[29] -1.12946492 -0.76031333 -0.31664339 -1.26375113 -0.87870243 0.06994974 0.38821179
[36] -0.46051974 -1.31011711 0.03496685 -0.83879342 -0.49699792 -0.06994974 -0.96000454
[43] -0.60796735 0.31664339 0.64553873 -0.21036451 -0.14002801 -1.04349839 -0.68343776
[50] 0.24567075 0.57070110 -0.28109135 0.14002801 0.46051974 -0.38821179 0.87870243
[57] -1.83333333 -2.01905570 -0.42426407 -1.40556386 -1.00146067 -2.15319621 -0.49699792
[64] -1.50502427 -1.08615375 -0.60796735 -1.66294052 -1.21821918 -0.21036451 0.10496474
[71] -0.76031333 -1.71822619 -0.24567075 -1.17347238 -0.79933966 -0.35234428 -1.31011711
[78] -0.91909591 0.03496685 0.35234428 -0.49699792 -0.42426407 -1.40556386 -1.00146067
[85] -0.03496685 0.28109135 -0.57070110 -0.14002801 0.17515579 -0.68343776 0.57070110
[92] -0.91909591 0.35234428 -0.49699792 -0.17515579 0.24567075 -0.60796735 -0.28109135
[99] 0.64553873 1.00146067 0.10496474 0.17515579 -0.68343776 -0.35234428 0.57070110
[106] 0.91909591 0.03496685 0.46051974 0.79933966 -0.06994974 1.26375113 0.42426407
[113] -0.42426407 -0.10496474 0.83879342 1.21821918 0.28109135 0.72168784 1.08615375
[120] 0.17515579 1.60903597 0.64553873 1.00146067 0.10496474 1.50502427 1.35736936
[127] -1.35736936 -1.50502427 -0.10496474 -1.00146067 -0.64553873 -1.60903597 -0.17515579
[134] -1.08615375 -0.72168784 -0.28109135 -1.21821918 -0.83879342 0.10496474 0.42426407
[141] -0.42426407 -1.26375113 0.06994974 -0.79933966 -0.46051974 -0.03496685 -0.91909591
[148] -0.57070110 0.35234428 0.68343776 -0.17515579 -0.10496474 -1.00146067 -0.64553873
[155] 0.28109135 0.60796735 -0.24567075 0.17515579 0.49699792 -0.35234428 0.91909591
[162] -0.57070110 0.68343776 -0.17515579 0.14002801 0.57070110 -0.28109135 0.03496685
[169] 1.00146067 1.40556386 0.42426407 0.49699792 -0.35234428 -0.03496685 0.91909591
[176] 1.31011711 0.35234428 0.79933966 1.17347238 0.24567075 1.71822619 0.76031333
[183] -0.10496474 0.21036451 1.21821918 1.66294052 0.60796735 1.08615375 1.50502427
[190] 0.49699792 2.15319621 1.00146067 1.40556386 0.42426407 2.01905570 1.83333333
[197] -0.87870243 0.38821179 -0.46051974 -0.14002801 0.28109135 -0.57070110 -0.24567075
[204] 0.68343776 1.04349839 0.14002801 0.21036451 -0.64553873 -0.31664339 0.60796735
[211] 0.96000454 0.06994974 0.49699792 0.83879342 -0.03496685 1.31011711 0.46051974
[218] -0.38821179 -0.06994974 0.87870243 1.26375113 0.31664339 0.76031333 1.12946492
[225] 0.21036451 1.66294052 0.68343776 1.04349839 0.14002801 1.55642433 1.40556386
[232] 1.12946492 0.21036451 0.53371828 1.66294052 2.22387014 0.96000454 1.50502427
[239] 2.01905570 0.83879342 2.90910520 1.40556386 1.89337368 0.76031333 2.71320887
[246] 2.45287581 1.77498894 2.37346442 1.04349839 3.51153439 3.12771621 2.90910520

[[3]]
[1] 0.03174603

Сообщение отредактировал ИНО - 9.08.2025 - 18:26
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Vitek_22   Критерий для анализа сверхмалых выборок   25.05.2022 - 12:45
- - Игорь   В принципе любая непараметрика. Можно посмотреть к...   26.05.2022 - 08:42
|- - salm   Цитата(Игорь @ 26.05.2022 - 08:42) В...   24.02.2023 - 13:32
|- - ИНО   В указанных критериях объемы выборок, учитывается ...   24.02.2023 - 14:47
||- - salm   Цитата(ИНО @ 24.02.2023 - 14:47) В у...   24.02.2023 - 20:55
||- - 100$   > Спасибо. А в принципе, такое выражение ...   24.02.2023 - 23:32
|- - Игорь   Цитата(salm @ 24.02.2023 - 14:32) Зд...   24.02.2023 - 17:37
|- - salm   Цитата(Игорь @ 24.02.2023 - 17:37) Е...   24.02.2023 - 20:47
|- - ИНО   Цитата(salm @ 24.02.2023 - 20:47) А ...   25.02.2023 - 05:37
|- - Игорь   Удалено автором поста.   1.03.2023 - 10:25
- - Vitek_22   Игорь, спасибо. А как обосновать использование это...   26.05.2022 - 10:41
|- - 100$   Цитата(Vitek_22 @ 26.05.2022 - 10:41...   26.05.2022 - 17:46
|- - Игорь   Цитата(Vitek_22 @ 26.05.2022 - 10:41...   31.05.2022 - 07:07
- - ИНО   Вот-только при помощи перестановок Вы никогда не д...   5.06.2022 - 23:55
- - Игорь   Цитата(Vitek_22 @ 25.05.2022 - 13:45...   9.06.2022 - 13:53
|- - 100$   Цитата(Игорь @ 9.06.2022 - 13:53) Кр...   9.06.2022 - 16:17
|- - ИНО   Цитата(100$ @ 9.06.2022 - 16:17...   9.06.2022 - 23:21
|- - 100$   Цитата(ИНО @ 9.06.2022 - 23:21) Поче...   10.06.2022 - 10:08
- - ИНО   Сдается мне, Ваше творение нагло врет, по крайней ...   9.06.2022 - 16:05
- - Игорь   Спасибо коллегам за подробный разбор. Проверил. Сн...   9.06.2022 - 20:08
- - ИНО   ЦитатаГрубо говоря - одно и то же. Исправлять нече...   9.06.2022 - 22:28
|- - Игорь   Цитата(ИНО @ 9.06.2022 - 22:28) Одна...   10.06.2022 - 13:15
- - ИНО   Очевидно, сии подделки экселя прозрачно намекают, ...   10.06.2022 - 14:00
- - ИНО   Почитал мануал ПАСТа, относительно "permutati...   11.06.2022 - 15:09
|- - 100$   Цитата(ИНО @ 11.06.2022 - 15:09) Пол...   12.06.2022 - 12:43
- - ИНО   ЦитатаА это разовое значение (в смысле, полученное...   13.06.2022 - 19:29
- - nokh   Цитата(Vitek_22 @ 25.05.2022 - 14:45...   17.06.2022 - 07:34
|- - ИНО   Цитата(nokh @ 17.06.2022 - 07:34) Мо...   17.06.2022 - 13:17
|- - 100$   Цитата(ИНО @ 17.06.2022 - 13:17) ......   17.06.2022 - 13:26
- - 100$   ЦитатаНе знаю почему уважаемые участники форума не...   17.06.2022 - 12:13
- - ИНО   Хороший вопрос! Документация пакета boot (свер...   17.06.2022 - 17:12
|- - 100$   Цитата(ИНО @ 17.06.2022 - 17:12) Выв...   18.06.2022 - 01:12
- - ИНО   Ну что поделать, я не умею толком ни программирова...   18.06.2022 - 01:54
- - comisora   Добрый день. Предлагаю рассмотреть на жизнеспособн...   18.06.2022 - 17:49
- - ИНО   ИМХО бета тут как бы совсем за уши притянута, огра...   18.06.2022 - 18:17
- - comisora   2ИНО Ошибки исправил, результат тоже, спасибо. По...   18.06.2022 - 19:12
- - 100$   >comisora, а вы можете откомментировать констр...   18.06.2022 - 21:26
- - comisora   2 100$ Конечно. Это я усложнил код, так как ...   18.06.2022 - 23:53
|- - 100$   Цитата(comisora @ 18.06.2022 - 23:53...   19.06.2022 - 00:16
- - 100$   Подведем некоторые промежуточные итоги. В соответ...   19.06.2022 - 22:20
- - comisora   2 100$ У меня опыта создания пакетов нет (да...   20.06.2022 - 00:42
- - ИНО   Цитата(100$ @ 19.06.2022 - 22:2...   20.06.2022 - 04:56
|- - 100$   "Я проснулся сегодня рано..." (Исполняет...   20.06.2022 - 13:01
- - ИНО   Нет, на той гистограмме - распределение при нулево...   20.06.2022 - 17:10
|- - 100$   ЦитатаНет, на той гистограмме - распределение при ...   20.06.2022 - 23:24
- - ИНО   Да все в порядке изначально было с гистограммой ст...   21.06.2022 - 03:31
|- - 100$   ЦитатаС этим не спорю. Заметьте, здесь порядок циф...   21.06.2022 - 12:21
- - ИНО   Ну, результаты моделирования как бы намекают, что ...   21.06.2022 - 21:00
|- - 100$   Цитата(ИНО @ 21.06.2022 - 21:00) А в...   23.06.2022 - 00:19
- - comisora   Цитата(100$ @ 21.06.2022 - 12:2...   22.06.2022 - 10:42
- - ИНО   Этот ответ справедлив только для критериев рандоми...   23.06.2022 - 04:56
- - 100$   Но, если уж на то пошло, для желаемого соотношения...   23.06.2022 - 11:10
- - salm   Добрый день. пожалуйста, у меня есть парные измер...   12.01.2023 - 11:51
|- - 100$   Цитата(salm @ 12.01.2023 - 11:51) До...   12.01.2023 - 13:39
|- - salm   Цитата(100$ @ 12.01.2023 - 13:3...   12.01.2023 - 16:09
- - ИНО   Проблема множественных сравнений отнюдь не исчерпы...   1.03.2023 - 12:35
|- - Игорь   Удалено автором поста.   1.03.2023 - 20:24
- - ИНО   Пример 1. Почему у Смирнова мощность значительно м...   2.03.2023 - 07:16
|- - Игорь   Удалено автором поста.   2.03.2023 - 07:39
- - ИНО   Так-то оно так, вот только для перестраховки приня...   2.03.2023 - 10:06
- - ИНО   Причем тут смежные области? Вопрос лежит сугубо в ...   2.03.2023 - 11:51
- - Vitek_22   Господа, я что-то совсем позабыл выложить пример. ...   8.08.2025 - 00:33
|- - Игорь   Цитата(Vitek_22 @ 8.08.2025 - 01:33)...   8.08.2025 - 07:38
- - ИНО   Если я правильно понял задачу, то получить p<0...   8.08.2025 - 18:26
- - Vitek_22   тов. Игорь, можете привести эти две выборки по 3 з...   8.08.2025 - 20:53
|- - Игорь   Цитата(Vitek_22 @ 8.08.2025 - 21:53)...   9.08.2025 - 10:01
- - ИНО   Признаю свою неправоту. Хотя она не столкьо моя, с...   8.08.2025 - 21:21
- - Vitek_22   Тов. Игорь, в статье. что я приложил объём выборок...   9.08.2025 - 13:02
|- - Игорь   Цитата(Vitek_22 @ 9.08.2025 - 14:02)...   9.08.2025 - 15:58
- - ИНО   Дело не в мощности. Мощность критерия - функция, з...   9.08.2025 - 17:51
- - ИНО   RE: Критерий для анализа сверхмалых выборок   9.08.2025 - 18:24
- - ИНО   Один неприятный технический момент, который можно ...   9.08.2025 - 18:34
- - Игорь   Удалено автором поста.   10.08.2025 - 18:41
- - ИНО   Я выложил распределение статистики. Постройте гист...   11.08.2025 - 12:32
|- - Игорь   Удалено автором поста.   11.08.2025 - 19:16
- - ИНО   То есть слово "exact" в выдаче Вы в упор...   11.08.2025 - 20:52
- - ИНО   ЦитатаStudent test (location): two sided p = 0.019...   11.08.2025 - 21:06
|- - Игорь   Удалено автором поста.   11.08.2025 - 21:56
- - ИНО   Скачал Руниона этого. Алгоритм, который он предлаг...   11.08.2025 - 22:13
- - ИНО   Цитата(Игорь @ 11.08.2025 - 21:56) У...   11.08.2025 - 22:25
- - Игорь   Удалено автором поста.   12.08.2025 - 13:29
- - ИНО   R правильно считает. StatXact, наверное, тоже счи...   12.08.2025 - 21:52
|- - Игорь   Удалено автором поста.   13.08.2025 - 11:44
- - ИНО   Вы неверно считаете двустороннее. Что есть односто...   13.08.2025 - 13:55
|- - Игорь   Удалено автором поста.   14.08.2025 - 07:10
- - ИНО   Вот именно двустороннее и неверное, к односторонни...   14.08.2025 - 17:40
|- - Игорь   Удалено автором поста   15.08.2025 - 09:21
- - ИНО   Только что совершенно случайно в процессе чтения с...   14.08.2025 - 18:01
- - ИНО   Игорь, полагаю, откуда и как установить R или еще ...   15.08.2025 - 13:48
|- - Игорь   Удалено автором поста.   15.08.2025 - 14:31
- - ИНО   Если Вы считаете слово "творения" оскорб...   16.08.2025 - 13:13
- - Игорь   Думаю, что мы немного погорячились. Да и я, винова...   26.08.2025 - 19:58
- - ИНО   Тогда и меня простите. Но это касается исключитель...   26.08.2025 - 23:54
|- - Игорь   Цитата(ИНО @ 27.08.2025 - 00:54) Во-...   27.08.2025 - 08:09
- - ИНО   Ну все ж хотелось бы докопаться до истины - какой ...   27.08.2025 - 16:26
- - Игорь   В комментариях исходников coin есть названия источ...   4.09.2025 - 19:12


Добавить ответ в эту темуОткрыть тему