Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Расчет выборки на малых данных

Автор: kont 9.03.2018 - 15:38

Добрый день. Суть задачи
Есть сервис. В этом сервисе много клиентов, но стабильный доход приносит всего 1500 клиентов
(что за сервис, абсолютно не важно)
Сервис хочет сменить оплату за услуги с одной валюты на другую. Раньше платили долларами, а сейчас надо евро. (ну так удобно аффторам сервиса)
Естественно непонятно как люди на это отреагируют. Есть опасения, что если перевести на евровую оплату, то это меньшинство, которое платит деньги может обидеться и перестать пользоваться сервисом pardon.gif
Необходимо провести тесты чтобы просмотреть реакцию клиентов на смену. В нашем случае генеральная совокупность всего 1500 человек. Надо взять какую то самую минимальную выборку и посмотреть как изменить пользовательское поведение, как по метрическим параметрам
(время сессии на сайте, количество заказов,количество трат, покупок.......), так и категориальные (перестал пользоваться, продолжил)
Метрические переменные. Т.е. две выборки (одна пользуется старой оплатой, другой сказали плати еврами).
Т.о мы можем сравнивать выборки как независимые по нашим параметрам t-test или манна-Уитни
Можем как зависимые. до-после на евровой выборк t-test dep, Вилкоксон
категориальные тут МакНимара нужно использовать только на евровой выборке
Как сделать так, чтобы выборка была минимально возможной с одной стороны, т.е. кол-во крайне мало, и при этом максимально точно описывала результат.

Автор: passant 9.03.2018 - 18:46

Осмелюсь дать ссылочку на блог нашего уважаемого коллеги по форуму.
http://biostat-r.blogspot.com/2015/03/trialsize.html
Хоть ссылка явно с медицинским уклоном, но информацию по математике метода, который независим от прикладной области, там найти можно. Ну и ссылочка для дальнейшего углубления в тему при необходимости - тоже есть.

Автор: DoctorStat 11.03.2018 - 21:18

Цитата(kont @ 9.03.2018 - 15:38) *
Как сделать так, чтобы выборка была минимально возможной с одной стороны, т.е. кол-во крайне мало, и при этом максимально точно описывала результат.
Вы неточно ставите задачу. Для большей определенности следует переформулировать ее примерно так (простейший случай):
Есть генеральная выборка (1500 зайцев) двух цветов: белого и серого, которые прячутся в норках, поэтому определить цвет всей популяции мы не можем. Мы можем только вытащить наугад зайцев из двух соседних нор (сделать две независимые выборки) и сравнить долю белых в каждой из них. Требуется предложить статистический метод для проверки гипотезы: процент белых зайцев в популяции больше X. При этом должны выполняться условия: чувствительность метода должна быть не меньше Y, специфичность не меньше Z при минимальной сумме двух выборок.


Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)