Форум врачей-аспирантов > Расчет выборки на малых данных

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: Расчет выборки на малых данных

Форум врачей-аспирантов > Разделы форума > Медицинская статистика

kont

9.03.2018 - 15:38

Добрый день. Суть задачи
Есть сервис. В этом сервисе много клиентов, но стабильный доход приносит всего 1500 клиентов
(что за сервис, абсолютно не важно)
Сервис хочет сменить оплату за услуги с одной валюты на другую. Раньше платили долларами, а сейчас надо евро. (ну так удобно аффторам сервиса)
Естественно непонятно как люди на это отреагируют. Есть опасения, что если перевести на евровую оплату, то это меньшинство, которое платит деньги может обидеться и перестать пользоваться сервисом

Необходимо провести тесты чтобы просмотреть реакцию клиентов на смену. В нашем случае генеральная совокупность всего 1500 человек. Надо взять какую то самую минимальную выборку и посмотреть как изменить пользовательское поведение, как по метрическим параметрам
(время сессии на сайте, количество заказов,количество трат, покупок.......), так и категориальные (перестал пользоваться, продолжил)
Метрические переменные. Т.е. две выборки (одна пользуется старой оплатой, другой сказали плати еврами).
Т.о мы можем сравнивать выборки как независимые по нашим параметрам t-test или манна-Уитни
Можем как зависимые. до-после на евровой выборк t-test dep, Вилкоксон
категориальные тут МакНимара нужно использовать только на евровой выборке
Как сделать так, чтобы выборка была минимально возможной с одной стороны, т.е. кол-во крайне мало, и при этом максимально точно описывала результат.

passant

9.03.2018 - 18:46

Осмелюсь дать ссылочку на блог нашего уважаемого коллеги по форуму.
http://biostat-r.blogspot.com/2015/03/trialsize.html
Хоть ссылка явно с медицинским уклоном, но информацию по математике метода, который независим от прикладной области, там найти можно. Ну и ссылочка для дальнейшего углубления в тему при необходимости - тоже есть.

DoctorStat

11.03.2018 - 21:18

Цитата(kont @ 9.03.2018 - 15:38)

Как сделать так, чтобы выборка была минимально возможной с одной стороны, т.е. кол-во крайне мало, и при этом максимально точно описывала результат.

Вы неточно ставите задачу. Для большей определенности следует переформулировать ее примерно так (простейший случай):
Есть генеральная выборка (1500 зайцев) двух цветов: белого и серого, которые прячутся в норках, поэтому определить цвет всей популяции мы не можем. Мы можем только вытащить наугад зайцев из двух соседних нор (сделать две независимые выборки) и сравнить долю белых в каждой из них. Требуется предложить статистический метод для проверки гипотезы: процент белых зайцев в популяции больше X. При этом должны выполняться условия: чувствительность метода должна быть не меньше Y, специфичность не меньше Z при минимальной сумме двух выборок.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.