Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Расчет выборки на малых данных
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
kont
Добрый день. Суть задачи
Есть сервис. В этом сервисе много клиентов, но стабильный доход приносит всего 1500 клиентов
(что за сервис, абсолютно не важно)
Сервис хочет сменить оплату за услуги с одной валюты на другую. Раньше платили долларами, а сейчас надо евро. (ну так удобно аффторам сервиса)
Естественно непонятно как люди на это отреагируют. Есть опасения, что если перевести на евровую оплату, то это меньшинство, которое платит деньги может обидеться и перестать пользоваться сервисом pardon.gif
Необходимо провести тесты чтобы просмотреть реакцию клиентов на смену. В нашем случае генеральная совокупность всего 1500 человек. Надо взять какую то самую минимальную выборку и посмотреть как изменить пользовательское поведение, как по метрическим параметрам
(время сессии на сайте, количество заказов,количество трат, покупок.......), так и категориальные (перестал пользоваться, продолжил)
Метрические переменные. Т.е. две выборки (одна пользуется старой оплатой, другой сказали плати еврами).
Т.о мы можем сравнивать выборки как независимые по нашим параметрам t-test или манна-Уитни
Можем как зависимые. до-после на евровой выборк t-test dep, Вилкоксон
категориальные тут МакНимара нужно использовать только на евровой выборке
Как сделать так, чтобы выборка была минимально возможной с одной стороны, т.е. кол-во крайне мало, и при этом максимально точно описывала результат.
passant
Осмелюсь дать ссылочку на блог нашего уважаемого коллеги по форуму.
http://biostat-r.blogspot.com/2015/03/trialsize.html
Хоть ссылка явно с медицинским уклоном, но информацию по математике метода, который независим от прикладной области, там найти можно. Ну и ссылочка для дальнейшего углубления в тему при необходимости - тоже есть.
DoctorStat
Цитата(kont @ 9.03.2018 - 15:38) *
Как сделать так, чтобы выборка была минимально возможной с одной стороны, т.е. кол-во крайне мало, и при этом максимально точно описывала результат.
Вы неточно ставите задачу. Для большей определенности следует переформулировать ее примерно так (простейший случай):
Есть генеральная выборка (1500 зайцев) двух цветов: белого и серого, которые прячутся в норках, поэтому определить цвет всей популяции мы не можем. Мы можем только вытащить наугад зайцев из двух соседних нор (сделать две независимые выборки) и сравнить долю белых в каждой из них. Требуется предложить статистический метод для проверки гипотезы: процент белых зайцев в популяции больше X. При этом должны выполняться условия: чувствительность метода должна быть не меньше Y, специфичность не меньше Z при минимальной сумме двух выборок.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.