Статистическая значимость отчетов

P4
На сайте с 01.06.2016
Offline
13
1094

Здравствуйте! Хочу разобраться с тем, какое количество данных по любому из отчетов системы Веб-аналитики можно считать статистически значимыми. Для примера - нужно понять, что конкретная площадка РСЯ/ключевая фраза по рекламной кампании неэффективна. Нельзя же делать вывод по 1-2 посетителям? Вопрос - сколько их нужно, чтобы результат был значимым? Как это рассчитывать?

Пытался читать, но математика всегда была моей слабой стороной и очень сложно для понимания. Был бы очень благодарен за более простое объяснение, чем статьи в интернете (которые в основном про a/b тестирование)

T
На сайте с 26.06.2008
Offline
67
#1

Ответ на твой вопрос зависит от двух вещей:

* какова конверсия (чем меньше конверсия, тем больше кликов нужно, чтобы определить выше ли или ниже средней конверсии показывает площадка)

* алгоритмы оптимизации, которые использует Директ, например, когда ты выбираешь стратегию "максимальное число кликов" могут и скорее всего будут принимать решение быстрее твоих ручных расчетов, т.к. у них есть больше данных о ситуации (и о пользователях, и о конкурентах, и о вероятности клика по баннеру)

По первому пункту, можешь попробовать почитать про ошибки первого и второго рода, а также воспользоваться калькуляторами типа http://www.evanmiller.org/ab-testing/sample-size.html В твоем случае Baseline conversion rate - это средняя конверсия. Minimum Detectable Effect - это некое отклонение от средней конверсии такое, что если фактическая конверсия кампании лежит в пределах Baseline conversion rate +/- Minimum Detectable Effect - то тебя это устраивает. А если фактическая конверсия сильно ниже (или выше средней) ты бы хотел знать об этом достоверно.

По второму пункту. Иногда запариваться смысла нет. Например, при выборе более эффективного объявления. Этот вопрос автоматически решается Директом с успехом. А что касается площадок и ключевых слов, то есть 2 камня преткновения.

1) Деньги. Проще отталкиваться от финансовой стороны вопроса. У тебя есть некая сумма денег которую ты можешь потратить на тес. И в условиях не особо большой конверсии тебе выгоднее просто прекратить тест после того, как потрачено достаточно денег. Статистическая достоверность может быть слишком дорогим довольствием. Если слышал, как работает алгоритм "многорукий бандит", то тут что-то похожее. Ты просто ставишь на паузу варианты, показывающие плохие результаты. Но потом, когда появятся деньги на тест, сможешь к ним вернуться.

2) Время. Если траффа идет мало, то тебе может потребоваться год для получения достаточного количества кликов. А за год ситуация успеет поменяться. И вот у тебе через год снова нет достоверной инфы. Есть только какое-то очень среднее за весь год.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий