а кто тут статистику знает? :)

M
На сайте с 12.01.2003
Offline
130
#41

Arsh, вас тоже в число таки непонявших задачу придется перекинуть :)

Happy-joker, это неверный ответ. 400 достаточно для сильно посещаемого сайта. Действительно, если сайт посещает половина населения страны. А с малопосещаемыми сайтами все не так. Смотри: есть сайт А и сайт Б с посещаемостью 1 и 2 человека в день соответственно. Страна - Россия с 50 миллионами пользователей. Панель в 400 носов очевидно покажет нули по обоим. То есть в доверительный интервал мы не попадем. Я ж уже в третий раз разве что ни на пальцах показываю - существует зависимость между размером панели и ее способностью ловить малопосещаемые сайты с требуемой точностью.

yet_warm
На сайте с 26.05.2007
Offline
129
#42
Mauser:
Arsh, вас тоже в число таки непонявших задачу придется перекинуть :)

Mauser, а каков предполагаемый процент понявших задачу по расчетам выходит?

Вроде статданных должно хватать?

Многие хотят попасть в рай, мало кто хочет для этого умирать.
Arsh
На сайте с 21.03.2007
Offline
199
#43
Mauser:
Arsh, вас тоже в число таки непонявших задачу придется перекинуть

Это ничего. Зато я вероятность и закономерность не путаю :)

HJ
На сайте с 14.02.2006
Offline
274
#44
Mauser:

Happy-joker, это неверный ответ. 400 достаточно для сильно посещаемого сайта. Действительно, если сайт посещает половина населения страны. А с малопосещаемыми сайтами все не так. Смотри: есть сайт А и сайт Б с посещаемостью 1 и 2 человека в день соответственно. Страна - Россия с 50 миллионами пользователей. Панель в 400 носов очевидно покажет нули по обоим. То есть в доверительный интервал мы не попадем. Я ж уже в третий раз разве что ни на пальцах показываю - существует зависимость между размером панели и ее способностью ловить малопосещаемые сайты с требуемой точностью.

400 - это для случая, если соблюдено условие:

Процент людей, посетивших сайт, в рамках панели и в рамках страны должен быть одинаков, т.е. (m/M) = (n/N).

Т.е. для случая N=50kk и n=1, (m/M) должно равняться (1/50kk)=0,00000002

Впринципе, выборка 400 установок в этом случае должна ловить 8 посещений сайта за 1кк суток с заданной погрешностью. Но если оценивать нужно в течение суток, то М нужно увеличивать, соблюдая всё ту же пропорцию (m/M) = (n/N).

The_Rock
На сайте с 26.02.2009
Offline
89
#45
Бардо:
У меня пятак был по терверу и матстату. Я теперь в казино могу выигрывать на раз. Обращайтесь.

6 чёрное, нащяльнике.:)

Закажи свое видео! Рекламные ролики, обзоры товаров и услуг, заставки... (/ru/forum/comment/12596209) Более 5 лет опыта и сотни довольных заказчиков.
M
На сайте с 12.01.2003
Offline
130
#46

Happy-joker, и опять, очевидно, это неверный ответ :) по твоей же собственной формуле получается что если на 50м тебе надо панель в 400 носов, то в стране со 100м населения надо будет 800 :)

И не забывай что N/n=M/m в среднем :) а результаты конкретной выборки могу отличаться.

Психиатр
На сайте с 16.11.2010
Offline
360
#47

Мне кажется, The_Rock написал правильный ответ.

SAlex
На сайте с 27.07.2008
Offline
409
#48

Пурга. Бред. Прогон. Тарабарщина. Чепуховина. Шняга. Бред. Россказни. Гонево. П_здешь. Абсурд. Нелепица. Неправда. Туфта. Враки. Ботва. Ерундятина. Парожняк. Гонилово. Ересь. Флуд. Бестолковка. Абракадабрина. Абы что. Абракадабра. Лепет. Дребедень. Лабуда. Выдумка. Не имеет смысла. Белиберда. Брехня. Ерунда. Ахинея. Чушь. Ребячество. Гониво. Ересь. Околесица. Фуфло. Чес. Чепуха. Вздор. Муть. Галиматья. Враньё.

Чертовски трудно врать, когда не знаешь правды.
HJ
На сайте с 14.02.2006
Offline
274
#49
Mauser:
Happy-joker, и опять, очевидно, это неверный ответ :) по твоей же собственной формуле получается что если на 50м тебе надо панель в 400 носов, то в стране со 100м населения надо будет 800 :)
И не забывай что N/n=M/m в среднем :) а результаты конкретной выборки могу отличаться.

Тогда жду вашего ответа с обоснованиями, ибо не вижу ошибки в своих рассуждениях. Пользовался лишь определением репрезентативной выборки и стандартной табличкой подбора размера выборки.

Mad_Man
На сайте с 10.11.2008
Offline
162
#50
Mauser:
Итак, у нас есть страна, в ней живет N интернет юзеров. M из них установили себе наш тулбар, который сообщает обо всех посещенных ими УРЛов. Они образуют нашу панель. Cкажем УРЛы нас интересуют с точностью до домена. Доменов у нас имеется всего K. Участники панели за сути посетили домен Х m раз. Соответственно мы предсказываем суточную посещаемость домена как n=m*(N/M).
Итак, вопрос: какова зависимость между посещаемостью домена X и необходимым размером панели, что бы полученная панелью оценка посещаемости отличалась от настоящей с точностью +-5% с вероятностью более 95%?

Имея такие печальные сведения, можно утверждать следующее: 510 > 310. Вот и вся унылая зависимость.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий