а кто тут статистику знает? :)

Arsh
На сайте с 21.03.2007
Offline
199
#51

Mad_Man, Можно и по-другому показать

Mad_Man:
бессмысленность и беспощадность

:)

В Стране Дураков тысячи Буратин подбрасывают золотой сольдо, а мы имеем возможность наблюдать за ними в дырку.

Вопрос: какова зависимость между частотой выпадения решки и размером дырки, в которую мы подглядываем (чем больше дырка - тем больше Буратин мы можем видеть)?

Ответ: никакой зависимости нет. Решка выпадает в 50% случаев независимо от размера дырки.

dRiveR.dLL
На сайте с 25.09.2006
Offline
79
#52

Не совсем понял, почему мы рассчитывая предполагаемое кол-во посетителей, за основу берем кол-во просмотров.

Mad_Man
На сайте с 10.11.2008
Offline
162
#53
Arsh:
Mad_Man, Можно и по-другому показать

Проапдейтил пост, зачем-то в начальном варианте решил использовать формулу ТСа, только на 5 минуте дошло, что эта формула полное фуфло и ТС просто не дружит с неопределённостью.

Если нужна точность в 95% - инсталльте 95% населения свою панельку и будьте уверены в результате.

M
На сайте с 12.01.2003
Offline
130
#54
happy-joker:
Тогда жду вашего ответа с обоснованиями, ибо не вижу ошибки в своих рассуждениях. Пользовался лишь определением репрезентативной выборки и стандартной табличкой подбора размера выборки.

Ответа - это рано :) Но ссылку дам :) Вот http://sider.home.nov.ru/book/side2/ch5_3.htm , пример 5.5. http://sider.home.nov.ru/book/side2/ch5_4.htm пример 5.9. Я так и знал, что ты в таблички для социологов смотришь. Они все составлены для условно больших вероятностей. А в случае с сайтами вероятность посещения сайта KrutoyVasek.com весьма мала. Твои цифры верны для сравнения Гугля и Яхи. Но вопрос как раз и состоит в том, что бы рассчитать как далеко от гиганстких сайтов мы можем отойти.

dRiveR.dLL, не принципиально. Будем для простоты считать что посетитель и просмотр для нас одно и тоже.

Итого, на текущий момент: happy-joker задачу примерно понимает, но решить не может :) Остальные и тем похвастаться не могут.

stabuev
На сайте с 18.11.2003
Offline
150
#55

Зависимость безусловно обратная. Чем больше "m" тем меньше может быть "M".

А если "все распределения считаем для простоты равномерными. выборку равномерно размазаной", то (m*M)/N должно быть больше чего-то там наверно.

Швейцарские часы (http://www.horlogerie.ru/)
angr
На сайте с 11.05.2006
Offline
413
#56

Mauser, а вы чего добиваетесь?

хотите что бы вам на халяву вывели формулу?

или просто по понтоватся решили, мол вот какой я крутой, никто из сеошников не может решить задачку...

Требуется СЕО-Специалист в Кишиневе, в офис. ()
malls
На сайте с 08.08.2005
Offline
255
#57
Mauser:
Итак, вопрос: какова зависимость между посещаемостью домена X и необходимым размером панели, что бы полученная панелью оценка посещаемости отличалась от настоящей с точностью +-5% с вероятностью более 95%?

дурацкие термины "панель" и "размер панели", ну да ладно - на результат это не влияет - в любом варианте, для обеспечение точности, надо учитывать не только (и даже не столько) количество установленных тулбаров, сколько качество их установки.

Примеры:

1. Тулбар установило 1000 школьников- результат будет где-то в области высокой посещаемости развлекательных сайтов

2. Тулбар установило 1000 гинекокологов (результат предсказать не берусь)

3. и т.д. по списку

Иначе говоря вопрос не в том 1000 тулбаров будет или 100500, вопрос в том репрезентативно ли их количество "демо-социо-гендеро-ипрочая" составу изучаемой аудитории.

Если да - то там вроде стандартные есть проценты какие-то у статистиков - то-ли 2, то ли 4 процента, считаются достаточными. Если нет - то статистика не поможет точно ответить на вопросы которые поставлены.

UN
На сайте с 16.10.2007
Offline
58
#58
Mauser:
Итак, вопрос: какова зависимость между посещаемостью домена X и необходимым размером панели, что бы полученная панелью оценка посещаемости отличалась от настоящей с точностью +-5% с вероятностью более 95%?
Mauser:
о достоверности данных подобных сервисов для малопосещаемых сайтов.

для малопосещаемых "панель" должна быть заведомо большая и тогда, приблизительно, соотношение между этими величинами вычисляется из соотношения:

1/sqrt(2pi*X*M/N*(N-M)/N) * sum [ e ^ - ((y-X*M/N)/sqrt(X*M/N*(N-M)/N))^2 /2) ] = 0,95 , в диапазоне y (сумма по y в этом диапазоне считается): от X*M/N - sqrt(X*M/N*(N-M)/N*ln1,05) до X*M/N +sqrt(X*M/N*(N-M)/N*ln1,05)

:)

M
На сайте с 12.01.2003
Offline
130
#59

UZPN, :)

Вторую часть хочешь? Смотри: ведь на самом деле мы не знаем N. Соответственно вопрос выворачивается наизнанку: у нас есть доступ к статистике по I сайтам. Их посещаемость согласно панели и согласно реальным данным соответственно m1, n1; m2, n2; ...mi,ni. Размер панели мы знаем. Вопрос теперь в оценке N.

UN
На сайте с 16.10.2007
Offline
58
#60
Mauser:
ведь на самом деле мы не знаем N. Соответственно вопрос выворачивается наизнанку: у нас есть доступ к статистике по I сайтам. Их посещаемость согласно панели и согласно реальным данным соответственно m1, n1; m2, n2; ...mi,ni. Размер панели мы знаем. Вопрос теперь в оценке N.

Не совсем понял наверное. Если есть достаточно наборов mi ni, то берете и просто усредняете (можно сложно усреднить - взвешивать с учетом вероятности отклонения от M/N, но здесь это наверное не нужно совсем) , смотрите потом всякую дисперсию и соответствие распределению вероятности по теории для оценки качества этого результата. Для лучшего качества лучше отбирать те пары где m побольше.

Или нужно оценить минимальное количество таких пар, при некотором минимальном значении mi, при котором оценка M/N будет иметь необходимую точность?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий