а кто тут статистику знает? :)

asto
На сайте с 13.10.2005
Offline
180
#21
скажем N=M или, в переводе на русский тулбар поставили себе абсолютно все.

Что курил?;) Такое даже теоретически невозможно, чтобы гавнопанель поставили все пользователи сети Интернет. Фантазёр)

Еще раз повторяю, эти "ВСЕ" будут 100% пользователей панельки, а не все пользователи сети Интернет. Потому по данным формулам прогноз достоверный получить будет невозможно. Недостаточно достоверной статистики.

У нас как-то в универе был случай:


Препод на физре спрашивает, во что играть будете? Один пацан кричит "В баскетбол все играть будут!", все говорят "В футбол играть будем!", тот пацан опять "Нет! Мы все будем в баскетбол играть!" и тут все его послали и сказали "Все будут играть в футбол, а ты иди играй в баскетбол".

К чему этот мега-рассказ из университетской жизни? Всё элементарно - Ваши "все" будут только те, кто поставил панельку, но это будет не более 5% от общего числа пользователей глобальной сети)

Если бы всё было так просто в прогнозировании...)

В 2009 году строил прогноз посещаемости туристских сайтов Рунета на летний период, на 3 года, без учёта статистической погрешности, но с учётом собственного коэффициента. Без учёта этого коэффициента прогноз недостоверен. С учётом моего коэффициента расхождение прогноза с фактом помоему было 3-15%, что достоверно. Недостоверный прогноз - если разница прогноза и факта была более 30%. На один год достоверно, в этом году узнаем, будет ли он достоверным на второй год.

asto добавил 09.07.2011 в 01:07

ак, asto тоже не понимает условий задачи

Условия задачи понятны были изначально. Формула говно - этого не поймёте Вы)

asto добавил 09.07.2011 в 01:12

То есть мы не в состоянии даже с такой астрономической панелью оценивать малопосещаемые сайты с достаточной точностью.

Сами признались, что не сможете.

С другой стороны: скажем в стране всего 300 человек живет. Тогда имей всего 100 человек в панели, что менее твоих 400, сайт с 200 посетителями в день будет оценен по трафику с требуемой точностью - и даже намного выше.

Где такие страны видели? Это деревня скорее, а не страна. Ну и там фиг из 300 жителей 100 человек поставят панельку)

Слава Шевцов
На сайте с 23.07.2005
Offline
370
#22
Mauser:
Слава Шевцов, ответ неверный

Верный. Вспомните соцопросы перед выборами и сами выборы. Результаты нормальных соцопросов лишь на несколько процентов отличаются от результатов выборов. И вне зависимости от населённости страны достаточно грамотно отобрать и опросить 1600 респондентов.

Mauser:
смотри: если сайт Х имеет всего одного посетителя в день. Точность +-5% означает оценку от 0.95 до 1.05.

Не может быть здесь точности 5%. Может быть лишь погрешность 100%. Погрешность_количества_посетителей равна 100% делить на корень_квадратный_из_количества_посетителей.

Mauser:
То есть мы не в состоянии даже с такой астрономической панелью оценивать малопосещаемые сайты с достаточной точностью.

Это не так. См. стандартный соц. опрос на базе панели из 1600 человек.

Слава Шевцов добавил 09.07.2011 в 01:19

asto:
Где такие страны видели? Это деревня скорее, а не страна.

Ватикан? А что, хороша деревенька на 829 человек.

Неизменность точки зрения неизменно порождает иллюзию понимания.
asto
На сайте с 13.10.2005
Offline
180
#23
Слава Шевцов:
Ватикан? А что, хороша деревенька на 829 человек.

Ватиканы, Люксембурги, Лехтенштейны, Монако, Сан-Марины, Андрорры... это страны бенилюкса)

В Ватикане Папа Римский может панельку пропиарить среди местного населения:)

M
На сайте с 12.01.2003
Offline
130
#24

Слава Шевцов, неверный :) панели опросов на выборах работают только для кандидатов набирающих заметный процент голосов :) Но в случае выборов это всех устраивает, так как выяснять набрал ли аутсайдер 0.0001% или 0.0005% никому не надо. А в задаче вопрос именно так и ставится: указать связь между размером панели и посещаемостью оцениваемой.

Кажется тебя таки надо в стан непонявших задачу перекидывать :) Во всяком случае не до конца понявших.

SAlex
На сайте с 27.07.2008
Offline
409
#25
Mauser:
Итак, вопрос: какова зависимость между посещаемостью домена X и необходимым размером панели, что бы полученная панелью оценка посещаемости отличалась от настоящей с точностью +-5% с вероятностью более 95%?

А Вы с какой целью интересуетесь?

Психиатр
На сайте с 16.11.2010
Offline
360
#26

о, как тут все запущено

Слава Шевцов
На сайте с 23.07.2005
Offline
370
#27
Mauser:
Слава Шевцов, неверный :) панели опросов на выборах работают только для кандидатов набирающих заметный процент голосов

Именно поэтому посещение каждого домена 400 посетителями с панелями позволяет для домена давать результаты с точностью 5% вне зависимости от населения страны. А посещаемость у нас, по уточнённому условию, равномерная.

M
На сайте с 12.01.2003
Offline
130
#28
Слава Шевцов:
Именно поэтому посещение каждого домена 400 посетителей с панелями позволяет для домена давать результаты с точностью 5% вне зависимости от населения страны. А посещаемость у нас по уточнённому условию равномерная.

Ну это же явно неверный ответ. Возьми крайний случай. У тебя всего в стране 200 посетителей и каждый посещает один домен в день. :) Очевидно что панель в 200 юзеров ответит на вопрос с должной точностью для домена с любой посещаемостью. И 199. И 198. :)

Ты, видимо, знаком с результатами расчетов для всякой социологии, но не в курсе почему и как оно считается.

Слава Шевцов
На сайте с 23.07.2005
Offline
370
#29
Mauser:
Ну это же явно неверный ответ. Возьми крайний случай. У тебя всего в стране 200 посетителей и каждый посещает один домен в день. Очевидно что панель в 200 юзеров ответит на вопрос с должной точностью.

И что? Стран с < 10 тыс. человек три или четыре (Ватикан, Себорга, Тувалу, может ещё кто). То есть на практике этим краевым случаем можно пренебречь. Ладно. Я изложил верное решение, основанное на строгой матстатистике, нужно ли оно Вам - решайте сами.

ScarletThread
На сайте с 28.04.2011
Offline
6
#30

Взяла вашу мега задачу и немного подкорректировала ;)

Mauser:

Итак, у нас есть страна, в ней живет 40 000 000 интернет юзеров. 1 000 000 из них установили себе наш тулбар, который сообщает обо всех посещенных ими УРЛов. Они образуют нашу панель. Cкажем УРЛы нас интересуют с точностью до домена. Доменов у нас имеется всего 5. Участники панели за сути посетили домен 2 6 000 раз. Соответственно мы предсказываем суточную посещаемость домена как 40 000 000=1 000 000*(40 000 000/1 000 000)
Итак, вопрос: какова зависимость между посещаемостью домена 2 и необходимым размером панели, что бы полученная панелью оценка посещаемости отличалась от настоящей с точностью +-5% с вероятностью более 95%?

Вопрос если честно вообще не поняла ))) но и сильно не расстроилась 🍿

Я считаю, что данная задача - как раз и писалась для Ватикана в 300 жителей :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий