Улучшенный WordStat

12
Hkey
На сайте с 30.09.2006
Offline
222
#11
Oyuna:
"Чистые" показы как-то не согласуются с "чистыми" показами в вордстате. Оценки оценками, но отличия в разы немножко расстраивают.
В целом впечатление не однозначное. Удобно, наглядно, но есть такое чувство, что цифры выдают себя за то, чем не являются.
P.S. для оператора (*) существенным оказалось отсутствие пробела между запросом и (*), если он есть, выдается ошибка. Интересно, какие 'косвенные факторы' учитывает этот оператор..

Про оператор не понял.

Чистые это оценка показов запроса без уточнений.

"Чистые" могут сильно отличаться от вордстатовских кавычек, особенно если глубина парсинга ограничена и чистых намного меньше чем всех.

Погрешность (Все - Чистые) в среднем около 3-5%.

Для чистых погрешность увеличивается в Все/Чистые раз.

Т.е. если чистых в десять раз меньше чем всех, то погрешность около 30-50%.

Счас работаю над улучшением расчета.

HTraffic.ru (http://HTraffic.ru/) - удобная система для управления контекстной рекламой. тема на форуме (/ru/forum/810827) HTracer (http://htracer.ru/) - скрипт для автопродвижения сайтов по НЧ и СЧ запросам. Для больших сайтов от 100 страниц. (тема на форуме (/ru/forum/676867))
regta
На сайте с 15.04.2006
Offline
320
#12
Hkey:
Добавлять кеи которые она не видит по вордстату, но косвенные факторы говорят об их присутствии.

Интересная возможность

Можно подробнее об этой функции?

Цитируйте, плиз, историю переписки в личке. Спасибо.
Hkey
На сайте с 30.09.2006
Offline
222
#13
regta:
Интересная возможность
Можно подробнее об этой функции?

Например запрос|показы (пример абстрактный цифры не связаны с реальностью)

ноутбуки | 15

ноутбуки купить | 13

ноутбуки недорого | 7

Сумма показов "ноутбуки купить" и "ноутбуки недорого" больше показов первого кея на 5. Из этого следует что у запросов есть невидимый общий потомок (ноутбуки купить недорого) с числом показов от 5 до 7.

Чтобы таблица была нагляднее, я переверну ее


запрос |показы |оценка чистых показов
ноутбуки купить недорого (*) | 6 | 6
ноутбуки недорого | 7 | 7-6=1
ноутбуки купить | 13 | 13-6=7
ноутбуки | 15 | 15-7-1-6 =1

Либо, очень редко такое бывает, эти два запроса пересекаются по омонемии. Т.е. существуют словоформы обоих запросов, которые пишутся одинаково. Это определяется по косвенным признакам.

Tryerty
На сайте с 04.12.2007
Offline
68
#14
Все — показы ключа и его уточнений, по WordStat
Чистые — оценка числа показов ключа без уточнений.
Чистые — оценка выдачи WordStat, если запрос взять в кавычки.

Два определения одного понятия, причём второе точно не соответствует истине.

поставщики моющих средств 48 48

Wordstat в кавычках показывает число 4. Какая погрешность?

Впрочем и первое определение явно требует разъяснений.

В целом же идея интересная, а реализация, смею надеяться, будет полезной для многих.

Движение вверх нельзя воспринимать как движение вперед не только с точки зрения физики. Достаточно взглянуть, ЧТО плавает на поверхности...
O
На сайте с 15.12.2010
Offline
43
#15
Hkey:
Про оператор не понял.

Имелось в виду:"запрос(*)" работает как "запрос", а вот "запроспробел(*)" (выдавая результат, отличный от "запрос"), сообщает о делении на ноль в.. (номер строки в зависимости от запроса). Например, "скалолазание (*)".

Hkey:
Для чистых погрешность увеличивается в Все/Чистые раз.

Почему погрешность зависит от отношения (все/чистые)?

По-моему, честнее считать обычную относительную ошибку: погрешность=("чистые"-"чистые_вордстат")/"чистые_вордстат".

Hkey
На сайте с 30.09.2006
Offline
222
#16
Oyuna:
Имелось в виду:"запрос(*)" работает как "запрос", а вот "запроспробел(*)" (выдавая результат, отличный от "запрос"), сообщает о делении на ноль в.. (номер строки в зависимости от запроса). Например, "скалолазание (*)".

Запрос "скалолазанье (*)" некоректный в обычном вордстате. AWS понимает только запросы без операторов.

Oyuna:

Почему погрешность зависит от отношения (все/чистые)?
По-моему, честнее считать обычную относительную ошибку: погрешность=("чистые"-"чистые_вордстат")/"чистые_вордстат".

Расчеты скрипта происходят так:

Начиная от запроса с минимальным число показов, до запроса с максимальным числом показов:

Чистые=Все - Сумма_Чистых_всех_дочерних_кеев(Далее обозначим как E)

Допустим чистых в 10 раз меньше. E=9/10 * Все. и погрешность расчета E = 5% (1/20)


Чистые = Все - E +- 1/20 * E
= Все - 9/10 * Все +- 1/20 * E
= 1/10* Все +- 1/20 * E
= 1/10* Все +- 1/20 * 9/10 Все
= (1/10 +- 9/200) * Все
= (1 +- 9/20) * Все/10

(9/20=45%) погрешность составляет 45% при изначальной в 5%

Hkey добавил 11.03.2011 в 21:43

Tryerty:
Два определения одного понятия, причём второе точно не соответствует истине.

Так понятнее. Написано же оценка.

Tryerty:

Wordstat в кавычках показывает число 4. Какая погрешность?

Да в некоторых случаях может быть большая погрешность для низкочастотных запросов.

Единственный выход парсить по всем НЧ в кавычках Вордстат, но это долго и может привести к бану.

O
На сайте с 15.12.2010
Offline
43
#17
Hkey:
Запрос "скалолазанье (*)" некоректный в обычном вордстате. AWS понимает только запросы без операторов.

Поняла, где ошиблась: рассматривала Ваш (*) как дополнительную функцию, а не как свойство алгоритма. Спасибо за пояснения.

B0
На сайте с 30.01.2011
Offline
8
#18

По части безопасности, на ввод скриптов поле не филтруется, как результат xss))

Аудит безопасности сайта. (http://bo0om.ru/o-vzlome)
Hkey
На сайте с 30.09.2006
Offline
222
#19

Дыры уже тИЦ не дают

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий