Тимон

Тимон
Рейтинг
74
Регистрация
08.06.2007
alexmedv:
Тимон, да, это будет подбор абстрактных коэффициентов при помощи регрессии... Корреляция высока, но... Думаю для пользователей важнее, чтобы корреляция была высока именно с его данными. И не просто корреляция была высока, но и матожидание было одинаковым между оценкой по сервису и по его оценкой.

Ну да-да...

Тогда немножко снаглею и спрошу еще - а вы используете предварительную кластеризацию запросов? ;)

Просто чисто студенческий интерес, я вам все равно не конкурент... Я вообще вон блог по фотографии веду

alexmedv:
Внимание! Немного подумав пришел к выводу, что можно сделать следующее:
1) Вы вводите небольшой список запросов в систему с ценами, которые как вам кажется система должна выдавать именно для вас
2) Система обсчитывает введенные запросы и считает, какие коэффициенты надо поставить, чтобы выдаваемая оценка была наиболее приближенной к вашей модели ценообразования и способу продвижения
3) Система на основе введенных данных оценивает стоимость конкретно для вас.

По сути это будет обучающаяся система, которая на основе вторичных данных, которыми являются стоимости запросов, делать выводы о вашим методах продвижения и ценообразовании, соответственно которым вам будет выдаваться стоимость по запросам, наиболее приближенным к вашим реалиям.
Такая система необходима, так как у каждого свое ценообразование и свои методы продвижения.
Просьба высказаться о необходимости внедрения такого алгоритма.

Регрессию будете стоить нелинейную? Она же под собой никакого особенного смысла не несет, просто подбор абстрактных коэффициентов. Да и запросов тогда нужно штук 50 от одного пользователя, не меньше.

Тем более, корреляция с вашими данными и так высокая в общем случае, но не в частностях.

Или вы какой-то способ похитрее знаете?

alexmedv:
Это данные по ссылочному бюджету на ваши проекты?

да... чисто стоимость ссылок

Ну а если мне нужно узнать конкуренцию по запросу именно "воздухоохладитель"? Что тогда? Вводить "воздухоохладители" и получать оценку сверху?

---------

Так что расхождений больших нет .

А вот это не расхождения?

разработка дизайна 65,80 315,00

Grundfos 74,90 350,00

ипотечное кредитование 268,29 470,00

строительная техника 65,81 485,00

недвижимость за рубежом 243,90 630,00

---------

Поэтому я также не уверен, что ваши данные правильны по стоимости (а правильных данных даже вручную посчитанных быть не может в принципе

Мои данные рассчитаны исходя из стоимости ссылок на страницы, анходящиеся в top3 по запросам, причем находящиеся не одну неделю. Вполне адекватные данные

Ну вот и я добрался до сервиса...

Что могу сказать... Как и ожидалось точной оценки нет. Вот что у меня получилось (с позволения ТС, все равно пока лишь тестируем). Сначала реальная цена, затем то, что насчитал сервис.

Видно, что с дешевыми плохо справляется. То оценка в большую сторону, то в меньшую.

воздухоохладитель 65,34 10,00

деревянная отделка 53,53 30,00

автопогрузчик 346,20 95,00

кредит квартира 160,05 130,00

разработка дизайна 65,80 315,00

Grundfos 74,90 350,00

ипотечное кредитование 268,29 470,00

строительная техника 65,81 485,00

недвижимость за рубежом 243,90 630,00

каско 1592,20 1220,00

осаго 902,44 1375,00

-----------

Прикол в том, что результаты расчетов сервиса коррелируют с реальной ценой на 80%, но если рассматривать отдельные величины, то расхождения очень большие. Итого: можно оценивать стоимость группы запросов, по 20-30 штук. Тогда вроде точность нормальная будет.

-----------

Вообще, оценить конкуренцию сложно. Нет даже достоверных данных, чтобы обучить модель, т.к. вы знаете себестоимость продвижения только запросов своих клиентов. Да и то, продвигаете то вы не оптимальным образом, так что изначально получается, что обучающая выборка недостоверна.

-----------

Пробовал считать через конкуренцию. Результаты те же - 80% корреляции, однако по отдельно взятым запросам лажа. Наверное, надо нелинейную регрессию пробовать...

-----------

А вообще приплетать конкурентность запроса не очень корректно, так как не везде предложение соответстует спросу, и наоборот.

По поводу "Не все ли равно пользователю" добавлю...

Получается по логике, что данный фильтр сделан именно для пользователей. Т.к. когда Яндекс борется с накруткой - он банит и пессимизирует, когда он фильтрует выдачу - он делает это для пользователя.

А пользователю важен именно контент

Почитал... Не понимаю логику данного фильтра. Если группа сайтов определилась как "аффилированные", то нафига их вообще в выдаче оставлять - в бан их! Например, если контент одинаковый. А если у них только похожая информация - надо оставлять все в выдаче. Не все ли равно пользователю, как они там перелинкованы, какие у них ip - главное, чтобы информация была разной.

Кстати, вот пример. Есть группа сайтов

www.avtolubitel.com

www.avtovoditel.com

www.gruzoperevoz.com

на одном ip 88.214.200.21, да и внешне очень похожи

По запросу "2005-2006 &&/(1 1) support" (без кавычек) находятся на 14, 61, 45 позициях соответственно. Фильтра нет... Звачин, наверное, их Яндекс не считает аффилированными, так что ли?

Интересует следующие вопросы (можно и в личку):

1. Стоимость безлимитного доступа к сервису

2. Полнота базы, по которой производится поиск бэклинков (Я так понял 3 млн? А я где-то слышал о 7-8...)

3. Будет ли функциональная возможность, аналогичная anchor#link? Если будет, то когда?

Господа, вы мне скажите пожалуйста, те кто пользуется сервисом Каширина, какова полнота и точность инструмента? Ну т.е. сколько % запросов сервис может обрабатывать без сбоев и насколько точную оценку он дает запросам, насколько различия с реальными данными?

Резюмируя все вышесказанное, я сделал следующий вывод:

На сегодняшний момент возможна ситуация, когда сайт может относится к нескольким регионам, однако это сделать достаточно сложно.

1. Можно изучать сайты, которые попадают в несколько регионов и смотреть, почему у них это получилось (скорее всего, сайт попадает в несколько регионов, если на него идет определенное количество ссылок, включающих наименование региона + текстовая информация на сайте соответствует нескольким регионам).

2. Можно сделать запрос на платное добавление сайта в каталог Яндекса. При этом попросить модератора, чтобы добавили сайт сразу в дву региона (шансы попасть в несколько регионов повышаются в случае, если на сайте есть соответствующая текстовая информация)

3. Создать отдельный сайт/поддомен - тогда возможно попадание поддомена в другой регион (при соответствующем текстовом наполнении поддомена)

Всего: 265