Интересен ли YaDirectBot/1.0

DyaDya
На сайте с 11.04.2007
Offline
147
728

Поднимаю тему /ru/forum/61141 и особенно /ru/forum/163637 ибо она уже просрочена...

YaDirectBot/1.0 (compatible; Win16; I) — робот, индексирующий страницы сайтов, участвующих в Рекламной сети Яндекса. Это я уже понял. Но поднимая вопрос /ru/forum/163637 хочу описать одну ситуацию:

Начало...

1. site.ru учавствует в рекламной сети яшки.

2. сайт учавствует в маркете.

3. стоит обработчик переходов с маркета, для сбора данных по переходам с market.yandex.ru на site.ru/tovar123.php

4. для маркера переходов с маркета, при экспорте товаров в ссылки на сами товары добавляется некий параметр, например, site.ru/tovar123.php?from=market

Замечено:

Робот YaDirectBot/1.0 переходит или просто заходит или как-то находит ссылки, подобные site.ru/tovar123.php?from=market - Их нет на самом сайте! Этих страниц нет в поисковом индексе яшки!! IP адрес с которого заходил бот: 77.88.33.139

Вопросы (некоторые уже с ИМХО ответами):

в продолжении темы /ru/forum/163637 и напрашивается вопросики...

- Как он находит подобные ссылки?

Предполагается: бот находит такие страницы по посещениям пользователей, которые приходят в моем случае с маркета. Похоже так он обнаруживает новые (с точки зрения яшки) страницы на котороых стоит директ.

- Для чего он приходит на обнаруженные страницы?

Предполагается: робот YaDirectBot/1.0 заходит для определения тематики страницы, чтобы потом давать "нужные" объявы.

- Сохраняются ли эти страницы у яшки?

- Попадают ли такие новые страницы в поисковый индекс яшки?

Проверял на проиндексированность, в поисковом индексе их нет. Возможно уже прошла склейка site.ru/tovar123.php?from=market с site.ru/tovar123.php

- Каким методом можно определить проиндексирована и склеена ли одна страница с другой страницей? с какой именно страницей была склейка?

Выбирайте качественный хостинг (http://vashmaster.ru/informaciya/o_poleznyh_programmah/news83.php) и продвигайте сайты в СЕОПУЛЬТ (http://seopult.ru/ref.php?ref=72b5ed9561fe66a1). А на «SAPE» я в обиде :) Не упрекайте за очепятки, пишу вслепую (http://ergosolo.ru/) и также делаю сайты (http://www.vashmaster.ru/) ;)
upyrj
На сайте с 17.09.2005
Offline
140
#1
DyaDya:
- Как он находит подобные ссылки?

По вызову рекламы с них. Юзер приходит и вызывает блок Директа, при этом в РСЯ передается URL, на котором был показан блок. Потом приходит ЯДиректБот и хавает этот URL.

DyaDya:
- Для чего он приходит на обнаруженные страницы?

Чтобы привязать объявления к контенту.

DyaDya:
- Сохраняются ли эти страницы у яшки?

Да, страницы сохраняются в отдельном кеше.

DyaDya:
- Попадают ли такие новые страницы в поисковый индекс яшки?

Насколько я знаю, эти индексы независимые. То есть нет, не попадают.

DyaDya:
- Каким методом можно определить проиндексирована и склеена ли одна страница с другой страницей? с какой именно страницей была склейка?

Знаю только один достоверный способ: если текст ссылки, ведущей на URL1, есть в анкор-листе документа, отображаемого в SERPе как URL2, и на URL2 не ведет больше ссылок с тем же текстом, то URL1 «приклеен» к URL2.

Денис Иванов Важно: обменом валют я не занимаюсь.
DyaDya
На сайте с 11.04.2007
Offline
147
#2
upyrj:
Знаю только один достоверный способ: если текст ссылки, ведущей на URL1, есть в анкор-листе документа, отображаемого в SERPе как URL2, и на URL2 не ведет больше ссылок с тем же текстом, то URL1 «приклеен» к URL2.

Ага, вроде как логично, хоть и сложновато выходит... Получается, что только экспериментом, ставить внешнюю ссылку с нужным анкором и проверять какая страница найдется.

В принципе, возможно, бот интересен с точки зрения еще одного способа добавления страниц в яндекс, просто поставив директ и походив по страницам с ним.

upyrj
На сайте с 17.09.2005
Offline
140
#3

А посмотрели бы по логам — шарится ли I-робот по маркетовским URLам?

Мне кажется, что не должен бы. Разве что только когда юзера где-то ссылок наставят с ?from=market (а это можно по переходам отследить или по Я.вебмастеру).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий