Вопрос про робота и бан.

12
SZ
На сайте с 17.08.2005
Offline
63
#11

BigBrother, сорри, уже исправился =)

I - не ходит, посмотрел по логам, тока зеркальщик забегает.

Megavolt
На сайте с 23.12.2005
Offline
179
#12
BigBrother:
А вот с этого места поподробнее, лучше с примерами.

кстати да, ведь это глюк. зачем ресурсы тратить на забаненый сайт?

BigBrother, тут еще такая непонятка, не факт, что сайт в бане, даже если был ответ платона, что в бане. проскакивали тут такие неприятные фактики.

Иногда лучше жевать.... (С)
DH
На сайте с 23.08.2006
Offline
3
#13

Все понял, значит ходит...

С одной стороны может и нормально быть в курсе чо там с сайтом происходит, а с другой стороны раз уж забанил так зачем ходить ресурсы в самом деле тратить.

Разбанили сайт, заново проиндексил и готово:)

V
На сайте с 10.01.2005
Offline
26
#14

А как робот интересно поступит, если забан. сайт просто запретить к индексации в robot.txt? Интересно уберёт с бана по истечении времени? Кто нибудь эксперементировал?

S
На сайте с 28.10.2005
Offline
313
#15

Запрещал в роботсе индексировать Я, бот не шарился, из бана не вышел

[Удален]
#16
DuHast:
Добрый день.

После вчерашнего апа сайт вылетел из индекса полностью.
Добавил через адурелку и седня ко мне пришел робот I.

И тут возник вопрос:

Ходит ли робот I на забаненые сайты?
Или по другому: означает ли приход робота I то, что сайт не в бане?

По забаненым сайтам ходит еще активнее чем по проиндексированым

Яндекс не до конца проработал систему банов сайтов

Для робота не существует понятия забаненый сайт а робот это автономный механизм дополняющий общий алгоритм поиска но не имеющий о нем предствления(кроме страниц присутсвующих в индексе )

Поэтому робот натыкается на забаненый сайт и думает ну нифига себе позор моим сединам сайт вообще не проиндексирован и начинает его насиловать.....

S
На сайте с 28.10.2005
Offline
313
#17

Зачем индекирующий бот ходит по забанненым сайтам, несколько гипотез:

1. Ему все равно он ходит по всем сайтам (хм, а как же экономия ресурсов?)

2. Чтобы иметь свежий кеш, на случай принятия решения о помиловании

3. Отследить переезд сайта, если контент "мутный"

4. Собирать ссылки, как и со всех остальных сайтов (например для расчета уровня доверия)

5. Для обучения алгаритмов распознавания потенциального спама

6. ???

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий