Коллекционирую сообщения об ошибках яндекс.вебмастера

ИМХО
На сайте с 05.01.2008
Offline
42
596

Хочу собрать список сообщений об ошибках и чем они были вызваны, чтобы выжать хоть какой-то функционал из этой штуки. На сайте яндекса искал - не нашел.

Начну с себя, перечислю что есть.

1) HTTP-статус: Ресурс временно перемещён (302). Причина: редирект.

2) Формат документа не поддерживается. Причина: нестандартное расширение на конце адреса, rss-фиды, кривой xml. Наверняка еще что-то есть, просто у меня примеров нет.

3) HTTP-статус: Ресурс не найден (404). Причина: 404 ошибка. Хочу заметить, что яндекс зачастую проверяет снова вторичку которая у него есть в базе, даже если во время нового обхода он уже не нашел ссылок на нее. И в этом случае он также пишет 404.

4) HTTP-статус: Ресурс перемещён навсегда (301). Причина: редирект. В эту категорию также попадают редиректы с www. на без www. и наоборот. И даже банальное отрезание-добавление слеша в конце адреса. Фактически любое заигрывание с url на уровне сервера.

5) Документ запрещен в файле robots.txt. Причина: запрет на индексацию в robots.txt

Будьте добры, дополните и поправьте список.

С уважением, Константин.
albion
На сайте с 07.10.2005
Offline
247
#1
ИМХО:
Хочу собрать список сообщений об ошибках и чем они были вызваны, чтобы выжать хоть какой-то функционал из этой штуки. На сайте яндекса искал - не нашел.

http://help.yandex.ru/webmaster/?id=995305 - это смотрели?

ИМХО
На сайте с 05.01.2008
Offline
42
#2

Спасибо, не нашел.

Не поскажете теперь насколько оно соответствует действительности?

albion
На сайте с 07.10.2005
Offline
247
#3
ИМХО:
Не поскажете теперь насколько оно соответствует действительности?

соответствует

ИМХО
На сайте с 05.01.2008
Offline
42
#4

Спасибо конечно, но все же немного не то.

Там только ответы http, не описываются специальные случаи типа запрета в роботсе.

К тому не рассмотрены нюансы. Я ж хочу процесс как-то автоматизировать. И вот на 404 сразу выскакивает нюанс, что может все в порядке, страницу просто удалили, битых ссылок на сайте нет, просто робот "вспомнил" ее из базы, не нашел и написал ошибку.

Вот такие нюансы мне и нужны. Народ помогите, будьте добры.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий