Disallow: и Яндекс

chudinov
На сайте с 28.10.2005
Offline
101
680

Поясните что не так?

у сайта в http://www.rabota.ru/robots.txt прописано Disallow: /pix/

Но если http://www.rabota.ru/pix/ добавить как URL в сервисе http://webmaster.yandex.ru/add.xml

Пишет:

Адрес http://www.rabota.ru/pix/ может быть внесен в нашу базу данных (и, соответственно, проиндексирован)

Добавляем http://rabota.ru/pix/

Адрес rabota.ru/pix/ не был внесен в базу Яндекса, так как он запрещен к индексации в файле robots.txt, или при обращении к robots.txt сервер вернул ошибку 5xx

Как так, если у www.rabota.ru и rabota.ru одинаковый robots.txt а результат для add.xml разный...

p.s. Host: www.rabota.ru добавил после...

# rm -rf *
Antony69
На сайте с 16.09.2004
Offline
146
#1

Скорее всего глюки.

Заметки SEO аналитика (http://www.seonotes.ru)
chudinov
На сайте с 28.10.2005
Offline
101
#2
Antony69:
Скорее всего глюки.

шут его знает...

213.180.216.9 - - [14/Jul/2006:10:22:31 +0400] "GET /robots.txt HTTP/1.1" 200 369 "-" "Yandex/1.03.003 (compatible; Win16; D)"

213.180.206.223 - - [14/Jul/2006:10:31:28 +0400] "GET /robots.txt HTTP/1.1" 200 369 "-" "Yandex/1.03.003 (compatible; Win16; D

)"

213.180.206.248 - - [14/Jul/2006:10:38:36 +0400] "GET /robots.txt HTTP/1.1" 200 369 "-" "Yandex/1.01.001 (compatible; Win16; I

)"

SS
На сайте с 03.09.2004
Offline
141
#3

chudinov, Ваш сайт известен Яндексу как rabota.ru, без www, а www.rabota.ru - его зеркало. В алгоритме скрипта добавления страницы на индексацию add.xml сначала идет проверка на то, является ли добавляемый сайт зеркалом какого-то другого (дабы сразу отследить добавление дубля), а только потом проверки на запреты в роботс.тхт.

Собственно говоря, имхо все отработало корректно.

«Клянусь своей жизнью и любовью к ней, что никогда не буду жить ради другого человека и никогда не попрошу и не заставлю другого человека жить ради меня» (с) Джон Галт
chudinov
На сайте с 28.10.2005
Offline
101
#4
Seventh Son:
Собственно говоря, все отработало корректно.

а разумно ли посылать 3 роботов для корректности, когда можно один раз по результату поста addurl ответить, мол 5хх ошибка - свободен...

p.s. один робот, а не три

SS
На сайте с 03.09.2004
Offline
141
#5
chudinov:
а разумно ли посылать 3 роботов для корректности, когда можно один раз по результату поста addurl ответить, мол 5хх ошибка - свободен...
p.s. один робот, а не три

Я не в курсе, приходит ли робот на сайт, если ему скармливают явное зеркало (http://www.rabota.ru/pix/). Имхо нет, так как это было бы нелогично, хотя надо проверить по логам. После второго добавления (http://rabota.ru/pix/) пришел робот с буквой D, который всегда приходит на сайт, если вы что-то скармливаете в аддурл. Он запросил robots.txt и только потом сказал:

Адрес rabota.ru/pix/ не был внесен в базу Яндекса, так как он запрещен к индексации в файле robots.txt, или при обращении к robots.txt сервер вернул ошибку 5xx

А визит индексатора (I) навряд ли связан с этими событиями. Скорее всего это совпадение, что именно в это время у индексатора в расписании была индексация Вашего сайта.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий