Почему Yandex игнорирует robots.txt?

123
Z
На сайте с 28.10.2004
Offline
50
#11

Miha, а что означает "проверять через strstr"?

я пока не очень большой спец в программинге...

wolf
На сайте с 13.03.2001
Offline
1183
#12
При том, что эта начальная строка указывает Яндексу конкретный файл.

При чем здесь конкретный файл?


Disallow
The value of this field specifies a partial URL that is not to be visited. This can be a full path, or a partial path; any URL that starts with this value will not be retrieved

http://www.robotstxt.org/wc/norobots.html

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
-=Илья=-
На сайте с 05.12.2003
Offline
222
#13

wolf, описание robots.txt, каким он должен быть, и как его проверяет Яндекс - разные вещи.

wolf
На сайте с 13.03.2001
Offline
1183
#14
wolf, описание robots.txt, каким он должен быть, и как его проверяет Яндекс - разные вещи.

Ок, в таком случае, покажите мне, где написано то, "как его проверяет Яндекс". :)

А если серьезно, то любой вежливый робот (а, надеюсь, хотя бы своего индексирующего робота "I" яндексоиды считают таки роботом, причем, вежливым :)) обязан соблюдать протокол файла robots.txt

C
На сайте с 19.09.2001
Offline
120
#15
А если серьезно, то любой вежливый робот (а, надеюсь, хотя бы своего индексирующего робота "I" яндексоиды считают таки роботом, причем, вежливым) обязан соблюдать протокол файла robots.txt

К сожалению не обязан :(

Из того же документа:

It is not an official standard backed by a standards body, or owned by any commercial organisation. It is not enforced by anybody, and there no guarantee that all current and future robots will use it. Consider it a common facility the majority of robot authors offer the WWW community to protect WWW server against unwanted accesses by their robots.

Т.е. данный стандарт фактически является рекомендациями. Вот вежливый робот должен этот стандарт соблюдать, а вебмастер вправе отправить робота, игнорирующего стандарт, подальше...

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
wolf
На сайте с 13.03.2001
Offline
1183
#16
Вот вежливый робот должен этот стандарт соблюдать

Я же про вежливых роботов и говорил. Или для Вас слова "обязан" и "должен" - разные по смыслу?

C
На сайте с 19.09.2001
Offline
120
#17
Или для Вас слова "обязан" и "должен" - разные по смыслу?

Нет, не разные.

А где сотрудники Яндекса утверждали, что их робот вежливый?

Вот фразу "если вам не нравится, можете нашего робота на сайт не пускать" я где-то точно слышал или читал.

wolf
На сайте с 13.03.2001
Offline
1183
#18
А где сотрудники Яндекса утверждали, что их робот вежливый?

Они не утверждали и обратного (по крайней мере, про индексирующего робота). А те модификации, которые не соблюдали robots.txt ("D", "H") они величали не роботами, а агентами. :)

-=Илья=-
На сайте с 05.12.2003
Offline
222
#19

wolf,

Идём сюда:

Особо отмечаем строчку "Disallow: /report.php"

Затем сюда:

http://webmaster.yandex.ru/

И добавляем туда вот это:

Надеюсь, вопрос с вежливыми роботами на этом и исчерпается.

C
На сайте с 19.09.2001
Offline
120
#20

Нашел как раз ту тему, аккурат три года назад было 🚬

Этот вопрос уже жеван-пережеван, да и яндексоиды сейчас в дискуссии не ввязываются, как раньше.

Так что прошу меня извинить, если написал что-то не то, продолжать "наезжать" на Яндекс не хочется.

P.S. А D, кстати, robots.txt сейчас запрашивает, насчет соблюдает ли -- не проверял 🙄

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий