robots.txt что прописать чтобы разрешал sape.ru

12
Z
На сайте с 23.05.2007
Offline
69
#11
neznaika:
Ziby, я бы не стал ТАК делать, не вижу необходимости, а проблем огрести как пару пальцев...

Я бы тоже не стал, поэтому мы с Вами не LuCkyManы. :) Но это уже другой вопрос.

neznaika:
Хотя в вашей квалификации не сомневаюсь.

Спасибо. ;) Не, на самом деле, robots.txt, оформленный таким образом, поставленную задачу выполняет (на грани правда, но всё же).

Shortlist
На сайте с 03.02.2008
Offline
162
#12

LuCkyMan, robots.txt Вам в помощь

BJ
На сайте с 28.11.2008
Offline
85
#13

LuCkyMan, вот пара советов по оптимизации нагрузок краулеров:

Можно снизить нагрузку гуглобота установив интервал запросов в панельке вебмастера.

Так же в сети есть список "мусорных" для ru ресурса юзер агентов, которым можно запретить поиск, поищи сам (я не в состоянии просто сейчас:)).

Возможно этих мер будет достаточно.

давлю адвордс
S
На сайте с 28.10.2005
Offline
319
#14
neznaika:
Ziby, я бы не стал ТАК делать, не вижу необходимости, а проблем огрести как пару пальцев... Хотя в вашей квалификации не сомневаюсь.

Почему проблем? Роботс по стандартам сделан

Z
На сайте с 23.05.2007
Offline
69
#15
semenov:
Роботс по стандартам сделан

Да не совсем по «стандартам». Взять хотя бы директиву «Crawl-delay»:

Яндекс.Вебмастер:
В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву "Crawl-delay" необходимо добавлять в группе, начинающейся с записи "User-Agent", непосредственно после директив "Disallow" ("Allow").

И кроме неё есть ещё отклонения от «стандартов». ;) Например, Гугл «Crawl-delay» не поддерживает. Да, она игнорируется при обработке, но кто знает как поведёт себя робот в случае чего.

S
На сайте с 28.10.2005
Offline
319
#16

Я про секцию


User-agent: *
Disallow: /

некоторых напугавшей ($

Z
На сайте с 23.05.2007
Offline
69
#17

semenov, а, ну с этим всё ок. :)

Просто нужно помнить, что директивы в robots.txt не наследуются (согласно стандарту). Тобишь, запрет, объявленный для произвольных роботов, не является действующим для робота, которому объявлена персональная инструкция.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий