robots.txt что прописать чтобы разрешал sape.ru

LuCkyMan · 2009-03-29T05:35:47.0000000Z

доброго времени суток. Я довольно долго привышал лимиты Cpu хостинга, переезжать не имеет смысла так как привышаю не много( не более 0.10%) есть помощь чтобы уменьшить этот показатель, сделать robots.txt дабы приструнить бродящих роботов. User-agent: * Disallow: / User-agent: Yandex Crawl-delay: 4 Disallow: User-agent: Googlebot Crawl-delay: 4 Disallow: User-agent: StackRambler Crawl-delay: 4 Disallow: но здесь запрещается нормальной работы sape.ru что прописать нужно чтобы заработало? движок у меня wordpress

Z

69

Ziby

29 марта 2009, 14:04

#11

neznaika:
Ziby, я бы не стал ТАК делать, не вижу необходимости, а проблем огрести как пару пальцев...

Я бы тоже не стал, поэтому мы с Вами не LuCkyManы. :) Но это уже другой вопрос.

neznaika:
Хотя в вашей квалификации не сомневаюсь.

Спасибо. ;) Не, на самом деле, robots.txt, оформленный таким образом, поставленную задачу выполняет (на грани правда, но всё же).

162

Shortlist

31 марта 2009, 21:04

#12

LuCkyMan, robots.txt Вам в помощь

BJ

85

bond.jamesbond

31 марта 2009, 21:22

#13

LuCkyMan, вот пара советов по оптимизации нагрузок краулеров:

Можно снизить нагрузку гуглобота установив интервал запросов в панельке вебмастера.

Так же в сети есть список "мусорных" для ru ресурса юзер агентов, которым можно запретить поиск, поищи сам (я не в состоянии просто сейчас:)).

Возможно этих мер будет достаточно.

давлю адвордс

S

320

semenov

2 апреля 2009, 03:02

#14

neznaika:
Ziby, я бы не стал ТАК делать, не вижу необходимости, а проблем огрести как пару пальцев... Хотя в вашей квалификации не сомневаюсь.

Почему проблем? Роботс по стандартам сделан

Z

69

Ziby

2 апреля 2009, 06:02

#15

semenov:
Роботс по стандартам сделан

Да не совсем по «стандартам». Взять хотя бы директиву «Crawl-delay»:

Яндекс.Вебмастер:
В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву "Crawl-delay" необходимо добавлять в группе, начинающейся с записи "User-Agent", непосредственно после директив "Disallow" ("Allow").

И кроме неё есть ещё отклонения от «стандартов». ;) Например, Гугл «Crawl-delay» не поддерживает. Да, она игнорируется при обработке, но кто знает как поведёт себя робот в случае чего.

S

320

semenov

2 апреля 2009, 06:51

#16

Я про секцию

User-agent: *
Disallow: /

некоторых напугавшей ($

Z

69

Ziby

2 апреля 2009, 08:07

#17

semenov, а, ну с этим всё ок. :)

Просто нужно помнить, что директивы в robots.txt не наследуются (согласно стандарту). Тобишь, запрет, объявленный для произвольных роботов, не является действующим для робота, которому объявлена персональная инструкция.

Что такое Power BI и зачем это нужно бизнесу

Google: E-E-A-T не является фактором ранжирования