Ограничить количество одновременно забираемых страниц

P
На сайте с 14.03.2003
Offline
150
637

Когда-то на этом форуме читал, как с помощью robots.txt ограничить количество одновременно забираемых Яндексом страниц с сайта, но сейчас не могу найти. Подскажите, пожалуйста.

Что сделать с доменом pr5, тиц 90, english site. предложения в личку. Беки: 4 .edu, worldbank.org, bbc.co.uk, www.un.int (www.un.int), washingtonpost.com
Avatar
На сайте с 18.05.2003
Offline
168
#1

Вообще то по моему это делается с помощью .htaccess. Роботс.тхт тут ни при чем.

Но по моему ограничивать поисковику лимит забираемых страниц не самое правильное решение. Тут люди "молятся" и "шаманят", чтоб он только почаще заходил ;)

UltraBait
На сайте с 10.05.2005
Offline
220
#2

Поставь лимит на кол-во подключений с опеределенного ип.

P
На сайте с 14.03.2003
Offline
150
#3
Avatar:
Вообще то по моему это делается с помощью .htaccess. Роботс.тхт тут ни при чем.
Но по моему ограничивать поисковику лимит забираемых страниц не самое правильное решение. Тут люди "молятся" и "шаманят", чтоб он только почаще заходил ;)

С помощью .htaccess можно целиком закрыть доступ к сайту\файлам. Я же хочу уменьшить количество нагрузки, создаваемой ботами Яндекса на форум.

На сервере много чего еще крутится и я готов пожертвовать некой частью пользователей, приходящих с Яндекса.

Но, здесь где-то был совет не как целиком запретить индексацию, а как бы "растянуть" ее по времени.

P
На сайте с 14.03.2003
Offline
150
#4
UltraBait:
Поставь лимит на кол-во подключений с опеределенного ип.

И отлавливать все ip Яндекса?

Piligrim
На сайте с 10.04.2005
Offline
145
#5

а crawl-delay только для Yahoo работает?

Директив (http://directiv.ru) - поисковый маркетинг Адвербо (http://adverbo.ru) - продвижение с ежедневными списаниями за топ или трафик
Коля Дубр
На сайте с 02.03.2005
Offline
153
#6

В теории, можно настроить If-modified-since для динамики, тогда робот не будет индексировать одно и то же по восемь раз, а будет брать только HEAD для старых документов. На практике не сталкивался с такой задачей. Ну, еще сессии правильно настроить. Короче, убрать из индексации то, что не надо индексировать. Ограничение по IP кажется мне довольно ненадежным и кривоватым решением.

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий