Гугл и другие поисковики валят сервак. Как ограничить доступ чтоп они не обиделись?

D
На сайте с 21.10.2005
Offline
15
1573

сабж. :rolleyes:

Беру заказы на разработку/модификацию программного обеспечения (Web, Win). Отзывы здесь (http://weblancer.net/users/majestic/reviews/). DVZ aka Majestic (http://majestic.ws/). ICQ: 124-247-583.
human
На сайте с 05.02.2004
Offline
78
#1

У Yahoo для robots.txt есть дополнительная инструкция Crawl-delay. Подробнее тут:

/ru/forum/23973

Как с остальными поисковиками - не знаю. Может кто ещё подскажет? Яндекс, например, советует запретить его в robots.txt в подобных случаях :)

http://webmaster.yandex.ru/faq.xml?id=502499#overload

Если же отвлечься от robots.txt и meta-тэгов, то можно после определенного количества запросов подряд выдавать на "If-Modified-Since" - код 304 без загрузки содержимого. Однако, это будет уже явно манипулированием выдачи для роботов. Могут быть неприятные последствия в виде объяснений с модераторами и возвращения в индекс сайта.

Normy:
В robots.txt пропиши:

User-agent: *
Crawl-delay: 30



30 - секунды между заходом одного и того-же бота. Можно менять как угодно.

Google и Яндекс - не знают такого.

Yahoo и MSN - знают.

С уважением, Кучеров Дмитрий SEO complex — комплексный подход к продвижению (http://seo-complex.ru/) моб. тел.: +7 (495) 506-80-90
Andreyka
На сайте с 19.02.2005
Offline
822
#2

Если сервер свой - лимит на коннекты с одного IP

Не стоит плодить сущности без необходимости
A
На сайте с 12.05.2004
Offline
176
#3

Может проблема не в гугле, а в хостинге или в кривых руках админа?

human
На сайте с 05.02.2004
Offline
78
#4
alexseo:
Может проблема не в гугле, а в хостинге или в кривых руках админа?

А возможно скрипты на сайте требуют оптимизации производительности.

D
На сайте с 21.10.2005
Offline
15
#5
Normy:
User-agent: *
Crawl-delay: 30

спасибо. хоть двоих успокою, надеюсь, они меня не "разлюбят" )

Andreyka:
Если сервер свой - лимит на коннекты с одного IP

точно обидяца )

alexseo:
Может проблема не в гугле, а в хостинге или в кривых руках админа?

тут сложно что-то утверждать ) проблема не постоянная, а именно периодами. причем независимо от того сколько пользователей на серваке. в "кто в онлайн" боты поисковиков постоянно 1-3, за сутки 10-12 из тех что определяет ). хочтер валит все на ботов. изучил логи апача - действительно иногда по многу запросов с периодичностью 1-5 сек. особенно гугл. вот и думаю как их угомонить и остаться в "теплых чувствах".

РожденныйОсенью
На сайте с 05.01.2006
Offline
77
#6
Andreyka:
Если сервер свой - лимит на коннекты с одного IP

Вместе с этим прибьете большую часть пользователей, работающих через шлюз.

denm:
тут сложно что-то утверждать ) проблема не постоянная, а именно периодами. причем независимо от того сколько пользователей на серваке. в "кто в онлайн" боты поисковиков постоянно 1-3, за сутки 10-12 из тех что определяет ). хочтер валит все на ботов. изучил логи апача - действительно иногда по многу запросов с периодичностью 1-5 сек. особенно гугл. вот и думаю как их угомонить и остаться в "теплых чувствах".

На 100% уверены, что IP именно поисковиков, а не подставные? Может DDOS?

Проблемы зоны РФ (http://www.yaoptimizator.ru/2008/09/06/kirillicheskie-domeny/) Как заставить пользователей подписываться на RSS? (http://www.yaoptimizator.ru/2008/10/22/istoriya-sozdaniya-rss-kartinki/)
D
На сайте с 21.10.2005
Offline
15
#7
РожденныйОсенью:
На 100% уверены, что IP именно поисковиков, а не подставные? Может DDOS?

собрал все айпишники с того же лога за полдня... получилось около 60 уникальных. ткнул штук 10 наугад во вхуис - все поисковиков.

[Удален]
#8

Если женщина, пардон, поисковик к Вам постоянно пристаёт - Вы ЕЁ, sorry, ЕГО не удовлетворили до конца. Посмотрите, может Вы не корректно отдаёте нужные заголовки и/или саму страницу (например на http://webcode.ru/use/header/ ). Может у Вас получается "циклический" Редирект?

I
На сайте с 22.10.2005
Offline
58
Iso
#9
denm:
действительно иногда по многу запросов с периодичностью 1-5 сек. особенно гугл. вот и думаю как их угомонить и остаться в "теплых чувствах".

Я правильно понял, что перерыв между запросами 1-5 секунд?

Хотелось бы услышать реальную нагрузку. Грубо говоря, сколько строк в час (в минуту) пишется в лог при таких "атаках" поисковиков?

Сейчас роботы довольно-таки смышлёные, поэтому трудно их упрекнуть в склонности "валить" сайты... Давно уже не видел такого.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий