боты поисковых систем

G9
На сайте с 06.10.2007
Offline
48
3627

Наверняка тема боян, но погуглив мало чего нашел толкового, все темы как то разрознены. И так задача:

в борьбе с ддосами и так далее часто применяют правило ограничений доступа с одного айпи и естественно отсекаются так же и боты поисковиков. Значит нужен вайт лист со списком поисковых систем.

1)Яндекс вроде более менее понятно, идем сюда http://www.db.ripe.net/whois?form_type=advanced&full_query_string=&searchtext=YANDEX-MNT&do_search=Search&inverse_attributes=mnt-by&ip_search_lvl=Default%2528nearest+match%2529&alt_database=ALL&object_type=inetnum

и все диапозоны в вайт - если я не прав поправьте.

2) Нужно аналогично для Google Ramblera Mail и Aporta что там из полезно еще ? Qip

как правильно в рипе запрос сделать для них ?

3) как это правильно в ipfw (для Freebsd) и в iptables (опционально для linux) прописать

Просьба свои айпи не приводить, все равно не поверю - нужен надежный источник.

К манам просьба тоже не посылать, уважаю доки но хочу здесь ман под конкретную задачу собрать.

Профи велком.

iHead
На сайте с 25.04.2008
Offline
137
#1

Примерно так:

07000 allow tcp from table(0) to me dst-port 80

07001 deny ip from table(1) to me

(если из командной строки, то завернуть table(N) в кавычки "table(N)")

затем добавляем белые сети (поисковиков)

ipfw table 0 add сеть1

ipfw table 0 add сеть2

...

ipfw table 0 add сетьN

и черные сети (ддосеров собираем из логов)

ipfw table 1 add ip1

ipfw table 1 add ip2

...

ipfw table 1 add ipN

Осталось найти сети поисковиков :)

Рекомендуемый хостинг партнер 1С-Битрикс (https://www.ihead.ru/bitrix/), PHP-хостинг (https://www.ihead.ru/php/), доверенный партнер RU-CENTER (https://www.ihead.ru/news/573.html), официальный представитель REG.RU в Кирове (https://www.ihead.ru/news/851.html)
G9
На сайте с 06.10.2007
Offline
48
#2
iHead:

Осталось найти сети поисковиков :)

ну собственно это и есть основной вопрос :)

Andreyka
На сайте с 19.02.2005
Offline
822
#3

Нормальная практика - отдать боту 503. Он зайдет позже.

Ненормальная - ограничивать его по IP.

Не стоит плодить сущности без необходимости
G9
На сайте с 06.10.2007
Offline
48
#4
Andreyka:
Нормальная практика - отдать боту 503. Он зайдет позже.
Ненормальная - ограничивать его по IP.

Я разве говорил что ботов поисковых систем нужно ограничивать ? нет я как раз о том чтобы их в белый лист добавить !

кстати это ваше попозже может месяцами длится ...

лучше уж Crawl-delay использовать http://help.yandex.ru/webmaster/?id=996567

ENELIS
На сайте с 29.08.2008
Offline
194
#5

1397 ip есть список. Можем продать.

С Уважением, ServerAstra.ru (https://serverastra.com) - VPS и выделенные сервера в Будапеште по выгодным ценам!
G9
На сайте с 06.10.2007
Offline
48
#6
ENELIS:
1397 ip есть список. Можем продать.

говорю же надежные источники нужны, а то вместе с поисковыми ботами можно еще и трипер зароботать ... Из разряда - могу посоветовать что использовать в качестве root пароля ;)

Вообще это что сверхсикретная информация ?

Andreyka
На сайте с 19.02.2005
Offline
822
#7
Guru911:

кстати это ваше попозже может месяцами длится ...

Для говносайтов - да

iHead
На сайте с 25.04.2008
Offline
137
#8

щас нормальный народ подтянется, может и поделится.

я на днях таким же вопросом задавался.

список сетей можно получить по номерам AS.

как вариант брать логи посещаемого сайта или сайтов (желательно за несеолько дней), получать уникальные IP-адреса и делать обратный резолвинг, далее по вхождению домена решать какие адреса (сети) им принадлежат.

G9
На сайте с 06.10.2007
Offline
48
#9

такое впечатление что никто не в курсе что вообще есть поисковые боты :)

мы на форуме о поисковых системах, а никто не в курсе что это такое ?

DV
На сайте с 01.05.2010
Offline
644
#10
Guru911:
лучше уж Crawl-delay использовать http://help.yandex.ru/webmaster/?id=996567

который кроме Яндекса и пары-тройки других никто не понимает.

MajesticSeo так вообще будет долбить до посинения, и даже персональные просьбы в их поддержку не помогут. Только в бан по IP, которых очень много.

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий