Как запретить индексацию baidu.com?

T

44

tiras

4 мая 2009, 09:06

4479

Как запретить индексацию ботами baidu.com?

Отдам фарма домен в хорошие руки БЕСПЛАТНО! (http://clck.ru/3nqR)

205

Цахес

4 мая 2009, 17:49

#1

User-Agent: Baiduspider

Disallow: /

- Хорошие и плохие тексты для ваших сайтов (http://www.textsale.ru/team57397.html). - Удаленная работа. Вакансия копирайтера/рерайтера. (http://advego.ru/6myq8sgvKk) - Быстрое составление семантического ядра (https://topvisor.ru/?inv=39380).

MP

12

MR_PR

4 мая 2009, 19:13

#2

tiras:
Как запретить индексацию ботами baidu.com?

в robots.txt прописать строчку:

User-Agent: Baiduspider

Disallow: /

205

Цахес

4 мая 2009, 19:21

#3

MR_PR, что именно я написал не правильно?

T

44

tiras

4 мая 2009, 19:45

#4

Пробовал пропичывать в роботсе , не помогает! Поэтому и задаю вопрос

205

Цахес

5 мая 2009, 03:38

#5

tiras:
Пробовал пропичывать в роботсе , не помогает!

Значит роботс некорректно составлен.

Робот Байду поддерживает стандарт описания robots.txt, в принципе как и все остальные приличные роботы - http://www.baidu.com/search/robots.html

1040

Евген

5 мая 2009, 04:45

#6

Цахес:
http://www.baidu.com/search/robots.html

во чего вычитал :)

User-agent:

　　该项的值用于描述搜索引擎robot的名字。在"robots.txt"文件中，如果有多条User-agent记录说明有多个robot会受到"robots.txt"的限制，对该文件来说，至少要有一条User-agent记录。如果该项的值设为*，则对任何robot均有效，在"robots.txt"文件中，"User-agent:*"这样的记录只能有一条。如果在"robots.txt"文件中，加入"User- agent:SomeBot"和若干Disallow、Allow行，那么名为"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。

Арбитражишь? подними РОИ на 10-20% - бонусы на пополнение рекламных сетей (тм, мт, твк, твс) (https://eprofit.me/ru/partner?olymp)

F

70

fed

5 мая 2009, 04:51

#7

Попробуйте прописать в .htaccess

RewriteEngine On

RewriteCond %{REQUEST_URI} !^/403.php$

RewriteCond %{HTTP_USER_AGENT} .*Baiduspider.* [OR]

RewriteCond %{HTTP_USER_AGENT} .*Yeti.*

RewriteRule .* /403.php [F]

Только вот не факт, что поможет.

Я пытаюсь запретить доступ для Slurp и msnbot (грузят сервер), запрет в robots.txt, бан по айпи и как указал выше не помогает.

Может кто подскажет что еще можно сделать чтобы их успокоить.

Резкий всплеск прямых заходов. Настройка .htaccess. 301-редирект одной Подскажите как сделать редирект

T

44

tiras

5 мая 2009, 06:38

#8

fed:
Попробуйте прописать в .htaccess

RewriteEngine On
RewriteCond %{REQUEST_URI} !^/403.php$
RewriteCond %{HTTP_USER_AGENT} .*Baiduspider.* [OR]
RewriteCond %{HTTP_USER_AGENT} .*Yeti.*
RewriteRule .* /403.php [F]

Только вот не факт, что поможет.

Я пытаюсь запретить доступ для Slurp и msnbot (грузят сервер), запрет в robots.txt, бан по айпи и как указал выше не помогает.
Может кто подскажет что еще можно сделать чтобы их успокоить.

Мне посоветовали так прописать в htaccess:

SetEnvIfNoCase User-Agent "^Baiduspider" search_bot

SetEnvIfNoCase User-Agent "^BaiduImagespider" search_bot

Order Allow,Deny

Allow from all

Deny from env=search_bot

</Limit>

Вроде перестал ходить засра...ец:)

205

Цахес

5 мая 2009, 09:39

#9

fed:
Я пытаюсь запретить доступ для Slurp и msnbot (грузят сервер), запрет в robots.txt, бан по айпи и как указал выше не помогает.
Может кто подскажет что еще можно сделать чтобы их успокоить.

Директиву Crawl-delay юзайте. Она-то как раз и призвана усмирять чересчур активных роботов.

F

70

fed

5 мая 2009, 09:52

#10

Crawl-delay раньше помогала, сейчас не работает.

Мне проблемы создает юзер-агент такого вида:

Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)

При запрете:

SetEnvIfNoCase User-Agent "^Slurp" search_bot

Бот продолжает бомбить сервер.

П.С. кстати может кому понадобиться, проверка доступа юзер-агентов:

http://www.botsvsbrowsers.com/SimulateUserAgent.asp

Что делать, если ваша email-рассылка попала в спам

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах