Редактирование .htaccess

12
D
На сайте с 03.03.2006
Offline
123
#11

Azazelkin, ну это понятно, я про то, КАК хтаксес обрабатывает это.

Если юзер-агент будет "A-BOT" и мы его пропишем, то доступ ему будет закрыт.

А если придёт "А-BOTS" , пустит ли его твой пример, вот в чём вопрос.

lap09
На сайте с 17.12.2007
Offline
192
#12
Azazelkin:
Эх... горе с вами :)
Отпишитесь, помогло или нет)) самому интересно :D

Отпишусь. Экспериментировать завтра буду, если эти хмыри опять начнут злобствовать.

Спасибо. :)

Azazelkin
На сайте с 13.06.2010
Offline
101
#13
Dzen:
Azazelkin, ну это понятно, я про то, КАК хтаксес обрабатывает это.
Если юзер-агент будет "A-BOT" и мы его пропишем, то доступ ему будет закрыт.
А если придёт "А-BOTS" , пустит ли его твой пример, вот в чём вопрос.

Конечно пропустит. Соответствие юзер_агента должно быть 100%.

Если вы вместо index.php пропишите indexx.php, то при обращении к index.php будет отдаваться indexx.php? :D

подпезь
D
На сайте с 03.03.2006
Offline
123
#14

Azazelkin, index.php прописывается не командой SetEnvIfNoCase, поэтому вопроса такого не возникает.

Не просто так я привёл пример с preg_match.

Azazelkin
На сайте с 13.06.2010
Offline
101
#15

Dzen, непонимаю, при чём тут соответствия?

Задача .htaccess не искать какие-то соответствия (это не скрипт), а выполнять определённые правила, которые в нём прописаны.

Azazelkin добавил 20.07.2011 в 22:17

Кстати, вот ещё одно решение (взято отсюда)

Блокирование роботов

Описание:

Как мы можем заблокировать действительно надоедливых роботов на получение страниц из специфических областей сайта? Файла /robots.txt содержащего записи «Robot Exclusion Protocol» обычно недостаточно для избавления от такого робота.

Решение:

Мы используем набор правил запрещающие доступ для роботов к URL из веб-пространства /~quux/foo/arc/ (возможно это пространство имеет очень глубокую иерархию каталогов, обход которой роботом, привел бы к очень большой нагрузке на сервер). Мы должны убедиться что запрещается доступ только для конкретного робота, т.е. просто запрет для хоста с которого работает робот недостаточен. Это, также блокировало бы доступ пользователей с этого хоста. Этого эффекта мы добьемся проверяя также информацию из HTTP заголовока User-Agent.

RewriteCond %{HTTP_USER_AGENT} ^NameOfBadRobot.*
RewriteCond %{REMOTE_ADDR} ^123\.45\.67\.[8-9]$
RewriteRule ^/~quux/foo/arc/.+ - [F]
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий