как запретить индексацию через .htaccess

12
S8
На сайте с 11.07.2006
Offline
86
3444

Подскажите что надо прописать в .htaccess чтоб запретить индексацию файлов с расширением txt всем поисковикам.

Samail
На сайте с 10.05.2007
Offline
362
#1
sidor80:
прописать в .htaccess чтоб запретить индексацию

Может быть имелось ввиду «в robots.txt»?

user-agent: *

disallow: /*.txt$

S8
На сайте с 11.07.2006
Offline
86
#2

Имено хочу через .htaccess

K
На сайте с 31.01.2001
Offline
737
#3
Samail:
user-agent: *
disallow: /*.txt$

И кто же у нас понимает * и $ ? Яндекс? Рамблер?

sidor80:
Имено хочу через .htaccess

О, мсье знает толк в извращениях ! ;)

Наверное надо отдавать код 404 на все запросы.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
S8
На сайте с 11.07.2006
Offline
86
#4
Kost:
И кто же у нас понимает * и $ ? Яндекс? Рамблер?

О, мсье знает толк в извращениях ! ;)
Наверное надо отдавать код 404 на все запросы.

Только ботам

d1ma
На сайте с 18.03.2007
Offline
102
#5

.htaccess


RewriteCond %{HTTP_USER_AGENT} ^.*crawler*$ [NC]
RewriteRule ^(.*).txt$ - [F,L]

Если надо другие поисковые системы которые не указывает Crawler в User Agent то допиши До их список:


RewriteCond %{HTTP_USER_AGENT} ^ia_archiver$ [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^.*yandex*$ [NC,OR]
RewriteCond %{HTTP_USER_AGENT} ^.*google*$ [NC,OR]
...

Если какие то поисковики маскируют User Agent можно добавлять их диапазоны, 100% результат не достич но все основные поисковики можно так отфильтровать

S8
На сайте с 11.07.2006
Offline
86
#6

чтоб как можно больше отфильтровать поисковиков надо в .htaccess прописать

RewriteCond %{HTTP_USER_AGENT} ^ia_archiver$ [NC,OR]

RewriteCond %{HTTP_USER_AGENT} ^.*yandex*$ [NC,OR]

RewriteCond %{HTTP_USER_AGENT} ^.*google*$ [NC,OR]

RewriteCond %{HTTP_USER_AGENT} ^.*Rambler.* [NC,OR]

RewriteCond %{HTTP_USER_AGENT} ^.*Aport.* [NC,OR]

RewriteCond %{HTTP_USER_AGENT} ^.*crawler*$ [NC]

RewriteRule ^(.*).txt$ - [F,L]

правильно?

А yandex и google указывают Crawler?

progress
На сайте с 11.07.2006
Offline
125
#7

А с чего Вы решили, что Вас вообще будет ктото индексировать? Ни одной внешней ссылки на вас - и не нужно никаких извращений

А вообще - просто отдавайте статусом ответа 404, ie и firefox всеравно отобразят вашу страницу с контентом как 404 страницу, про остальных не скажу - не проверял, может и свою дефолтную покажут какую, хотя врядли, а боты естественно уйдут

Reservist
На сайте с 21.07.2005
Offline
86
#8

а чем отличается запись

RewriteCond %{HTTP_USER_AGENT} ^googlebot.* [NC,OR]

от

RewriteCond %{HTTP_USER_AGENT} ^.*google*$ [NC,OR]
Yandex - найдется всё! Google™ - а ничего и не терялось!
K
На сайте с 31.01.2001
Offline
737
#9

В первой строка начинается с google.

Во второй строка содержит googlebot.

Reservist
На сайте с 21.07.2005
Offline
86
#10

а такая

RewriteCond %{HTTP_USER_AGENT} ^google [NC,OR]

Т.е. какая из этих строк

RewriteCond %{HTTP_USER_AGENT} ^google [NC,OR]

RewriteCond %{HTTP_USER_AGENT} ^.*google*$ [NC,OR]

RewriteCond %{HTTP_USER_AGENT} ^googlebot.* [NC,OR]

указывает правило "для всех строк, в котором есть слово google"

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий