запрет в htaccess от яндекс-бота

V
На сайте с 25.01.2015
Offline
25
3098

Подскажите, пожалуйста, как можно реализовать следующее.

Для скачивания файла с сайта я использую перенаправление в виде ссылки

http://mysite.ru/redirect?url=http://mysite.ru/files/file.zip

в результате чего человек попадает на страницу где уже скачивается нужный файл.

(в адресной строке урл - "http://mysite.ru/redirect?url=http://mysite.ru/files/file.zip")

Так вот, как запретить яндекс-боту доступ к подобным страницам?

J
На сайте с 20.02.2014
Offline
120
jkm
#1

Проверять User-Agent


RewriteCond %{HTTP_USER_AGENT} Yandex
RewriteRule ^redirect - [L,F]

Ставить в самое начало файла сразу после RewriteEngine On

V
На сайте с 25.01.2015
Offline
25
#2
Проверять User-Agent
Код:

RewriteCond %{HTTP_USER_AGENT} Yandex
RewriteRule ^redirect - [L,F]

Ставить в самое начало файла сразу после RewriteEngine On

Спасибо, а можно как-то проверить, что оно сработало?

DV
На сайте с 01.05.2010
Offline
644
#3

Поставьте в Firefox User Agent Switcher и прикиньтесь Яндексом.

Кстати, затея полезная, тоже займусь.

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
J
На сайте с 20.02.2014
Offline
120
jkm
#4

По запросу проверка заголовков http находится полно онлайн сервисов, например http://www.bertal.ru/

iHead
На сайте с 25.04.2008
Offline
137
#5

robots.txt нынче не в моде?

Рекомендуемый хостинг партнер 1С-Битрикс (https://www.ihead.ru/bitrix/), PHP-хостинг (https://www.ihead.ru/php/), доверенный партнер RU-CENTER (https://www.ihead.ru/news/573.html), официальный представитель REG.RU в Кирове (https://www.ihead.ru/news/851.html)
[umka]
На сайте с 25.05.2008
Offline
456
#6

Это же раздел "Администрирование серверов".

Тоже самое, что если вы придёте к хирургу с тонзилитом, он сразу предложит вам выдрать гланды :)

Более мягкое лечение предложат в "Веб-строительстве".

Лог в помощь!
V
На сайте с 25.01.2015
Offline
25
#7
iHead:
robots.txt нынче не в моде?

robots.txt это рекомендация для поисковика, физически ему ничто не мешает полезть туда, куда его не просят.

DV
На сайте с 01.05.2010
Offline
644
#8

Единственная дилемма — сохранение баланса между секъюрностью и риском заработать фильтр за клоакинг.

[umka]
На сайте с 25.05.2008
Offline
456
#9
DenisVS:
риском заработать фильтр за клоакинг.

А какие могут быть обиды, если в robots.txt для яндекса явно указано, что "туда нельзя".

В .htaccess — это так, на всякий случай, если вдруг всё-таки ткнётся, то убедится, что действительно нельзя :)

LM
На сайте с 18.10.2009
Offline
117
#10
vpartem:
robots.txt это рекомендация для поисковика, физически ему ничто не мешает полезть туда, куда его не просят.

Смотрим логи. В первую очередь Яндекс скачивает с сайта robots.txt. Туда, на что стоит запрет, робот не лезет.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий