/usr/bin/perl - не папка, а программа.
Т.е. это - та программа, которая будет исполнять этот перл скрипт.
Соответственно, сам .pl файл можем класть куда угодно.
И это можно. Данный код вызовет index.pl, если обратятся к index.html:
RewriteRule ^index\.html$ "/htdocx/index.pl" [L]
А уж index.pl разберётся какой ip, кому что показывать.
Я согласен, что решение с RewriteCond %{REMOTE_ADDR} ^205\.204\.167\.190$ более изящное и наглядное.
да, только лучше в названии без русских букв.
Нет! В начале файла (первой строкой) пишите "#!/usr/bin/perl -w".
А сам файл кладёте в /htdocs
И ещё надо сделать, чтобы этот файл всегда вызывался, когда обращаются по любому адресу на Вашем сайте. Например, так:
добавтье в файл .htaccess следующие две строки
RewriteEngine on
RewriteRule !\.(gif|jpg|png|css|txt|ico)$ "/htdocx/index.pl" [L]
(где index.pl - имя Вашего скрипта)
Всегда пожалуйста!
Я потому и прошу конкретезировать, что хочу понять, что Вам не понятно :)
Полагаю, что если Вы раньше не работали с перлом, а использовали только пхп, то лучше на нём делать (программа эта на пхп переводится быстро, надо?). Если же Вам так актуально сделать именно на перле, но Вы не знаете что и куда, то пните на эту тему хостера - может он подскажет где надо перл-скрипты у него размещать (всё от хостера зависит, хотя, у них всё весьма одинакого).
Почти ничего. Надо заменить блок "print < Наши пришли! OURPAGE" на вывод Вашего файл для "нормальных", а "print < Уйди, прааативный ALIENPAGE" - выводом файла для "чужих".
Вполне нормальный скрипт, отделяющий "чужих" по ip. Всё зависит от целей, для которых он будет использоваться. Например, если набор "плохих" ip-адресов планируется часто менять, то удобно вынести его в отдельный файл. Если же набор стабилен, то и так нормально. Короче, всё правильно.
В чём вопрос? Это у Вас, как я вижу, скрипт на перле. Если у Вас хостинг перл поддерживает, то можно так и воткнуть. Если нет, то легко сконвертить в пхп.
Всегда пожалуйста! Я руками написал в пхп-коде проверку "а не враг ли спрашивает?". Соответственно, если обнаружен злодей, то он получает заранее припасённые данные.
В Вашем случае, возможно, хорошим решением было бы заменять на парные символы, одинакого выглядящие в разных языках (а, о, у, е, Т, Р, Н и т. д.). Тогда супостат не сразу поймет, от чего на его копию Вашего сайта ещё меньше народу идёт. Не знаю, смешно ли это... Но пользу какую-нибудь можно из этого попробовать извлечь. Например, свой яавскрипт пихнуть, который бы перебросил посетителя на исконно родной Ваш сайт. Успеха в борьбе с создателями клонов!
Был у меня в молодости схожий эпизод (правда, менее масштабный):
повадились ко мне дёргать курсы валют 1 раз в секунду (вот ведь жадные :) Было легко определить на какой сайт всё это проецировалось, поэтому не составило труда сделать "персональный клоакинг" с вымышленными данными :-) Это веселило, но через день достало, что большая нагрузка на сервак из-за этих орлов - запретил апачу общаться с их ip-адресом, чем и решил проблему.
А в чём сложность? Значит их скрипт при каждом обращении (если на их стороне нет какого-нибудь собственного кэширования) к их сайту выкачивает страницу с Вашего, производя простую замену относительных адресов на свои абсолютные. Это должно быть легко отследить по собственным логам. И закрыть, видимо, это можно простым ручным запретом на обращение с выкачивающих ip-ардесов (скорее всего, из сетки мхоста, раз у них хостятся).
Как я понимаю, если у Вас есть счётчик Rambler's top100, то они могут подвозненавидеть за накрутку (т.е. убрать из своего рейтинга, который при таких масштабных накрутах, как Вы пишите, может нехило трафа приносить). Но на сам Rambler это может и не распространиться.
Скорее всего, текст ссылки сыграл преобладающую роль.
Яндекс хотя и любит новые документы, но я думаю, не на столько, чтобы это было так заметно.
А то, что Яндекс быстро проиндексировал - это скорее нормально, чем странно.
Но главное тут в другом: являются ли эти запросы кому-нибудь интересными? Не было ли такого, что эти запросы на столько простые, что простого упоминания их в тексте страницы и одной ссылки с ключевиком со своего же сайта хватает, чтобы вылезти в топ?