Парсят мой сайт

1 23
PR
На сайте с 08.08.2008
Offline
32
#21
drv:
Поставте на все картинки "водяные знаки" со своим url и ждите...

Польностью согласен - так делают очень многие сайты, судя по популярности - очень эффективная мера - по-простому говоря на картинке стоит адрес Вашего сайте - у пусть своим пользователям Ваш сайт рекламируют - и Вам хорошо (ссылочка на сайт) и им неплохо (схемки чужие используют)

[Удален]
#22

Решение этой задачи на примере движка IPB 1.3:

В движке уже есть функции create_guest_session(), пишущая сессию в куки, и update_guest_session(), читающая сессию из куков.

Сессия, айпишник, время последнего клика и еще ряд величин пишутся в таблицу сессий ibf_sessions.

В таблицу сессий добавляем поле spam_key - тиниинт(2), дефолт 0.

Для дерьмоботов без куков добавляем в функцию create_guest_session() проверку по айпишнику:

$DB->query("SELECT id, spam_key, ip_address, running_time FROM ibf_sessions WHERE ip_address='".$this->ip_address."' AND member_name = ''");

$result = $DB->fetch_row();
if( $result['ip_address'] == $this->ip_address ){
$this->session_id = $result['id'];
$this->last_click = $result['running_time'];
$this->update_guest_session();
}
Теперь и боты пойдут на апдейт сессии.

Теперь в функцию update_guest_session() добавляем элементы:

Проверяем время между обращениями к страницам:

if(($this->time() - $this->last_click) < 5){
Вряд ли нормальный пользователь пробудет на странице меньше 5 секунд...

Итак, в этом случае, считываем spam_key, и если оно меньше 10 (дадим юзерам за сессию право случайно 9 раз сделать двойные клики) - приплюсовываем единичку.

По эльзе (spam_key не меньше 9) считываем файл .htaccess и добавляем в него айпишник, либо создаем содержимое для нового файла:

if(is_writeable( '.htaccess' ))

{
@ob_start();
include( '.htaccess' );
$htaccess = @ob_get_contents();
@ob_end_clean();
if(!stristr($htaccess,"Deny from "))
{
$htt_data = "#Options -Indexes\n<Limit GET>\nOrder Allow,Deny\nDeny from ".$result['ip_address']."\nAllow from All\n</Limit>\n".$htaccess;
}
else
{
$htaccess = explode("Deny from ",$htaccess);
$htaccess[0] .= "Deny from ".$result['ip_address']."\n";
$htt_data = implode("Deny from ",$htaccess);
}
}
else
{
$htt_data = "#Options -Indexes\n<Limit GET>\nOrder Allow,Deny\nDeny from ".$result['ip_address']."\nAllow from All\n</Limit>\n";
}
$fh = fopen('.htaccess', "w");
fwrite($fh, $htt_data);
fclose($fh);

Это скелет защиты. В полной защите есть и второй алгоритм проверки на личерство, и проверка перед баном на незалогиненного полезного пользователя форума, и логирование сообщением в форум...

Плюс, в самом движке поисковые боты на более ранней стадии выявляются и обрабатываются другими функциями.

В общем, я поделился не готовым защитным кодом, а скорее рядом идей с наглядными демонстрациями в кодах. Кому нужно - тот реализует в полной мере под свои проекты.

Sattt
На сайте с 12.04.2008
Offline
131
#23

Я вот не пойму, зачем картинки то блокировать/заменять?

Они ж тоже какой-то вес должны давать, хоть и мизерный. Закроете – так воры их перекачают себе, программно это очень просто делается.

Ещё есть такая теория, что ПС будет легче распознать первоисточник, т.к. рядом с парсенным контентом стоят картинки с адресом вашего сайта. Они будут работать как "Ссылка на источник". Но опять таки, утверждать ничего не могу, т.к. сам не проверял.

S2
На сайте с 07.01.2008
Offline
611
#24
Sattt:
Я вот не пойму, зачем картинки то блокировать/заменять?
Они ж тоже какой-то вес должны давать, хоть и мизерный. Закроете – так воры их перекачают себе, программно это очень просто делается.
Ещё есть такая теория, что ПС будет легче распознать первоисточник, т.к. рядом с парсенным контентом стоят картинки с адресом вашего сайта. Они будут работать как "Ссылка на источник". Но опять таки, утверждать ничего не могу, т.к. сам не проверял.

Несколько раз это обсуждали. Вывод был такой: вес не передаётся, но индексирующий робот по ним активно ходит, то есть их можно использовать для ускорения индексации сайта. Чтоб не перекачали - надо ставить водяные знаки, другое дело, что на миниатюрах, они будут заслонять изображение. В общем меры защиты тоже много раз обсуждали.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий