Защита от граббера ДЛЕ 8,0

12
[Удален]
#11
zerg:
можно сделать динамические ксс и названия таблиц тем самым усложните задачу грабинга, уберите публичную карту сайта, навигацию по станицам сделайте на джава, а карту сайта добавте через яндекс вебмастер чтоб никто не знал. Поставте ЧПУ и уберите тег контент генератор. Так вы задачу спарсить сайт в поисковике + сграбить контент сделаете практически невозможной.

чушь и брехня

bearman добавил 30.08.2009 в 10:05

ДЛЕ ЛЕГКО УЗНАЕТСЯ ВОТ ТАК - http://site.ru/engine/rss.php

K
На сайте с 19.06.2007
Offline
67
#12

bearman, значит я не просто так чищу этот файл :)

Z
На сайте с 06.01.2007
Offline
25
#13
ДЛЕ ЛЕГКО УЗНАЕТСЯ ВОТ ТАК - http://site.ru/engine/rss.php

bearman, когда будет чпу, ссылка будет не такой а http://site.ru/note/rss/ и даже если вы узнаете что это дле, двиг не имеет значения, спарсить с генерированных таблиц где постоянно мееняются ид и названия ... полей будет очень сложно.

Можно только вырезать инфу с самого большого блока. К примеру структура по сайту где дивы это могуд быть и выравнивания и тд, тоесть подсчитать количество вы не сможите и вырезать к примеру 5, поэтому можно спарсить только самый большой. Ну вот попробуйте сделать скрипт, а я посмотрю какой это бред.

к примеру


<div id="sadfsdfsf">
...
<div id="sadfsdfsf">...</div>
<div id="87878">...</div>
....
</div>

Если сделаете так можно любой движок, любой сайт сграбить, таким скриптом.

темболее когда ссылки будут в виде

forum.searchengines.ru/Защита-от-граббера-ДЛЕ-8

+ навигация по страницам вся будет на флеше или замудренно на аджакс чтоб нельзя было точную ссылку получить, вы все не сграбите а то что сграбите не факт что будет статья а какаянить форма отправки или теги итд. + еще придумал сделать скрытые ссылки ну как нить через ксс спрятать чтоб пользователь не увидел а скрипты которые грабят подхватывали, и если ктото по ней перейдет ип сразу в баню, а в хетакесс поставить запрет индексации такой страницы.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий