Как строить сайты, защищенные от автоматического выкачивания (эксперимент)

12
_
На сайте с 24.07.2002
Offline
299
_Ad
3262

Полное название топика звучит так: Как строить сайты, защищенные от автоматического выкачивания с помощью программ типа Teleport всякими пианерами, которые хотят повесить на ваш контент свой дизайн и зарабатывать на контексте :smoke:

Суть эксперимента заключалась в том, чтобы не дать офлайн броузерам и грабилкам сайтов линков по структуре вашего сайта, но при этом чтобы поисковики нормально могли бродить по нему.

В ходе эксперимента выяснилось, что есть два пути. оба примерно одинаковые по трудоемкости, но разные в плане отображения для нормальных юзеров ваших ссылок навигации сайта:

1. Все меню запихать в яваскрипт, сделать карту сайта на флэше.

2. Сразу делать меню на простом флэше.

Первый способ удобен тем, что грамотно сделанные ссылки в яваскрипте можно юзать даже тем, у кого яваскрипт отключен (полностью параметр href прописывать). По виду ничем от обычных не будет отличаться, значит юзабилити не пострадает.

Второй способ не так универсален, зато с картой сайта возиться не надо. Ну и опять же, оформить можно красиво..

Напоминаю, что поисковики флэш-ссылки нормально кушают.

Сейчас все будут возмущаться на тему того, что это осуществимо только на небольших статичных сайтах и что карту сайта во флэше для гигантских сайтов хрен нарисуешь вручную... Нифига не так. Умные люди придумали библиотеку Ming SWF, которая будучи подключена на сервере позволяет генерить флэшки скриптом (так же как библиотека GD2 генерит картинки). Если у вас свой сервак, ставите эту библиотеку и пишете скрипт, который вам навигацию генерит во флэше. Если вы на хостинге, упросите хостера поставить эту библиотеку. ничего сложного в установке и настройке там нет.

Метод проверялся на программах Teleport Pro (страницу, на которую вела ссылка во флэше он не нашел) и Offline Explorer (мало того, что не нашел страницу, так еще и намертво подвис обрабатывая счетчик рамблера :D )

Лично я использую комбинированную навигацию. С главной страницы прямые ссылки есть только на флэш-карту сайта, которая генерится каждый раз когда добавляется новый контент.. Ссылки на подподразделы сайта (третий, четвертый уровни вложенности) остаются в html-виде.. Можно и их защитить конечно, но я пока еще тестю и не хочу усложнять жизнь поисковикам.. Если окажется, что им не принципиально, то я и их защитю..

Предполагается, что способ будет работать и для защиты от парсилок контента (им тоже ведь нужно карту сайта составлять, прежде чем они текст отковыривать будут). Но это не точно, потому что мне на вопрос "как работают парсилки" очень умные люди вместо того чтоб ответить, начали рассуждать на тему того что, мол, сайт все равно не защитить, кому надо тот по страничке все сохранит.. :no:

I
На сайте с 29.04.2006
Offline
135
#1

Толку от этого 0! Я сам пишу парсеры для сайтов.. и это - не спасет. Есть другие способы, которые могут СИЛЬНО усложнить жизнь парсерописателей, вплоть до того, что возможно скачать будет только по копи-паст, но не известно как отреагирует на такое поисковик))

_
На сайте с 24.07.2002
Offline
299
_Ad
#2

я не про парсеры говорил, если вы не заметили.. про парсеры я специально оговорился, что не знаю будет работать или нет...

Против программ типа Телепорт оно работает отлично. я ж проверял.

Есть другие способы, которые могут СИЛЬНО усложнить жизнь парсерописателей, вплоть до того, что возможно скачать будет только по копи-паст

Расскажите пожалуйста..

Мне на ум приходил способ генерации тегов типа <br id="3907840"> и т.п.

Николай В.
На сайте с 07.09.2006
Offline
62
#3
_Ad:
Сейчас все будут возмущаться на тему того, что это осуществимо только на небольших статичных сайтах и что карту сайта во флэше для гигантских сайтов хрен нарисуешь вручную... Нифига не так. Умные люди придумали библиотеку Ming SWF, которая будучи подключена на сервере позволяет генерить флэшки скриптом (так же как библиотека GD2 генерит картинки).

Гораздо проще подгружать во флеш-ролик xml-ку и строить меню динамически.

_
На сайте с 24.07.2002
Offline
299
_Ad
#4
Николай В.:
Гораздо проще подгружать во флеш-ролик xml-ку и строить меню динамически.

я тоже так думал сначала, но на самом деле это не очень удачный ход, потому что менюшка строится динамически каждый раз.. а генеренная swf-ка генерится один раз и дальше работает как статичный файлик... Нагрузка меньше получается..

Dweep
На сайте с 11.12.2006
Offline
207
#5

теперь осталось задуматся над вопросом - чем все таки "всякие пианеры" выкачивают сайты. Если они выкачивают их этими програмами, то все равно им придется писать скрипт, который парсит то, что скачал Teleport или Offline Explorer.

А раз есть такой скрипт, то парсить это с локального компа или прямо с Вашего хостинга значения особого не имеет. Я это к тому, что именно самописных скриптов надо бояться.

Так как я парсить флеш не умею, то думаю Ваш способ частично спасет, но опять таки - если ПС распознает флеш-ссылки, то и самописный скрипт это сможет сделать.

_
На сайте с 24.07.2002
Offline
299
_Ad
#6

Гыгы... нет, все гораздо проще. потому что они в скаченном сайте меняют css и автозаменой вешают свою шапку.. Пианеры же ж, фигли =)

ЗЫ. фраза про "если Поисковая система может распознать флеш, то и самописный скрипт сумеет" порадовала грамотным соотношением масштабов сравниваемого =)

S2
На сайте с 07.01.2008
Offline
611
#7

А на httrack вы проверяли? Она многими считается лучше Телепорта.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
Николай В.
На сайте с 07.09.2006
Offline
62
#8
_Ad:
Нагрузка меньше получается..

Нагрузка на что? Клиентская машина отрисует меню по xml мгновенно.

На самом деле мне не кажется эта идея хорошей, так как спасет только от откровенных «пионеров», зато не даст пользоваться сайтом людям без флеша, например пользователям той же Оперы Мини.

_
На сайте с 24.07.2002
Offline
299
_Ad
#9

тогда идею про xml не осознал.. надо будет попробовать..

по поводу всего остального - естественно это компромисс... но я предложил два варианта.. Первое - это где только карта сайта на флэше, а менюха в яваскрипте.. Правда и тут можно будет спросить "а что делать тем, у кого яваскрипт отрублен в броузере?"...

_Ad добавил 23.03.2008 в 14:40

Str256:
А на httrack вы проверяли? Она многими считается лучше Телепорта.

проверил. Эта программа нашла ссылку в яваскрипте. Флэш она также не смогла осилить.

[Удален]
#10

Как только прочитал название топика придумал ещё один способ: постоянно менять ссылки на страницы типа index_edfg2c23ffc.html будет алиасом index_243fd3hweqee.html, но видя каждый раз новую ссылку на новой странице телепорт в итоге захлебнётся в бесконечном цикле и полной версии сайта не получится. Однако есть проблема со склейкой зеркал ПС. Тут либо паранойя, либо хороший индекс в поисковых системах.

Написать парсер, который будет отбрасывать мусор несложно, но от пионэров спасёт.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий