Как усложнить парсинг сайта?

1 234
A
На сайте с 19.07.2010
Offline
130
#31
borisd:
Задача ведь не в полной защите от парсинга, а в экономической нецелесообразности. Да не разового копирования, а регулярного. Плюс временной лаг между обновлением контента на моем сайте и сайтах конкурентов - чем больше, тем лучше.

Из опыта: нанимать программиста на каждый чих они не будут, удовлетворятся старыми данными.

Вот Вы сами себе и ответили. Можно периодически менять шаблон вывода данных. Раз в месяц будет достаточно, можно реже.

Програмер спарсит, сдаст работу, получит деньги, уйдет. Через месяц - по новой.

Думаю конкурента хватит не больше чем на 3-4 итерации и он пойдет искать другой источник данных или забьет.

.............
SeVlad
На сайте с 03.11.2008
Offline
1609
#32
Solmyr:
Домашние прокси - денег стоят.

Куча завирусованых хоумланщиков. На них основные ботсети и держаться.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
B
На сайте с 13.02.2008
Offline
262
#33

В общем остановился на самом простом варианте. Буду периодически внедрять какие-нибудь ссылки (можно и не активные) на себя в тех же тегах, что и элементы основного контента, а потом их убирать. Если они парсер не перестроят, у них будут ссылки на меня, а если парсер они перестроят на исключение этих элементов, то после того как я уберу эти блоки, у них похерится часть содержимого. Т.е. они не смогут для гарантированного исключения вставок полагаться на теги, а должны будут полагаться на содержимое вставок, которое в моих руках и не будет постоянным. Таким образом мне даже верстку не надо будет менять.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий