Защита от парсинга сайта

112

Ervin

23 января 2010, 18:33

9511

Есть сильное желание защитить контент сайта :) Подумал о том, чтобы рандомизировать названия стилей - для каждой страницы генерировать уникальные, или грузить свой css.

Подскажите, будет ли это работать? :) И какие возможны подводные камни? Кроме невозможности кэширования и увеличения трафика и ресурсов?

Credendo vidas!

247

fhuuz

23 января 2010, 18:38

#1

Ervin:
Есть сильное желание защитить контент сайта :) Подумал о том, чтобы рандомизировать названия стилей - для каждой страницы генерировать уникальные, или грузить свой css.
Подскажите, будет ли это работать? :) И какие возможны подводные камни? Кроме невозможности кэширования и увеличения трафика и ресурсов?

Самый лучший вариант проверить, работает ли это, это протестировать на наиболее распространенных парсерах.

У меня есть несколько, могу проверить, присылайте урл.

ZennoPoster (https://zennolab.com/ru/products/zennoposter/?utm_source=searchengines.guru&utm_medium=signature&utm_campaign=zennoposter5&utm_content=fhuuz) - реальная экономия на кодерах

1777

LEOnidUKG

23 января 2010, 18:43

#2

защитить контент сайта

и

рандомизировать названия стилей

я один связи не вижу?

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/

KU

251

Vitalii Polishchuk

23 января 2010, 18:45

#3

Не будет работать. CSS парсерам нафиг не нужен.

Хостинг ( https://good-host.net ) / Linux VPS ( https://good-host.net/vps ) / Windows VPS ( https://good-host.net/windows-vps ) / Выделенные серверы ( https://good-host.net/dedicated ) 14 лет онлайн!

456

[umka]

23 января 2010, 18:46

#4

LEOnidUKG, ага ))

Тут нужно копать, как минимум, в сторону рандомизации структуры документа.

Я предполагаю, что "парсеры", как вы их называете, первым же делом вырезают из документа все стили, переносы строк и повторяющиеся пробелы.

Как минимум, я бы сделал, чтобы в тэгах периодически параметры местами менялись в случайном порядке.

Лог в помощь!

Google Updates - апдейты Добавьте налоговую информацию Яндекс кобласит

225

ewg777

23 января 2010, 18:47

#5

Есть сильное желание защитить контент

Не публикуйте этот контент.

Может хватит уже?

112

Ervin

23 января 2010, 18:48

#6

LEOnidUKG, переформулирую: осложнить работу парсеру, убрав повторяющиеся элементы со страницы, в частности - названия стилей.

KM.UA, а как определяется, что такой-то кусок кода содержит текст, а такой-то - меню?

SS

116

specialist-seo

23 января 2010, 18:56

#7

LEOnidUKG:
я один связи не вижу?

большинство парсеров работают по принципу. Задал начальный тег в странице и конечный. Они все что между ними копируют. Если сочетания тегов или знаков не найдено, то копируется только одна страница.

Дальше парсер просто не знает, что ему искать.

нужны теги на сайте Как в google прописать Не платил налоги к

112

Ervin

23 января 2010, 19:07

#8

Мдя, похоже, я не с того конца подошёл к проблеме...

Тогда не скажете, где почитать, как работает типичный парсер? То есть, что он делает с html-страницей, конкретно?

P.S.: Я не глупый... и гуглем пользоваться умею... просто никогда раньше с этим дела не имел, и не знаю откуда начать :o

Яндекс кобласит Помогите! Некоторые страницы с Гугл: сайту 1 год,

1777

LEOnidUKG

23 января 2010, 19:12

#9

specialist-seo:
большинство парсеров работают по принципу. Задал начальный тег в странице и конечный. Они все что между ними копируют. Если сочетания тегов или знаков не найдено, то копируется только одна страница.
Дальше парсер просто не знает, что ему искать.

ооо ну вы типо усложнили задачу? Самый простой вариант:

1. Парсим все div

2. Выбираем где символов побольше

3. Профит.

12

satrau

23 января 2010, 19:35

#10

у меня есть защита от любых парсеров на 100% :)

--

для вывода каждого предложения текста надо просить ввести капчу :). и каждое следующее предложение подгружать аяксом :).

Хотя. [чтобы прочитать этот текст отправьте смс на номер 5555 с текстом TEXT]. Это я думаю будет лучший вариант :)

Защитится от парсеров подругому будет проблематичней.

Россошь (http://www.flash9.ru)

В функции «Добавить в Нарушение требований к запросам Радикальное обновление сайта

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ