Защита от парсеров

12
RM
На сайте с 21.06.2011
Offline
77
1531

Встала задача защитить содержимое файла от ботов-парсеров. Авторизация есть, но это не решение проблемы, файл обновляется каждый день и по этому каждый день его будут парсить а мне этого не надо... Может есть у кого задумки по поводу того как отличить пользователей от ботов, один из вариантов это проверка на js, но что и как проверять? В общем, если есть интересные идеи или готовые решения проблемы, буду благодарен за информацию.

Заранее благодарен за ответы.

blackcat72
На сайте с 22.03.2009
Offline
25
#1

Если сайт загружается пользователю, то значит он УЖЕ спарсен. Дело только в автоматической обработке контента останется ему.

--- Лучше день потерять, зато потом за пять минут долететь.
Mad_Man
На сайте с 10.11.2008
Offline
162
#2
RoMaN444Ik:
если есть интересные идеи

LEOnidUKG
На сайте с 25.11.2006
Offline
1773
#3

Не выкладывать в сеть.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
Ink-developer
На сайте с 31.01.2009
Offline
138
#4

Защита от парсеров невозможна, кто сможет пусть отпишется в Яндекс, возьмут на работу в течении часа, зарплатой не обидят.

Невозможна по причине того что запрос бота на 100% может повторять запрос пользователя.

RM
На сайте с 21.06.2011
Offline
77
#5
Ink-developer:
Защита от парсеров невозможна, кто сможет пусть отпишется в Яндекс, возьмут на работу в течении часа, зарплатой не обидят.

Невозможна по причине того что запрос бота на 100% может повторять запрос пользователя.

Ну, к примеру боты, js не понимают, это уже отличает их от обычных юзеров...

LEOnidUKG
На сайте с 25.11.2006
Offline
1773
#6
RoMaN444Ik:
Ну, к примеру боты, js не понимают, это уже отличает их от обычных юзеров...

Ну допустим вашу догадку приняли... и как вы хотите серверно проверять наличие JS?))))

Или на каждой странице проверку вставлять? 🍿

Ink-developer
На сайте с 31.01.2009
Offline
138
#7
RoMaN444Ik:
Ну, к примеру боты, js не понимают, это уже отличает их от обычных юзеров...

Дело в том, что вы просто не понимаете о чем говорите.

Сервер который отдает информацию, понятия не имеет понимает ли JS то устройство которому он ее отдает т.к. выполнение JS идет уже после получения данных в точке назначения, и сервер уже отдал эти данные, в результате чего уже поздно думать выполнится ли JS там куда сервер отдал данные. Сервер просто об этом не может узнать.

hatsub
На сайте с 29.12.2010
Offline
7
#8

Если скрываете от парсеров, то и поисковики тоже пройдут мимо. учитывайте это.

Ragnarok
На сайте с 25.06.2010
Offline
239
#9
Ink-developer:
Дело в том, что вы просто не понимаете о чем говорите.

Сервер который отдает информацию, понятия не имеет понимает ли JS то устройство которому он ее отдает т.к. выполнение JS идет уже после получения данных в точке назначения, и сервер уже отдал эти данные, в результате чего уже поздно думать выполнится ли JS там куда сервер отдал данные. Сервер просто об этом не может узнать.

а если при запросе пользовательский браузер получает js, который в свою очередь запрашивает данные с сервера и отображает их?

//TODO: перестать откладывать на потом
ДП
На сайте с 23.11.2009
Offline
203
#10
RoMaN444Ik:
Ну, к примеру боты, js не понимают, это уже отличает их от обычных юзеров...

Посмотрите на selenium, phantomjs - их к ботам можно прикрутить на раз-два.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий