Реальна ли такая защита от парсинга

12
K6
На сайте с 28.02.2022
Offline
95
1636

на сайте  https://seo.klimin-viktor.com/parsery-dlya-blokirovki.htmlнашел список парсеров 

если их в .htaccess запихнуть таким образом

RewriteEngine On

RewriteCond %{HTTP_USER_AGENT} ^PhantomJS[OR]

RewriteCond %{HTTP_USER_AGENT} ^Python-urllib

RewriteRule ^.* - [F,L]

кстати вопрос: как прописать многосоставные названия, типа Codular Sample cURL Request

и еще вот такое добавить:

# Block via Query String

<IfModule mod_rewrite.c>

RewriteEngine On

RewriteCond %{QUERY_STRING} (crawl|scanx) [NC]

RewriteRule (.*) - [F,L]

</IfModule>

даст ли реальную защиту или нужно блокировать всех г-хостеров и облачные сервисы по IP?

дешевые VIP VPS: https://clck.ru/324vy9
-S
На сайте с 10.12.2006
Offline
Модератор1355
#1
Это вообще не защита, по юзер-агенту банят школоботов, многие парсеры делают безобидный ЮА или маскируются под поисковики.
K6
На сайте с 28.02.2022
Offline
95
#2
спасибо, так и подозревал
K6
На сайте с 28.02.2022
Offline
95
#3

кстати, побанил всех ру г-хостеров по подсетям и бурж. облачным сервисы, ни один парсер статейки по 30-50 кило просмотров за последние пару месяцев не скачал. Понятно, что от школоты только, но тоже неплохо.

один минус - около 1000 строк в .htaccess

а если сделать отдельным файлом и вызывать с помощью кода

IP в строке и параметр -1 к примеру , так не понял как указывать в таком файле примечания - а это важно (хостер, AS, чей и т.д)

PS: антибот просьба не предлагать, так как они не по сайтам парсят, а конкретно трафиковые статьи в топе по ВС и СЧ запросам.

Антоний Казанский
На сайте с 12.04.2007
Online
617
#4
katz666 :
даст ли реальную защиту или нужно блокировать всех г-хостеров и облачные сервисы по IP?

Как выше верно указал Станислав многие даже десктопные парсеры имеют пользовательские настройки для смены User Agent.

Банить лучше по признаку кол-ва запросов от одного IP (исключая поисковики), но подобные настройки как правило доступны либо в сервисе хостинга, либо в сервисах типа CF. 

√ SEO продвижение https://akazansky.ru - экспертный аудит сайтов ( https://akazansky.ru/audit-sajtov ), внедрение эффективных решений цифрового маркетинга. Обучение автоматизации с помощью Zennoposter https://goo-gl.me/6Zypu
demonichka
На сайте с 01.04.2011
Offline
210
#5
Если я хочу забанить  множественные заходы по  определенному IP поможет блокировка в .htaccess ?
Vladimir
На сайте с 07.06.2004
Offline
531
#6
demonichka #:
Если я хочу забанить  множественные заходы по  определенному IP поможет блокировка в .htaccess ?
- поможет для данного IP
- скорее всего сменят IP ( поможет на какое то время )
Аэройога ( https://vk.com/aeroyogadom ) Йога в гамаках ( https://vk.com/aero_yoga ) Аэройога обучение ( https://aeroyoga.ru ) и просто фото ( https://weandworld.com )
Антоний Казанский
На сайте с 12.04.2007
Online
617
#7
demonichka #:
Если я хочу забанить  множественные заходы по  определенному IP поможет блокировка в .htaccess ?

Т.е. одиночные заходы вы хотите разрешить, а более частые запретить?

AfterWar
На сайте с 28.01.2013
Offline
169
#8
не защита все вышеперечисленное + кому надо спарсить - спарсят с вебархива. Cloudflare ставьте и очень жесткие правила - например капчу на все по http 1.0 Но и то могут спарсить браузерными ботами которых яндекс то от юзеров отличить не может
⭐⭐⭐ЛУЧШАЯ АЛЬТЕРНАТИВА ADSENSE (ПЛАТЯТ, И ДЛЯ RU ДЛЯ БУРЖ) ( https://clck.ru/KgyqY )
fliger
На сайте с 17.09.2015
Offline
107
#9
AfterWar #:
спарсят с вебархива
Сохранение сайта в вебархиве элементарно банится.
maximka77
На сайте с 15.10.2011
Offline
227
#10
fliger #:
Сохранение сайта в вебархиве элементарно банится.

Даже если сайт уже сохранён?

- Дизайн-радиаторы отопления ( https://velarshop.ru/design/) - Зарабатываю в РСЯ через ( https://app.adprofit.world/login/registration?u=219 ) пока что мне нравится, выплаты получаю каждый понедельник на USDT - Заказать обратные внешние ссылки с главных страниц PBN ( https://tier1.shop/ )
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий