damn-doubleclick

damn-doubleclick
Рейтинг
63
Регистрация
10.09.2021
Если действительно хотите защитить свое детище от парсеров, то самым эффективным способом является шифрование текста используя CSS.

Логика такая: скрипт рандомно переставляет буквы статьи, а потом используя правила CSS делает текст читабельным только визуально, если недруги попытаются спарсить/скопировать то получится "абракадабрака". 

Таким образом можно отсеять 98% парсеров, остаётся лишь 2% которые используют комбинацию инструментов и могут сделать снимок страницы, далее скопировать текст через OCR, но от таких никакой "антибот" не спасёт. 


1. Cloudflare ускоряет время соединения клиента с исходным сервером, и тут неважно сколько данных обрабатывается на стороне сервера, вы можете хоть Nuxt.js подключить, но это не отменяет физическое расстояние от Москвы до Лос-Анджелеса. 

GET, POST - все это запросы от клиента к исходному серверу, мб POST будет чуть чуть быстрее но это не делает погоду. То есть TTFB будет +/- одинаковой. 

Простыми словами: GET /page.html = 1-2 секунды, POST /page.html = ~0,8-1,5 секунды. 

А если подключить Cloudflare эти показатели сократятся в 1-3 раза. 

2. По умолчанию Cloudflare не кэширует динамические страницы, клиент же получает ответ от исходного сервера, а исходный сервер учитывает входящие данные пользователя, делает расчёты без Cloudflare, и только потом выдаёт ответ. А Cloudflare доставляет этот ответ. 
От тематики зависит скорее всего, у меня например: 5к с РФ, 150-170к показов, 3-3,5к руб. в сутки. Тематика развлечение. Три баннера между статьями, адаптивные.

С теми показателями трафик с стран СНГ не приносят даже 1000 рублей. Поэтому качество трафика тоже играет роль, мб трафик у вас 45к из Средней Азии, и только немного из РФ? 
Yes or No.

Сделайте кнопку Yes зелёным, красивым, приятным а кнопку No серым, не заметным. 

Ещё можно подключить Click io, там все сделано за вас со всеми текстами, достаточно добавить js код. 
EdwardEdit :
В последнее время стал замечать все больше переходов с домен.translate.goog. Правильно ли я понимаю, что это переходы из поиска Google с автоматическим переводом страниц на другие языки? Или это что-то другое?

Кто-то парсит наверное, Chrome может переводить страницы без этого домена.

in dashboard → Analytics → web Analytics → select domain → manage site → under " advanced options"
check “Disable automatic setup” → wait for some time
ADpro #:

Напишу тут, чтобы не открывать свою тему.

Есть у кого-нибудь идеи или варианты как обойти данный фильтр?  

Т.е. если сайт пиратский возможно ли обойти данный фильтр?

буду очень благодарен за любую информацию по теме. 

Я уже пытался, причём достаточно продуманно: сделал функцию авто смены URL страницы, а потом настроил скрипт так чтобы проверял почту и парсил удалённые страницы. На всякий случай прикрутил Google Indexing API и аналог от Yandex, Bing. 

Создал несколько разных зеркал, в одном из них закрыл информацию от гостей открыв индексирования только для Google и Yandex. 

Ещё попытался клонироваться гсайты на blogspot с ключевыми словами и ссылкой на мой сайт. 

Но все это не помогло, противник видимо стирает все что попадает кроме некоторых известных каталогов. 

Результаты: теневой бан домена из-за большого количества DMCA, снижение трафика до 95% с ПС. Ограничение показа рекламы, спустя какое-то время полный бан Adsense аккаунта. 

Не рассчитывайте на индусов из отдела проверки DMCA, они все пропускают. 

Но, не сдавайтесь и попробуйте, мб получится. 

L-ee #:
По-моему такая задержка в статистике уже понятно, что дело не чисто тут. Другие компании же как то справляются с этим. адфинити, аднитро. У них все в реальном времени

Да, было бы неплохо видеть доход в режиме реального времени, или хотя бы раз в 30-60 минут как это сделано в Adsense. 

Сегодня утром получил выплату, и вечером только что получил письмо о "закрытии платежного профиля". 

В соответствии с правилами программы мы регулярно проверяем аккаунты издателей. Ниже перечислены нарушения, обнаруженные в вашем аккаунте.

Обнаруженные нарушения:

Материалы, защищенные авторским правом: несанкционированный обмен файлами:

Издателям запрещается показывать рекламу Google рядом с материалами, защищенными авторским правом, без надлежащих разрешений на их публикацию. На сайте или в приложении не должно быть несанкционированно размещенных материалов или файлов, защищенных авторским правом, а также ссылок на ресурсы с таким содержанием.

Придется делать новый акк, эх 😞

Инструменты для сбора данных: A-Parser, Datacol, BAS, ZennoPoster.

По ищите специалистов выше перечисленных инструментов, и предоставьте им свой ТЗ. 

На крайный вариант: ChatGPT-4 + Python + Selenium. 
Всего: 535