Posting_i_PIAR, в том, что сегментов очень большое количество, а здесь выделяются именно статистически достоверные отличия.
Вот в этом примере - выбрано 550 из 250 000
-так это они не "к тебе" приезжали, а "к дяде"
-я человек со стороны, вот только что прочитал вашу историю с Leadia
и непонятно
если вы прямой байер лидов, то зачем занимаетесь "оценкой средних показателей, естественностью поведения, качеством трафа"
когда можете, как прямой потребитель лидов, платить просто за сработавшие заявки, за заказы? тупо
пусть их будет меньше, пусть они будут дороже, но зато меньше модерации
Надежный способ - это просканировать все 320к (актуальных на сейчас) или до 800к ip (в архиве) или все ip из подсетей, куда попали ip выше
на предмет нахождения сайта у них
(понятно, что парковки доменов, которые будут отвечать 200 нужно будет отключить, но и кроме парковок тонна хостеров вам что-то покажут)
Но т.к ТС не уверен, что он сможет сделать после нахождения реального IP вора - так и не о чем говорить
Miha Kuzmin (KMY), ты них не умеешь кроме как сказать "гугл в помощь"?
ну тафай тафай, скажи сам
А что будет, если найдете IP сайта? который спрятан за CF
Хотя, конечно, если клон спецом под ваш написан, он такой скрипт может вырезать, либо придется хитро зашивать его в остальные рабочие скрипты
Если не при каждом заходе юзера он дергает ваш сайт каждый раз (через Тор это будет долго), то
1. отключить кеширование, чтобы каждому юзеру отдавались разные копии
2. брать юзерагент и другие параметры, которые JS может посмотреть на клиенте. Пусть будет юзерагент, можно добавить, например, час запроса (по гринвичу какому нить)
3. брать хеш от него и вставлять на каждую страницу JS, в котором в явном виде прописан этот хеш
4. JS на клиенте проверяет юзерагент, берет от него хеш и сравнивает с прописанным значением, если совпадает - ок, если не совпадает - редиректит на ваш основной домен например, или не кажет контент, или по-другому вредит.
5. профит
очевидно, это задание для подготовки обучающей и тестовой баз для конкурса про Алису https://contest.yandex.ru/algorithm2018/contest/7914/problems/
- а почему ваш страж апдейтов перепощивает из чужого сервиса апы? )