Логи посещений сайтов

1 23
S
На сайте с 12.10.2012
Offline
202
#21
Антоний Казанский #:

Однако как в статическом виде отличать ботов от пользователей я себе например не представляю. Запись в логе - это перечень post/get запросов и в них в отношении поведенческих ботов нет признаков, что это бот.

Товарищ на первой странице написал принцип вычисления ботов. Установка JS ловушек, по ним вычисляют спам сеть, анализируют по ней посещения и формирует фингерпринты.

Согласен с ним, что ботоводы не сильно заморачиваются со сценариями и все их можно вычислить по поведению и другим метрикам.

Остается только практическая реализация. Но тут помимо анализа логов нужен будет программист, который будет писать бэкенд.

Антоний Казанский
На сайте с 12.04.2007
Online
617
#22
sagamorr #:
Товарищ на первой странице написал принцип вычисления ботов.
sagamorr #:
Установка JS ловушек, по ним вычисляют спам сеть, анализируют по ней посещения и формирует фингерпринты.

Это уже надстройки, они к тестовому анализу логов в целом не имеют отношения. 

Так-то конечно, можно и свой Saas сервис написать. Но мы же просто анализируем текстовую информацию из лога, а там всё довольно скупо.


sagamorr #:
Согласен с ним, что ботоводы не сильно заморачиваются со сценариями и все их можно вычислить по поведению и другим метрикам.

Заморачиваются по разному, анализ поведения - это задача уже совсем другого порядка. Не парсинг текстовых данных.

√ SEO продвижение https://akazansky.ru - экспертный аудит сайтов ( https://akazansky.ru/audit-sajtov ), внедрение эффективных решений цифрового маркетинга. Обучение автоматизации с помощью Zennoposter https://goo-gl.me/6Zypu
S
На сайте с 12.10.2012
Offline
202
#23
Антоний Казанский #:

Это уже надстройки, они к тестовому анализу логов в целом не имеют отношения. 

Так-то конечно, можно и свой Saas сервис написать. Но мы же просто анализируем текстовую информацию из лога, а там всё довольно скупо.

Никто и не говорит, что только по одному логу можно, что то понять. А вот анализирую массив, можно найти закономерности.

С помощью JS обработок можно быстрее обработать массив и отфильтровать нужные данные.

После того как будут готовы фингерпринты, уже можно все логи только по ним сигментировать.

Антоний Казанский #:
Заморачиваются по разному, анализ поведения - это задача уже совсем другого порядка. Не парсинг текстовых данных.

Поведение у юзеров, у ботов - это сценарии и все они достаточно примитивные. Единственная цель - обмануть метрику, поэтому если это можно будет сделать в 2-3 действия, то сценарий на 20 действий никто делать не будет.

Антоний Казанский
На сайте с 12.04.2007
Online
617
#24
sagamorr #:

А вот анализирую массив, можно найти закономерности.

С помощью JS обработок можно быстрее обработать массив и отфильтровать нужные данные.

После того как будут готовы фингерпринты, уже можно все логи только по ним сигментировать.

Заморочиться конечно можно. Но получить все FP отпечатки можно только из анализа гостевого браузера, а значит нужно писать функционал, который будет это делать.

Я перечитал информацию на первой странице - всё это звучит симпатично, но это реализация уровня командной работы, простому вебмастеру её не поднять.

При всём уважении к автору - это всё-таки гипотеза и некоторые наработки (без пруфов и доказательств широкого практического применения это можно воспринимать только как частное мнение). Если бы это было уверенное решение c высоким уровнем точности обнаружения, то автору надо не с нами беседовать, а скорее её Яндексу продать, либо реализовать свой сервис, ибо спрос на такие услуги, я уверен, огромный.


sagamorr #:
Поведение у юзеров, у ботов - это сценарии и все они достаточно примитивные. Единственная цель - обмануть метрику, поэтому если это можно будет сделать в 2-3 действия, то сценарий на 20 действий никто делать не будет.

Поведение у юзеров и ботов всё-таки разное. Цели у накрутчиков могут быть не только обмануть Метрику, что касается сценариев - тут тоже всё индивидуально.

Я пишу десятки сценариев и на это уходит десятки часов. Как-то язык не поворачивается их называть примитивными. Как закончу рефакторинг своего рабочего алгоритма - скину вам общую визуализацию, посмотрите на общий объем рабочих поинтов, уверяю, это не 2-3 действия.

S
На сайте с 12.10.2012
Offline
202
#25
Антоний Казанский #:

Поведение у юзеров и ботов всё-таки разное. Цели у накрутчиков могут быть не только обмануть Метрику, что касается сценариев - тут тоже всё индивидуально.

Я пишу десятки сценариев и на это уходит десятки часов. Как-то язык не поворачивается их называть примитивными. Как закончу рефакторинг своего рабочего алгоритма - скину вам общую визуализацию, посмотрите на общий объем рабочих поинтов, уверяю, это не 2-3 действия.

А какая еще может быть цель у ПФ ботов? Эмулировать действия пользователей, обманывая метрику-алгоритмы Яндекса, чтобы тем самым поднять в органике нужный сайт.

Понятно, что сценариев может быть огромное количество, но если кто то нашел как добиться поставленной цели в 2-3 действия, зачем ему выполнять остальные?

Антоний Казанский
На сайте с 12.04.2007
Online
617
#26
sagamorr #:
А какая еще может быть цель у ПФ ботов?

Имитировать конверсии, например.


sagamorr #:
но если кто то нашел как добиться поставленной цели в 2-3 действия

Если кому-то надо именно 2-3, переубеждать его в чём-то другом - дело неблагодарное.

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий