Есть рецепты по определению на лету бот / не бот с помощью РНР?

12
Asar
На сайте с 23.08.2004
Offline
288
622

Нужно не для того, чтобы банить левак и уменьшать нагрузку на сервер, а просто для статы. Поэтому задача не в том, чтобы отделить людей и хороших ботов от плохих ботов, а в том, чтобы отделить людей от всех ботов и поэтому цена ошибки невелика, а гимор наживать неохота.

Есть готовые рецепты какие-нить или только смотреть, какие боты ходят и пробовать отшивать по навзаниям в юзерагенте? Но и в агенте, канеш, на панацея, потому как мне неочевидно, что это

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.93 Safari/537.36 OPR/32.0.1948.69

бот, а, судя по поведению, это таки бот...

В общем, просьба поделиться опытом, кто задачку решал какую-нить похожую.

V_G
На сайте с 12.04.2011
Offline
102
V_G
#1

Тогда только через Javascript.

Оптимизайка
На сайте с 11.03.2012
Offline
396
#2

С помощью PHP очень немного случаев можно отследить.

⭐ BotGuard (https://botguard.net) ⭐ — защита вашего сайта от вредоносных ботов, воровства контента, клонирования, спама и хакерских атак!
Asar
На сайте с 23.08.2004
Offline
288
#3

Т.е. тупо перебирать по вхождению в агент? Если да, то хоть списки есть более-менее вменяемые, по чему отбор делать, чтобы самому велосипед не изобретать?

дани мапов
На сайте с 06.09.2012
Offline
192
#4
Написание и доработка скриптов (PHP, MySQL, JavaScript, jQuery) (/ru/forum/811046)
Asar
На сайте с 23.08.2004
Offline
288
#5

дани мапов, понял, спасиб, примерно так щас и делаю.

Оптимизайка
На сайте с 11.03.2012
Offline
396
#6

Поставьте метрику, она показывает % ботов, плюс свой счетчик по логам веб-сервера, да и всего делов.

Asar
На сайте с 23.08.2004
Offline
288
#7

Я б поставил, но мне нужна стата по условиям, которые видит только РНР, а метрика не видит...

edogs software
На сайте с 15.12.2005
Offline
734
#8
Asar :

бот, а, судя по поведению, это таки бот...

В общем, просьба поделиться опытом, кто задачку решал какую-нить похожую.

Боты крайне редко грузят картинки.
А те кто грузят, обычно грузят так же и невидимые картинки (которые не грузят браузеры).
Поэтому делаем так что бы на странице была видимая картинка (пусть даже логотип или пустую 1х1) и невидимая (в слое дисплей-нон).
А потом смотрим по логам апача
а) если в один запрос было обращение к странице но не дергались картинки - скорее всего бот
б) если в один запрос было обращение к странице но дернулись обе картинки - скорее всего бот
в) если же дернулась сама страница и только видимая картинка - скорее всего человек

От ботов на headless браузерах не особо спасает, но ими пользуется очень мало народу, т.к. ресурсы жрут безбожно.



Разработка крупных и средних проектов. Можно с криптой. Разумные цены. Хорошее качество. Адекватный подход.
C2
На сайте с 12.01.2021
Offline
2
#9
сейчас куча ботов, ваш сайт не пасти. не занимайтесь ерундой, бывают даже полезные боты.
S
На сайте с 26.02.2017
Offline
37
#10

сейчас куча ботов, ваш сайт не пасти. не занимайтесь ерундой, бывают даже полезные боты.

Выявление ботов, это важная задача. Есть особи, которые невидны, ни каким метрикам и яваскриптам. И, к стати, именно такие боты и  убивают сервер своими запросами.  Но это уже не в тему:)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий