Анти БОТ

Анти БОТ
Рейтинг
135
Регистрация
14.03.2020
Должность
специалист по поведенческим ботам
Ирина #:
AppleWebKit/537.36

Да просто идентификатор движка браузера. Забудьте.

А вот кейссо да, можно банить.

Smuel #:
И ip как они могут узнать, если ip показывается от CF.

Не знаю как именно это работает, но это достаточно частое явление, когда боты ломятся в обход клауда. Именно поведенческие.

Методы решения вопроса - есть, пробуйте, ищите, изучайте, и все получится.

makepuff #:
решил проверить на детекторе новую модель, текст на 3500 знаков с пробелами. Только один детектор из 5 сказал что это написал человек, все остальные 88%+ указали на ии

Вы любой человеческий текст туда добавьте, анализаторы то же самое покажут.

Да уже все давно забыли. Как в свое время про ICQ или Скайп.

Так что актуально в этом тописке только то, через сколько последним 2 пользователям вебманей надоест обсуждать былые славные времена, и через сколько тема уйдет в архив.

Ирина Рина #:
Так, перенесла сайт и базу данных на новый сервер, теперь вот такая ошибка, что я не так сделала?

Есть подозрение, что если машина не едет, дело не в машине, а в том, кто между рулем и сиденьем.

Почему-то никому в наше время не приходит в голову ставить себе на компьютер Windows 3.1. Но при этом весту ставят. И не смущает например, что единственный апдейт за последние годы они родили в 22 году. А в RU части их форума за 5 месяцев этого года написано одно сообщение. 
А потом рождаются вот такие вот странные темы.

Вы же не системный администратор, чтобы пытаться разобраться в таком древнем устаревшем софте.
Поставьте на VPS более современную панель управления, которая будет работать из коробки.

i.lisovenko #:
А если на сайте есть просто прямые заходы, явно бота кто то чему то учит, как таких запретить?

Так и загуглите: нагул профиля поведенческими ботами.

dataworld #:
При этом в Cloudflare в логах WAF я не вижу этих посещений на эту страницу (кроме своих)

Они есть в access логах сервера?

yalol #:

а как проверить доступен ли сайт для них?

В логах access сервера можно посмотреть, что в итоге приходит на сайт.
Если бы читали ветку про Cloudflare, то там обсуждалось это. Выше Skip ставится правило с блоком.

boobi #:


Одна из базовых настроек для CF чтобы ПС Я/Г боты сканировали сайт.

Таким образом не только боты поисковиков будут иметь доступ к сайту, но и целая толпа полезных с точки зрения Клауда ботов: Амазонбот, Ашрефсбот, Клаудибот, Маджестик и прочее, что забьет сервер пачкой бесполезных подключений.

tripsik #:
пока это рекоммендация но скоро станет обязательной и ркн всех российских хостеров легко заставит ее исполнять

Это не рекомендация. Это выдернутое журналистами ради хайпа мнение какого-то собеседника о том, что в списке ботов есть ИИ бот Гугла. О блокировке поисковых ботов Гугла там и рядом не стояло. Мнение собеседника основано на том, что в этом эксперименте Гугла пока что нет возможности как-то отключить этого бота, и в целом запрет на его использование в роботс ни разу не приводит к тому, что поисковик перестает использовать контент сайта для обучения своего ИИ.

А сам список - это список ботов какого-то чувака из ЮАР с Гитхаб.

Развели флуда на 12 страниц.

Токен Google-Extended для файла robots.txt указывает сканерам Google включить сайт в поиск, но не разрешает использовать сайт для обучения системам ИИ, подобным тем, которые лежат в основе чат-бота Bard и Vertex AI, в том числе и для будущих поколений ИИ-моделей компании.
Всего: 1389