CX41 - https://www.hetzner.com/cloud-ru
18,76 € в месяц
0,031 € / час
4 vCPU
16 ГБ RAM
160 ГБ Disk space
20 ТБ Traffic
такой впс в облаке держит 70.000 юзеров в день (7 сайтов на Джумле). А вот график нагрузки на проц, мускуль и память (ну она не показательна, я ее просто под кеш разный отдал)
P.S. эти же сайты пару дней во время перезда висели на CX21 за 6 евро и ничего :))) правда нагрузка была под 80% на проц и памяти не хватало...
Есть еще вариант - сайт на обычном HTTP и блоки видны в мобильных девайсах.
Тогда их встраивает мобильный оператор, тоже известная проблема.
Личится переходом на HTTPS
По моим наблюдениям, пока по HTTP/2.0 ботов менее 0,1%, поэтому все проверки у меня на HTTP/1.1, а HTTP/2.0 я пропускаю свободно, просто торможу через лимит зон на всяк пожарный
Как-то не сочетается у меня в голове "кодер хорошего уровня" и неспособность/нежелание разобраться в современных, популярных движках.
Как я уже писал выше, более чем за год на 50-80.000 юзеров в день я дополнил этот список всего дважды.
Ну а сравнивать быстроту и простоту решений на nginx и php даже смысла нет, тем более что мои примеры бесплатны...
А есть третий вариант? :))) Они или кладут или че-то тырят с вашего сайта и лично я с этим мериться не намерен!
Кому интересно - вот топ 10 хитроботов, маскирующихся под ботов Гугла и Яндекса, но таковыми не являющимеся. (слева кол-во запросов за 4 дня)
А теперь цитрую ваш же сайт
Т.е вам собирать белые списки можно - а мне руки отрубать? :))))
Пользуюсь этим списком более года - траф только растет. Сайты добавлены в кабинеты вебмастеров гугла и яндекса и ниразу не было сообщений о проблемах сканирования.
У меня есть отдельные логи для ботов поисковиков - так самый посещаемый сайт сканируют чуть ли не каждую секунду и в этом логе только 200-е ответы.
У меня есть так же отдельный лог для "возможно бот поисковика" - где собираются запросы от подсетей НЕ посиковиков, но с юзерагентом поисковиков.
Их я пока иногда проверяю вручную, и за год нашел еще парочку реальных IP поисковых ботов и добавил в белый список.
А вскоре я автоматизирую этот процесс и вообще не буду туда лазить.
P.S. аа ну все понятно :))) увидел вашу подпись.... мешаю бизнесу да? :)))
Не вижу смысла засирать аптейблс.
Где я на 100% уверен что бот - отдаю 444 ошибку (просто разрываю соединение, nginx этого действа вообще не чувствует, это совершенно его не нагружает.
Например
или
Таким сразу
остальных торможу через limit_req_zone или отправляю на гугл капчу.
P.S. вот Оптимизайка предлагал еще одно оригинальное решение /ru/forum/958253
если в кратце - блокируются через апсет подсети всех крупных датацентров мира. Ведь 90% мусорного трафика идет как раз с разных серверов (не с домашних компов).
Я юзал его решение почти год - полет был нормальный рекомендую.