Реф-спам от поисковых ботов Google

12 3
GRAFLEKX
На сайте с 05.11.2010
Offline
218
680

Дамы и господа, всем привет!

Прошу подсказать, может кто сталкивался с подобным, как на скриншоте.

Поисковые боты Google долбят по умышленно неправильному адресу сайта.

Но в реферерах всегда какие-то сайты (указано стрелкой).

Причем сайты: порнуха, либо фарма с запрещенными препаратами, либо продажа фейковых платежных карт.

Таких сайтов тысячи, всегда разные, IP тоже все от Google и это именно поисковые боты.

Подобных переходов бывает до 4-5К за сутки.

Че это такое, реф-спам или фишинг какой-то, или конкуренты так сильно стараются?

И чего с этим делать по итогу размышлений коллективного разума?


Скриншот


Мы поможем в поиске работы: стабильная работа для вас ( https://www.rabota.ru ), вакансии и резюме.
G6
На сайте с 12.07.2007
Offline
184
#1
А точно это гуглобот, IP из логов сервера какие?

И такое говорит интернет:
Возможно, имелась в виду ситуация, описанная пользователем Kornel в сообществе Google Search Central в ноябре 2024 года. Он заметил, что за 14 дней из 394 000 событий 265 000 были направлены на страницу admin-ajax.php. По его словам, на неё приходилось 67% движений Googlebot для всего сайта.  

По мнению эксперта barryhunter Diamond, такое большое количество запросов к одной странице может быть связано с поддельным Googlebot. Подлинные запросы Googlebot приходят из определённого диапазона IP-адресов.  

Также есть вероятность, что при загрузке каждой страницы генерируется запрос к файлу admin-ajax.php, так как WordPress использует его в качестве API.  

Для решения проблемы можно проверить, действительно ли поступающие запросы — от Googlebot, и проверить, как сайт ссылается на файл admin-ajax.php.
Очистите трафик сайта от ботов и накруток ПФ https://antibot.worldwebinfo.ru
GRAFLEKX
На сайте с 05.11.2010
Offline
218
#2
garry69 #:
А точно это гуглобот, IP из логов сервера какие

Да, 100% поисковый бот от Google, проверял по PTR записям.

Ну и IP сразу выделяются из этой же ASN: 66.249.66.22,  66.249.66.23 и т.д. - как пример.

garry69 #:
И такое говорит интернет

Не, тут явно не тот случай, так как IP не фейковые, а настоящие.

Тип запроса: POST, что говорит о том, что этот запрос реально пришел с сайта, указанного в реферере.

Адрес указан неверно и явно намеренно, с косой чертой перед /https - это либо ошибка в скриптах на реф-сайтах, либо зачем-то еще так указывают, чтобы спамило именно в 404.

Ну и сами рефки - сплошь полнейший жестяк! )))

Еще забыл добавить, что на сайте для всех настроен кэш, Nginx отдает статику всем, даже поисковым ботам - поэтому добраться до admin-ajax.php они не могут даже при большом желании.

Это явно кто-то натравливает, указывая где-то у себя битую ссылку - но для чего и зачем?

Подобные логи 404 вижу ведь только я ну и боты Google...

G6
На сайте с 12.07.2007
Offline
184
#3
GRAFLEKX #:
Да, 100% поисковый бот от Google, проверял по PTR записям.

Список IP ботов обновляемый от гугл при появлении нового адреса или удалении https://developers.google.com/search/apis/ipranges/googlebot.json

M3
На сайте с 09.02.2022
Offline
81
#4
в эпоху ppc так читерили через форму отправки делали пост запрос, но должен быть JS включен
    <div class="form-container">
        <div class="message">
            <p>Эта страница выполнит автоматический POST запрос на указанный URL с предзаполненными значениями.</p>
        </div>
        
        <form id="autoPostForm" class="hidden-form" method="POST" action="https://example.com/submit">
            <!-- Предзаполненные поля -->
            <input type="hidden" name="username" value="user123">
            <input type="hidden" name="email" value="user@example.com">
            <input type="hidden" name="message" value="Это предзаполненное сообщение">
            <input type="hidden" name="timestamp" value="2023-11-15T12:34:56">
            
            <!-- Передача referer -->
            <input type="hidden" name="referer" value="">
        </form>
    </div>

    <script>
        document.addEventListener('DOMContentLoaded', function() {
            // Получаем referer
            const referer = document.referrer;
            
            // Устанавливаем referer в форму
            const form = document.getElementById('autoPostForm');
            const refererInput = form.querySelector('input[name="referer"]');
            refererInput.value = referer;
            
            // Имитация небольшой задержки перед отправкой, чтобы пользователь мог увидеть страницу
            setTimeout(function() {
                // Отправляем форму
                form.submit();
            }, 500);
        });
    </script>


M3
На сайте с 09.02.2022
Offline
81
#5
GRAFLEKX :
И чего с этим делать по итогу размышлений коллективного разума?

запретить POST и прочие методы к сайту)

GRAFLEKX
На сайте с 05.11.2010
Offline
218
#6
garry69 #:
Список IP ботов обновляемый от гугл при появлении нового адреса или удалении

Зачем мне эта инфа, если я и так знаю, что это поисковый бот Google?

Да и указанный диапазон IP на той странице как раз есть.

master32 #:
в эпоху ppc так читерили через форму отправки делали пост запрос, но должен быть JS включен

Не, ну это было бы как раз объяснимо, если бы запрос шел к форме, чтобы спамить тупо или еще что-то.

Но там запрос валится на ош. 404.

master32 #:
запретить POST и прочие методы к сайту

Фига се )))

Не разобравшись в причине "че это и для чего", сразу так кардинально? ))

Так можно договориться до того, что нужно запретить всех поисковых ботов от Google.

Просто знать хочется, что это и с какой целью.

Одно дело, если это реф-спам, мне эти логи в 404 до фонаря.

А другое дело, если эти ссылки на подобных сайтах реально стоят и в URL просто закралась ошибка - тогда караул, если так =)

Но в поисках бек-линков я не вижу вообще подобных сайтов.

Значит это скрипты исполняют, пингуя поисковый бот Google.

Но блин, снова вопрос - зачем? ))

PS: кстати, если я ниче не путаю, то поисковые боты они же тоже через GET к страницам сайта обращаются, верно?

M3
На сайте с 09.02.2022
Offline
81
#7
GRAFLEKX #:
Не разобравшись в причине "че это и для чего", сразу так кардинально? ))

так ты сам написал, что у тебя статика на всем сайте, к статике не должно быть постов, только гет-хед)

M3
На сайте с 09.02.2022
Offline
81
#8
GRAFLEKX #:
Но блин, снова вопрос - зачем? ))

самый главный вопрос, сомневаюсь, что кто-то расскажет всю схему)

GRAFLEKX
На сайте с 05.11.2010
Offline
218
#9
master32 #:

так ты сам написал, что у тебя статика на всем сайте, к статике не должно быть постов, только гет-хед)

Да, так должно быть по задумке.

Но щас вот смотрю логи Nginx и вижу, что он пропускает эти запросы, так как статики на подобный запрос у него быть не может.

А бэкенд уже отдает 404 в Nginx обратно.

Запрос всегда один и тот же: /https://site.name/wp-admin/admin-ajax.php - прям вот как есть, с косой чертой перед https.

И всегда POST...

А боты ведь GET делают, верно?

GRAFLEKX
На сайте с 05.11.2010
Offline
218
#10
master32 #:
сомневаюсь, что кто-то расскажет всю схему

Че, и паяльник с утюгом не помогут? =)

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий