Копии сайта с порно-доменами в Google

12
REDGROUP
На сайте с 26.05.2021
Offline
14
840
Всем привет, буду благодарен за любой совет и подсказку. Суть проблемы следующая: пару месяцев назад обнаружили копии нашего сайта в гугле с различными порно-доменами, у них была тупо указана А-запись в ДНС-записях на IP-адрес нашего сервера, мы исправили этот косяк в настройке сервера и они уже более 2-х месяцев недоступны, но при этом в поисковой системе Google, они до сих пор есть, что в таком случае необходимо делать, чтобы исправить эту ситуацию? Спасибо.
iOweYouNothing
На сайте с 08.01.2011
Offline
195
#1

Есть три варианта:

1. просто ждать - не самый лучший;

Если остались А-записи в вашу сторону:

2. оставить на сервере www-домен, но залить туда ответ 404 - это уже интереснее чем п.1, но не так быстро;

3. оставить на сервере www-домен, но залить туда редирект 301 на "псевдоморду" с каким-то шлаком - это самый быстрый вариант вывалить страницы из индекса ПС.

3.1 полить ссылок на п.3 чтобы ещё быстрее бот забегал :)

3.2. в сёрчконсоли подтвердить права на эти самые порно-домены и там на выбор: либо сделать "удаления" или через IndexingAPI переиндексить п.2 или п.3.

W1
На сайте с 22.01.2021
Offline
306
#2
REDGROUP :
при этом в поисковой системе Google, они до сих пор есть

По-видимому, бот не получает ответа от сервера, поэтому не может переиндексировать сайт, и ждёт, когда тот появится. Как отметили выше, нужно дать ему ответ - тогда он быстрее выкинет из индекса ваш контент.

Мой форум - https://webinfo.guru –Там я всегда на связи
REDGROUP
На сайте с 26.05.2021
Offline
14
#3
webinfo #:

По-видимому, бот не получает ответа от сервера, поэтому не может переиндексировать сайт, и ждёт, когда тот появится. Как отметили выше, нужно дать ему ответ - тогда он быстрее выкинет из индекса ваш контент.

Подскажите пожалуйста, а что если у меня запросы к 80/443 идут через подсети защиты (iptables правила), соответветственно они просто бесконечно грузятся (эти левые домены), без какого-либо ответа сервера, что в таком случае делать? Или если я это сделаю на сервере (например return 403;), разве они всё равно получат ответ?

W1
На сайте с 22.01.2021
Offline
306
#4
REDGROUP #:
разве они всё равно получат ответ?

Какой ответ они получают, Вы сами можете проверить, сделав запрос на адрес с соответствующим доменом. Лучше отдавать 301 или 404.

Mik Foxi
На сайте с 02.03.2011
Offline
1133
#5
разрешить открываться этим доменам на вашем сервере, только показывать другой сайт заглушку. внутряк чтоб отдавал 404. добавить в гугл вебмастер их, подтвердив через файл, и повыкидывать через него из индекса.
Универсальный антибот, антиспам, веб файрвол, защита от накрутки поведенческих № 1 в рунете: https://antibot.cloud/
REDGROUP
На сайте с 26.05.2021
Offline
14
#6
Mik Foxi #:
разрешить открываться этим доменам на вашем сервере, только показывать другой сайт заглушку. внутряк чтоб отдавал 404. добавить в гугл вебмастер их, подтвердив через файл, и повыкидывать через него из индекса.

Часть из этих доменов, как выяснилось... Направлены вообще уже на другие айпи-адреса, но в гугле всё равно висит копия нашего ресурса. Что в таком случае делать?

REDGROUP
На сайте с 26.05.2021
Offline
14
#7
webinfo #:

Какой ответ они получают, Вы сами можете проверить, сделав запрос на адрес с соответствующим доменом. Лучше отдавать 301 или 404.

Подскажите пожалуйста, почему именно 301 или 404? Если я сделаю deny all; в Nginx и им будет отдавать 403-ую ошибку, почему это плохо? 

W1
На сайте с 22.01.2021
Offline
306
#8
REDGROUP #:

Подскажите пожалуйста, почему именно 301 или 404? Если я сделаю deny all; в Nginx и им будет отдавать 403-ую ошибку, почему это плохо? 

Если сказать честно, я не настолько вникал в особенности индексации, чтобы дать уверенный ответ. На мой взгляд, если робот получает ответ 404 - это означает, что страница не найдена, и её надо выкинуть из индекса; если робот получает ответ 301 - то он индексирует страницу с новым адресом. То есть это прямые указания на изменение индекса. А ответ 403 интерпретируется как "Ошибка сканирования", и если это первичное сканирование, то страница в индексе не появляется. А вот если она уже находится в индексе - то тут я не могу сказать, что робот с ней сделает.

REDGROUP
На сайте с 26.05.2021
Offline
14
#9
webinfo #:

Если сказать честно, я не настолько вникал в особенности индексации, чтобы дать уверенный ответ. На мой взгляд, если робот получает ответ 404 - это означает, что страница не найдена, и её надо выкинуть из индекса; если робот получает ответ 301 - то он индексирует страницу с новым адресом. То есть это прямые указания на изменение индекса. А ответ 403 интерпретируется как "Ошибка сканирования", и если это первичное сканирование, то страница в индексе не появляется. А вот если она уже находится в индексе - то тут я не могу сказать, что робот с ней сделает.

Звучит логично, спасибо большое. Как думаете, за какой промежуток времени с 404 их выкинет из ПС?

W1
На сайте с 22.01.2021
Offline
306
#10
REDGROUP #:

Как думаете, за какой промежуток времени с 404 их выкинет из ПС?

Вещь непредсказуемая, зависит от того, когда робот снова зайдёт на эту страницу. Может и месяцами висеть запросто. Именно поэтому выше советовали удалять непосредственно через вебмастер. Но это было возможно, пока домены не переписали на другие IP (собственно, для этого и затеваются подобные схемы). Теперь через вебмастер не получится, потому что не сможете верифицироваться.
НО! Вы и 404 не сможете отдать, если домены перекинули на другие IP, так что только ждать.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий