Запретить сканирование как ?

123 4
P
На сайте с 17.08.2025
Offline
12
#11
 но и траста сайту подобная проблема явно не добавляет

Считаю то что и не убавляет. 

Genius Ideaing
На сайте с 12.02.2024
Offline
112
#12
alaev #:

User-agent: *

Disallow: /users/

Disallow: /offers/

Disallow: /chat/

увы, Disallow - только рекомендация. боты вправе их как учитывать, так и не учитывать...

Дешёвый хостинг и домены: https://clck.ru/3FxXCa / Заработок в $$$ на трафике сайта! Не РСЯ/AdSense: https://clck.ru/3REcmY / Есть Идеи! Ищу людей для совместного воплощения этих идей в Интернете! Мой Telegram: https://clck.ru/396JFF
Vladimir SEO
На сайте с 19.10.2011
Offline
2083
#13
Директива эта не работает в Гугл ( клин парам) 

Что бы не сканировал гугл бот - нужно удалить все ссылки в коде на эти страницы 

от сканирования помогает только роботс тхт , но страницы могут попадать в индекс из-за трафика на них 

Эксперт по продуктам Google https://support.google.com/profile/58734375 ᐈ Продвижение коммерческих сайтов https://kulinenko.com/
LEOnidUKG
На сайте с 25.11.2006
Offline
1778
#14

Ещё как вариант можно бахнуть canonical на главную страницу каждого раздела + выводить ссылки на эти мусорные страницы через JS, чтобы боты меньше их кушали.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
JJwar
На сайте с 16.06.2009
Offline
152
#15
Стас Рахимов #:
Ну и пусть сканирует, в чём проблема? Они же не попадают в поисковый индекс.
раньше за подобное - поисковики жёстко банили сайты, с формулировкой "Сайт создаёт излишнюю нагрузку на сервера поисковой системы". Сейчас поисковики не банят сайт, но и траста сайту подобная проблема явно не добавляет.
JJwar
На сайте с 16.06.2009
Offline
152
#16
Mik Foxi #:
сейчас тоже за такие страницы яндекс вносит сайт под фильтры за "малополезный контент". такой мусор в роботс надо запрещать.
в роботсе я запретил, но яндекс-бот всё равно к ним обращается
JJwar
На сайте с 16.06.2009
Offline
152
#17
Стас Рахимов #:

Ну так он хочет, чтобы робот их вообще не дёргал, как я понял.

Робот их будет в любом случае дёргать, даже если запретить во всех местах.

А если я не понял, то вообще проблема не является проблемой.

Да, скорее всего проблема не решаема на данный момент, с платонами устал уже переписываться, горбатого лепят двадцать писем подряд. Раньше, 10-15 лет назад было просто - прописал в роботсе запрет и всё, бот даже не пытался сканировать.  

Думаю, проблема таки является проблемой: с тех пор как поисковики начали пытаться сканировать десятки тысяч этого мусора - рост сайта в обоих поисковых остановился. Совпадение ? Не думаю.

JJwar
На сайте с 16.06.2009
Offline
152
#18
LEOnidUKG #:

Можете попробовать на таких страницах прописать:

Но при этом надо их открыть в robots.txt чтобы робот увидел, что не надо ничего там сканировать и ходить там по ссылкам.

Убрать в 404 от роботов это не панацея т.к. они будут ходить по ссылкам и кричать, что у вас теперь много 404 ошибок, а это ещё хуже.

Если я уберу из роботса запрет, бот ГАРАНТИРОВАННО будет обращаться к этим страницам. А мне как раз и нужно чтобы он к ним не обращался, не пытался их сканировать.
JJwar
На сайте с 16.06.2009
Offline
152
#19
Стас Рахимов #:

Будут. Тебе это простительно не знать, ты не сеошник, но вот сеошники тут местные - они то должны знать, что бот всё равно будет ходить в этом случае.

В гугле даже есть специальный пункт, который называется "проиндексировано несмотря на блокировку в файле robots.txt"

Вот расскажите, сеошники, как может робот не ходить на эти страницы, при этом индексировать их?

В яндексе тоже, если не ошибаюсь есть такое "директивы в роботсе носят для поискового бота РЕКОМЕНДАТЕЛЬНЫЙ характер"
Mazay
На сайте с 07.11.2009
Offline
157
#20
JJwar #:
в роботсе я запретил, но яндекс-бот всё равно к ним обращается
Ну и что? ПС в любом случае проверяют, нет ли какой чернухи на сайте. 
123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий