Как отвадить робота от переобхода мусорных страниц

1 234
WN
На сайте с 22.02.2022
Offline
26
#31
Антоний Казанский #:

Про те, которые формируют страницу.


Практически в любой CMS страница собирается из базовых частей. Самописные кстати тоже.

Суть в том, что при формировании 404 страницы, код Метрики никуда не пропадает.

Более того, в Метрике можно вести отслеживание 404 страниц через цели.

к примеру в вп можно условие сделать отображать метрику на всех страницах кроме 404. просто пример.

Антоний Казанский
На сайте с 12.04.2007
Offline
766
#32
WantNight #:
к примеру в вп можно условие сделать отображать метрику на всех страницах кроме 404. просто пример.

Да, можно. Уверен и на других CMS тоже можно, если будет такая задача. Резонное дополнение.

√ SEO продвижение ► https://akazansky.ru - экспертный аудит сайтов ( https://akazansky.ru/audit-sajtov ), внедрение эффективных решений цифрового маркетинга. Разговоры о SEO и не только: культурно, вежливо, доброжелательно ► https://t.me/seotusovochka
sochi-russia
На сайте с 06.01.2012
Offline
193
#33
Антоний Казанский #:

Да, можно. Уверен и на других CMS тоже можно, если будет такая задача. Резонное дополнение.

Ну как вариант создать эти страницы (каким-нибудь сервисом), сделать 301 редирект внутри каждой на главную, опять придумав как, но как на seo скажется это неизвестно.

Telegram Чат Бот дешёвых авиабилетов https://t.me/Aviaonlinebot Супер Хостинг от 9,20 руб в день https://clck.ru/Rk2P5 🖧 VPS от 19 руб. https://clck.ru/afhGc 🖧 Выделенные СЕРВЕРЫ - БЕСПЛАТНЫЕ плюшки https://clck.ru/YhkZe 🖧 / / Хостинг от 6руб в день! https://clck.ru/Rk2P5
GRAFLEKX
На сайте с 05.11.2010
Offline
226
#34

ТС уже не появляется, а здесь все воду льют любители поговорить )))

По сути - тоже с такой проблемой сталкиваюсь часто.

Решить можно только комплексно, иначе бот так и будет долбить по этим адресам.

1. Отключить на время обход по счетчикам, иначе любой заход по урлу Метрика отправляет как сигнал роботу на переобход. А еще лучше, вообще его отключить, ибо куча мусора идет по сигналам Метрики, с хорошим сайтмапом и структурой, никакой обход по счетчикам не нужен.

2. ЯВМ - Инструменты - Удаление страниц из Поиска - кидаем туда весь список урлов, на которые нужно запретить заход. Понимаю, звучит нелепо, но реально работает как-то так, что робот долбит эти страницы и удалять их нужно именно таким способом. Придется этот список кидать раза три, в течение пары недель. Со временем список сойдет на нет.

3. Если у урлов прослеживается общий путь, то добавить в robots.txt - Disallow маску этих урлов.

Через пару недель все закончится или заметно уменьшится.

Мы поможем в поиске работы: стабильная работа для вас ( https://www.rabota.ru ), вакансии и резюме.
Seveteen
На сайте с 09.11.2007
Offline
131
#35
Всем доброго дня, сейчас посмотрел идет все таки угасание переобхода подобного мусора http://joxi.ru/p27YDa9CZxa9xr уже в день находит менее 100 шт, думается что само сойдет на нет, ну и отключил переобход по счетчику на всякий случай до момента пока эта канитель не кончится, спасибо всем за советы и участие.  
Joxi (159 kb) закачан 5 июня 2023 г. Joxi
Joxi (159 kb) закачан 5 июня 2023 г. Joxi
  • joxi.ru
сделан при помощи Joxi.ru
Задач без решения не бывает. Пришел. Увидел. BMW.
MI
На сайте с 18.08.2021
Offline
55
#36
Seveteen #:
Всем доброго дня, сейчас посмотрел идет все таки угасание переобхода подобного мусора http://joxi.ru/p27YDa9CZxa9xr уже в день находит менее 100 шт, думается что само сойдет на нет, ну и отключил переобход по счетчику на всякий случай до момента пока эта канитель не кончится, спасибо всем за советы и участие.  

Также отключил переобход, вроде стали пропадать давно удаленные страницы. Я так понимаю что по ним ходят боты, а яндекс их естественно переобходит по счетчику и не удаляет

Vladimir
На сайте с 07.06.2004
Offline
604
#37
GRAFLEKX #:

ТС уже не появляется, а здесь все воду льют любители поговорить )))

По сути - тоже с такой проблемой сталкиваюсь часто.

Решить можно только комплексно, иначе бот так и будет долбить по этим адресам.

1. Отключить на время обход по счетчикам, иначе любой заход по урлу Метрика отправляет как сигнал роботу на переобход. А еще лучше, вообще его отключить, ибо куча мусора идет по сигналам Метрики, с хорошим сайтмапом и структурой, никакой обход по счетчикам не нужен.

2. ЯВМ - Инструменты - Удаление страниц из Поиска - кидаем туда весь список урлов, на которые нужно запретить заход. Понимаю, звучит нелепо, но реально работает как-то так, что робот долбит эти страницы и удалять их нужно именно таким способом. Придется этот список кидать раза три, в течение пары недель. Со временем список сойдет на нет.

3. Если у урлов прослеживается общий путь, то добавить в robots.txt - Disallow маску этих урлов.

Через пару недель все закончится или заметно уменьшится.

Комплес работ который яляется бредом. Вместо стандартных решений.
- Включен обход по счетчикам на сайтах - удаляет 404 быстро.
Чем быстрее бот,  дойдет до удаленной страницы, тем быстрее он ее удалит.
- Запретить обход - вы запрещаете боту зайти на страницу и получить 404
- добавить в robots.txt Disallow - вы запрещаете боту зайти на страниицу и получить 404.
Удаленные страницы могут висеть при таком запрете вечно в индексе.

- Уменьшение скорости обхода.  Может оставить ее высокой, а уменьшить количество страниц при обходе сайта.
И сохранить при этом лимиты? И не создавать топики, что роботы кладут сайт из-за 404?
Аэройога ( https://vk.com/aeroyogadom ) Йога в гамаках ( https://vk.com/aero_yoga ) Аэройога обучение ( https://aeroyoga.ru ) и просто фото ( https://weandworld.com )
GRAFLEKX
На сайте с 05.11.2010
Offline
226
#38
Vladimir #:
Комплес работ который яляется бредом. Вместо стандартных решений.

Все это безусловно верно и правильно, но только с нормальным ботом.

У Яндекса бот работает так, как ему вздумается, порой нарушая свои же инструкции.

Vladimir #:
Включен обход по счетчикам на сайтах - удаляет 404 быстро.

Угу... и добавляет еще кучу новых 404, которые нагенерят парсеры и краулеры.

Vladimir #:
Чем быстрее бот,  дойдет до удаленной страницы, тем быстрее он ее удалит.

В случае ТС - это не работает.

Да и вообще у Яндекса часто не работает - он будет долбить эту 404 страницу еще месяц, прежде чем удалит из базы.

M
На сайте с 02.08.2022
Offline
18
#39

В продолжение данной темы, возможно будет интересно кому-то: столкнулся совсем недавно с похожей проблемой. Поизучал логи того, как робот яндекс обрабатывает 404 ошибки и вот что заметил: прежде чем выкинуть страницу из индекса своего и перестать на нее ходить, он делает 3 попытки в течении месяца примерно с такими периодами:

 3я попытка
 31.08.2023
 2я попытка
 04.08.2023
 1я попытка
 23.07.2023

После этого он забывает про нее (про влияние внешних ссылок ничего не могу сказать - на мои страницы ничто не указывало извне и внутренних тоже не было).

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий