Антоний Казанский

Антоний Казанский
Рейтинг
787
Регистрация
12.04.2007
Должность
Частный интернет-маркетолог и SEO специалист
Интересы
Интернет-маркетинг, SEO, интернет реклама
Подробности на сайте https://akazansky.ru
Andrew666 #:
Исключено наличие внутренних, внешних ссылок и иных источников уже год

Не должно быть без причин таких аномалий, надо разбираться в чём дело.

Наверняка что-то упустили.

Дайте доступы, посмотрю.

Anarion #:
А я расскажу про характер этой личности. Бесплатно.

Что-то случайно угадаете, что-то нет. Но совершенно точно не сможете описать так, чтобы каждого слово в точности соответствовало.

Всё это приблизительно и размыто. Тем же самым занимается физиогномика.

Andrew666 #:
Увы, суровая реальность яндекс бота. ИМЕННО ЯНДЕКСА. Гугл, бинг и прочее туда не идет без недели год.

Это не отменяет вышенаписанное. Здесь важно понять, что любые рабочие процессы запрограммированы и все они имеют причинно-следственные связи. 

Просто так Яндекс не будет тратить ресурсы на обход бесполезных URL-ов, если робот ходит, значит есть стартовые импульсы туда идти и этот импульс не возникает на пустом месте. Значит есть источники, которые ссылаются на давно удалённые вами страницы.

Скорее всего это генерируется в результате не удалённых данных, либо других ошибок в навигации, которые генерируются в коде, а в видимой части сайты вы их не видите.

Andrew666 #:
Как мою проблему связать с вашей подсказкой так и не понял

Еще раз.  Значит есть источники сигналов, которые провоцируют поисковых роботов.

Сканируйте сайт, изучайте код, наверняка где-то в слепой для вас зоне движок продолжает генерировать ненужные URL.

Полтора года слишком большой срок, чтобы хранить в очереди короткий рабочий эпизод.

Уверен, есть ссылки, которые провоцируют эти переходы, просто так робот ходить не будет, ищите.

Vladimir #:
Он написал причину))

Мой предыдущий ответ был не в адрес ТС, а для Andrew666. 

Andrew666 #:
Год разными методами выгоняю и ничего. Год же, а не вот вот.
Andrew666 #:
я говорю про ботов яндекса из всех щелей, которым год на все пофиг

Значит есть источники сигналов, которые провоцируют поисковых роботов.

Сама по себе ПС по левым адресам их не генерирует, должны быть причины. А причин масса - внешние ссылки, внутренние ссылки (особенно что касается адресации, которые генерируют шаблоны, компоненты и т.д.). 

Andrew666 #:
Все равно ходит, пробовал. Дошел даже до 410 ответа. Ничто ему не указ.

Верно. Рабочая очередь - это уже то, что принято к исполнению.

p.s. Многократно сталкивался.

Вот конкретно сейчас рабочая ситуация - написал ТЗ-шку программисту поправить сломавшийся sitemap.xml (по этого всё нормально работало), а программист никому ничего не говоря вообще решил обновить шаблон Аспро Битрикса и затянул туда кучу рекламных данных. Я смотрю у меня на дня в индекс пачками полетели левые разделы, которые после обновления насоздавались в каких-то абсолютно левых разделах. Cмотрю в новый sitemap.xml - а там весь этот мусор тоже подключен.

Всё закрыл, всё удалил, всё поправили, нигде левых данных нет, а Яндекс всё равно ходит по левым адресам. Бестолково и бессмысленно ходит, получая 410, а всё равно ходит, потому что очередь на переобход уже создана. 

И обновление рабочих данных пока не помогает. Впрочем, нестрашно, походит и успокоится.

Vladimir #:
Уменьшите обьем страниц при обходе поискового робота — настройте last-modified
скорость обхода при этом можно оставить максимальной

Настройка Last-Modified и Last-Modified Since не помогут, когда очередь на индексацию уже сформирована.

Last-Modified и прочие <lastmod>-ы - это настройки следующего порядка. 

Есть существенная разница между обработкой рабочей очереди и учётом новых правил в работе поискового робота.


Vladimir #:
...левый sitemap удалили?
Положите назад, без спам ссылок, отправьте на переобход

Здесь согласен, об этом выше сказал.

Paradine :
Дело в том, что календарь (таблица с датами) выводится на js на стороне клиента. То есть поисковому роботу может быть не видна.

Ничто не мешает проверить. Сначала через содержание кэша, потом через запросы путём использования прямых цитат с содержанием табличных данных.


Paradine :
Вопрос: важна ли для сео сама таблица?

Как форма - нет, как содержание - да, если там есть целевая информация.


Paradine :
И тогда её нужно рендерить на стороне сервера

Если есть возможность - лучше рендерить, если нет - лучше эту возможность организовать :)


Paradine :
Или для поисковиков важен только текст на странице, заголовки, метатеги?

Табличные данные - это и есть текст на странице. 

Seveteen :
На ЦП хоста идет значительная нагрузка из-за роботов Яндекса. Своего рода ДДос от Яндекса, что с этим делать мыслей нет

Попробуйте изменить скорость обхода поискового робота,


В остальном, если ПС очередь на обход уже сформировала, то она будет его обрабатывать, пока не исчерпает полностью.

Повлиять на неё можно только приоритетным переобходом других страниц, но это ничего не даст, пока заданная не исчерпает свою полноту. Как-то точечно повлиять на неё невозможно. Проверить её также нет возможности.

p.s. Попробуйте пересоздать и перезагрузить свою рабочую sitemap.xml карту. 

Не могу сказать, даст ли это какой-то позитивный эффект в том, чтобы робот перестал ходить по старым адресам, но я бы на вашем месте всё равно попробовал.

Всего: 12572