Яндекс долго обходит сайт

Z
На сайте с 09.05.2009
Offline
116
zac
1929

Всем привет. 

В начале февраля яндекс в вебмастере пометил что несколько тысяч страниц на сайте имеют одинаковые заголовки и описания (страницы пагинации интернет магазина), я уникализировал их путем добавления приставки "страница 2" "страница 3" и тд

Прошел еще месяц-полтора, яндекс снизил количество таких страниц процентов на 10%. Потом вообще начал запихивать такие старницы в НКС. Я закрыл страницы пагинации тегом 

<meta name="robots" content="noindex,follow"/>

И вот два месяца он выкидывает по 10-100 страниц в сутки из индекса с пометкой "запрещено тегом ноуиндекс" но при этом добавляя какие то страницы пагинации все равно в индекс.

При этом так же висит уведомление что несколько тысяч страниц имеют одинаковые заголовки и описания. Хотя они уже как несколько месяцев разные и вообще закрыты от индексации.

Вопрос: почему яндекс так медленно выкидывает страницы и сканирует сайт, и как это исправить?
Причем новые товары он добавляет в индекс в этот же или на следующий день после их размещения на сайте.


Vladimir SEO
На сайте с 19.10.2011
Online
1708
#1
zac :
Вопрос: почему яндекс так медленно выкидывает страницы и сканирует сайт, и как это исправить?
потому что яндекс приболел короной и уже почти год не может нормально обработать редиректы, ноиндекс, 404
Эксперт по продуктам Google https://support.google.com/profile/58734375 ᐈ Продвижение коммерческих сайтов https://kulinenko.com/
Антоний Казанский
На сайте с 12.04.2007
Offline
616
#2
zac :
Вопрос: почему яндекс так медленно выкидывает страницы

Потому что у Яндекса свои приоритеты в индексации и инструкции Disallow: /адрес страницы, а также noindex, nofollow всего лишь рекомендация.

Для оптимизации индексации нужно:

а) соблюдать корректные данные в <lastmod>  в xml карте сайте

б) вручную заниматься вопросами переиндексации сайта (добавлять страницы на переобход поисковым роботом)


zac :
И вот два месяца он выкидывает по 10-100 страниц в сутки из индекса с пометкой "запрещено тегом ноуиндекс" но при этом добавляя какие то страницы пагинации все равно в индекс.

Именно так, потому что приоритет добавления новых страниц выше, чем переобход старых менее приоритетных.


zac :
При этом так же висит уведомление что несколько тысяч страниц имеют одинаковые заголовки и описания.

Пока не обновятся данные, уведомление так и будет висеть.


zac :
Хотя они уже как несколько месяцев разные и вообще закрыты от индексации.

Они могут хоть пол года быть закрыты и так до конца и не обновлены. Как я написал выше, нужно самостоятельно стимулировать этот процесс.

√ SEO продвижение https://akazansky.ru - экспертный аудит сайтов ( https://akazansky.ru/audit-sajtov ), внедрение эффективных решений цифрового маркетинга. Обучение автоматизации с помощью Zennoposter https://goo-gl.me/6Zypu
Vladimir SEO
На сайте с 19.10.2011
Online
1708
#3
Антоний Казанский #:
noindex, nofollow всего лишь рекомендация.

это не рекоменда, это правило

в случае ТС просто используется старая база - он может посмотреть дату рядом с залетевшей страницей и увидит там старую

Антоний Казанский #:
б) вручную заниматься вопросами переиндексации сайта (добавлять страницы на переобход поисковым роботом)

ты же знаешь что когда тысячи страниц никто вручную делать не будет 

Антоний Казанский
На сайте с 12.04.2007
Offline
616
#4
Vladimir SEO #:
это не рекоменда, это правило

Это инструкция, которая определённое время может игнорироваться. Недавний эксперимент - полный спрос индексации Disallow: / - три недели сайт видел в индексе, более того, прибавлял в индексе те страницы, которые были дополнительно указаны noindex, nofollow.

И только после принудительного переобхода страницы начали исключаться из индекса.

Vladimir SEO #:
ты же знаешь что когда тысячи страниц никто вручную делать не будет 

Я - делаю, и многие мои коллеги делают. Определяют порядок приоритетности и делают.

Кол-во - это не причина не делать. Кол-во - это условиe для определения порядка обработки.

Vladimir SEO
На сайте с 19.10.2011
Online
1708
#5
Антоний Казанский #:

Это инструкция, которая определённое время может игнорироваться. Недавний эксперимент - полный спрос индексации Disallow: / - три недели сайт видел в индексе, более того, прибавлял в индексе те страницы, которые были дополнительно указаны noindex, nofollow.

И только после принудительного переобхода страницы начали исключаться из индекса.

она не может игнорироватся при посещении роботом. А вот при закрытии для сканирования - то робот просто может не доходить туда ))
Антоний Казанский
На сайте с 12.04.2007
Offline
616
#6
Vladimir SEO #:
она не может игнорироватся при посещении роботом.

Я тоже так считал, но вот недавний пример.

В 20-х числах сайту полностью была запрещена индексация на уровне robots и в мета постранично, а межу тем 31-го числа,

и я этому тоже очень сильно удивился. Поэтому теория - теорией, а практика вносит свои нюансы и коррективы.


Vladimir SEO #:
А вот при закрытии для сканирования - то робот просто может не доходить туда ))

Здесь - да.

kustov
На сайте с 23.04.2021
Offline
61
#7
Антоний Казанский #:

В 20-х числах сайту полностью была запрещена индексация на уровне robots и в мета постранично, а межу тем 31-го числа,

В мае и июне Яндекс часто откатывал базу.  Был замечен вылет уже закрепившихся страниц и возвращение в ТОП уже удаленных и забытых.

Vladimir SEO
На сайте с 19.10.2011
Online
1708
#8
Антоний Казанский #:

Я тоже так считал, но вот недавний пример.

В 20-х числах сайту полностью была запрещена индексация на уровне robots и в мета постранично, а межу тем 31-го числа,

там есть колонка третья - "последнее посещение" - вот ее смотри
Антоний Казанский #:
запрещена индексация на уровне robots и в мета постранично
не индексация а сканировка , стандартная ошибка сео . Запрещаем сканить в роботсе  и ставим мета ноиндекс который не видят пс)))) и удивляемся а чего же оно не работает ))) если ставишь но индекс - то открывай в роботсе, я удивлен что ты этого не знал, это основы
Антоний Казанский
На сайте с 12.04.2007
Offline
616
#9
Vladimir SEO #:
не индексация а сканировка , стандартная ошибка сео . Запрещаем сканить в роботсе  и ставим мета ноиндекс который не видят пс)))) и удивляемся а чего же оно не работает ))) если ставишь но индекс - то открывай в роботсе, я удивлен что ты этого не знал, это основы

Валишь всё в одну кучу и индексирование, и следование по ссылкам, речь не об этом.

Еще раз - сайт был полностью запрещен, о чём Вебмастер вывел соответствующее уведомление. Это был сброс индексации глобальный. Но при этом некоторое время в индекс ещё залетали страницы. Почему залетали? Потому что инструкция Вебмастера - это одно, а порядок обработки накопленных данных Яндексом - другое.


Vladimir SEO #:
там есть колонка третья - "последнее посещение" - вот ее смотри

Там могут быть данные полугодовой давности и поэтому сколько на них не смотри, свежее от этого они не станут. Однако замечание верное, потому что первичен и более приоритетен сигнал который есть у поисковика, поэтому на текущий Disallow или noindex, nofollow ему пофиг, до момента принудительного переобхода. 

И дело тут в порядке следований инструкций, поэтому у TC и тянется всё это месяцами, а указанные noindex по факту является не более, чем рекомендацией в общей череде обработки данных.

Итого: принудительный переобход смещает фокус поисковика для обработки данных, именно поэтому данную процедуру нужно выполнять вручную, потому как ноуиндексы - это не более, чем доп. атрибут страницы, потому как фактическое состояние - это одно, а обработка старых данных, которая исполняется после ноуиндекса - другое. 

МА
На сайте с 02.11.2018
Offline
167
#10
Антоний Казанский #:

Валишь всё в одну кучу и индексирование, и следование по ссылкам, речь не об этом.

Еще раз - сайт был полностью запрещен, о чём Вебмастер вывел соответствующее уведомление. Это был сброс индексации глобальный. Но при этом некоторое время в индекс ещё залетали страницы. Почему залетали? Потому что инструкция Вебмастера - это одно, а порядок обработки накопленных данных Яндексом - другое.


Там могут быть данные полугодовой давности и поэтому сколько на них не смотри, свежее от этого они не станут. Однако замечание верное, потому что первичен и более приоритетен сигнал который есть у поисковика, поэтому на текущий Disallow или noindex, nofollow ему пофиг, до момента принудительного переобхода. 

И дело тут в порядке следований инструкций, поэтому у TC и тянется всё это месяцами, а указанные noindex по факту является не более, чем рекомендацией в общей череде обработки данных.

Итого: принудительный переобход смещает фокус поисковика для обработки данных, именно поэтому данную процедуру нужно выполнять вручную, потому как ноуиндексы - это не более, чем доп. атрибут страницы.

Тебе Вован прально всё выше распедалил, а ты как уж на сковороде опять начинаешь свой факап замыливать тысячей бесполезных слов.

Nokia x71 (https://x71.ru/) - хороший смартфон, и отзывы интересные

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий