Google может частично индексировать основной контент страниц

Специалист по техническому SEO и R&D-менеджер Onely Томек Рудзки (Tomek Rudzki) выяснил, что Google индексирует не весь контент тех страниц, которые содержатся в его индексе. 

С помощью программного обеспечения Onely он установил, что Google обычно пропускает части контента, даже если это чистый HTML. Нередко Google индексирует основной контент страниц, а менее важные части, такие как похожие товары или информация о доставке на страницах коммерческих сайтов, пропускает. 

Однако Рудзки выяснил, что Google также может пропускать основной контент. И речь может идти о тысячах частично проиндексированных страниц. 

Так, на сайте крупного ритейлера Target у 23% проиндексированных страниц не проиндексировано описание основного товара. Поэтому Google ранжирует одну из четырёх страниц товаров c Target.com, ориентируясь на другие сигналы, а не основной контент. 

И это, не учитывая 9,28% страниц в файле Sitemap этого сайта, которые не индексируются вообще, даже частично. 

При этом такая ситуация наблюдается не только по Target, но и по ряду других крупных сайтов: 


  • Возможные причины 

По мнению Рудзки, эта ситуация может быть вызвана следующими причинами: 

  • Алгоритмы Google не распознают основной контент. 
  • Google решает, что это дублированный контент. 
  • На стороне Google есть какие-то неизвестные баги. 

Рудзки предполагает, что в случае Target.com причина, скорее всего, во втором пункте. Интернет-магазины обычно используют описания товаров, предоставляемые производителями. Поэтому Google, возможно, сталкивался с этими описаниями ранее, а на этот раз решил их проигнорировать и не индексировать. 

  • Выводы

Для ранжирования страниц Google использует тысячи сигналов. Однако самым важным из них является релевантность. 

Чтобы высоко ранжироваться в Google, нужно убедить поисковую систему, что страница релевантна запросу пользователя. Если же Google не индексирует основной контент страницы, то скорее всего, он не считает её релевантной. 

При этом Рудзки отметил, что это может быть и проблема ранжирования, которое тесно связано с индексированием. 

Со всеми данными исследования можно ознакомиться в блоге Onely

preview WordPress теперь используют 39,6% всех сайтов

WordPress теперь используют 39,6% всех сайтов

Согласно последним данным W3Techs
preview Google Lighthouse теперь рекомендует альтернативные JavaScript-библиотеки

Google Lighthouse теперь рекомендует альтернативные JavaScript-библиотеки

Более оптимальные для использования
preview Общий хостинг всё же влияет на ранжирование в Google

Общий хостинг всё же влияет на ранжирование в Google

Повторное исследование Reboot Online
preview Google запустил функцию запросов на контент Question Hub в США

Google запустил функцию запросов на контент Question Hub в США

Чтобы пользователи могли получать ответы на свои вопросы в поиске
preview Как долго публикации остаются в ленте рекомендаций Google Discover

Как долго публикации остаются в ленте рекомендаций Google Discover

Исследование на основе 6000 URL
preview Сотрудники поиска Google рассказали о планах на 2021 год

Сотрудники поиска Google рассказали о планах на 2021 год

В последнем выпуске подкаста Search Off the Record за 2020 год