Google может определять дублированный контент ещё до сканирования

Во время последней видеовстречи для вебмастеров сотрудник Google Джон Мюллер рассказал, что поисковик способен определять дублированный контент ещё до того, как он будет просканирован.

Один из участников встречи поинтересовался, может ли Google расценивать франкоязычную версию страницы как дубликат англоязычной, и если да, то в каких случаях это возможно.

Мюллер ответил следующее:

«Иногда мы проактивно признаём, что что-то, вероятно, является дубликатом – ещё до того, как это просканируем…

Например, на странице имеется языковой параметр, который вы может задать для любого термина, и мы можем пройти и попробовать что-то вроде «language=English», «language=French», «language=German» …, если мы обнаружим, что все эти страницы показывают англоязычный контент, за исключением, например, «language=Spanish», тогда мы можем предположить, что этот языковой параметр не имеет отношения к этой странице, и тогда мы можем пропустить ту страницу, которая на самом деле содержит уникальный контент».

Если отойти от ситуации с разными языками, то Мюллер заявил, что Google может определять дублированный контент, если страница содержит те же параметры URL, что и страницы, которые не отличаются друг от друга.

При этом стоит учитывать, что возможны случаи, когда и страницы с уникальным контентом содержат одинаковые параметры URL, а не только дубликаты.

Чтобы избежать проблемы с тем, что Google расценивает страницы с уникальным контентом как дубликаты, рекомендуется уделять внимание тому, как генерируются параметры URL на сайте.

Мюллер также добавил, что за ситуации с ошибочным определением страниц как дубликатов не всегда ответственны вебмастера. Иногда это могут быть собственные «баги» Google.

Прослушать вопрос к Мюллеру и его ответ на него можно, начиная с отметки 27:38 на видео ниже:

https://youtu.be/RAtHrze2ijk

Напомним, что Google не наказывает сайты за дублирование контента в разных форматах, а также не видит проблемы в дублировании PDF-файлом содержимого страницы.

А в марте 2016 года сотрудник Google Гэри Илш заявил, что вебмастерам вообще не стоит беспокоиться о дублировании контента на сайте.

Источник: Search Engine Journal
subscribe

Подпишитесь на рассылку SearchEngines

— Статьи мировых экспертов

— Аналитические обзоры

— Важные новости

— Горячие темы с нашего форума

preview Клименко о технической готовности к отключению от глобальной сети и о хранении данных в России

Клименко о технической готовности к отключению от глобальной сети и о хранении данных в России

Советник президента РФ по вопросам развития интернета Герман Клименко считает, что отключение страны от глобальной сети, если оно произойдет, не должно сказаться ни на жизни...
preview МКБ стал доступен в Директе всем желающим

МКБ стал доступен в Директе всем желающим

Обновленный медийно-контекстный баннер вышел из закрытой беты и стал доступен в Директе
preview Google AdWords будет закрывать аккаунты, неактивные более 15 месяцев

Google AdWords будет закрывать аккаунты, неактивные более 15 месяцев

Начиная с 26 марта, Google AdWords будет закрывать аккаунты, владельцы которых в течение 15 месяцев не покупали рекламу
preview Яндекс улучшил защиту от майнинга в своём браузере

Яндекс улучшил защиту от майнинга в своём браузере

Яндекс сообщил о запуске новой версии защиты от скрытого майнинга в своём браузере
preview Bing начал поддерживать синтаксис микроразметки JSON-LD

Bing начал поддерживать синтаксис микроразметки JSON-LD

Поисковая система Bing начала поддерживать синтаксис JSON-LD для разметки структурированных данных. Об этом сообщил SEO-аналитик Джон Хеншоу (Jon Henshaw) в Twitter
preview YouTube Studio выходит из беты с тремя новыми метриками

YouTube Studio выходит из беты с тремя новыми метриками

YouTube объявил, что YouTube Studio выходит из беты и в ближайшие две недели станет доступен всем владельцам каналов