Наличие на сайте большого количества файлов PDF, содержимое которых дублирует контент со страниц, не должно негативно отражаться на позициях ресурса. Об этом сообщил представитель Google Джон Мюллер (John Mueller) в ответ на вопрос специалиста.
@davebuts I don't see a problem with that. If your users are also consuming your content like that, then go for it.
— John Mueller (@JohnMu) 11 августа 2016 г.
Если владелец сайта предложит пользователю загрузить PDF с описаниями, доступными на страницах, контент при индексировании не будет считаться дублированным. Во многом такой подход к вопросу обусловлен удобством восприятия содержимого подобных файлов пользователями.
Google начал индексировать PDF-файлы ещё в 2001 году. Сейчас в индексе поисковой машины находятся миллиарды таких файлов. В 2011 году представители поиска опубликовали FAQ, в списке нашли отражение вопросы о том, как Google относится к ссылкам в PDF-документах, как предотвратить появление PDF-файлов в результатах поиска, как повлиять на показ заголовка документа и другие.
Около года назад аналитик и инженер отдела качества поиска Google Гэри Илш (Gary Illyes) заявил о том, что ссылки в PDF-документах действительно передают PageRank.