PDF - дублировать ли текстовой версией?

K
На сайте с 01.05.2013
Offline
55
611

Есть сайт wordpress и статья на 40 страниц в pdf. Исторически для PDF статьи есть страница с абзацем описания, куда PDF встроен через соответствующий плагин. PDF можно немного оптимизировать правильными заполнениями полей файлов, но, понятно он не конкурент полноценному html.

Если я сделаю на странице html, куда встроен этот pdf, дубль текста pdf в виде честно отформатированного html, будет ли это наказываться со стороны поисковых систем? Отберет ли это трафик из поиска у pdf?

Из теста я вижу, что трафик html страницы вырос за месяц в 4 раза, а вот упадет ли со временем трафик на pdf пока не ясно, и я не уверен в чистоте своего теста. Вопрос важный, так как таких статей много.

Подскажите, пожалуйста, как оно на самом деле работает.

0
На сайте с 21.11.2009
Offline
279
#1

Вот пару интересных статей по поводу PDF:

Один, два

K
На сайте с 01.05.2013
Offline
55
#2

Спасибо за ссылки, 0pium.

Да, примерно то, что описано в статьях и происходит. Pdf действительно собирают какой-то траффик (это видно в google webmaster). Судя по всему, он все равно меньше, чем тот траффик, что статьи собирали бы будь они отформатированы в текстовом виде. Что хуже - пользователь не видит ни фирменного дизайна сайта, ни попапа для сбора email и конвертации в подписчиков. В общем, не просто траффик меньше, он ещё и тратится бессмысленно.

Проблема в том, что надо ещё доказать, что затраты на переверстку pdf в html окупаются. По количеству посещений доказать проще - начальству это понятнее, чем более сложные вещи типа "запоминаемость бренда" и "повторные визиты".

Удалять все pdf, полностью переведя их в html не хочется: часть аудитории любит читать именно в pdf, сохранять статьи на будущее. Вариант с disallow все pdf для роботов интересный. Не уверен, что он лучший, потому что могут искать и именно pdf версию статьи. В выдаче та же самая статья показывается еще на десятке сайтов, которые копируют их у нас, и есть подозрение, что pdf лучше ранжируются при ответе на точный запрос, не знаю почему. Но может этот вариант с disallow действительно лучший. Спасибо за него, я не думал о нем. Второй вариант - оставить в поиске обе версии страницы и дать гуглу выкинуть один из них. Третий - пытаться прописать канонический url с html на pdf, не уверен что в этом есть смысл.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий