Как индексируются pdf файлы?

X
На сайте с 26.04.2008
Offline
38
#21

Может я ошибаюсь, но кажется в Acrobat 8.0 есть функция авто форматирования в html.

Не страшно родиться дураком, страшно умереть идиотом.
Lem625
На сайте с 11.02.2007
Offline
134
#22

Вот вот. Все что-то и где-то слыхали.

И встроенные возможности в Акробате есть и плюгины вероятно есть - но все конвертации приводят к тому, что html получается безобразно кривым.

Кто достоверно пользовался, знает способ получить корректный html файл с сохранением (хотя бы базовым) форматирования текста, взаимного расположения картинок, в кодировке например charset=windows-1251 -

пожалуйста отпишитесь, поделитесь опытом.

chuprun
На сайте с 07.11.2007
Offline
113
#23
Слава Шевцов:
Вы там что курите, уважаемые оптимизаторы pdf-документов под Яндекс?

Все что-то чего-то курят:)

мм а где сказано про Яндекс? Я про google к примеру

Там по заголовкам НЧ вылазит при отсутствии большой точной конкуренции

так вот, почему бы опять же в pdf не смотреть плотность ключевиков?

Maxiz
На сайте с 04.01.2008
Offline
208
#24

Adobe Acrobat Pro Extended

drv - я пишу про 9 pro версию ,а не про обычный "Акробат ридер 5"

ещё Abby Fine reader (последний) умеет - там поподробнее настройки экспорта в ХТМЛ

Maxiz добавил 07.07.2008 в 11:36

Вообще конечно странные вопросы на форуме поисковых систем. Если погуглить ,то можно обнаружить существование таких прог, как:

Advanced PDF to HTML

Comfortable PDF to HTML

Easy PDF to HTML

center
На сайте с 18.01.2008
Offline
26
#25

юзаем онлайн конвертер от адоба

http://www.adobe.com/products/acrobat/access_onlinetools.html

Adobe PDF Conversion by Simple Form
To convert an Adobe® Portable Document Format (PDF) file to HTML or text, simply type a URL for an Adobe PDF document into this electronic form and select "Convert". The Adobe PDF document will be converted and returned to you in your browser application. Depending on the complexity of the document and the number of requests being made on the server at the time, the conversion process may take a while.
Lem625
На сайте с 11.02.2007
Offline
134
#26
Maxiz:
Adobe Acrobat Pro Extended
drv - я пишу про 9 pro версию ,а не про обычный "Акробат ридер 5"
ещё Abby Fine reader (последний) умеет - там поподробнее настройки экспорта в ХТМЛ

Maxiz добавил 07.07.2008 в 11:36
Вообще конечно странные вопросы на форуме поисковых систем. Если погуглить ,то можно обнаружить существование таких прог, как:
Advanced PDF to HTML
Comfortable PDF to HTML
Easy PDF to HTML

Вообще-то странные ответы, "на форуме поисковых систем" 🚬

Если погуглить можно найти много чего. Потом этим "много чем" можно долго пробовать экспериментировать в поисках корректного результата.

Интересен как раз опыт использования.

У меня корректно перегнать pdf -> html не получилось, честно признаюсь. Все попытки приводили к очень корявым файлам, которые приходилось очень сильно дорабатывать "ручками".

А если речь шла про газеты - быстрее и проще оказывалось из исходника (Файла верстки, например. А не из pdf) сохранить размеченный тегами текст, конвертнуть эти теги разметки в теги HTML макросом и вставить картинки.

Может конечно, я не особо напрягался с тем, чтоб разобраться с конвертацией (когда исходная верстка есть - с ней проще оказалось). Но... зачем в принципе изобретать велосипед?

Хочется услышать (с подробностями - "чем" и "как") тех, у кого корректно, с минимальными потерями, получалось это сделать...

[Удален]
#27

Google отлично индексирует PDF. так что не волнуйтесь

Maxiz
На сайте с 04.01.2008
Offline
208
#28

да, но вот какйо вес придаётся PDF файлам ? То ты страничками на сайте информацию размещаещь - это одно, а когда в PDF это другое, не придаётся ли PDF'у намного меньшее значения при ранжировании сайта, нежели контенту в ХТМЛ формате ?

voodoo911
На сайте с 11.03.2008
Offline
157
#29

Врое как все правила что и для хтмл рулят и для пдф, даже ПР льется. (http://sps.ru/file/0034/6516/index.pdf)

Я думаю все равнозначно.

Тут вопрос релевантности, сами понимаете.

Относительно текста: вычатл на гугле такую тему, мол если вы в акробате нажмете найти и введете чать слова (текста) и поиск определет их - значит и ПС распознает данный текст.

Слава Шевцов
На сайте с 23.07.2005
Offline
370
#30
chuprun:

так вот, почему бы опять же в pdf не смотреть плотность ключевиков?

А смысл? PDF делается только для людей. Если начнёте затачивать документы реалього мира под поисковики, Вас могут неправильно понять 🚬

Неизменность точки зрения неизменно порождает иллюзию понимания.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий