PDF RTF и т.д.

T.R.O.N
На сайте с 18.05.2004
Offline
314
288

Есть такой вопрос.

Я индексирует документы PDF, RTF и подобные, но больше вопрос именно по этим двум.

В начале поделюсь наблюдением.

По средне и ни зкочастостникам можно в топе встретить именно такие документы. Сокорее всега там действуют те-же факторы, что ина страницы "версия для печати" (мало мусора, мало ссылок, много смыслового текста).

Теперь собственно вопрос.

1. Применяется ли к документам ссылочное ранжирование? Если да, то считаются внешние ссылки куда?

2. формат PDF может содержать ссылки в документе. Понимает ли Я их?

3. Какие способа выделения текста понимает Я и использует для индексации?

PS провел свои эксперементы, но по их результатам не получил более- мение разумительного ответа

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
[Удален]
#1

T.R.O.N,

1. Скорее всего да, т.к. для Яндекса это точно такие же документы, как и обычные html

2. Теоретически да. Если знаете pdf, содержащий ссылку, то легко проверить через расширенный поиск (ссылающиеся документы).

3. Это уже вопрос к Яндексу. Экспериментально это будет сложно обнаружить.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий