Проблемы с индексацией PDF файлов

M3
На сайте с 13.01.2007
Offline
31
1521

Написал в support@yandex.ru

жду ответа , копию выкладываю здесь , хотелось бы услышать мнение местных оптимизаторов, может быть ,уже кто-то сталкивался

Здравствуйте , на нашем сайте http://www.atc-tele.ru

возникли проблемы следующего характера:

pdf инструкции выложенные на нашем сайте , оказались каким-то образом более

релевантны ,чем html странички.

Например, нам важен запрос "Гибкий мультиплексор МАКОМ-МХ"

В результатах поиска по региону Омск выходит страничка

http://www.atc-tele.ru/mp/MAKOM-MX_ToPGATE_4E1_2F.pdf

ХОТЯ !!! для этого запроса ,специально оптимизировалась страница

http://www.atc-tele.ru/mp/makommx.php ,где запрос "Гибкий мультиплексор МАКОМ-МХ"

точно цитируется в тегах title , h1, alt , а также частично

цитируется по тексту ...

ПОЧЕМУ Яндекс считает ,что pdf документ с ничтожной релевантностью

по данному запросу, несет в себе большую информацию чем

оптимизированная html страница?

Мы специально не архивировали pdf файлы , для тех людей ,которые

будут искать к примеру "руководство к Гибкому мультиплексору

МАКОМ-МХ" и совсем не ожидали ,что этот файл(ссылки на который нет

даже в карте сайте) переплюнет родительскую страницу... Я не

претендую на полное обьяснения работы алгоритов ранжирования , но

хотел бы все-таки понять ,чем руководствовался робот , при

ранжировании страниц

http://www.yandex.ru/yandsearch?text=%C3%E8%E1%EA%E8%E9%20%EC%F3%EB%FC%F2%E8%EF%EB%E5%EA%F1%EE%F0%20%CC%C0%CA%CE%CC-%CC%D5&pag=u&site=atc-tele.ru&&rstr=-66

из этой ссылки видно , что страница

http://www.atc-tele.ru/mp/makommx.php все-таки проиндексирована , но

оказалась на третьем месте на внутреннем ранжировании сайта...

Очень бы не хотелось ,все таки наш сайт сделан для

людей,чтобы им были доступны все документы и материалы сайта,без

всяких дополнительных манипуляций,как например разархивирование,

сжимать и прятать PDF файлы... Но нас вынуждают обстоятельства .

Можно еще конечно запретить индексацию всех pdf в robots.txt , но

это опять же радикальная мера...

Хотелось мы услышать ваше мнение по этому поводу

p.s таких запросов ,по которым pdf файлы выруливают на 1-ое место не

меньше десяти

T.R.O.N
На сайте с 18.05.2004
Offline
314
#1
mnp357:
ПОЧЕМУ Яндекс считает ,что pdf документ с ничтожной релевантностью
по данному запросу, несет в себе большую информацию чем
оптимизированная html страница?

Потому, что не релевантностью единой все определяется...

Достаточно того, что кто-то поставил ссылки с похожим анкором именно на пдф файл.

И тогда суммарный фактор, ждля пдф, стал выше, чем для страницы

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
H
На сайте с 24.10.2005
Offline
50
#2

T.R.O.N, ну пожалуйста http://www.yandex.ru/yandsearch?text=%23link%3D%22www.atc-tele.ru%2Fmp%2FMAKOM-MX_ToPGATE_4E1_2F.pdf%22&tbf=1

Никто не ссылается.

Вы вероятно не оцениваете мощь и глупость школьников, два этих фактора способны свернуть горы, а сегодня мы делаем шаг к тому чтобы выпустить этого джини на свободу (/ru/forum/comment/4436338)
T.R.O.N
На сайте с 18.05.2004
Offline
314
#3
Hazard:
Никто не ссылается.

Не не ссылается, а яша не отображает... Или Вы все еще пользуете яшину инфу о бэках?

Я сказал об одной из причин. Их может быть уйма.

1. Яшин глюк.

2. Результат быстроробота.

3. Недоступность для бота страницы.

4. Более высокий стат-вес (в связи с отсуствием исходящих ссылок) (такой вариант тоже иногда обсуждается)

5. .....

Г0
На сайте с 19.08.2004
Offline
129
#4

Проблема глубже, в обычной выдаче (без Омска) по этому запросу вообще нет ни одной вашей страницы, хотя судя по странице, у вас должен быть самы релевантный контент. (Мог просмотреть).

Вижу сусликов, которых нет. Покупаю заброшенные сайты, ссылки с pr17-18, пью водку. В личку. Интим не предлагать.
M3
На сайте с 13.01.2007
Offline
31
#5

Хотел поковыряться поискать , был уверен , что где-нибудь , в самом конце выдачи все-таки сайт есть ... Каково было моё удивление , когда обнаружил его , с СЕГОДНЯШНЕГО дня на 7-м месте , неужели это так оперативно сработала команда тех.поддержки яндекса ? Страница теперь правильная www.atc-tele.ru/mp/makommx.php... Но еще больше удивляет ,что при уточнении региона Омск , в выдаче по старому pdf файл ... Как я понимаю , такого априори в принципе быть не может ...Несколько раз перепроверял ,включая ctrl+F5 ... Действительно глюк яндекса?

И еще на третьем месте точно такой же pdf ,только с другого сайта ... По видимому, переплюнули нас именно ссылочным ранжированием... Отсюда у меня складывается мнение , что контент уступает ссылочному , как ни прискорбно это принимать...

M3
На сайте с 13.01.2007
Offline
31
#6

Хочу привести очередной пример , как наиболее колоритный

http://www.yandex.ru/yandsearch?text=%CA%EE%EC%EC%F3%F2%E0%F2%EE%F0+%F6%E8%F4%F0%EE%E2%FB%F5+%E8%ED%F2%E5%F0%F4%E5%E9%F1%EE%E2&rstr_manually=false

Запрос :Коммутатор цифровых интерфейсов

1ое место держит наш сайт с pdf файлом www.atc-tele.ru/mp/MAKOM-MX_KCI.pdf

а должен быть www.atc-tele.ru/mp/kci.php ...

Обидно ,столько труда и всё коту под хвост ... О каждом таком пример писать в яндекс не с руки ...

Похоже единственным правильным решением в данном случае , архивировать pdf ... т.к Яндекс еще не научился обрабатывать их должным образом

T.R.O.N
На сайте с 18.05.2004
Offline
314
#7
mnp357:
неужели это так оперативно сработала команда тех.поддержки яндекса ?

сегодня был ап....

mnp357:
1ое место держит наш сайт с pdf файлом www.atc-tele.ru/mp/MAKOM-MX_KCI.pdf
а должен быть www.atc-tele.ru/mp/kci.php ...

Кому кто должен????

Да поставьте ссылки с нужным анкором на страницу, и все будет ок...

Вес документа, с точки зрения яши, выше чем страницы... И по сути, так и есть

M3
На сайте с 13.01.2007
Offline
31
#8

стоит,как минимум ,три ссылки с анкором на страницу : одна в левой нав.таблице , ВТОРАЯ НА ГЛАВНОЙ , третья в карте сайта ...

И ЧТО?!

Будьте добры , обьясните по какой это такой СУТИ вес документа pdf выше ,чем страницы ?

Даже ТУПО , как можно считать ссылку с анкором с внутренней странице ,более весомее ,чем тэг title и h3... ДА и тот факт ,что яндекс не может на 100% правильно распознать текста pdf ,является НЕМАЛОВАЖНЫМ

T.R.O.N
На сайте с 18.05.2004
Offline
314
#9
mnp357:
стоит,как минимум ,три ссылки с анкором на страницу : одна в левой нав.таблице , ВТОРАЯ НА ГЛАВНОЙ , третья в карте сайта ...

речь идет о внешних ссылках.

mnp357:
Даже ТУПО , как можно считать ссылку с анкором с внутренней странице ,более весомее ,чем тэг title и h3... ДА и тот факт ,что яндекс не может на 100% правильно распознать текста pdf ,является НЕМАЛОВАЖНЫМ

Здесь написан бред. Потрудитесь, для начала, почитать хоть что-то о ранжирование в ПС.

mnp357:
ДА и тот факт ,что яндекс не может на 100% правильно распознать текста pdf ,является НЕМАЛОВАЖНЫМ

А вот теперь задумайтесь, что при этом, ваш пдф "весомей" страницы. И это логично, в вашем случае.

M3
На сайте с 13.01.2007
Offline
31
#10

и что теперь на каждую страницу ,которую перевешивает pdf , размещать внешние ссылки ?

По моему ,суть не в этом , но я все равно размещу на своих других сайтах , посмотрим ,что из этого выйдет...

ИМХО ,все таки глюк Яши , это обьясняется тем ,что Я НИЧЕГО НЕ ДЕЛАЛ со страницей и с сайтом , а страница тем не менее появилась в общей выдаче ,после письма в тех поддержку ...

Вы, T.R.O.N, видимо ,невнимательно читали мои посты ... Ладно проигнорировали просьбу об обьяснении конкретного вопроса, не буду настаивать ...

Но как обьясните ,что при одном и том же запросе в общей выдаче выходит страница, а при запросе по региону документ ?!

В подтверждение :

страница :

http://www.yandex.ru/yandsearch?text=%E3%E8%E1%EA%E8%E9+%EC%F3%EB%FC%F2%E8%EF%EB%E5%EA%F1%EE%F0+%EC%E0%EA%EE%EC&rstr_manually=false

документ :

http://www.yandex.ru/yandsearch?text=%E3%E8%E1%EA%E8%E9+%EC%F3%EB%FC%F2%E8%EF%EB%E5%EA%F1%EE%F0+%EC%E0%EA%EE%EC&rstr=-66&rstr_manually=true

А теперь вы скажите мне , стоит мне ломать голову над контентом и задумываться , почем pdf весомее ............

ИЛИ ЭТО ГЛЮК ?

p.s не вижу никакой логики

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий