svtim

Рейтинг
26
Регистрация
20.07.2008
Интересы
Маркетинг, бильярд
DyaDya:
Не думаю, что версия страницы в формате пдф - это баг).

1. Запрещайте индексацию таких страниц и всё. Я не совсем понял, как вы запретили индексацию страниц с подобным расширением. О каком расширении идёт речь?

Запретить нужно индексацию всех урлов с параметром format=pdf

Проверьте, действительно ли вы их правильно запретили?

2. Для надёжности поменять настройки в движке, чтобы версии в формате пдф вообще не выдавалось!
Если речь об этом, то тут да, можно на форум по джумле идти.

1. В роботсе прописано:

Disallow: /*.pdf$

Disallow: /*format=pdf$

svtim добавил 27.10.2009 в 15:16

borej:
подобной проблемы не замечал, пдф запрещены в роботах.

кроме всего можно глобально убрать значки ПДФов, соответственно линки со всех станиц тоже исчезнут. (админ-панель/менеджер материаллов/справа в верху глобальные настройки всех отображаемый материалов/почти в самом низу)

Иконки 	  Скрыть

Иконка PDF Скрыть
Иконка печати Скрыть
Иконка E-mail Скрыть
Просмотров Скрыть

В течении недели после запуска сайта, прописали запрет в роботсе и "подали" все подобные страницы на удаление из индекса в панели веб-мастеров... Настройки pdf были изначально "скрыть". И глобально, и я перестраховывался проставлял еще на материалах вручную...

Но месяц назад в индексе снова стали появляться pdf-ные страницы. Причем новые.

saleseo:
На форумах cms этой запостите...в ней надо фиксить баг

Ок, спасибо!

ZoomY:
Этот тег — не директива, а подсказка. Попробуйте — попытка не пытка. Расскажете заодно.
Кроме того, вы можете в .htaccess автоматически редиректить все урлы с ?format=pdf на оригинальную страницу (просто удалять эту часть из урла), и Гугл тогда физически до них не доберётся.

С редиректами не очень хотелось бы извращаться... Что бы не говорили, а при их использовании есть "темные" пятна. Этот вариант самый простой, но самый трудоемкий.

К тому же, проблема не только с google... Хоть меня и мало интересует Yahoo и "творчество" Microsoft, но лучше о них не забывать... Насколько я вижу по индексу с роботсом работает нормально только Яндекс.

Спасибо, ZoomY, буду пробовать!

saleseo:
Это уже кривость cms, переходите на нормальные движки.
Скорее всего надо в cms устранять причину...может pdf графически чтоб собирался...и не текстом.

Не первый год пользуюсь данной cms, но в предыдущих версиях подобных боков не было. Мы все прекрасно понимаем, что идеальных решений не существует... Но суть не в этом.

В принципе мне этот pdf вообще не нужен.

svtim добавил 27.10.2009 в 13:09

ZoomY:
А базируются они на чём? На основной странице?
Т.е. page.php автоматически генерирует page.php?format=pdf?

Ну да... Вот в этом, собственно, и вопрос. Могу ли я проставлять данный тег на основных страницах?

Насколько я понял из статьи, то нет.

ZoomY:
Поставьте rel=canonical и будет вам счастье, останутся только основные страницы.

Спасибо, впервые встречаю этот тег... Но есть некоторые сложности в использовании. Нашел следующее:

12 февраля Google анонсировал новый тег canonical, который поможет вам избавиться на сайте от дублированного контента, указывая предпочитаемую версию URL адреса для страницы. Также в этот день ввод нового тега анонсировали компании Yahoo и Microsoft.

Если ваш сайт имеет идентичный или очень похожий контент, доступный по разным URL, тогда новый формат позволит указать тот URL, который должен возвращаться в поисковой системе. Также можно быть уверенным, что все характеристики, такие как ссылочный вес и т.д. передадутся на нужную версию адреса.

Теперь вы можете добавить этот тег, для указания вашей версии адреса, внутри тега <head> на страницах с дублированным контентом

Но в том то и дело, что фактически этих страниц не существует... Они генерятся автоматически.

nothing:
странно, но сервис http://www.mapelli.info/tools/supplemental-index-ratio-calculator дает диаметрально противоположные результаты...
кто врет?

Пытаюсь работать с этим сервисом уже почти год. Глючит его не по детски все время. Зато если показывает что-то адекватное, то цифры более похожи на правду... Ну или хочется на это надеяться:) А так только в нем я видел примеры, когда страниц в основном индексе больше чем проиндексировано вообще.

Все же лучше пользоваться предыдущим сервисом. Подобных сбоев у него практически не бывает.

svtim добавил 23.10.2009 в 14:20

tutonhamon_:
сейчас точно ни один сервис не покажет

А почему именно сейчас? Хотя я склонен ставить под сомнение результаты обоих сервисов...

Punches:
Сайту 2 года, всю свою жизнь состоял из 1й страницы, никак не продвигался, ни с кем не зеркалился. Примерно последний год имел всего 2 бека, месяц назад появился 3й и от него весу не много.
Т.е. весь его PR4 от одного бека, со страницы на которой 96 внешних ссылок. Забавно :)

Так с этого и стоило начинать:) Похоже, что собственнику ресурса просто повезло... Но не думаю, что это продлится слишком долго.

Punches:
на сайт всего 3 бека, при этом у него морда PR 4. Чем такое можно объяснить?
беки: 2-PR0 1-PR5

А что тут нереального? Все "по плану":)

А какой возраст сайта?

IvanKia:
Проверил я на склейку.
оба варианта (с ввв и без ввв) ведет на www.site.com
Повторюсь - никакие настройки в панели вебмастера и редиректы не применял. Гугл сам склеил.

Возможно, что на уровне cms это предусмотрено. Есть такие примеры. Но это, скорее, исключение.

Правда есть теория, что "вес" передается только при 301 редиректе, а в остальных случаях - нет. Около года назад, я отредиректил все домены с www и без, прикрученные к одному сайту, на один и получил после апа рост PR. Ранее переадресация с www была прописана в алиасе сайта... Не исключаю, что это совпадение.

Я считаю, что нужно сделать правильно и заниматься более важными делами, чем ломать себе голову и искать ответы на "риторические" вопросы.

nomarketing:
А как проверять ? ну задал я с www PR 3 без PR 2 в Google *(яша не интересует.)

Задаете несколько вариантов домена. В данном случае с www и без. При правильной склейке (обычно работает 301 редирект) оба варианта должны вести на один и тот же адрес и выделяться красным. Ниже есть текст - соответствует домену.

Кстати, в Яндексе у Вас склейка произошла. Можете посмотреть на других сайтах под которые зарегистрированы несколько доменов. Там вариантов предостаточно.

Всего: 134