Joomle 3.3 Гугл индесирует странные УРЛы

F
На сайте с 06.02.2012
Offline
124
501

Сайт начал продвигать недели три назад. Ранее с CMS вообще не работал, делал сайты на html и php.

В настройках Joomle 3.3 всё установил по советам из интернета - включил ЧПУ и перенеправление УРЛ, исправил название .htaccess.

Всё работает, все урлы на страницы формируются в нужном виде по принципу http://site.ru/kategoria/pagename.

Яндекс всё индексирует правильно пока.

Гугл тоже сначала правильно всё проиндексировал, но дополнительно начал индексировать эти страницы с другими непонятными урлами, например появляются в индексе дубли страниц с урлами типа site.ru/kategoria/pagename?start=5 . Т.е добавляет знак вопроса и что-то дальше.

Дубль главной страницы проиндексировал site.ru/?catid=0&id=24.

Я ему в роботсе запретил урлы с вопросительным знаком. Удаляю эти дубли из индекса в WMT.

Всё равно опять находит и индексирует с дискрипшном "Описание веб-страницы недоступно из-за ограничений в файле robots.txt".

КАк с этим бороться?

Есть ещё проблема с дублями c www в индексе Гугла. Но об этом позже, есть надежда что всё уладится, вчера сделал необходимые настройки в WMT (указал приоритет на site.ru), указал в роботсе Host: site.ru, сделал в .htaccess. редирект на без www, удалил дубли, жду переиндексации главной страницы.

alaev
На сайте с 18.11.2010
Offline
809
#1

Ну, да, Гугл он такой :)

А какая проблема-то?

У меня есть несколько сайтов, где Гугл пытается лазить там, где ему в роботсе запрещено.

Пытался руками удалять даже, ему хоть бы хны. До 301 редиректа не дошел, так все и оставил и не парюсь.

Создание и продвижение сайтов - https://alaev.net , аудиты сайтов, контекстная реклама
F
На сайте с 06.02.2012
Offline
124
#2
alaev:
А какая проблема-то?

Так ведь индексирует дубли и прячет их в сопли..

Везде пишут, что за дубли страниц Гугл пессимизирует сайт.

Есть ли какие-нибудь способы запретить формирование ненужных Урлов на одни и те же страницы в Joomle?

Непонятна сама система, как образуется адрес страницы. Может что-то поправить в .htaccess?

siv1987
На сайте с 02.04.2009
Offline
427
#3
fordzon:
Всё равно опять находит и индексирует с дискрипшном "Описание веб-страницы недоступно из-за ограничений в файле robots.txt".

Просто расслабится. Все равно релевантнее будет основной адрес, а урлы запрещенные в robots практически не встречаются в поиске. Такие страницы полноценными дублями назвать нельзя.

Дополнительно можете настроить rel canonical

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий