Проблема с индексацией. Подскажите советом

[Удален]
684

Всем привет! Есть пациент podgolovnik.ru и проблема с его индексацией гуглом.

Проблема такая. Сайт на друпале, контент 100% уник, ссылок не продается. В индексе отсутствуют ВСЕ ПРОДВИГАЕМЫЕ страницы.

Продвигаются страницы каталога второго уровня, например podgolovnik.ru/catalog/monitory-v-podgolovnik. В остальном с индексацией все не плохо. Дочерние страницы, например podgolovnik.ru/catalog/monitory-v-podgolovnik/avis/podgolovnik-so-vstroennym-dvd-pleerom-i-lcd-monitorom-85-0 в индексе более менее есть. Все ссылки естественно покупались на продвигаемые страницы, но вот что показывает панель вебмастера гугл

ссылок на страницы таксономии нет вообще, ибо в нашем случае это внутренние страницы и они запрещены к индексации в роботс.тхт.

переспама страницы покупными ссылками быть не может, так как с новыми разделами каталога (на которые нет ссылок) такая же песня (страница не индексируется, дочерние страницы в поиске).

сам грешу на sitemap.xml, т.к. продвигаемых страниц каталога в нем нет. но мне не верится, что гугл руководствуясь одним сайтмэпом не может найти эти страницы, когда на них куча внешних ссылок. проблема на текущий момент очень актуальна, ибо в яндексе все ок, а с гугла трафа кот наплакал

у кого какие мысли будут по этому поводу?

ps еще небольшая ремарка по проблеме (возможно поможет)

изначально сайтмэп генерировался неправильно (как в принципе и сейчас). и вместо страниц каталога в нем находятся страницы категорий

эти страницы категорий занимали 90% выдачи (причем на хороших позициях). на этих страницах нет контента, а есть только сообщение "в данной категории нет материалов". для интернет магазина это не круто. к индексации их запретили, думали на их место встанут страницы каталога. но вот не встали ))

[Удален]
#2

это все наши дилеры, и информацию они брали у нас с сайта (мы первоисточник). к сути дела это не относится

K
На сайте с 08.03.2007
Offline
57
#3
serg_shishov:
к сути дела это не относится

Как же не относится. Дублированный контент. Это как раз и есть причина.

Интернет магазины на платформе Magento под ключ (http://www.peexl.com)
[Удален]
#4

да у нас половина сайта по дилерам перекопирована :) и это не мешает страницам, с которых скопирован контент, находится в индексе. это не может быть контент. смотрел пару раз за этим. создавался новый раздел с товарами, попадал в индекс. страницы каталога не было. только после этого материалы появлялись у дилеров

если не верится, наберите в гугле поиск по сайту с запросом "переходные рамки". раздел был доделан на прошлой неделе, у дилеров контента нет. часть страниц с товарами уже в индексе, страницы каталога нет. хотя есть внешние ссылки на эту страницу, проиндексированные гуглом

K
На сайте с 08.03.2007
Offline
57
#5

С дублями это ведь не 100% - иногда продвигаемая страница выкидывается, иногда нет.

У Вас, коль речь о категориях и taxonomy, в роботсе написано:

Disallow: /category/

Disallow: /taxonomy/

[Удален]
#6
Koleaba:

У Вас, коль речь о категориях и taxonomy, в роботсе написано:
Disallow: /category/
Disallow: /taxonomy/

в этом то и вся соль. в теории должно быть все ок, все что надо индексируется, все что не надо - запрещено. в реале все не так.

K
На сайте с 08.03.2007
Offline
57
#7

Таки да, в мануале Google не очень внятно написано:

Disallow: /folder2/
In this example only the URLs matching /folder2/ would be disallowed for Googlebot.

Может быть, сюда подпадают все вложенные папки (типа /term/).

Может быть, попробовать директиву Allow для них?

[Удален]
#8

спасибо за дельный совет, буду на работе, обязательно посмотрю что на хосте. сегодня через панель вебмастера удалил вручную около 60 ссылок taxonomy. но их и так в выдаче нет, хотя гугл упорно считает, что все внешние ссылки на них стоят

serg_shishov добавил 17.12.2010 в 15:34

у кого еще какие мысли?

[Удален]
#9

все ссылки таксономии удалены руками, стоят в удаленных. проблема осталась ) неужели больше ни у кого никаких мыслей? у кого нибудь получалось с тп гугла общаться?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий