Вопрос о дублированном контенте сайта

MD
На сайте с 13.12.2010
Offline
21
276

Здравствуйте, есть такой вопрос. У моего блога, построенного на Wordpress есть такая проблема, как дублирование контента - в индексе Google число проиндексированных страниц в 10 раз превышает число реальных постов.

Возможно ли это из-за того, что robots.txt я создавал через некоторое время после создания и запуска сайта. Однако, роботс уже около месяца существует и находится в рабочем состоянии. Как долго ждать обновления данных об индексации? Или причина вовсе не в этом?

Заранее, спасибо за ответы! Если кто-то может помочь, то буду рад пообщаться в ICQ 465-303-788, возможно, за плату при устранении проблемы.

Антон Белов
На сайте с 28.05.2010
Offline
183
#1

у меня роботс за ап или два обновился, может он плохо составлен? Покажите хоть...с урлом естественно.

Ещё есть такая мудрая вещь вебмастер - она всё видит.

Аудит за 100 рублей (/ru/forum/787849) теперь реальность курс Подводные камни мфа (/ru/forum/comment/11861126) - всего за 100 рублей Твой сервер снова лежит? Пользуюсь Inferno Solutions, таких проблем не знаю. (http://cp.inferno.name/link.php?id=13)
MD
На сайте с 13.12.2010
Offline
21
#2

сказали, что роботс составлен неплохо) сайт evrosports.ru

Роботс, соответственно:

User-agent: *

Disallow: /cgi-bin

Disallow: /wp-admin

Disallow: /wp-content/

Disallow: /wp-includes

Disallow: /wp-content/plugins

Disallow: /wp-content/cache

Disallow: /wp-content/themes

Disallow: /trackback

Disallow: */trackback

Disallow: */*/trackback

Disallow: */*/feed/*/

Disallow: */feed

Disallow: /*?*

Disallow: /tag

Disallow: /page/

Disallow: /2011/*/*

Disallow: /2010/*/*

User-agent: Yandex

Disallow: /cgi-bin

Disallow: /wp-content/

Disallow: /wp-admin

Disallow: /wp-includes

Disallow: /wp-content/plugins

Disallow: /wp-content/cache

Disallow: /wp-content/themes

Disallow: /trackback

Disallow: */trackback

Disallow: */*/trackback

Disallow: */*/feed/*/

Disallow: */feed

Disallow: /*?*

Disallow: /tag

Disallow: /page/

Disallow: /2011/*/*

Disallow: /2010/*/*

Host: evrosports.ru

Sitemap: http://evrosports.ru/sitemap.xml.gz

Sitemap: http://evrosports.ru/sitemap.xml

P.S. Поступило предложение добавить disallow: /*.html/ в роботс - насколько корректна такая запись?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий